ChatGPT狂飙160天,世界已经不是之前的样子。
更多资源欢迎关注
1、英伟达今年在华销售额预计将达120亿美元
芯片咨询公司SemiAnalysis报告预估,今年英伟达有望在中国销售价值约120亿美元的人工智能芯片。黄仁勋曾表示,希望借助新的芯片使得英伟达在中国的业务实现最大化。
英伟达有望在未来几个月内在中国交付超过100万颗定制版H20芯片,这些芯片的设计不受美国对向中国客户销售人工智能处理器的限制。据悉,每颗H20芯片的价格在12000至13000美元之间。
英伟达创始人CEO黄仁勋曾表示,这款芯片符合美国对中国出口管制的要求,有望最大程度提升英伟达在中国的业务。
SemiAnalysis创始人帕特尔(Dylan Patel)此前在一份报告中称,由于内存容量更高,H20的制造成本会比H100更高。他同时表示,H20的售价是H100的大约一半,英伟达在利润率方面作出妥协。(来源:第一财经)
2、百度宣布文心智能体平台免费开放文心大模型4.0
据百度官方消息,百度文心智能体平台(AgentBuilder)免费开放文心大模型4.0。开发者在文心智能体平台上制作智能体时,可灵活选择文心大模型3.5或4.0版本。
据悉,目前已经有20万开发者、6.3万企业加入百度文心智能体平台。(来源:钛媒体)
3、快手大模型首次集体亮相,可灵AI推出网页端,可图正式开源
2024世界人工智能大会期间,快手举办了以“新AI·新应用·新生态”为主题的大模型论坛,会上,快手大模型首次集体亮相,视频生成大模型可灵、图像生成大模型可图等产品的多项新功能正式发布。
继图生视频、视频续写功能发布之后,可灵在一个月内迎来了第三次重大升级,网页端(https://klingai.kuaishou.com)也正式上线。
可灵推出更加清晰的高画质版,以及首尾帧控制、镜头控制等新功能,同时,创作者单次生成的文生视频时长增加至10秒。图像生成大模型可图则宣布正式开源。(来源:上游新闻)
4、阿里云 CTO 周靖人:通义真正实现全尺寸、全模态开源,下载量已破 2000万
上海世界人工智能大会上,阿里云 CTO 周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近 2 个月,通义千问开源模型下载量增长 2 倍,突破 2000 万次,阿里云百炼服务客户数从 9 万增长至 23 万,涨幅超 150%。
周靖人重申了阿里云拥抱开源开放的坚定立场,“两年前,我们在世界人工智能大会上发布通义大模型系列,当时我们公布,通义核心模型将开源开放。到今天,通义千问已经实现真正意义上的全尺寸、全模态开源,拉平了开源、闭源模型之间的差距。”(来源:新浪财经)
5、MiniMax创始人闫俊杰:至少三年后才会出现“杀手级”AI应用
7月4日下午举行的大会产业发展主论坛上,国内 AI 大模型“独角兽”公司MiniMax创始人兼CEO闫俊杰表示,虽然国内很多公司正在迎头赶上ChatGPT,但是目前模型的错误率在60%-70%的水平,远不及GPT-4的30%-40%。
在闫俊杰看来,降低大模型的整体错误率是目前最为核心的问题,而不断提高训练效率、研究新型的网络结构、做更好的对齐等方案都是为了促使AI大模型的错误率,能在半年或一年后降至个位数,从而真正起到辅助人类工作的作用。
会后闫俊杰表示,类似于微信、抖音、今日头条这种规模的“杀手级”AI超级应用(Killer App),至少要到三年之后才能实现。(来源:钛媒体AGI)
6、商汤发布“日日新5o” 实时多模态流式交互对标GPT-4o
商汤发布国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。
通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内首个所见即所得模型“日日新5o”带来一种全新的AI交互模式,即实时的流式多模态交互。
这种交互模式适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验正是源于“日日新5.5”基础模型能力的全面提升。
今年4月份发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,此次,“日日新5.5”体系迎来多项升级,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。(来源:证券日报)
7、面壁智能开源“小钢炮”MiniCPM-S AI 模型,主打高效低能耗
世界人工智能大会(WAIC)上,面壁智能联合创始人、首席科学家刘知远宣布,开源主打高效低能耗的新一代“面壁小钢炮”MiniCPM-S 模型,同时发布助力开发者一键打造大模型 SuperApp 的全栈工具集 MobileCPM。
此次开源的 MiniCPM-S 采用“稀疏激活”在同等参数下减少大模型的推理能耗,稀疏度越高,每个词元(token)激活的神经元越少,大模型的推理成本和能耗就越少。MiniCPM-S 1.2B 采用了高度稀疏架构,通过将激活函数替换为 ReLU 及通过带渐进约束的稀疏感知训练,巧妙地解决了此前主流大模型在稀疏激活上面临的困境。
MiniCPM-S 1.2B 号称实现知识密度的“空前提升”—— 达到同规模稠密模型 MiniCPM 1.2B 的 2.57 倍,Mistral-7B 的 12.1 倍。(来源:IT之家)
8、智谱发布并开源代码生成大模型 CodeGeeX 第四代
智谱 AI 发布并开源代码生成大模型 CodeGeeX 的第四代产品 CodeGeeX 4-ALL-9B,集代码补全和生成、代码问答、代码解释器、工具调用、联网搜索、项目级代码问答等所有能力于一体,号称是目前百亿(10B)参数以下性能最强、最全能的代码大模型。
据介绍,该模型在 GLM4 的语言能力的基础上大幅增强了代码生成能力。CodeGeeX 4-ALL-9B 单一模型,即可支持代码补全和生成、代码解释器、联网搜索、工具调用、仓库级长代码问答及生成等功能,覆盖编程开发的各种场景,支持 300 + 编程语言。(来源:IT之家)
9、达摩院发布一站式AI视频创作平台"寻光" 打造全新AI工作流
世界人工智能大会(WAIC)上,达摩院发布了一站式AI视频创作平台“寻光”。
其定位为PUGC一站式AI视频创作平台,可辅助用户创作剧本、分镜图等,并通过工作流整合提升创作全流程的效率,支持对生成及上传素材进行丰富的AI编辑,提供人物控制、场景控制、风格迁移、运镜控制、目标新增/消除/修改等十多种AI编辑功能,让视频中的元素和对象精准可控。
达摩院希望借由寻光平台进一步提升AI视频创作的效率,目标是用AI能力重塑传统视频制作的整个流程,打造AI时代的全新视频工作流。(来源:新华网)