「ChatGPT」掀起新一轮AI热潮!超越GPT-4 Turbo,商汤日日新大升级!

图片

目录

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

端侧大模型,唯快不破

AI 应用落地需要一个即插即用的大模型超市

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。


福利:文末有福利哦,最新AI资料免费领

chat gpt 免费领,无魔法,无限制

在大模型的浪潮席卷而来的前几年,其实也掀起过一阵 AI 创业热潮。其中商汤科技、旷视科技、云从科技、依图科技是这个时期的代表,这四家公司也被称为「中国 AI 四小龙」。

到了 OpenAI 掀起的这股新浪潮中,四小龙中的商汤科技还留在舞台中央。去年 4 月商汤发布「日日新·大模型」 系列,是国内最早推出基于千亿参数大语言模型的公司之一。

苟日新,日日新,又日新。

商朝的开国君主汤在澡盆上刻了上述自我告诫的格言,恰似今天 AIGC 领域的变化速度,商汤大模型更新的节奏也可谓「日日新」。

图片

两个月前,商汤推出「日日新 SenseNova 4.0」大模型体系,甚至先 OpenAI 一步首发了全球首个支持不同模态工具调用的 Assistants API。

而今天下午,「又日新」的商汤继续推出了一系列基于「日日新」的生成式 AI 模型及应用,先给大家划重点:

日日新 5.0:常用客观评测上达到或超越了 GPT-4 Turbo

1.8B 的端侧模型:同等尺度性能最优,跨级尺度全面领先

企业级的应用一体机:涉及金融、医疗、政务、代码等领域

尚未上线的文生视频生成平台

拳打 GPT-4 Turbo ,脚踢 DALL·E 3

AI 2.0 时代,生成式 AI 被视为推动生产力进步的重要技术,如果能在知识、推理、执行三层能力上实现突破,将真正带来整个社会生产力的跨越式发展。

上个月,商汤 CEO 徐立在出席 2024 GDC 提出了如上观点,而在今天的发布会上,他再次强调,商汤在尺度定律的指导下,会持续探索大模型能力的 KRE 三层架构(知识-推理-执行),不断突破大模型能力边界。

那么全新升级的日日新 SenseNova 5.0(以下简称:日日新 5.0)又有哪些更新亮点呢?

采用 MoE 架构

基于 10TB tokens 训练,大量合成数据

推理上下文窗口支持 200K

知识、推理、数学、代码全面对标 GPT-4 Turbo

图片

日日新 5.0 本次更新主要增强了知识、数学、推理及代码能力,全面对标 GPT-4 Turbo。

在主流客观评测上,日日新 5.0 达到或超越了去年 OpenAI 在开发者大会上发布的 GPT-4 Turbo 版本,同时也几乎碾压了近期发布的 Llama 3-70B。

图片

光说不练假把式,在发布会现场,商汤全方位展示了日日新 5.0 在语言、数学推理等方面的实际能力。

同样输入一道 2022 年的高考作文题,对比 GPT-4 Turbo(仅为去年 11 月份的版本,下同)可以看到,日日新 5.0 生成的结果脱离了模版套路化的束缚,多了点人味,一看就是能走进高考阅卷老师心坎的文章。

图片

面对数学问题的拷问,GPT-4 Turbo 开始有些招架不住,不仅计算过程复杂,最终得出的结果也是错误的,而日日新 5.0 这边得出的答案则充满条理性,也完全正确。

图片

行业差异化是大模型竞争中脱颖而出的关键因素。

瞄准本土化应用场景的日日新 5.0,在理解中文特有的文化和语境上是要优于 GPT-4 Turbo 的。GPT-4 Turbo 既然不熟悉中文语境,自然也就无法准确把握「老鹰捉小鸡」这样的本土游戏规则。

图片

多模态能力被业界普遍视为实现 AGI 的关键路径。

从基准测试结果上看,日日新 5.0 也能与 GPT-4V 打得火热,并且互有胜负。在实际的案例演示中,日日新 5.0 支持的秒画生成老象的效果更自然一些,而同样的问题给到友商,甚至还会出现三条腿的谬误。

基于同一 Prompt 生成的人像图,商汤旗下秒画生成的皮肤纹理自然,既没有过度磨皮加滤镜,也顺利完成了「美丽」的指标 。考虑到国际上用于训练 AI 模型的亚洲人像数据库相对有限,这样的对比结果也相对正常。

图片

结合多模态和数据分析能力,AI 能够实现更为复杂和高级的任务。

日日新 5.0 上能「攻破」长图的总结描述,中能识别滴滴打车的具体信息,下还能计算中国特有早餐的热量,同样的问题给到 GPT-4 Turbo,也许就是两眼一抹黑。

图片

总说 AI 会重塑工作流,这一次,商汤也特别演示办公小浣熊在这方面的能力。

将 F1 赛车手周冠宇三年的参赛记录输入到系统中,并让它绘制出参与比赛数量的柱状图,这个任务看似简单,但实际上牵涉到复杂的识别难题。

在国际比赛中,周冠宇使用其英文名字参赛。传统的大模型在处理这类涉及非英文常规拼写或者特定人物的识别任务时,往往表现不佳。而日日新 5.0 升级的办公小浣熊虽然经历了一些波折,但最终还是顺利绘制出来。

端侧大模型,唯快不破

在武侠世界中,「天下武功,唯快不破」强调了速度在实战中的重要性,而在大模型的战役中,这一原则同样适用。

随着大模型技术的快速发展,不同应用场景的需求日益显现,智能手机、电脑、VR 眼镜等终端设备对大模型的使用频率,性能速度,安全稳定等提出了更高要求。

变得更务实的商汤在本次发布会也正式推出了 1.8B 的 SenseChat-Lite 版本端侧⼤模型。

在基准测试中,该端侧模型全面超越了 MiniCPM-2B、Phi-2 等同量级的大模型,并且还越级比肩一些 7B、13B 大模型,用徐立的话来说,那就是同等尺度性能最优,跨级尺度全面领先。

图片

研究表明,人眼最快的阅读速度大概就是 20 字/秒,而搭载 1.8B 商汤端侧模型在中端手机上能够实现 18.3 字/秒的速度,而在旗舰手机则最高支持 78.3 字/秒,成为业内最快推理速度。

商汤还推出端云协同解决方案,可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过 80%,从而显著降低推理成本。

在与「商量」的寥寥几秒对谈中,无论是几秒生成请假报告,还是总结几千字的文档都能快速响应。

图片

端侧扩散模型还能实现业内最快推理速度,端侧 LDM-AI 扩图技术在某主流平台上,推理速度小于 1.5 秒,比友商云端 app 快10倍,支持输出 1200 万像素及以上的高清图片,支持在端上快速进行等比扩图、自由扩图、旋转扩图等图像编辑功能。

现场的演示中,工作人员更是可以做到随拍随扩,将端侧大模型「唯快不破」的能力展现得淋漓尽致。

并且,据徐立介绍,该端侧大模型主要适用于日常对话、常识问答、文案生成、相册管理、图片生成、图片扩展等六大领域,还支持多设备适配,使其能够灵活地应用于各种不同的场景和设备之中。

对于金融、代码、医疗、政务等重点行业边缘侧日益增长的 AI 应用需求,商汤还正式推出了高性价比、开箱即用、数据安全、全国产化的企业级应用一体机,涉及金融、医疗、政务、代码等四大行业。

以政务智能咨询问答平台为例,它不仅能够理解用户提出的问题,还能提供答案的参考来源,极大地提升政务服务的智能化水平。

图片

徐立指出,自然语言仍然不能替代编程语言,当前的「AI 程序员」无法独立完成复杂的工业级代码项目,而 Copilot 才是更适合的形态。

因此,今天商汤还发布了小浣熊·代码大模型一体机轻量版,单台支持 100 人规模研发团队使用。支持数据不出域,安全有保障,免费部署即可开箱即用。每台售价 35 万元起,为中小企业用户提供了高性价比的选择。

今年以来,Sora 的出现让人们见识到了 AI 视频生成的无限创造潜力,徐立在最后环节也带来了「One more thing」——三段完全由大模型生成的视频。尚未上线的文生视频生成平台也在人物可控性、动作可控性以及场景可控性等方面都有着出色的表现。

AI 应用落地需要一个即插即用的大模型超市

在 GPT-4 发布一年后,大模型们依然在不断卷参数刷榜。但今年行业里大家真正关心的,其实是怎么将大模型通过 Agent,并接入到无数企业和个人的工作流中。

OpenAI 的 GPT Store 没有如愿成为 AI 行业的 GPT Store,但大量的需求和问题依然摆在那。大模型的强大的能力和落地不同行业场景之间缺乏畅通的桥梁,同时也意味着一个巨大的机遇。

商汤的日日新开放平台,实际上就是一个大模型超市。通过多模态的模型能力提升 API 的调用效率,降低企业和开发者调用和定制各种 AI 功能的门槛。

图片

比起模型的规模参数,商汤更侧重于模型的能力应用。从商汤针对金融、医疗、政务、代码的行业大模型,到目前行业推理速度最快的端侧模型,以及商量、 如影、大医、小浣熊家族等 AI 原生应用,都可能看出商汤想要提供接口更丰富,能执行不同行业复杂任务的 AI 工具箱。

知名调研机构 Frost & Sullivan 发布的《2023年中国AI开发平台市场报告》指出,SenseCore 商汤大装置已成为中国 AI 开发平台云计算基础设施供应商的领先者。在硬件基础设施兼容性、产业链合作情况、模型训练优化模块、智能标注技术能力、预训练模型技术水平5个评估项目中,商汤均获得最高分。

我们前段时间报道过金山办公的 WPS AI 企业版,其中合作的大模型就有商汤。金山表示商汤在数据分析上比较出色,因此 WPS AI 就调用它处需要理科思维的场景。

APPSO 把金山这种不生产大模型,而是坚定做大模型应用的公司,称为 AI 的应用主义者。而商汤在其中扮演的角色,与其说是大模型的提供商,不如说是帮助各行各业大规模应用落地 AI 应用的百货超市。

图片

什么是百货超市?有着广泛的产品线,能满足不同消费者大大小小的个性化需求。最重要的是,百货超市的出现让种类繁多的商品更容易被大众获取,让更多普通人便捷享受到全世界的优质产品和体验。

而这,正是方兴未艾的 AIGC 未来对我们最大的价值。而公司作为现代社会最伟大的发明之一,如果说大模型正在带来第四次工业革命,大概率是从对企业的影响开始。已故的商汤创始人汤晓鸥也曾表示:

并不存在 AI 这个行业,只有 AI+行业,强调 AI 需要与传统产业合作,这种关系是结合与赋能,而不是颠覆,其价值在于帮助传统产业提高生产效率,解放生产力。

汤晓鸥在一次演讲中提到,「企业融资不是用来烧的,而是做伟大的事。」而商汤科技未来十年要做的「伟大的事」,将是帮助千行百业将 AIGC 落地。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/571584.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

网络安全-Diffie Hellman密钥协商

密钥协商是保密通信双方(或更多方)通过公开信道来共同形成密钥的过程。一个密钥协商方案中,密钥的值是某个函数值,其输入量由两个成员(或更多方)来提供。密钥协商的记过是参与协商的双方(或更多…

政安晨:【Keras机器学习示例演绎】(十五)—— 用于图像分类的 CutMix 数据增强技术

目录 简介 设置 加载 CIFAR-10 数据集 定义超参数 定义图像预处理函数 将数据转换为 TensorFlow 数据集对象 定义 CutMix 数据增强功能 可视化应用 CutMix 扩增后的新数据集 定义 ResNet-20 模型 使用经 CutMix 扩展的数据集训练模型 使用原始非增强数据集训练模型 …

nginx 配置 SSL 证书实现 https 访问

nginx 配置SSL证书实现https访问 1. SSL 证书简介与获取1.1 SSL 证书介绍1.2 获取 SSL 证书 2. nginx 配置 SSL 文件2.1 SSL 文件放置与配置文件修改2.1.1 文件配置2.1.2 强制 https 访问 2.2 验证配置结果 同步发布在个人笔记 nginx 配置 SSL 证书实现 https 访问 配置好 ngi…

Powershell 一键安装 virtio_qemu_agent

前言 qemu-guest-agent qemu-guest-agent是一个助手守护进程,安装在客户机中。它用于在主机和客户端之间交换信息,并在客户端执行命令。 在Proxmox VE中,qemu-guest-agent主要用于三件事: 正确关闭客户机,而不是依赖于ACPI命令或windows策略在进行备份/快照时冻结客户机…

20240309web前端_第四次作业_完成随机点名程序

要求 一、结合抽奖案例完成随机点名程序,要求如下: 1.点击点名按钮,名字界面随机显示,按钮文字由点名变为停止 2.再次点击点名按钮,显示当前被点名学生姓名,按钮文字由停止变为点名 3.样式请参考css及html自由发挥完成…

flutter ios Firebase 消息通知错误 I-COR000005,I-FCM001000 解决

*前提是已经 使用firebase-tools 已经给 Flutter 加入了 消息通知相关配置。教程>> 一、I-COR000005 10.22.0 - [FirebaseCore][I-COR000005] No app has been configured yet. import Firebase....FirebaseApp.configure() 10.22.0 - [FirebaseMessaging][I-FCM001000…

kubernetes中Pod调度-Taints污点和污点容忍

一、污点的概念 所谓的污点,是给k8s集群中的节点设置的,通过设置污点,来规划资源创建是所在的节点 污点的类型 解释说明PreferNoshedule 节点设置这个污点类型后; 表示,该节点接收调度,但是会降低调度的概…

hbase 集成 phoenix 实现 sql 化

1. 依赖 hbase > hbase 集群搭建 2. 下载安装包 点击下载 ps:该网页在内网可能打不开,遇到该情况有条件的可以打开 VPN 在下载 3. 上传解压 使用工具将安装包上传的服务器上 笔者这里选择 上传到 /opt/software 目录,解压到 /opt/mo…

基于STM32和阿里云的智能台灯(STM32+ESP8266+MQTT+阿里云+语音模块)

一、主要完成功能 1、冷光模式和暖光模式两种灯光 主要支持冷光和暖光模式两种,可以通过语音模块或手机app远程切换冷暖光 2、自动模式和手动模式 主要支持手动模式和自动两种模式(app或语音助手切换) (1)自动模式:根据环境光照…

针孔相机模型原理坐标系辨析内参标定流程内参变换

针孔相机的内参标定 针孔相机原理真空相机模型图片的伸缩和裁剪变换 内参标定———非线性优化张正定标定详细原理(含公式推导)通过多张棋盘格照片完成相机的内参标定流程(C代码)其他工具箱 相机分为短焦镜头和长焦镜头,短焦镜头看到的视野更广阔,同样距…

QFD赋能人工智能:打造智能化需求分析与优化新纪元

在科技飞速发展的今天,人工智能(AI)已经渗透到我们生活的方方面面。然而,如何让AI更加贴合用户需求,提供更加精准和个性化的服务?这成为了一个亟待解决的问题。质量功能展开(Quality Function Deployment,简…

openjudge_2.5基本算法之搜索_1998:寻找Nemo

题目 1998:寻找Nemo 总时间限制: 2000ms 内存限制: 65536kB 描述 Nemo 是个顽皮的小孩. 一天他一个人跑到深海里去玩. 可是他迷路了. 于是他向父亲 Marlin 发送了求救信号.通过查找地图 Marlin 发现那片海像一个有着墙和门的迷宫.所有的墙都是平行于 X 轴或 Y 轴的. 墙的厚度可…

股票战法课程之倍阴龙战法

1. 核心要素 1、股价处于低位震荡区间 2、涨停板分时走的比较流畅,即使去到分时均线以下也能够是秒拉上来,或者沿着分时均线上攻打板 3、涨停后次日阴线的成交量是前一日涨停板成交量的两倍以上 4、倍量阴线出现后的30天以内第一个涨停板则是买点的浮现…

【数据结构】图(Graph)

文章目录 概念图的存储方式邻接矩阵邻接矩阵表示法邻接矩阵表示法的特点 邻接表邻接表表示法邻接表表示法的特点邻接表表示法的定义与实现查找插入删除其它构造函数析构函数创建图输出图 图的遍历深度优先遍历(DFS)广度优先遍历 图的连接分量和生成树生成…

Hive查询操作详解

Hive 数据准备: Tips: (1)SQL 语言大小写不敏感。 (2)SQL 可以写在一行或者多行。 (3)关键字不能被缩写也不能分行。 (4)各子句一般要分行写。 &#xff0…

进程动静态库

文章目录 动态库和静态库1. 静态库2. 动态库 承接上文: 文件描述符 动态库和静态库 静态库与动态库: 静态库(.a):程序在编译链接的时候把库的代码链接到可执行文件中。程序运行的时候将不再需要静态库动态库&#xf…

python绘制R控制图(Range Chart)

R控制图(Range Chart),也称为范围图或移动极差图,是一种用于分析和控制生产过程中的变异性的统计工具。它通常与Xbar控制图(均值图)一起使用,可以提供关于生产过程变异性的额外信息。以下是R控制…

ArgoCD集成部署到Kubernetes

1:环境 kubernetes1.23.3ArgoCD2.3.3 2:ArgoCD介绍 Argo CD is a declarative, GitOps continuous delivery tool for Kubernetes. Argo CD是一个基于Kubernetes的声明式的GitOps工具。 那么,什么是GitOps呢? GitOps是以Git为基…

feign整合sentinel做降级知识点

1&#xff0c;配置依赖 <!-- Feign远程调用依赖 --><dependency><groupId>org.springframework.cloud</groupId><artifactId>spring-cloud-starter-openfeign</artifactId></dependency> <!--sentinel--><dependency>…

Linux使用操作(一)

Linux创建链接的方式 在Linux中&#xff0c;可以给文件创建链接。链接的意思可以理解是快捷方式&#xff0c;它指向另一个文件或目录。 软链接 软连接&#xff08;也叫符号链接&#xff09;是一种特殊类型的文件&#xff0c;它指向另一个文件或目录 语法 ln -s 原文件路径…