大模型落地竞逐,云计算大厂“百舸争流”

作者 | 辰纹

来源 | 洞见新研社

从ChatGPT到Sora,从图文到视频,从通用大模型到垂直大模型……经过了1年多时间的探索,大模型进入到以落地为先的第二阶段。

行业的躁动与资本的狂热相交汇,既造就了信仰派的脚踏实地,也产生了投机者的浑水摸鱼,如今回头,大模型落地到底进行的怎样了,大模型厂商们又是如何实践的?

我们今天选取阿里、百度、腾讯、华为这四个头部云计算厂商,从他们或明或暗的战略路线,来窥视出大模型落地的路径分野。

01 阿里云:闭源开源两线并举 

不久前结束的阿里云AI智领者峰会·北京站上,阿里云CTO周靖人直接亮明了“底牌“,“阿里云是全球唯一一家既在持续做(大)模型开发,又做大量(大)模型开源的公司。”

之所以会两线并举,周靖人的解释是,为了满足用户和开发者生态对基础模型的不通需求,这也是“模型即服务“的内涵之一。

具体实践中,阿里云此次大会发布了闭源SOTA大模型通义千问2.5,根据权威基准OpenCompass的测评结果,通义千问2.5得分追平了GPT-4 Turbo,为国产大模型取得的最高排名。

开源路线上,自2023年8月以来,阿里云陆续开源了十数款模型,据官方公布数据显示,目前通义开源模型下载量已经超过了700万,最新开源的1100亿参数模型在多个基准测评收获最佳成绩,超越Meta的Llama-3-70。

虽然有了基础模型,但是各行各业的需求不同,即便是同一行业中的不同企业,他们之间的需求也很难被统一,因而标准化的基础模型很难被直接用起来,为此,阿里云贴着开发者生态的场景需求,升级了AI Infra平台——百炼,推出了百炼 2.0。

百炼 2.0依托阿里云AI基础设施,同时对模型开发、应用开发和算力底座等工具进行了升级,引入更多模型,还率先兼容LlamaIndex等开源框架,企业可自由替换能力组件来适配自身系统。

作为国内最大的云厂商,阿里云拥有最为庞大的业务规模和覆盖最全面的客户群体,在AI路线还远没有收敛的行业背景下,一面是客户需求的驱动,一面是对技术踏空的隐忧,阿里云在大模型上全面布局也就可以理解了。

如果再将阿里云3月份时的史上最大力度降价相关联,可以看出,阿里云的种种动作都指向一个目标,即实现云和人工智能业务的螺旋上升,暗含着对未来业绩增长的长远考量。

02 百度云:以AI原生应用为矛 

在几家云计算大厂中,百度云的规模最小,但由于大模型与百度一直坚持的AI技术路线强关联,加之去年3月推出文心一言后,又陆续在大模型工具平台、大模型对自身应用重构、大模型生态建设等方面,进行了一系列体系化的出击,使得其成为大模型行业中极为重要的一支力量。

百度的打法并不复杂,一方面通过对文心一言的持续进化,保证文心一言的能力始终处于第一梯队,去年的百度世界大会上推出的文心大模型4.0版本的参数规模达到万亿级别,综合能力不逊色于GPT-4。

另一方面强调原生应用重要性,李彦宏分析大模型应用竞争的本质是表示:“企业竞争,不是大鱼吃小鱼,而是快鱼吃慢鱼,比竞争对手更快决策,很可能你就赢了。”这事实上也是百度在大模型落地上的竞争策略:加速冲刺,多方探索应用可能,尤其看重“AI原生应用”。

百度首先用大模型对自己的产品进行了全面改造和焕新,基于现有的用户基础,获得真实使用反馈后,反过来加速大模型的迭代;然后与云服务相结合,提供智能算力资源和训练工具,帮助其他企业开发自己的模型。

为此,百度智能云推出了一系列平台或工具产品,如帮助生成营销材料的“擎舵”、文心大模型插件开发平台“灵境”,企业级大模型生产平台“千帆”等。

百度云今年春季召开的首届生态大会中,宣布面向三类市场——头部市场、价值市场和高潜市场,厘清与伙伴之间的分工协作边界,实现协同作战,其目的也是为了将场景快速闭环,加速大模型落地。

03 腾讯云:以实用主义落地实体经济 

腾讯入局大模型的时间比较晚,直到去年9月的腾讯全球数字生态大会上才正式发布自研的通用大语言模型混元大模型,在行业中一直是比较低调和另类的存在。

混元大模型发布之前,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生曾阐述过腾讯的大模型价值观,“通用大模型不一定是满足行业场景需求的最优解。企业需要有针对性的行业大模型,结合自己的数据做训练或精调,在合理的成本下,打造实用性更高的智能服务。”

实用主义由此被提炼出来。

一方面是关注大模型解决具体问题而不是参数大小,另一方面是用什么样的技术组合更有效率的解决问题。

腾讯云副总裁、腾讯云智能负责人吴运声曾表示:“几亿、几十亿、几百亿还是一千多亿,我们并不关心模型参数的那个数字,我们更关注的怎么解决客户的问题,希望用最有效,最低成本的手段去解决客户的问题。”

在具体实践上,腾讯云有着非常清晰的思考,第一步,铆钉标杆客户;第二部辐射整个上下游产业链的腰部企业,而破局的关键就是实体经济

目前,腾讯云已经携手政务等行业的头部企业,在20余个行业探索了超50个行业大模型的应用解决方案。以腾讯云数智人工厂为例,腾讯云MaaS能力可以让数智人分身复刻缩短至24小时,大幅降低成本。在文旅领域推出的文旅大模型,金融领域打造的OCR大模型都是已经落地的案例。

04 华为云:以算力底座为基础深入千行百业 

与很多大模型厂商在刚入局时死磕技术,专注于对标ChatGPT的能力有所不通,华为云的大模型战略一开始就是奔着落地去的,去年的世界人工智能大会上,华为轮值董事长胡厚崑演讲时表示,人工智能的发展关键在于“走深向实”,华为的定位是赋能产业升级,服务好千行百业,服务好科学研究。

围绕这个定位,华为的大模型战略出现了两条路径,一是大模型领域,从通用大模型到行业大模型,让人工智能使能行业,助力科研;二是算力领域,打造强有力的算力底座。

华为云盘古大模型3.0发布时,提出了“不作诗只做事”的口号,按照“5+N+X”三层架构,即基础模型、行业模型和场景模型,目前已经落地金融、制造、政务、煤矿、铁路等10多个行业,支撑400多个业务场景的AI应用落地。

一个最典型的场景,煤矿的智能化升级中,盘古矿山大模型只需导入海量无标注的矿山场景数据进行预训练,即可进行无监督自主学习,一个大模型可以覆盖煤矿的采、掘、机、运、通、洗选等业务流程下的1000多个细分场景的通用。目前,盘古矿山大模型已在全国8个矿井规模使用。

做强算力底座方面,华为的关键词是“自研”和“开放”

在相对底层的计算效率研究方面,华为的打法是架构创新,基于自研的达芬奇架构,推出昇腾处理器,围绕昇腾芯片打造昇腾AI集群,国内建设的规模最大的AI计算集群深圳鹏城云脑II期不但实现了全栈软硬件的自主可控,还蝉联了多项全球AI性能榜单的冠军,算力达到1000P。

不难看出,华为不但直接卖“鱼”,还传授“捕鱼”技巧。

05 结语 

综上所述,这四家云计算大厂对于大模型的落地虽然在打法上各有侧重,但目标还是非常一致,基本上都是在自身原有业务的基础上进行延展,或继续加长自己的长板,或开发出新的增量。

值得一提的是,除了在大模型的技术和业务层面进行竞争之外,这几家大厂还广泛参与到大模型创业公司的投资之中,目前中国估值前五的生成时AI独角兽(月之暗面、智谱AI、Minmax、零一万物和百川智能),阿里的参投率为100%,腾讯则投了百川智能、智谱 AI 、MiniMax 3家,此外深言科技、无问芯穹等大模型公司也曾进入到腾讯的投资名单。

这也是说,大模型的竞争不仅仅只停留在大模型上,资本层面的暗战同样激烈。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/634827.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

适用于当下的红色系统可视化大屏,大量图。

特定场合下使用红色系可视化大屏是可以的,但是千万要注意时间和场合,平时最好别用。

获取支持Windows7的最新Edge离线版本

从110版本开始,微软Edge和谷歌停止了对Win7、Win8/8.1的支持,后续又发布了几版安全更新,截止目前为止,能支持Win7的版本是 109.0.1518.140。 如果你想用最新版本谷歌浏览器,可以考虑下Supermium,这个浏览器…

内存马实战(持续更新中)

注:这篇文章记录在我的语雀里面,语雀格式好看一点,地址: https://ganmaocai.yuque.com/ghgp8x/zoy1yn/faet35ae9gpxzn61 计划 复现以下框架的内存马注入: shiro: 普通内存马 冰蝎马 WebSocket马 xxl-job…

C++ 计时器

文章目录 一、简介二、实现代码2.1 windows平台2.2 C标准库 三、实现效果 一、简介 有时候总是会用到一些计时的操作,这里也整理了一些代码,包括C标准库以及window自带的时间计算函数。 二、实现代码 2.1 windows平台 StopWatch.h #ifndef STOP_WATCH_H…

JWT的详解

一.什么是JWT JWT(JSON Web Token)是一种开放标准(RFC 7519),用于在网络应用间安全地传递信息。它是一种紧凑的、自包含的方式,用于在用户和服务之间以 JSON 对象的形式安全地传输信息。 JWT 主要由三部分…

计算机系统基础 7 分支程序的实现

简单条件转移指令 根据单个标志位的值(CF, SF,OF,PF,ZF)来确定是否转移, 如果条件成立,则(EIP) 位移量 ➡ EIP,否则什么也不做。 注意&#xff0…

c# 将数据库连接字符串写到配置文件中,及获取

考虑到代码的安全性,已经修改起来的方便性,我们常常不会将数据库连接字符串直接放在代码中,而是将这个字符串放到一个App.config配置文件中,赋值给一个变量,然后再在代码中引用这个变量。 具体做法如下: ①展开项目名称…

微星笔记本618爆款推荐清单,好评有礼活动火热进行中

微星笔记本618爆款推荐清单,好评有礼活动火热进行中 又是一年一度的618大促,作为电子数码产品的主场,准备选购笔记本的消费者早已翘首以盼有更实惠的价格~ 不负期待,微星笔记本携多款性价比爆款笔记本、Claw掌上游戏机&#xff0…

Google Find My Device:科技守护,安心无忧

在数字化的时代,我们的生活与各种智能设备紧密相连。而 Google Find My Device 便是一款为我们提供安心保障的实用工具。 一、Find My Decice Netword的定义 谷歌的Find My Device Netword旨在通过利用Android设备的众包网络的力量,帮助用户安全的定位所…

记录一个更新adobe软件导致加载PDF文件异常的问题

最近由于项目需要,没有办法把原有的adobe正版软件进行了卸载,换了个盗版软件,结果导致我的pdf文件加载的时候出现异常。 报错的语句是这个 string str = System.Environment.CurrentDirectory; // string fileName = MyOpenFileDialog(); axAcroPDF1.LoadFile(…

abs(-2147483648) == 2147483648?

从数学意义上,这是对的。但是,就怕但是。 #include int main() {long long v;v abs(-2147483648);printf("%lld\n", v);return 0; } 输出: -2147483648 我们从source code中一一解开. /* Return the absolute value of I. */ int abs (…

uniapp星空效果

uniapp星空效果 背景实现思路代码实现尾巴 背景 之前在网上看到过一个视频,使用纯css实现过一个星空效果。具体出处找不到了,我们按照他那个思路来实现一个类似的效果,还是先上一张图镇楼: 实现思路 首先我们这个效果使用的是…

Php composer 基础教程

一、什么是Composer? Composer 是 PHP 中的依赖管理工具。它允许声明项目所依赖的库,并且它将为您管理(安装/更新)它们。 二、如何安装? Linux 系统和 MacOS 系统 直接下载最新稳定版: 然后执行下列命令&…

去中心化的 S3,CESS 首创去中心化对象存储 DeOSS

Web3 在各个领域的应用和发展已成为讨论的焦点,尽管行业对 Web3 的定义各不相同,但一个普遍的共识是 Web3 赋予了用户对其数据的所有权和自主权。这一转变在我们的生活和工作与数字化越来越深入地融合之际至关重要,这意味着所有人类活动很快将…

【Linux】Centos7安装JDK

【Linux】Centos7安装JDK 下载 Oracle 官网下载 JDK17 https://www.oracle.com/cn/java/technologies/downloads/#java17 安装 使用rz命令上传 jdk tar 包,上传失败直接用 xftp 上传 在安装图形界面时,有勾选开发工具,会自动安装 JDK 需要先…

D435相机内参标定(无法直接应用在相机上)

打开roscore和相机 输入 rostopic echo /camera/color/camera_info 从而得到相机的内参 cameraInfo包含D、K、R、P四个矩阵。 矩阵D是失真系数,包括(k1, k2, t1, t2, k3) 矩阵K是相机内参,即 矩阵R是一个3✖3的旋转矩阵,仅对双目相机有效&…

每日5题Day9 - LeetCode 41 - 45

每一步向前都是向自己的梦想更近一步,坚持不懈,勇往直前! 第一题:41. 缺失的第一个正数 - 力扣(LeetCode) 今天这道题没有ac,写不动了,下次再通过吧,先给个半成品下次回…

微信小程序画布显示图片绘制矩形选区

wxml <view class"page-body"><!-- 画布 --><view class"page-body-wrapper"><canvas canvas-id"myCanvas" type"2d" id"myCanvas" classmyCanvas bindtouchstart"touchStart" bindtouchmo…

HackTheBox-Machines--Bank

文章目录 0x01 信息收集0x02 文件上传漏洞利用0x03 权限提升方法一&#xff1a;SUID提权方法二&#xff1a;配置不当提权 Bank 测试过程 0x01 信息收集 1.端口扫描 发现 ssh(22)、DNS(53)、HTTP(80) 端口 nmap -sC -sV 10.129.29.200访问 80 端口&#xff0c;页面为Apache2 U…

数据挖掘与机器学习——机器学习概述

一、什么是机器学习 机器学习的英文名称叫Machine Learning&#xff0c;简称ML&#xff0c;该领域主要研究的是如何使计算机能够模拟人类的学习行为从而获得新的知识。 机器学习与数据挖掘的联系&#xff1a;简单来说&#xff0c;机器学习就是让计算机从大量 的数据中学习到相关…