重新理解百度智能云:写在大模型开放后的24小时

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。 

作者| 皮爷 

出品|产业家 

过去的5个月,李亮很忙。

“从今年3月份文心一言发布之后,很多工业侧的企业,甚至是国央企,都主动来和我们探讨大模型的落地。”他表示,“也包括很多行业伙伴都找过来,说看如何一起打造具备服务共性的平台。”

作为百度智能云的一位工程师,过去的近半年时间里,他真切感受到了企业对AI大模型的热切程度。这种热切是企业对具备落地能力的新技术的期待,也更是担心落后的焦虑。

这不是个例。

伴随着OpenAI和国内一众大模型企业的频频发声,越来越多的“产业+AI大模型”框架正在清晰地呈现在企业面前,相较于之前的元宇宙、区块链等技术,AI大模型应用距离企业的真实场景更近,应用路径也更短,效果更“立竿见影”。

但在热火朝天的AI实践里,越来越多企业开始逐渐发现一个更为现实的问题:最佳的大模型切入点在哪?或者说,企业应该如何高效地构建适配自身的大模型?

问题背后,对应着一众企业在大模型转型路上的“挫折”。“现在很多企业的问题是有意愿,但没渠道;或者是尝试后,整体进度很慢。”一位投资人告诉我们,“中间包括数据清洗、标注,以及prompt的生成、模型微调、训练这些,市面上都没有特别易用的方式。”

实际上,这些现象也构成了尽管企业对大模型热情依旧高涨,但越来越多开始在迈出第一步同时保持“谨慎”态度,这种观望在清晰与否的转型路径,也更在参与其中的成本性价比。

不过,AI加速的好消息依旧在传来。在刚刚过去的8月31日,百度文心一言、商汤商量SenseChat等大模型首批通过了《生成式人工智能服务管理暂行办法》备案,正式面向全社会开放服务。此外,据悉,针对企业用户,百度智能云还将在9月5日举行的2023百度云智大会上宣布四大配套举措,旨在助力企业以更低成本更快捷方式使用上大模型。

在滚滚而来的AI洪流中,企业应该如何选择适合自己的大模型?或者说,在如今大模型开放的AI时代,怎样的AI大模型才能成为企业在AI数智化时代的最佳航船?

在8家大模型获批上线的当下,这个问题正在被加速推到台前。

一、AI需求,和背后的新产业命题

在得出答案之前,不妨先来看天平的另一侧:即客户AI落地的难点到底在哪?

“现在大家对于大模型在行业会怎么落地,有哪些完全颠覆性的应用,或者说这种能带来很大风潮的应用,会出现在哪儿,也都不是很确定。其实我们客户也很清楚的认识到这一点。”百度智能云一位解决方案工程师表示。

这是如今国内很多企业面临AI大模型的共性。即尽管企业对自身的业务场景有充分的认知,但大模型能做到哪一步,以及如何使用大模型进行原有业务的降本增效,这都是未知命题。

而对部分已经尝试的企业,问题则是更为尖锐。

“我们最开始使用的是国外开源模型,但最近也在考虑尝试重新接入国内的大模型,因为国外开源的中文语义理解太差了,基本的交互都出现问题。”一位低代码企业创始人这样告诉我们。

有同样感受的是另外一家农业方向的企业,在和其创始人的交流过程中,他直言,“从最开始做prompt,到后面一轮一轮的训练,包括数据清洗、高质量标注等等,整个过程的开销非常大的,训练效果还不是特别好,甚至不如原有界面。”截止到目前,这家企业的大模型产品仍然处在内测阶段,尚未对外使用。

在这些之外,更多的企业则是停滞在大模型的“第一步”——选型。

不过,在选型阶段,企业的顾虑有所不同。对目前大部分中小企业而言,其选型难的原因在于不清楚哪家底层大模型企业的产业能力强,这些能力包括产品能力,也更有对模型微调、知识增强等服务落地的要求。

而对大型企业而言,除了数据安全之外,产业理解和复用性是企业的最核心考量。“大企业更看重的是,你不仅要在我看重的这一点的业务上能做出效果,还有就是要在整个集团的复用性上,能和既有业务结合的效率要更高。”上述工程师表示。

在他的感知里,以央国企为代表的大型企业更多地希望大模型服务商是一个教练的角色,不仅要给到好的工具,还要教会企业怎么用,从长期提升价值。

从更大的视角来看,当下大模型落地的难点大概分为三个层面,一是企业不知道选择怎样的大模型,或者说企业不知道自身的需求怎样的大模型可以满足,视野范围内的大模型选项太少;二是对部分选择自建大模型的企业而言,其在prompt提示词和数据清洗、标注以及中文增强等工具链层面屡屡碰壁,投入太大或者经验不足;三是企业自身的数据安全和合规性较高,同时需要较深的产业know-how,对大模型服务商的功能能力要求较高。

不难感知到的是,如果从原子化服务的角度拆解来看,当下国内企业对大模型的需求已然不仅在产品层面,如参数、逻辑推理等硬核指标,更大的需求点涌现在服务侧,即对不同企业需求的一站式满足,这些满足或是在prompt层面、或在中文增强、数据标注、训练层面,再或是在产业场景适配乃至数据安全,以及最核心的成本层面。

大模型,已然从一道单纯的技术命题,悄然进化为一道糅合技术、产品、服务等全部环节的产业综合命题。

二、千帆背后,看见大模型的“真实表达”

在忙碌的几个月里,李亮对一家企业印象很深刻。

“有一个矿山行业的合作伙伴,在大模型的领域非常期望跟我们合作,想要通过大模型去进行整个的矿山的智慧化服务,包括安全生产的管理,安全生产的预警等等。”他说道,“我们现在在跟他进行多轮测试,有很多也有非常不错的测试效果。”

他的意外之处在于,像矿山这样的偏传统的企业,也开始主动找到百度寻求大模型方面的进展和落地。据了解,如今双方经过多轮共创,一个基于矿山场景的大模型已经接近成型。

实际上,这不是第一个主动找到百度智能云的企业。而百度智能云对这些产业伙伴的一个统一服务界面,正是在今年3月份正式推出的一站式企业级大模型平台“百度智能云千帆”。

作为唯一TO B大模型界面,百度智能云千帆也恰构成着百度大模型在如能源、金融、政务、交通等不同产业场景的真实表达,以及包括数据管理、模型训练、评估&优化、预测服务和Prompt工程和插件服务等全部大模型开发周期的能力展示。

而在刚刚过去的8月,它更是交出了一张亮眼的成绩单。

一个亮眼之处是,在本次对外公布的模型种类中,百度智能云千帆除了文心大模型的核心外,其也更全面接入Llama 2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33个开源大模型,成为国内拥有大模型最多的平台。

换言之,基于百度智能云千帆的“模型仓库”,除了文心大模型之外,企业可以自行适合自身的其它基础大模型产品。

此外,和其它模型仓库不同的是,百度智能云千帆对“模型仓库”内的模型进行了“二次加工”。

比如,在安全性层面,千帆对所有接入的第三方模型均做了模型安全增强,不仅保障文心大模型的内容安全,还保障了第三方大模型的安全输出;再比如在成本层面,对每一个接入的大模型,千帆都做了二次性能增强。

根据测算,在性能调优后,第三方模型体积可压缩至25%-50%,推理成本可降低50%。这意味着,相较于直接调用,企业在千帆平台上使用这些模型可极大地节约成本,提升效果。

与此同时,千帆对接入的大模型做了深度适配,其为企业提供模型再训练的全套工具链以及多种形式模型调优,其中包括SFT(全量参数微调、Prompt Tuning、Lora)及强化学习(奖励模型学习、强化学习训练)等等。

换言之,基于百度智能云千帆,不论是选择文心大模型,还是平台上的第三方开源大模型,企业都可以端到端地搭建自身的专属模型

不仅于此,在对外的服务能力上,百度智能云千帆可以为企业提供公有云和私有部署两种方式,包括上文所说的大模型落地难的推理、微调、托管,企业都可以基于公有云模式接入使用。而在本地部署方面,百度智能云千帆也更是可以纯软件和软硬一体的交付方式,充分满足企业本地部署的要求。

实际上,这些能力在也构成了百度智能云千帆在一众产业侧的真实落地。根据不完全统计,在过去的5个月时间里,千帆大模型平台在超过400个真实产业场景中实现了落地。截止目前,百度文心大模型已拥有中国最大的产业落地规模。

这些落地构成了中国大模型赛道的一个个特殊节点。比如在能源层面,百度智能云和国家电网联合打造的“设备运检知识助手”入选北京市首批十大行业大模型应用案例。与深圳燃气联合发布的“深燃-百度·文心大模型”,基于大模型能力,只需要进行微调,就可以形成针对性的行业模型能力,完成多个应用场景的任务。

再比如在金融层面,百度智能云与中信金控联合打造了基于大模型的数字人,让每一位银行客户都有自己专属的理财顾问,可以承担包括投研助手、投顾助手、营销助手、合规助手等在内的多个角色。

这些真实的产业落地侧写也更在一众中小企业侧。根据不完全统计,已经有超过10万家企业申请测试,这个数目伴随着如今面向全社会层面的开放动作,也更在加速倍增。据了解,在在开放的24小时内,文心一言共计回复网友问题数超过3342万个。

可以说,不论是在产品层面,还是服务层面,千帆大模型为企业提供的是一个开放兼容的大模型选择界面,在这里,企业既可以实现从0到1的端到端大模型搭建,也更可以寻求到包括数据标注、prompt在内的一众工具链能力,以最低的成本和门槛,构建出自身的专属大模型。

三、AI时代,我们需要怎样的大模型?

如今,越来越多人开始讨论的一个命题是:在如今的产业数字化时代,我们需要怎样的大模型?有的人的回答是产品,有的人的回答是服务,也更有人的回答是数据安全。

在这些回答背后共同折射出的一个现实是——大模型不再是一个单选题,而更是一个综合题。在这个新的时代帆船上,产品、服务、安全、开放等全部都需要成为必需品,甚至是从企业的落地层面来看,这些更是刚需品。

不过,这些问题也正在被作答。

以百度智能云为例,除了在产业领域侧联合企业进行落地之外,其也更是和生态伙伴联合打造了更多基于特定场景的产品。比如和软通动力打造的大模型基础设施软通天璇2.0,与微盟联合构建的AI应用型产品WAI,以及和金蝶、金山办公一起研发的专属领域大模型产品。

在这个新的团战背后,大模型正在以更加真实的姿态出现在各个产业场景和各个企业应用中,不仅是金融、能源,也不仅是大型的央国企,在如今百度智能云千帆的底座之上,越来越多的产业场景和越来越多体量的企业都正在齐力迈出AI大模型时代的第一步。

此外,从更大的视角也同样能清晰看到的是,这些产业的真实表达也恰在构成着大模型企业的产品和营收新增长飞轮。

根据不完全统计,截至目前,百度智能云千帆平台上有103款Prompt模板,包含对话、编程、电商、医疗、游戏、翻译、演讲等十余个场景。其中既有基于百度智能云在产业实践中积累的Prompt模板,也有来源于文心一言高频用户的Prompt模板。可以预见的是,作为大模型训练中最核心的环节之一,这些Prompt模板将使得千帆更容易被企业和市场欢迎。

而在财报层面,根据百度发布的2023年Q2财报显示,第二季度百度营收341亿元实现加速增长,净利润高速增长44%。此外,由《IDC中国AI公有云服务市场份额,2022》报告数据显示,2022年中国AI公有云服务总体市场79.7亿元,其中百度智能云占28.9%排名第一。

或者可以说,在AI大模型在成为各个产业基建企业验金石的同时,它也更在成为一个新的发动机。

进度仍在持续推进。在接下来的9月5日,百度智能云还将在2023百度云智大会上宣布四大配套举措。

据内部人士透露,在此次大会上,百度智能云将全面升级“千帆大模型平台”,升级将覆盖算力基础设施、大模型工具链、高质量数据集等等。此外,其将推出基于文心大模型重构的行业解决方案,同时还将发布覆盖服务营销、办公提效、生产优化三大领域的10款企业级的AI原生应用产品。大模型相关的生态政策也将在大会上同步披露。

或许再来回答前面那个问题,即“我们需要怎样的一个大模型?”——这不仅是一个对企业而言,寻找最佳选项的命题,也更是对大模型企业而言,锚定未来和自证的长期思考。

恰如百度相关负责人在采访中所说,“未来肯定还会有更多AI产品,或许这些产品不是百度开发出来,但企业都可以基于百度智能云千帆开发出来,这是我们想要的,也是会一直持续去做的。”

答案,已经在成形的路上。

*文中李亮为化名

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/99867.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

jmeter 线程组

在jmeter中,通过指定并发数量、启动延迟时间和持续时间,并组织示例(Samplers)在多个线程之间的执行方式,实现模拟并发用户的行为。 添加线程组: 在测试计划中,右键点击“添加” -> “Thread…

53 个 CSS 特效 3(完)

53 个 CSS 特效 3(完) 前两篇地址: 53 个 CSS 特效 153 个 CSS 特效 2 这里是第 33 到 53 个,很多内容都挺重复的,所以这里解释没之前的细,如果漏了一些之前的笔记会补一下,写过的就会跳过。…

【游戏开发教程】Unity Cinemachine快速上手,详细案例讲解(虚拟相机系统 | 新发出品 | 良心教程)

文章目录 一、前言二、插件下载三、案例1:第三人称自由视角,Free Look character场景1、场景演示2、组件参数2.1、CinemachineBrain:核心2.2、CinemachineFreeLook:第三人称自由视角相机2.2.1、设置Follow:跟随2.2.2、…

openlayers-16-添加一组轨迹动画

实现一组动画,即根据一组只有起止点坐标的线段,实现点在这些线段上较为平滑的移动,移动速度和平滑程度均可控制。 下面的代码仅作为思路参考,还欠缺很多细节,比如在进行插值计算时,还需要判断经纬度坐标差&…

6. vue-element-admin 二次开发避坑指南

vue-element-admin 二次开发避坑指南 1.1 前言1.1.1 切换标签时未保存页面的操作内容1.1.2 markdown 样式乱码1.1.3 修改默认尺寸1.1.4 当后端服务器宕机情况下页面加载层一直转圈无法停止,只能关闭页面1.1.5 隐藏齿轮 1.1 前言 上一篇博文,我们分享了vu…

传送带下料口堵塞识别检测算法 yolov5

传送带下料口堵塞识别检测算法通过python基于yolov5网络深度学习框架模型,下料口堵塞识别检测算法能够准确判断下料口是否出现堵塞现象,一旦发现下料口堵塞,算法会立即抓拍发出告警信号。Python是一种由Guido van Rossum开发的通用编程语言&a…

【VM】保姆级VM算法平台二次开发之-环境配置

VM算法平台二次开发 1.下载Visual Studio 20222.项目的创建 C# 应用3.设置属性,去掉属选型32位4. 进行引用的导入工作5. 重新加载,查看引用6. 工具箱添加Dll的依赖。(只需要加载一次就行) 1.下载Visual Studio 2022 可以直接在官…

【学习笔记】计算机视觉对比学习综述

计算机视觉对比学习综述 前言百花齐放InstDiscInvaSpreadCPCCMC CV双雄MoCoSimCLRMoCo v2SimCLR v2SwAV 不用负样本BYOLSimSiam TransformerMoCo v3DINO 总结参考链接 前言 本篇对比学习综述内容来自于沐神对比学习串讲视频以及其中所提到的论文和博客,对应的链接详…

ESXi 6.7添加螃蟹2.5g网卡支持

安装了ESXi 6.7,结果机器两块网卡只能识别一块,然后想着不能让另一块浪费啊,开始折腾,看着网上都是找的驱动然后封装进iso,可是我已经装完了,怎么办,然后找到了下面解决方法 1.找驱动 下载RTL81…

对话出海企业:2023亚马逊云科技出海日圆桌论坛

在全球经济亟待复苏的今天,持续对外开放是中国未来经济发展重要的“两条腿”之一。在愈发饱和的国内市场,中国企业需要对外寻找全新机遇才能在未来不确定的市场博弈下生存下去。“出海”,也成为近几年最炙手可热的词汇之一,大量中…

mysql通过.frm和.ibd 文件恢复数据库

问题背景:由于强制在服务关闭mysql导致部分数据表以及数据丢失 如下图只有.frm .ibd的文件为我的问题文件 查找不到表结构和表数据目录D:XXXX\mysql-5.7.24-winx64\data\mydata 从frm文件中恢复表结构 先把原来的数据备份一次 避免过程中出错 先备份之前数据的.fr…

Oracle的学习心得和知识总结(二十九)|Oracle数据库数据库回放功能之论文三翻译及学习

目录结构 注:提前言明 本文借鉴了以下博主、书籍或网站的内容,其列表如下: 1、参考书籍:《Oracle Database SQL Language Reference》 2、参考书籍:《PostgreSQL中文手册》 3、EDB Postgres Advanced Server User Gui…

数据结构入门 — 栈

本文属于数据结构专栏文章,适合数据结构入门者学习,涵盖数据结构基础的知识和内容体系,文章在介绍数据结构时会配合上动图演示,方便初学者在学习数据结构时理解和学习,了解数据结构系列专栏点击下方链接。 博客主页&am…

利用逻辑回归判断病人肺部是否发生病变

大家好,我是带我去滑雪! 判断肺部是否发生病变可以及早发现疾病、指导治疗和监测疾病进展,以及预防和促进肺部健康,定期进行肺部评估和检查对于保护肺健康、预防疾病和提高生活质量至关重要。本期将利用相关医学临床数据结合逻辑回…

DEAP库文档教程二-----创建类型

本节将展示如何通过creator创建类型以及如何使用toolbox进行初始化。 1、Fitness 已经提供的Fitness类是一个抽象类,它需要weight来使得它成为一个函数。一个最小化的适应度是通过负权重构建的,而一个最大化适应度则需要正权重。 creator.create(&quo…

算法通关村第10关【青铜】| 快速排序各种写法

思路: 指定一个数字,将数组比他小的放到左边,比他大的放到右边,实现归位 然后再指定一个数字递归,一直遍历完数组 最好的情况每次指定的都是中间位置的数字,划分完后两边长度相等,2T(n/2) O…

Ansible之playbooks剧本

文章目录 一.playbooks介绍1.playbooks简述2.playbooks剧本格式3.playbooks组成部分4.运行playbooks及检测文件配置 二.模块实战实例1.playbooks模块实战实例2.vars模块实战实例3.指定远程主机sudo切换用户4.when模块实战实例5.with_items迭代模块实战实例6.Templates 模块实战…

【BUG事务内消息发送】事务内消息发送,事务还未结束,消息发送已被消费,查无数据怎么解决?

问题描述 在一个事务内完成插入操作,通过MQ异步通知其他微服务进行事件处理。 由于是在事务内发送,其他服务消费消息,查询数据时还不存在如何解决呢? 解决方案 通过spring-tx包的TransactionSynchronizationManager事务管理器解…

OpenShift 4 - 用 Prometheus 和 Grafana 监视用户应用定制的观测指标(视频)

《OpenShift / RHEL / DevSecOps 汇总目录》 说明:本文已经在 OpenShift 4.13 的环境中验证 文章目录 OpenShift 的监控功能构成部署被监控应用用 OpenShift 内置功能监控应用用 Grafana 监控应用安装 Grafana 运行环境配置 Grafana 数据源定制监控 Dashboard 演示视…

LeetCode(力扣)669. 修剪二叉搜索树Python

LeetCode669. 修剪二叉搜索树 题目链接代码 题目链接 https://leetcode.cn/problems/trim-a-binary-search-tree/ 代码 递归 # Definition for a binary tree node. # class TreeNode: # def __init__(self, val0, leftNone, rightNone): # self.val val # …