既要仰望星空,更要脚踏实地。在被巨大的技术风口裹挟了一年多后,我们与大模型的“相处方式”越来越清晰了。
3月28日,在博鳌亚洲论坛2024年年会现场,我们与百度集团执行副总裁、百度智能云事业群总裁沈抖进行了一次深度交流。
在参与和观察了国内企业过去一年落地大模型的实践后,沈抖分享了自己的思考。他认为,大模型的产业落地不能用爆款思维,企业要尽快把大模型用起来,但不能冒进,潜移默化式的渗透才能从量变到质变。他多次提到“应用”才是大模型的真正价值,企业要到研、产、供、销、服每个环节中去找落地场景。在现阶段,但凡与“信息流通”有关的环节,都应该加入大模型提效。
当谈到给企业智能化升级的建议时,他说:想多了都是问题,做起来全是答案。
以下是对谈部分精华内容。
大模型产业落地一年情况如何?
大模型正在化身新质生产力
1、目前大模型在国内的产业落地如何?您如何看待中国在发展新质生产力方面的进展?
沈抖:新质生产力,我认为最核心的是创新。而人工智能和大模型,毫无疑问是创新最前沿的领域之一。
过去一年,生成式AI已经被企业真正用起来了。从百度的数据来看,百度文心一言C端用户已经超过了1亿;而在B端,用百度智能云千帆大模型平台开发应用的客户已经超过了8万,开发出了16万个应用。
具体来说,例如互联网、教育、电商、政务等数字化程度较高的行业,更适合大模型落地,在落地速度上也更快。
比如河南、重庆的一些县级政府,基于文心大模型开发了“居民助理”,把AI政务问答做进微信小程序,村民可以在微信群里问AI各种各样的问题,如医保缴费、婚姻登记、户籍办理等等。春节期间,它每天的调用量能达到60-70万次。以前没有这样的助手,村民想找到这些问题的答案,很麻烦,而大模型可以提供一种便捷的解法。在很多类似的场景,甚至更广泛的智能客服场景下,大模型都可以帮助满足用户的需求。
还有一些传统行业,大模型落地速度比我们想象的要更快,潜力巨大。比如制造业,大模型已经在质量管控、安全生产、智能调度这些核心场景上用起来了。
比如说,中天钢铁基于我们的大模型平台,打造了“智能问数”,把过去老师傅的经验灌给大模型,就能帮助新员工及时发现、处理关键设备的故障问题,还能帮助企业管理层时刻掌握生产经营里的关键数据指标。比如你问他“最近一周几条生产线的产量怎么样?”,或者“相比上周有啥变化”,它可以快速分析、决策和调整生产线。
从这些案例可以看到,无论是我们的日常生活还是工业生产,大模型都在发挥作用了,帮助提高生活的便利度、生产的效率,实际上是靠创新推动了生产力的发展。
2、您认为,在AI领域新质生产力如何才能更好的发展,惠及更多人?
沈抖:首先,我觉得AI和大模型的技术还得持续提升,归根结底,科学技术是第一生产力。
其次,我觉得一定要做到技术普惠。所谓普惠,就是得有好的工具链、好的AI人才培训培育机制等,能让更多的人参与进来。我们最终应该实现的是机器和人之间的“乘积效应“,而不是机器和人之间相互替代的“零和博弈”,只有这样AI才能发挥更大的价值,让更多的人因此受益。
另外,我觉得要抓住当前人工智能产业落地的窗口期和机遇期。今年的政府工作报告中也提出要做“人工智能+”,国资委也召开了央国企会议来推进人工智能在各场景落地,号召央国企打开场景,让更多的人来用,这些利好政策会加速大模型渗透到各个行业里去。
现阶段企业该如何使用大模型?
与“信息流通”有关的环节,都应加入大模型提效
3、“人工智能+”未来是每个企业都要做的事,在现在这个阶段,企业应该如何做智能化升级?您有什么建议。
沈抖:第一是,千万不能冒进。有的企业觉得大模型什么都能解,所以要先花大价钱做一个底座。而且现在很多人认为大模型越大越好,参数百亿不行,非得上千亿、万亿,而且确实有企业会迎合这样的需求,反正你要多大的参数我都有。我觉得这是不够客观、不够实事求是的。在解决行业问题的时候,一定要根据自己的需求,绝对不是模型越大越好;而且一些小模型,针对特定的场景经过微调之后,出来的效果比大模型还要好,而且成本低。
第二,也不能不积极,不能只想着做爆款。大家都在聊大模型要到产业里面去、到场景里面去,其实很多场景是靠挖掘出来的。大模型出来后,我们发现它能力很强,但它也不是神器,不是妙药,不是放到哪里它就能立刻生效。其实它应该是在研、产、供、销、服的每个环节,但凡与信息流通有关的环节,都应该把大模型加进去提效。
我觉得,大模型的产业落地不是“爆款思维”,反倒我认为大模型的能力最后就像氧气一样,深入到我们生活的方方面面,就是这样一个过程。
第三,我觉得还是要有一点耐心。其实我们拉长周期来看,任何一个新技术出现以后,你回头看当时的改变都是疾风骤雨似的,但是当时身在其中的时候反而没太感觉到。大家感觉大模型现在真的影响了我们很多吗?也没太感觉到。但是从百度过去一年的实践看,很多企业在核心场景中都在使用大模型,你会发现它其实已经潜移默化在我们生产生活的不少环节中发生作用了。
所以我觉得既不能做技术的冒进,也不能坐在这里等,而应该把生成式AI应用到自己的研、产、供、销、服的各个环节里面去,实现降本增效。
4、中小企业如何实现数字化、智能化升级?
沈抖:因为中小企业的需求很分散,过去讲数字化和智能化升级的时候,很多中小企业会觉得成本高,不值得,我觉得这也正是大模型出现之后可以马上改变的。
过去的AI要想实现产业落地,还是要用旧的研发范式,每次都要端到端的重新训练一遍。而今天有了大模型就不用了,大模型变成一个很厚的技术底座,只要用少量数据微调一下就能达到很好的效果,这样就能把产业智能化最后一公里的事变得越来越简单,让更多人参与开发。这个问题解决了,中小企业就可以把AI用起来了。
5、大家都使用生成式人工智能了,算力需求会大幅增加吗?
沈抖:算力是一个永恒的话题,随着人工智能的发展,对算力的需求肯定会持续扩张。目前国内算力还是紧张的,但是相比去年理性了很多,去年其实是存在着恐慌式屯卡的现象,为了做大模型,很多人疯狂采购,今年大家都回到了理性消费的阶段。卡的资源还是紧张,但是相对于去年,有所缓和。
大模型真的规模化用起来之后,算力需求会很大,甚至不只是算力,将来电力需求也会很大。所以现在国内外的科技企业都在持续推动芯片、算力的迭代和进步。
另外,异构算力这件事,我觉得从技术上是可以突破的。百度已经实现了GPU卡和几款国产芯片,不同卡放在同一个计算集群里,去训练同一个模型。这个我觉得是可以在技术上实现的,也会变成一个趋势。将来卡的多元化、异构化是一个必然。因为也很难一家垄断,大家只用一款芯片。
中国的人工智能产业挑战在哪?
中国机遇大于挑战,AI应用有反超机会
6、一个多月前Sora发布出来后,很多人都觉得很震撼,您怎么看?
沈抖:大模型迭代的速度的确越来越快,步步突破我们想象的天花板。这次Sora出来,大家都觉得很惊艳,也有人指出它存在的一些瑕疵。我认为Sora确实比已有的文生视频模型提升了不少。
但这类模型,如果最终就是用来生成视频的话,它的应用范围和价值还是非常有限。关键是看,能不能因为技术突破让模型更好地理解物理世界的规律和逻辑。因为它一旦突破了,就可以打通信息世界和物理世界之间的关系,这样一来,应用的场景也将更加广泛。因此,我觉得归根结底要看这些技术用在什么地方,不仅仅是技术本身的进步,而是技术应用产生的价值的变化。
在视觉模型领域,中国的科技企业还是有很多机会。以百度为例,比如在自动驾驶领域,百度一直在用同类方式训练视觉模型,将道路上捕获的图像和视频转换为特定任务,让自动驾驶更智能、更安全。
7、从AI产业整体来看,和国外相比,您觉得我们有什么差距和超越的可能?
沈抖:从1956年AI的概念首次被提出以来,我觉得中国的学者、企业都在持续跟进。在这个过程中,中国已经在AI领域沉淀了大量积累和储备,无论是技术、产品上,还是人才上。
以百度为例,百度在人工智能的投入上非常早,而且是持续、高强度、系统性地在投入。百度在人工智能技术栈的四层架构(芯片层 — 框架层-模型层-应用层)都有布局,在芯片层有昆仑芯,在框架层有飞桨深度学习框架,模型层有大家熟知的文心大模型,再到上面的应用层,我们既有基于大模型改造的百度产品,也有在各行各业用上的产品。我们已经有了完整的人工智能技术栈,而且在这四层,我们还在持续迭代。
在与国际的竞争和差距上,我觉得一旦国内企业认知到差距后,大家还是非常勤奋、执着的,而且精益求精。中国企业对大模型的投入力度很大,我们在很快地迭代模型,并且在技术领先性上快速跟上来。
最重要的一点,中国有非常丰富的应用场景。就像在移动时代,我们虽然不是最早的移动技术发源地,但在中国打磨出了最完善、最丰富的移动应用和生态。同样的道理,大模型在中国也能找到大量的落地场景,而这种场景反过来,又会推动大模型的发展。
我认为最终还是应用决定了技术的价值,决定了技术发展的动力。如果没有用的技术,最终也不会走多远。大模型在中国还有很大的空间,而且现在已经看到这个趋势和苗头,还是非常令人兴奋的。
8、您认为,应该怎样帮助AI行业更好更快地发展?
沈抖:我觉得第一是该做基础设施建设,包括算力基础设施,以及模型微调、应用开发的工具链建设。只有把这些基础设施建好后,才能更方便地使用和迭代大模型。而且随着大模型应用深入,对底层算力、工具链的需求只会越来越大。所以我们首先要把基础设施建好,无论是百度这类科技企业提供基础设施,还是应用大模型的企业来拥抱这些基础设施,基建的动作都应该加速推进了。
第二,我觉得还是得大胆地打开场景、放开场景,去拥抱大模型。不论是央国企打开场景使用大模型和人工智能,还是任何一个企业在生产中可以用大模型改进的点滴流程,都应该积极拥抱。可能在最初,大模型不一定立刻能带来多大、多显著的收益,但一旦它有效运转起来,就可以明显地降本增效。
大模型时代的“打工人”何去何从?
“AI指令师”将成为一项必备技能
9、您去年在博鳌预言,许多人的职业将成为AI指令师,现在也确实看到很多相关课程在教大家成为指令师。一年后来看,您觉得,这个观点有没有得到大家普遍的认可?AI指令师会成为一个独立的工种,还是人人都要具备的一种素养?
沈抖:大模型虽然通用性很强,但它也得“到什么山上唱什么歌”,这就需要有一个适配、微调的过程,要么用特定数据进行模型微调,要么就优化指令,让它能理解、遵循指令去执行。
从实际落地的情况来看,现在能用好大模型的人很少。这也是为什么市面上出现了很多培训班,教大家用大模型的原因之一。
我们经常有很多客户找过来说,你能不能先告诉我大模型能干啥,然后在我的场景里,怎么用起来。当我们看了客户的业务后,发现真的是改几个指令,大模型在客户场景用的效果就变好了。这也说明,对很多企业来说,“学会用”是“用好”的前提。
百度在大模型相关的培训上,也投入了比较大的精力。例如我们推出了首个大模型实训营“千帆 AGIHouse”,给高级别技术人员进行大模型培训;我们也跟工信部的教育考试中心联合制定了国内首个“生成式人工智能应用师”岗位人才标准,并有配套的培训课程和资格认证考试。
当大模型应用的广度和深度扩展开来,就需要有更多的人能够调教大模型。未来,“指令师”可能未必只成为一个独立的工种,也会成为一项大家必备的技能。就像司机是一个工种,但其他很多人出于方便工作生活的需要,也得会开车。在未来的工作中,具备“指令师”技能的人才,需求量会越来越大。
10、这种指令师的技能,具有通用性,还是针对各行各业,会有独特性?
沈抖:首先,大模型有比较强的通用性,比如格式、流程、规范等,指令师的指令也相应地有一定的通用性。但到具体一个行业里,我们在给大模型进行Prompt(提示词)工程时,通常会给它举几个例子,如少样本提示,这些例子举得好不好就跟行业非常相关。如果能将行业经典的例子、逻辑和解题思路告诉大模型,那它以后解这类题目就比较有优势。因此,指令师也要具备行业特征,得有某一行业的know-how才能提供出好的例子来,否则模型也学不会。
11、很多“打工人”有很强烈的“AI焦虑”,因为不论是文本生成、文生图、文生视频都给他们的岗位产生了冲击。您觉得,大模型会对哪些行业的从业者带来影响?
沈抖:我认为可能最危险的是中间的那批人。比如,做很多重复工作的白领岗位受到的挑战会很大,蓝领不太受影响,精英型的人才也很难取代。
“打败你的不是AI,而是比你更先掌握AI的人。”我很同意这句话。AI一定会创造很多新的职业,大模型还在渗透的过程中,很多人还没有完全掌握,一旦掌握了这些AI工具,就能率先成为新职业的受益者。但如果大家没有转变思路,没有掌握新的工具,那么当这个行业被颠覆后,可能很多工作不需要做了。为什么“死守”在那儿?就像赶马车,更先进的汽车出现后,真的不需要车夫了。