8个月过去了,中国大模型落地进展如何?

就目前来看,大模型落地金融、能源行业先行,智能客服等生成类应用大于决策类应用,落地价值不及预期。然而随着行业定制化、模型轻量级化和数据安全化等技术的发展,AI大模型的落地应用将迎来更加广阔的发展空间。 

作者|斗斗 

编辑|皮爷 

出品|产业家 

距离ChatGPT爆发的那一天,已经过去8个月了。

8个月的时间,中国诸多大模型拔地而起,以飞快的速度,不断向各个行业场景渗透。但就目前为止,并未出现真正被大模型颠覆的场景或行业。

统计数据显示,在大模型落地应用中,45%的企业处于观望阶段、39%的企业处于探索可研阶段、16%的企业处于试点应用阶段,而全面应用的企业为零。

一个值得被看见的问题是,如今在中国的土壤里,大模型的落地进展究竟如何?

一、大模型落地,金融、能源先行

“请帮我查一下我今年8月份的用电量,以及哪天用电最多?”“帮我检测一下这张图片有什么缺陷”……在南方人工智能创新平台上,通过语言交互,一项项数据清晰的被展现在眼前。

在这个平台上,电力行业工作人员可以向电力大模型发布指令,让其自动生成数据处理结果,准确识别缺陷场景的图像细节,帮助工作人员检索处理电力巡检过程中的数据。

目前,在南方电网客户服务领域,60%的高频问题都可通过电力大模型解决,在识别客户情绪波动方面,电力大模型的效果甚至优于人工。

此外,在输配电领域,电力大模型已具备每分钟处理100张问题图片的能力,还能同时识别20类缺陷,识别效率是传统AI算法的10倍。

而在电力调度领域,电力大模型能够协助调度部门针对电网异常情况快速自动化生成处置预案,及时响应电力市场调节要求,使预案更加安全、高效,成本更低。

这是大模型在能源领域落地的一个缩影。

据了解,部分能源头部厂商已经开启了与科技公司在大模型应用方面的合作,尤其在电网与矿山领域,形成了一些初步试点示范,如电网调度、缺陷/故障查询、煤矿作业监测等场景。

除了能源领域,金融领域也是目前大模型最大落地场景之一。

一份来自爱分析的报告中,也将能源、银行列为了大模型落地进展最快的两大行业。

在金融领域的落地之广,从大模型的数量和企业动态也可见一斑。一组数据显示,截止8月,国内参数在10亿规模以上的大模型数量高达116个,其中金融行业大模型约18个。

此外,在半年报中,工商银行、农业银行、中国银行、交通银行、招商银行、中信银行、兴业银行、华夏银行、浙商银行等9家银行明确提出在探索大模型的应用。

在大模型厂商侧,一些密集的行业模型发布也反映出金融场景落地的火热程度。

例如5月下旬,度小满发布了千亿级中文大模型「轩辕」;6月份,腾讯云携手神州信息开展金融大模型的合作,中国农业银行推出类ChatGPT的大模型应用ChatABC,中国工商银行发布了基于昇腾AI的金融行业通用模型。

7-8月,随着《生成式人工智能服务管理暂行办法》正式实施,包括腾讯、百度、科大讯飞、华为、字节跳动等多家公司,又相继释放了最新的大模型进展;9月,蚂蚁集团也正式发布了金融大模型,并开源生成式AI编程平台CodeFuse。

金融领域,无疑是大模型落地的最多场景之一。

无论是能源领域还是金融领域,之所以能够实现大模型的领先落地,都源于这两个行业的一些共性。

首先,能源和银行业都是高度数据化的行业,具有较好的数据基础和数字化环境,这为大模型的训练和应用提供了有利条件。

其次,两大行业均有大量的数据处理和决策需求,而大模型的机器学习和深度学习技术可以帮助行业解决这些难题,提高决策效率和准确度。

再有,能源和银行业的业务模式相对比较成熟,具有较高的商业价值,因此这些行业对大模型技术的需求也比较大,从而推动了大模型的落地应用。

可见,能源和银行两大行业在大模型落地进展中相对较快,主要是由于其数据基础好、技术需求大、商业价值高等多方面因素的综合作用。

值得注意的是,即使在金融、能源这两个落地场景中,大模型仍有一些目前难以跨越的难题。

二、达不到预期的场景价值

在金融行业,营销、风控、运营三个方向是诸多银行关注较多的大模型应用方向。

其中,智能问答助手、智能客服、营销图片自动生成、贷后报告撰写是当下银行等金融机构积极布局的细分场景。但就目前而言,生成类场景如智能问答助手、智能客服、营销图片自动生成等场景价值与预期相差无几,但在如沉睡客户唤醒、数字营业厅这类决策、原生类应用场景,大模型落地的预期和实际效果仍有差距。

例如在智能客服场景,过去智能陪练题库少,缺少针对性。如今基于大模型生产个性化题库,可以缩短培训周期上;在营销图片自动生成场景,过去设计师在素材库中选取并设计,如今可以利用Midjourney自动生成,可以降低版权成本和人力成本。

而在沉睡客户唤醒和数字营业厅场景价值预期中,前者利用大模型自动生成策略,可实现端到端的策略改善唤醒效果;后者大模型支持的数字人帮助客户办理业务、推荐产品完成交易,可实现独立于APP之外的新渠道。

然而,就目前来看,这两个场景的实际应用价值都尚未可知。

能源行业的大模型落地应用亦相似之处。

在能源行业,设备运检知识助手、智能客服等生成类应用,场景价值与预期相差无几。但在如检修文档、设备故障维修、电力负荷预测等场景,场景实际价值仍未可知。

具体来看,在设备运检知识助手场景,过去是基于NLP技术构建结构化知识库,在大模型的加持下,可利用大模型构建运检助手,改善效率;在智能客服场景,过去是基于Bert模型的智能客服,如今利用大模型改善智能客服的用户体验,可实现意图理解更准确、语言更拟人化,用户体验得到改善。

检修文档生成、设备故障维修、电力负荷预测场景中,大模型落地可带来的价值分别是,快速自动生成文档实现效率提升;大模型快速定位故障原因,提供检修建议和方案;纳入更多影响因素实时预测负荷,提高预测准确率。

然而,就目前来看,这些场景中大模型带来的价值都尚未可知,仍需时间不断探索。可以发现无论是金融行业还是能源行业,生成类场景落地速度快,应用较多,决策类场景落地速度较慢且难度较大,应用较少。

三、“生成场景>决策场景”:难转化的生产力

就目前而言,大模型的落地仍处于试点应用阶段,并非全面上线。

正如上文所言,金融行业的智能问答、智能客服、数字营业厅、贷后报告生成、沉睡客户唤醒、金融产品推荐等AI大模型应用已经逐渐落地;能源行业的智能客服、设备运检知识助手、检修文档生成、电力系统仿真平台、电力负荷预测等已经试点应用。

然而,消费品零售、证劵、媒体还处于探索阶段,此外制造业、药企还处于观望阶段。

由此可见,大模型落地虽广度上较为乐观,但深度上却较为艰难。

大模型落地的深度取决于其能力、规模、计算资源、数据质量、领域知识等。然而,对于当下的国内大模型而言,处于发展初期,很多设施和能力还在逐步完善。

受限于模型能力、应用效果等因素,当前落地应用以生成场景为主。

与决策大模型不同,生成式大模型主要应用于文本生成、对话系统、语言翻译等领域,通过分析大量文本数据,学习文本的生成规律和内在语义关系,从而能够生成高质量的文本输出。生成式大模型的代表模型包括OpenAI的GPT系列和百度文心一言等。

而决策大模型主要应用于推荐系统、强化学习等领域,需要处理的数据通常包含连续的数值变量,而且需要做出决策或预测未来的行为。决策大模型的代表模型包括DeepMind的AlphaZero系列和OpenAI的Dota2 AI等。

相比决策大模型,生成式大模型首先在在文本生成和对话系统中,数据可以通过大量的文本语料库进行收集和整理,而在推荐系统和强化学习中,数据通常需要人工设计和构造,相对较为复杂。

其次文本生成和对话系统等领域的研究已经比较成熟,有许多现成的算法和框架可以使用,而推荐系统和强化学习等领域则需要更多的探索和研究。

再有文本生成和对话系统等领域的应用场景非常广泛,如搜索引擎、聊天机器人、自动写作等,而推荐系统和强化学习等领域则主要应用于电商、广告、游戏等领域。

一个事实是,虽然生成类场景应用较广,但预测类决策场景是未来高价值场景。无论是大模型供应商,还是企业,想要基于大模型能力实现业务价值的提升,后者才是发力的方向。

四、行业场景中,再看AI大模型

大模型落地首先需要选择合适的领域和场景。该领域场景有着较强的数字化能力和数字化基础。

例如,在智能客服领域,可以考虑将大模型应用于FAQ问答系统和聊天机器人等场景;在广告推荐领域,可以将其应用于电商平台的个性化推荐等场景;在舆情监测领域,可以将其应用于新闻媒体的内容分类和情感分析等场景。

其次要具备较高的模型能力、应用效果等。而从当前企业用户落地大模型的主要路径来看,集团企业重点是大模型能力建设,一般企业/部门重点是应用场景探索。大模型能力建设分成三个层面:基础设施建设、大模型训练和大模型应用,当前以基础设施建设和大模型训练为主,大模型应用较少。

值得注意的是,目前大模型应用方向主要分为两种,一是小模型为主,大模型提升小模型的开发效率;二是大模型与小模型级联,小模型连接应用,大模型增强小模型能力。

而这种落地路径使得模型能力受限。

想要推动大模型落地深度,大模型供应商、企业需要在能力、合作模式上不断探索。

一些深化大模型落地的路径逐渐清晰。

未来,随着大模型技术的不断发展和普及,模型级联的应用将会越来越广泛。

例如,可以将多个大模型进行组合和级联,实现更复杂、更精准的语音识别、图像识别、自然语言处理等应用场景。同时,也可以将大模型和小模型进行级联,充分发挥各自的优势,提高模型的性能和泛化能力。

基于此,扩展大模型落地的应用深度,加速各领域决策类场景应用落地。

其次,不同行业有着不同的特定需求,未来大模型需要朝着更加定制化的方向发展。通过对行业特定语料库的训练,大模型可以更好地适应不同行业的实际应用场景。

其次,为了更好地满足实际应用中的效率和资源需求,大模型需要朝着更加轻量级化的方向发展。通过模型压缩和剪枝等技术,可以在保证模型性能的同时,降低模型的大小和计算资源消耗。

此外,随着数据隐私保护问题的日益突出,大模型需要更加注重数据的安全性和隐私保护。

模型的定制化、轻量化、数据安全化成为其落地的重要因素。

中国AI大模型的落地应用在智能客服、广告推荐、舆情监测等领域取得了一系列的成果。然而,在落地过程中也面临着诸多困局。未来,随着行业定制化、模型轻量级化和数据安全化等技术的发展,AI大模型的落地应用将迎来更加广阔的发展空间。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/138308.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

CPS:实现销售和广告的完美结合

随着互联网的快速发展,电商行业呈现出爆炸性的增长。在这个充满竞争的市场中,如何有效地吸引和引导消费者购买产品,成为电商企业成功的关键。而CPS(Cost Per Sales)作为一种创新的广告模式,正逐渐成为电商行…

关于pip basicsr,facexlib,realesrgan et al.安装报错。

首先basicsr是一个超分的库,在ubuntu系统上pip时会报错。 上图这种错误,或者其他的错误,有的方法让去github上安装,那种方法到setup.py的时候也会报错。 问题在于首先 -i的源要换成阿里的源,然后要安装他要求的库&…

ds前后台博客系统

源码私信或者公众号java大师获取 博客简介:本博客采用Spring Boot LayUI做为基础,进行的博客系统开发,与bootvue相比,更为适合开发简单的系统,并且更容易上手,简单!高效!更易上手&a…

【Java】集合(一)单列集合List

1.集合 可以动态保存任意多个对象,并提供了一系列的操作对象的方法:add、remove、set、get等。 2.集合框架体系 分为两大类: 单列集合和双列集合 3.List接口基本介绍 List接口是Collection接口的子接口 List集合类中元素有序&#xff0…

使用 `open-uri.with_proxy` 方法打开网页

Ruby 爬虫程序如下: require open-uri require nokogiri# 定义代理信息 proxy_host jshk.com.cn# 定义要爬取的网页 URL url http://www.example.com# 使用代理信息打开网页 open-uri.with_proxy(proxy_host, proxy_port) do |proxy|# 使用 Nokogiri 库解析网页内…

mysql主从复制和读写分离

什么叫主从复制? 主从复制架构图和数据流向 主MySQL上的数据、新增、修改库、表、表里的数据。都会同步到从MySQL上 面试题:MySQL的主从复制模式 1、 异步复制:MySQL的默认复制就是异步复制。工作中也一般使用异步复制。只要执行完之后&am…

excel记录wFm数值(推理过程)

1 导入计算wfm库2 实例化具体的指标 3 列表循环之前,设置空list 4 单图评测-将图号、图片名、数值记录 列表里面存储dict 5 将excel列表结果逐个存入excel.xlsx文件 完整代码 test_CPD.py ### test_CPD.py ### import torch import torch.nn.functional as Fimpor…

Autosar模块介绍:FEE(Flash模拟EEPROM)

上一篇 | 返回主目录 | 下一篇 Autosar模块介绍:FEE(Flash模拟EEPROM 1 基本术语解释2 Ea组成结构图3 Ea基本操作3.1 通用操作3.2 作业的进程(通用需求)3.3 读操作过程3.4 写操作过程3.5 擦除过程3.6 比较过程 4 Ea常用操作时序4.1 初始化4.…

SpringBoot日志全方位超详细手把手教程,零基础可学习 日志如何配置及SLF4J的使用......

🧸欢迎来到dream_ready的博客,📜相信您对这篇博客也感兴趣o (ˉ▽ˉ;) 📜SpringIOC和DI的代码实现,Spring如何存取对象?Controller、Service、Repository、Component、Configuration、Bean DI详…

【沐风老师】3dMax使用克隆修改器插件创建旋转楼梯教程

3DMAX克隆修改器插件,它通过增量平移、旋转和缩放输入几何体来创建对象的副本。在某些方面,它类似于 3dMax 的内置“阵列”工具,但有一个主要优点 -克隆修改器是完全参数化的,因此您可以随时更改重复项的数量及其分布。其他功能包…

LeetCode-剑指 Offer 22. 链表中倒数第k个节点(C语言 )

目录捏 一、题目描述二、示例与提示三、思路四、代码 一、题目描述 给定一个头节点为 head 的链表用于记录一系列核心肌群训练项目编号,请查找并返回倒数第 cnt 个训练项目编号。 二、示例与提示 示例 1: 输入: head [2,4,7,8], cnt 1 输…

北大Cobot V4.3换新登场

库博SAST V4.3焕然一新,重装上市。作为国内最早的研究并成功开发SAST产品的团队,北大软件下属与北京大学国家工程与软件工程研究中心组成的库博团队,从2012年就起步研发静态应用安全测试产品—Cobot。历经10余年迭代升级,目前已经…

JAVA数据代码示例

首先,我们需要导入一些必要的Java库 java import java.net.URL; import java.net.HttpURLConnection; import java.io.BufferedReader; import java.io.InputStreamReader; 然后,我们可以创建一个URL对象,表示我们要爬取的网页的URL。 jav…

Linux安装微信

Linux安装微信 环境:ubuntu 20.04 https://archive.ubuntukylin.com/ubuntukylin/pool/partner/weixin_2.1.4_amd64.deb sudo dpkg -i weixin_2.1.4_amd64.deb完成 参考文章

uniapp h5发行

前端使用uniapp开发项目完成后,需要将页面打包,生成H5的静态文件,部署在服务器上。 这样通过服务器链接地址,直接可以在手机上点开来访问。 打包全步骤如下: 首先在manifest.json文件中进行基础配置,获取…

银行数据中心机房动力环境监控系统设计与优化

安科瑞电气股份有限公司 上海嘉定201801 摘要:结合银行数据中心建设项目,设计银行数据中心机房动力环境监控系统,分析银行数据中心机房监控对象、搭建系统监控架构,给出监控实现方法,*后针对运行一段时间出现的问题&a…

优雅的Java编程:将接口对象作为方法参数

theme: smartblue 目录 概述 在Java编程中,方法的参数传递方式通常是通过基本类型、对象引用或者集合等方式。然而,一种更加优雅且灵活的设计模式是将接口对象作为方法的参数。这种方式为我们带来了许多好处,包括降低耦合性、实现多态性和可…

极智芯 | GPU架构与计算能力

欢迎关注我的公众号 [极智视界],获取我的更多经验分享 大家好,我是极智视界,本文分享一下 GPU架构与计算能力。 邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https:…

【.汇编语言基础入门】—— 汇编的基础介绍

文章目录 一、机器语言二、汇编语言三、CPU 与 CPU 内存1、CPU 对存储器的读写 四、CPU 的典型构成1、寄存器2、通用寄存器3、物理地址的计算方法4、CS5、DS6、SS SP 一、机器语言 在学习汇编语言之前,我们应该先了解一下什么是机器语言。机器语言是机器指令的集合&…

索引下推(ICP)是什么意思?如何理解?

目录 1. 索引下推概述 2. 索引下推举例 3. ICP 的主要作用 1. 索引下推概述 ICP 全称 Index Condition Pushdown,是MySQL5.6之后的一个新特性,它是一种在存储引擎层使用索引过滤数据的一种优化方式。 2. 索引下推举例 下面是数据库的一张 employee…