大模型2024规模化场景涌现,加速云计算走出第二增长曲线

导读:2024,大模型第一批规模化应用场景已出现。

如果说“百模大战”是2023年国内AI产业的关键词,那么2024年我们将正式迈进“应用为王”的新阶段。

不少业内观点认为,2024年“百模大战”将逐渐收敛甚至洗牌,而大模型在千行万业的应用将从小规模试水,逐渐走向规模化落地。

展望2024,哪些场景更有可能率先实现大模型的规模化应用?

如果将大模型的应用场景分为互联网和政企两大类,基于产业观察,「智能进化论」认为:

在互联网领域,搜索增强、多媒体内容生成(AIGC推理)、智能NPC、量化投研有望成为第一批规模化应用的场景;

在政企领域,政企AI算力调度平台、智能驾驶、销售预测、柔性制造、国产化AI大模型中心等场景走得更快,同时中小企业大模型体验版也有相当大的潜力。

透过大模型在TOP场景的落地,我们不妨追问,这些场景之间有什么共同之处吗?谁在推动大模型跨越规模化应用的奇点?

TOP场景盘点,大模型下一个杀手级应用在哪?

——大模型在互联网领域的规模化应用场景——

在互联网领域,2023年国内诞生了众多聊天机器人、文生文、文生图AI应用。其实,从搜索引擎、多媒体内容到游戏,中国领先的移动互联网生态与大模型的碰撞藏着无限可能,大模型下一个杀手级应用也许就会从中诞生。

  • 搜索增强

搜索增强/检索增强生成技术(RAG)已成为当前最火热的LLM应用方案,被认为能够有效解决知识的局限性和时效性、幻觉等大模型应用的核心痛点。

此前大模型的知识来自训练数据集,而对实时性、非公开的或离线的数据是无法获取到的。搜索增强能够让大模型与实时互联网信息和垂直专业知识库连接,极大拓展了大模型的应用范围。

比如,过去搜索引擎通过关键词检索的方式返回结果,用户还需要花费大量时间精力去筛选原始网页和内容,才能找到想要的信息。通过搜索增强,大模型可以带来更精准的搜索结果,让搜索引擎变成集知识的发现、处理、分析和重新组织为一身的个人智能助理。

搜索增强同时具备检索和生成两种能力。如果将互联网信息比作一座拥有海量知识的图书馆,搜索增强融合了图书管理员和作家两种角色。图书管理员首先能够精准理解用户意图,然后快速从海量知识库中找到最相关的内容,再由作家将内容生成一个清晰易懂的答案,交付给用户。

搜索增强应用范围极广,包括搜索引擎网站、各类垂直APP内的搜索功能、千行百业的智能客服、企业内部知识库构建等等。

  • 多媒体内容生成(AIGC推理)

麦肯锡数据显示,中国生成式AI市场2020~2025年复合增速将达到84% ,2025年中国市场将占全球市场规模的14%。

多媒体内容生成是普通人最有感知的AI场景,也是大模型最火热的应用领域之一。2023年,从AI孙燕姿到妙鸭相机,多个热门AI应用和现象都来自这一场景。AIGC也推动了影像、设计相关领域公司收入大涨。譬如根据2023年上半年财报,在AIGC推动下,美图公司以VIP订阅为主的影像和设计产品业务成为第一大收入,公司实现净利润同比增长320.4%。

多模态大模型提供的文生图、图生图、文生视频、文生3D、数字人生成等能力,能够快速、生成海量高质量创意内容,颠覆了内容产业的商业模式。此外,大模型结合AI增强、云渲染等技术,还能广泛应用于生成高分辨率图片和视频、噪点消除、老片修复和上色、高精度3D建模和3维重建等场景。

值得注意的是,2023年5月几名B站UP主基于开源模型推出的AI孙燕姿,通过AI歌手演绎翻唱歌曲获得了巨大关注度。这也说明大模型爆款应用,可能不一定来自大公司,也有可能来自初创企业甚至技术达人。

  • 智能NPC

传统游戏中,NPC就像工具人,只能按部就班运行早已设定好的指令。如果NPC变成一个个智能体,具备不同的思想、性格和记忆,游戏世界该有多么精彩?是不是有种《西部世界》的感觉?

在大模型加持下,智能NPC能够在与玩家的交互过程中不断进化,发展出独特的游戏剧情,推动整个游戏世界的自我发展,重塑玩家体验。

目前,Ubisoft、网易等头部游戏公司已经尝试应用智能NPC。2023年,Open AI收购了一家名为Global Illumination的游戏公司,看重的正是其用ChatGPT驱动每个NPC角色的能力。

更重要的是,智能NPC让人们看到大模型+游戏产业背后更大的想象力,未来游戏中的其他元素,会不会也逐渐向AI生成的方向发展?

  • 量化投研

量化投研是指金融机构通过分析大量金融和市场数据,预测市场走势与价格波动,从而提供投资策略和建议。然而金融市场瞬息万变,传统的投研工作面临信息爆炸、数据碎片化、预测准确率低、时效性差等挑战。

大模型投研工具成为金融行业提升投研效率的新解法。2023年已有多家金融科技平台推出大模型投研工具,让投研工作更高效更轻松。量化投研大模型可以通过分析市场行情、量价关系、研究报告、企业财报、舆情和热点等海量数据,为专业人士快速提供投资组合建议和风险管理策略。

——大模型在政企领域的规模化应用场景——

大模型在政企领域的热门应用场景在政企领域,那些率先实现规模化应用的场景将围绕政企客户、重点行业与中小企业展开。

比如,政企AI算力调度平台能够实现本地算力与云上算力的统一管理调度,国产化AI大模型中心为政企客户提供从芯片到平台应用全栈自主可控的基础设施。

在新能源汽车、新零售、新制造等产业,智能驾驶、销售预测、柔性制造是大模型的热门落地场景。

为降低中小企业使用大模型的资金、技术、人才门槛,中小企业大模型体验版可以让中小企业通过快速训练推理出适合自己的大模型,实现跨越式发展。

云计算,大模型走向规模化应用的必经之路

尽管上述场景分散在各行各业,但如果非要找出这些场景的共同点,它们背后都有同一个不可忽视的驱动力,那就是云计算。

观察最头部的大模型应用创新,从ChatGPT到MidJourney,不难发现一流的大模型初创公司都背靠强大的云厂商。

如今,大模型领域的竞争已经转化为“云+AI”的体系化技术竞争。尤其是当大模型步入规模化应用阶段,云计算已经成为AI大模型创新发展的土壤。换句话说,大模型在千行万业能不能用得好,关键在于云计算。

我们也是时候重新认识云计算对于AI的价值了。

首先,弹性、可靠、高效的云上算力支持

大模型是算力无底洞,此前业界曾预测OpenAI训练GPT-4可能使用了大约10000-25000张GPU,这背后离不开微软云上算力的支撑。而且,大模型不仅需要海量算力,还要求算力具备灵活、弹性、可靠、高效等特性,云计算可以给到最佳解决方案。

国内云上AI算力供给,不得不提到华为云。华为云在贵安、乌兰察布、芜湖3大AI云算力中心及30多分节点,能够为企业提供澎湃昇腾AI算力。目前,昇腾AI算力可实现千卡训练30天长稳率达到90%,训练作业故障自动恢复,非自动场景下恢复时长小于30分钟,为千行百业使用大模型提供了稳定可靠、高质量的云底座。

此外,云上AI算力的可用性也是中国AI企业面临的新挑战。面对美国商务部抛出的“云上AI算力禁令”,华为云提供了充沛的昇腾算力,大大降低了中国企业云上AI算力被卡脖子的风险。

其次,基于系统级优化能力,实现降本增效

大模型也是吞金兽。大模型要想取得突破,消耗的算力资源每3-4个月就要翻一番。不久前,马斯克称参与AI军备竞赛的企业每年需要在AI硬件上投入数十亿美元,才能保持竞争力。

云计算是解决大模型成本问题的必由之路。一方面,云计算可以通过容器或Serverless技术,能够极大提升资源的复用率,让客户无需为闲置资源付费。另一方面,近年来云计算还在不断产生大量细分领域技术创新,专门针对AI、大模型的降本增效而生。

以前面提到的搜索增强场景为例,要构建搜索大模型增强能力,需要海量数据和AI算力资源,资金和时间成本巨大。解决这些痛点必须靠云基础设施层面的系统性优化。比如,华为云SFS Turbo可以大幅提升数据加载、训练数据读取速度,而且故障备份恢复快,实现千亿大模型ckpt文件秒级保存,让企业省钱更省心。华为云ModelArts AI加速套件,通过AI训练组网、集合通信算子及训练框架优化,可实现6千卡集群并行训练性能领先业界30%。

在AIGC场景下,华为云针对该场景的算子优化,能将整体性能提升30%。在某客户案例中,将图像生成模型迁移到昇腾后,通过AIGC生成一张图片的时间从6.2秒减少到5.2秒,并且通过AI渲染加速可以提升渲染效率2-4倍,大幅降低了内容生成时间和成本。


第三、海量AI应用创新的平台

云服务商不仅是底层资源的提供者,也是创新服务的构建者。如今越来越多的云厂商在MaaS新商业模式下不断探索,将AI和大模型能力作为创新云服务对外赋能。

比如,高峰期智能NPC每天都要面临海量玩家的实时交互,这让智能NPC对实时交互的时延和推理算力弹性扩缩容要求非常高。华为云与网易伏羲进行联合创新,通过网易伏羲构AI多云平台与华为云昇腾AI云服务的适配,在算子层和框架层进行大量性能优化。满足了交互场景的秒级时延要求,让智能NPC做到“忙时不慌,闲时不废”,保障了各时段玩家的体验。

Cloud for AI,云厂商破局的新机会

AI已经成为云计算产业发展的第二增长曲线。

得益于AI技术的发展,全球云计算行业实现再次加速。Synergy Research数据显示,全球企业2023年四季度在云计算的总支出达740亿美元,环比增长56亿美元,环比增速创下历史新高。预计2023年全球云计算行业收入将达到2700亿美元。

Synergy分析师John Dinsdale表示:“云计算是一个规模很大的市场,需要付出很大努力才能获得进展,但人工智能已经做到了这点。”他认为,在AI的助力下,接下来云计算市场规模还会继续增长。

2023年,大模型与生成式AI的火爆,让一个大趋势日益明晰:未来,几乎所有应用都会接入AI/大模型能力,我们将迎来一个AI原生应用的时代。

大模型给千行万业带来了新的生产方式、交互方式、业务范式、商业模式,未来各个产业对AI的需求(包括大模型产业链、云上算力、生成式AI)一定是大规模增长,这也给云计算产业带来了新的增长点。

在这样的大趋势下,Cloud for AI不仅是云厂商的新机会,也是必答题。纵观全球头部云厂商,都在探索如何基于AI重塑云计算技术和服务体系,开辟出全新的服务场景和服务内容。

国际云厂商方面,微软是AI助力云业务腾飞的典型案例。在2024财年第二财季(截至2023年12月31日),微软智能云Azure和其他云业务实现营收同比增长30%。目前,在微软智能云的5.3万名客户中,有三分之一都是2023年新加入的。

在国内,华为云则是Cloud for AI的深度践行者。华为云提供了从昇腾AI云服务、盘古系列大模型以及一系列AI研发工具套件在内的完整AI全栈技术平台。可以预见的是,在Cloud for AI的时代,AI将成为华为云一张独特的名片。

过去,大模型高高在上,很难落地。在经过一番痛苦的摸索与实践后,人们才发现,大模型落地的解法不在大模型本身,而在Cloud for AI。当Cloud for AI已就绪,当第一批TOP场景诞生,大模型才能真正驶向规模化应用的广阔星空。

文中图片来自摄图网

END

本文为「智能进化论」原创作品。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/378919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

video / image上传操作-校验、截取首帧和正方形预览图等

常见video / image上传操作-校验、截取首帧和正方形预览图等。 上回搞了一个视频和图片上传和校验的需求,感觉学到很多,一些常见的函数记录如下: 1. 图片校验尺寸 const { maxCount 30, maxWidth, maxHeight, minHeight 200, minWidth …

Java基础知识练习题

1.对Java源文件进行编译操作的命令是(B) A.Java B.javac C.where is java D.javaw 2.下列命令中,用来运行Java程序的是(A)A.java B. javadoc C. jar D. javac 分析: 对Java源程序进行编译的命令是J…

力扣102. 二叉树的层序遍历 (复习vector和queue的常见用法

目录 题目描述 题目解析 题目答案 题目所用知识点 最后 题目描述 给你二叉树的根节点 root ,返回其节点值的 层序遍历 。 (即逐层地,从左到右访问所有节点)。力扣(LeetCode)官网 - 全球极客挚爱的技术…

使用pygame生成红包封面

import pygame import sys# 初始化pygame pygame.init()# 设置红包封面尺寸 size width, height 640, 960 screen_color (255, 0, 0) # 红色背景# 创建窗口 screen pygame.display.set_mode(size) pygame.display.set_caption(红包封面)# 加载龙形图片 dragon_image pygam…

一些参数(仅供个人理解)

1.mAP: 数据集的平均准确率 mAP50-95:mAP阈值为50到mAP阈值为95,间隔5%,取得10个mAP值,然后对这十个值取平均。 目标检测评估指标mAP:从Precision,Recall,到AP50-95【未完待续】_map50和map50-95-CSDN博客 2.IoU&a…

JVM调优(Window下)

1、编写代码&#xff0c;像下面代码这样&#xff0c;产生OOM&#xff0c; private static final Integer K 1024;/*** 死循环&#xff0c;验证JVM调优* return*/GetMapping(value "/deadLoop")public void deadLoop(){int size K * K * 8;List<byte[]> lis…

C语言第二十一弹---指针(五)

✨个人主页&#xff1a; 熬夜学编程的小林 &#x1f497;系列专栏&#xff1a; 【C语言详解】 【数据结构详解】 转移表 1、转移表 总结 1、转移表 函数指针数组的用途&#xff1a;转移表 举例&#xff1a;计算器的⼀般实现&#xff1a; 假设我们需要做一个能够进行加减…

Flume拦截器使用-实现分表、解决零点漂移等

1.场景分析 使用flume做数据传输时&#xff0c;可能遇到将一个数据流中的多张表分别保存到各自位置的问题&#xff0c;同时由于采集时间和数据实际发生时间存在差异&#xff0c;因此需要根据数据实际发生时间进行分区保存。 鉴于此&#xff0c;需要设计flume拦截器配置conf文件…

C#,佩尔数(Pell Number)的算法与源代码

1 佩尔数&#xff08;Pell Number&#xff09; 佩尔数&#xff08;Pell Number&#xff09;是一个自古以来就知道的整数数列&#xff0c;由递推关系定义&#xff0c;与斐波那契数类似。佩尔数呈指数增长&#xff0c;增长速率与白银比的幂成正比。它出现在2的算术平方根的近似值…

一图窥探RAG技术发展现状

2023年除了大语言模型&#xff0c;听到最多的当属RAG&#xff08;检索增强生成技术了&#xff09;&#xff0c;在实际业务场景落地过程中&#xff0c;由于大模型目前的一定局限和能力现状以及Token限制、训练成本等多种因素的影响下&#xff0c;RAG不得不成为大家选择快速试错、…

WebSocket+Http实现功能加成

WebSocketHttp实现功能加成 前言 首先&#xff0c;WebSocket和HTTP是两种不同的协议&#xff0c;它们在设计和用途上有一些显著的区别。以下是它们的主要特点和区别&#xff1a; HTTP (HyperText Transfer Protocol): 请求-响应模型&#xff1a; HTTP 是基于请求-响应模型的协…

Three.js学习8:基础贴图

一、贴图 贴图&#xff08;Texture Mapping&#xff09;&#xff0c;也翻译为纹理映射&#xff0c;“贴图”这个翻译更直观。 贴图&#xff0c;就是把图片贴在 3D 物体材质的表面&#xff0c;让它具有一定的纹理&#xff0c;来为 3D 物体添加细节的一种方法。这使我们能够添加…

TCP和UDP相关问题(重点)——7.TCP的流量控制怎么实现的?

流量控制就是在双方通信时&#xff0c;发送方的速率和接收方的速率不一定是相等的&#xff0c;如果发送方发送的太快&#xff0c;接收方就只能把数据先放到接收缓冲区中&#xff0c;如果缓冲区都满了&#xff0c;那么处理不过来就只能丢弃&#xff0c;所以需要控制发送方的速率…

【Go】三、Go并发编程

并发编程 我们主流的并发编程思路一般有&#xff1a;多进程、多线程 但这两种方式都需要操作系统介入&#xff0c;进入内核态&#xff0c;是十分大的时间开销 由此而来&#xff0c;一个解决该需求的技术出现了&#xff1a;用户级线程&#xff0c;也叫做 绿程、轻量级线程、协…

猫头虎分享已解决Bug || Spring Error: Request method ‘POST‘ not supported

博主猫头虎的技术世界 &#x1f31f; 欢迎来到猫头虎的博客 — 探索技术的无限可能&#xff01; 专栏链接&#xff1a; &#x1f517; 精选专栏&#xff1a; 《面试题大全》 — 面试准备的宝典&#xff01;《IDEA开发秘籍》 — 提升你的IDEA技能&#xff01;《100天精通鸿蒙》 …

06-OpenFeign-使用HtppClient连接池

默认下OpenFeign使用URLConnection 请求连接&#xff0c;每次都需要创建、销毁连接 1、添加ApacheHttpClient依赖 <!-- 使用Apache HttpClient替换Feign原生httpclient--><dependency><groupId>org.apache.httpcomponents</groupId><artifact…

springboo冬奥会科普平台源码和论文

随着信息技术和网络技术的飞速发展&#xff0c;人类已进入全新信息化时代&#xff0c;传统管理技术已无法高效&#xff0c;便捷地管理信息。为了迎合时代需求&#xff0c;优化管理效率&#xff0c;各种各样的管理平台应运而生&#xff0c;各行各业相继进入信息管理时代&#xf…

EMC学习笔记(二十二)降低EMI的PCB设计指南(二)

降低EMI的PCB设计指南&#xff08;二&#xff09; 1.电源和地概述2.电感量3.两层板和四层板4.单层和双层设计中的微控制器接地5.信号返回地6.模拟、数字信号与大功率电源7.模拟电源引脚和模拟参考电源8.四层板电源设计参考注意事项 tips&#xff1a;资料主要来自网络&#xff0…

Apache网站部署

站点添加及linux防火墙和selinux启动和停止 apache站点添加 linux系统防火墙和selinux起停 1、防火墙firewall操作 查看防火墙的状态&#xff0c;如下&#xff08;默认开启&#xff09;&#xff1a; systemctl status firewalld 关闭服务 systemctl stop firewalld 关闭…

《向量数据库指南》——Milvus Cloud「删除」:眼见未必为实

“执行 Collection 中的 delete 操作后,再次调用 num_entities 检查集合中的数据的条数,和删除前一致, delete 不能从物理层面上删除数据吗?”“删除的数据还能被查到是为什么?”“请问下删除 collection 后,磁盘大小没有恢复,该怎么处理?”社区中关于“删除”讨论最多…