大模型“诸神之战”,落地才是赛点

ChatGPT 诞生已经快一年,你还在与它对话吗?

有的人用来写报告、改代码,让它成为得力帮手;有的人却只是“调戏”个两三回,让它创作诗歌或故事,便不再“宠幸”。

根据网站分析工具 SimilarWeb 的数据,后者情况似乎更多。目前 ChatGPT 的月活数据已经连续三个月下滑,浏览量从四月的 17.6 亿下滑至八月的 14.3 亿,似乎开始有些过气。

一边是 ChatGPT 这样的通用大模型在退烧,一边是行业大模型研发热度只增不减。

国产大模型正在掀起一场“诸神之战”,然而不少企业都被卡在关键一步,那就是落地。

技术仅是门槛,落地才是赛点

和当年互联网“百团大战”比起来,这一回正在上演的“百模大战”要更内卷,也更烧钱。赛迪顾问数据显示,截至 2023 年 7 月,中国已累计有 130 个大模型问世 [1]。

《中国人工智能模型大地图研究报告》也指出,全国正有 14 个省(市)开展大模型研发。研发主体里,既有国内大学、科研机构,也有包括互联网巨头在内的企业,大佬们纷纷披甲上阵,准备迎接狂热的未来 [2]。

比起专业性弱的通用大模型,国内偏爱的行业大模型,基于各行业数据训练,结合专有知识和经验,更适用于具体场景的工作,能真正服务好千行万业。

但如果将大模型的问世比喻成研发的阶段性毕业,如今的现实情况是,没几个行业大模型能成功“上岗”。大模型能重塑行业,听起来似乎还是“空中楼阁”。

这其中最大的拦路石便是“落地难”。因为像“吞金兽”一样的 AI 大模型,训练成本真不是一般的高。没有雄厚的资金做支撑,很难商业落地。

由斯坦福大学发布的 2023 AI Index 年度报告,基于已有大模型披露的硬件和训练时间,对其训练成本进行了估算。

图片

2019 年发布的 GPT-2,被认为是第一个大型语言模型,拥有 15 亿个参数,估计需要五万美元的训练费用 [3]。

仅仅三年时间,2022 年推出的旗舰大型语言模型之一的 PaLM 拥有 5400 亿个参数,估计成本在 800 万美元。它比 GPT-2 大了约 360 倍,成本也高出了 160 倍 [3]。大模型规模变得越来越庞大,但也愈发昂贵。

落地难的原因除了成本高昂,还有 AI 发展的基础“燃料”算力比较有限。

如果把大模型比较一辆车,那它能走多远,正是取决于算力这个引擎。训练大模型,需要将数据集进行重复多轮计算处理,算力大小就代表着数据处理能力的强弱。

面对大模型数量成倍的增长,这几年中国智能算力规模也正在经历井喷式高速增长。

根据 IDC 发布的《2022-2023 中国人工智能计算力发展评估报告》,2023 年中国智能算力规模已达到 427 每秒百亿亿次浮点运算。预计到 2026 年,智能算力规模将进入每秒十万亿亿次浮点运算级别 [4]。

图片

早在今年 4 月 5 日,OpenAI 就以需求量过大为由,暂时关闭了 ChatGPT Plus 的付费渠道,这意味着仅发布几个月,OpenAI 就开始面临算力缺口 [5]。

大模型这场豪华游戏,能留在牌桌的玩家,注定只是少数。

所以别看大模型喧嚣盛极一时,但当面对成本、算力等现实问题时,国内外市场也正在出现更多理智思考——无法落地商用的通用大模型只能是玩具,成为企业应用的行业大模型才有产业价值 [6]。

AI 深入行业,

知识计算是关键

在国内,从华为云盘古大模型、阿里通义千问,再到 360 智慧大脑、智谱 AI ChatGLM 等,AI 大模型层出不穷。

不少人开始好奇《流浪地球》里不断学习,变得无所不能的最高人工智能莫斯是不是要走进现实了?

也有人担心有朝一日自己的饭碗会不会被 AI 抢走?但从麦肯锡全球研究院调研数据看,下此定论为时尚早。在 2020 年的人工智能全球调研中,AI 在不同行业的平均渗透率为 12.8%,处于较低水平 [7]。

更关键的是,AI 大模型和打工人并非互相取代的关系。而是大模型带来的新机会,能够提升工作效率、释放员工做更多高价值的事情。

图片

为何现阶段的 AI 深入行业程度还不够?

原因是不同行业都有自己数十上百年的专业积累,却缺乏高效利用的方法。解决这个难题的关键,在知识计算。

所谓知识计算,华为云认为就是把各种形态的知识,通过 AI 技术进行抽取、表达后,协同大量数据进行计算,进而产生更为精准的 AI 模型,从而提高行业效率。

为了能提供满足行业场景的多项技能,华为云团队使用 40TB 的文本数据,包含大量通用知识与行业经验,训练盘古自然语言大模型,为行业大模型打下坚实基础。

下一个问题接踵而至——行业专家与 AI 专家合作时,双方如何互相听得懂?华为云的做法是派 200 个博士深入客户现场,“走田头、跑工地、下矿井、进车间”,抓住 AI 技术创新与业务需求的结合点,解决行业难题。

图片

图片

200 多个博士深入行业现场,抓住 Al 技术创新与业务需求的结合点

像汽车领域,为了找到盘古大模型和自动驾驶行业的切入点,华为云深入一线交流请教,梳理行业业务和技术痛点。

现有自动驾驶技术能应对 95% 的常见驾驶场景,剩余 5% 是各类不常见却不断出现的“长尾问题”,阻碍更高智能化的自动驾驶落地。

盘古汽车大模型基于超车线路构建不同的光照、天气、建筑,快速生成近百个样本,生成灵活编辑的虚拟空间,重塑自动驾驶的训练,让模型更好学习应对“长尾问题”。现在学习一个新的复杂场景,时间能从两周以上缩短到两天内。

图片

除了汽车行业,华为云已陆续推出矿山、药物分子、电力、气象、海浪、铁路、政务、金融、制造等大模型,贡献先进的算法和解决方案,在行业内大展身手。

今年夏天,台风“泰利”“杜苏芮”“苏拉”“海葵”先后接棒登陆沿海地区,路径复杂,影响范围广,致灾程度高。如果能精准预测台风路径、级别和经过的地方,就能提早做准备。

但气象预测一直是科研领域的重难点。而盘古气象大模型,不仅将预测时间从 4-5 小时缩短到十秒内,而且在精度上超过传统数值预报方法。

可以说,AI 预报的出现,给天气预报带来了全新可能。

大模型落地,

盘古还使哪些力

前面提到,训练大模型一天也离不开海量的算力。有人形容算力就像我们日常用的水和电一样,要“一点接入、即取即用”。

大模型热潮下,面对企业算力需求的爆发式增长,“算力饥渴”成为了亟待解决的问题。

华为云基于系统性的创新,升级现有数据中心架构,突破单台服务器部件的限制,拆解和重新组合原来以 CPU 为中心的主从架构,升级为各种资源对等的全互联架构——分布式 QingTian 架构。

分布式 QingTian 架构打破了算力、存储和网络的边界,不仅实现高性能 AI 算力,轻松应对万亿级大模型训练,还将助力各行各业直接上云,一步到位搭建业务,更快更稳更高效。

图片

图片

QingTian 架构是基于高速网络协议的分布式对等全互联架构

得益于这一 AI 算力基础设施 ,企业使用华为云昇腾 AI 云服务时,只需要通过一根光纤,便能直接在云上获取算力,随取随用,让大模型算力触手可及。

今年七月,华为云海宣布在乌兰察布和贵安上线昇腾 AI 云服务,提供更长稳的 AI 算力服务;还发布了乌兰察布汽车专区,为自动驾驶开发提供澎湃算力。

开放性是昇腾 AI 云服务的重要优势之一,除了支持盘古大模型,更适配业界主流的近一百个开源大模型。

例如,美图仅用一个月就将 70 个模型迁移到了华为云昇腾 AI 云服务,同时华为云和美图团队一起进行了算子的优化,AI 性能提升了 30%。

图片

如何将大模型应用到行业具体业务和场景中?除了自己做落地,华为还希望构建起一个繁荣的生态。

大模型的创新,从来都不仅仅是模型自身的创新以及各项 AI 根技术的创新,在算力、算法、平台、应用、服务等方面都需要全链条生态伙伴和客户的参与。

打个比方,盘古大模型就像是各个行业通用的“轮子”,加入生态的伙伴都可以在车上找到自己的位置,共同助力,让这辆车跑得更快,行得更远。

为此,华为云开放了全方位的生态合作路径,希望团结伙伴加入盘古大模型全域协同生态体系,真正让 AI 重塑千行万业。

图片

一直以来,华为云践行的就是做实事、做最难的事。

一方面深耕算力,打造强有力的算力底座,支撑人工智能事业发展;另一方面结合大模型,从通用大模型到行业大模型的研究创新,来让人工智能真正服务好千行万业。

9 月 20-22 日,华为全联接大会在上海举办,大会以“加速行业智能化”为主题,汇聚业界思想领袖、商业精英、技术大咖、先锋企业、运营商、生态伙伴以及开发者等产业伙伴,共同探讨智能化技术的发展方向和未来机遇,加速行业智能化。

华为云认为,人工智能的发展,关键要“走深向实”,赋能产业升级,服务好千行万业、服务好科学研究,唯有这样,才能共赢人工智能新时代。

如何学习大模型

现在社会上大模型越来越普及了,已经有很多人都想往这里面扎,但是却找不到适合的方法去学习。

作为一名资深码农,初入大模型时也吃了很多亏,踩了无数坑。现在我想把我的经验和知识分享给你们,帮助你们学习AI大模型,能够解决你们学习中的困难。

我已将重要的AI大模型资料包括市面上AI大模型各大白皮书、AGI大模型系统学习路线、AI大模型视频教程、实战学习,等录播视频免费分享出来,需要的小伙伴可以扫取。

一、AGI大模型系统学习路线

很多人学习大模型的时候没有方向,东学一点西学一点,像只无头苍蝇乱撞,我下面分享的这个学习路线希望能够帮助到你们学习AI大模型。

在这里插入图片描述

二、AI大模型视频教程

在这里插入图片描述

三、AI大模型各大学习书籍

在这里插入图片描述

四、AI大模型各大场景实战案例

在这里插入图片描述

五、结束语

学习AI大模型是当前科技发展的趋势,它不仅能够为我们提供更多的机会和挑战,还能够让我们更好地理解和应用人工智能技术。通过学习AI大模型,我们可以深入了解深度学习、神经网络等核心概念,并将其应用于自然语言处理、计算机视觉、语音识别等领域。同时,掌握AI大模型还能够为我们的职业发展增添竞争力,成为未来技术领域的领导者。

再者,学习AI大模型也能为我们自己创造更多的价值,提供更多的岗位以及副业创收,让自己的生活更上一层楼。

因此,学习AI大模型是一项有前景且值得投入的时间和精力的重要选择。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/722884.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

护眼灯哪些牌子好?一文刨析护眼灯怎么选择!

护眼灯哪些牌子好?护眼台灯作为对抗视力挑战的一种方法,逐渐赢得了众多家长的青睐。这些台灯利用尖端光学技术,发出柔和且无刺激的照明,有助于保护眼睛不受伤害。它们不但可以调节亮度和色温,打造一个舒适且自然的阅读…

(done) 关于 GNU/Linux API setenv 的实验

写一个下面的代码来验证 #include <stdlib.h> #include <stdio.h> #include <unistd.h> #include <sys/types.h>int main() {// 设置环境变量 MY_VAR 的值为 "hello_world"if (setenv("MY_VAR", "hello_world", 1) ! 0…

将粘贴文本进输入框中时不带有任何格式(包括背景颜色和字体)解决办法

只需要四行代码解决&#xff0c;这里用到vue3里面的事件 paste"" 代码块&#xff1a; <div paste"handlePaste"></div>//粘贴文本时不带有任何格式&#xff08;包括背景颜色和字体&#xff09;function handlePaste(event) {event.preventDef…

Mac M3 Pro 部署Spark-2.3.2 On Hive-3.1.3

目录 1、下载安装包 2、解压安装 3、修改配置 4、将spark的jars上传到hdfs 5、mysql中创建hive库 6、hive初始化数据库 7、启动Spark 8、启动HIVE 9、检查是否成功 mac的配置如下 1、下载安装包 官网 Apache Projects Releases 在search中搜索hadoop、hive spark &…

Github Copilot 用账号登录,完美支持chat,不妨试试

Github Copilot 代码补全等功能&#xff0c;提高写代码的效率 获取地址&#xff1a;https://web.52shizhan.cn/activity/copilot 如果之前是激活器激活的&#xff0c;请到环境变量里删除相关的copilot配置。 ① 发你注册的github账号的邮箱或用户名给客服&#xff0c;客服邀…

产品Web3D交互展示有什么优势?如何快速制作?

智能互联网时代&#xff0c;传统的图片、文字、视频等产品展示方式&#xff0c;因为缺少互动性&#xff0c;很难引起用户的兴趣&#xff0c;已经逐渐失去了宣传优势。 Web3D交互展示技术的出现&#xff0c;让众多品牌和企业找到了新的方向&#xff0c;线上产品展示不在枯燥无趣…

红海云CEO孙伟获2024“新锐企业家”荣誉

近日&#xff0c;由羊城晚报报业集团联合广东软件行业协会主办的“2024广东软件风云榜”活动圆满落下帷幕&#xff0c;红海云CEO孙伟以新技术、新业态、新模式&#xff0c;带领企业取得创新发展&#xff0c;荣膺2024广东软件风云榜“新锐企业家”称号。 为把握广东省数字经济和…

C/S、B/S架构(详解)

一、CS、BS架构定义 CS架构&#xff08;Client-Server Architecture&#xff09;是一种分布式计算模型&#xff0c;其中客户端和服务器之间通过网络进行通信。在这种架构中&#xff0c;客户端负责向服务器发送请求&#xff0c;并接收服务器返回的响应。服务器则负责处理客户端的…

南充文化旅游职业学院领导一行莅临泰迪智能科技参观交流

6月18日&#xff0c;南充文化旅游职业学院旅游系副书记刘周、教务处教学运行与质量保障科科长及智慧旅游技术应用专业教研室主任李月娴、大数据技术专业负责人 龙群才、大数据技术专业专任教师 李昱洁莅临泰迪智能科技产教融合实训中心参观交流。泰迪智能科技董事长张良均、副总…

白酒:酒文化与艺术创作的结合

酒文化与艺术创作在历史长河中相互交融&#xff0c;共同发展。云仓酒庄的豪迈白酒作为中国的酒的品牌&#xff0c;以其与众不同的口感和品质&#xff0c;成为了艺术创作的重要灵感来源。 首先&#xff0c;豪迈白酒的酿造技艺本身就是一种与众不同的艺术。酿酒师傅们在传承古老技…

springmvc拦截器 和 异常拦截器

springmvc拦截器的配置使用&#xff1a; 自定义监听器实现HandlerInterceptor接口&#xff1a; 在springmvc的配置文件中引入自定义拦截器对象及拦截目标 拦截器的方法调用 自定义一个拦截器&#xff1a; Component public class LoginInterceptor implements HandlerIntercept…

上位机图像处理和嵌入式模块部署(h750 mcu和usb虚拟串口)

【 声明&#xff1a;版权所有&#xff0c;欢迎转载&#xff0c;请勿用于商业用途。 联系信箱&#xff1a;feixiaoxing 163.com】 对于mcu usb而言&#xff0c;大部分情况下&#xff0c;它和上位机之间的关系都是device的关系。一般usb&#xff0c;可以分成host和device。如果mc…

【调试笔记-20240611-Linux-配置 OpenWrt-23.05 支持泛域名 acme 更新】

调试笔记-系列文章目录 调试笔记-20240611-Linux-配置 OpenWrt-23.05 支持泛域名 acme 更新 文章目录 调试笔记-系列文章目录调试笔记-20240611-Linux-配置 OpenWrt-23.05 支持泛域名 acme 更新 前言一、调试环境操作系统&#xff1a;Windows 10 专业版调试环境调试目标 二、调…

Python10 python多线程

1.什么是python多线程 Python的多线程指的是在一个Python程序中同时运行多个线程&#xff0c;以达到并发执行多个任务的目的。线程是操作系统能够进行运算调度的最小单位&#xff0c;它被包含在进程之中&#xff0c;是进程中的实际运作单位。 在Python中&#xff0c;多线程的…

【Hudi】基础概念-数据写

目录 数据写写操作写流程(UPSERT)写流程(Insert)写流程(Insert Overwrite)Key生成策略删除策略 数据写 写操作 UPSERT&#xff1a;默认行为&#xff0c;数据先通过index打标&#xff0c;有一些启发式算法决定消息的组织以及优化文件的大小>CDC导入INSERT:跳过index,写入效…

(已解决) Github无法显示图像问题

Github无法显示图像的问题 问题描述初次尝试最终解决 问题描述 今天打开github&#xff0c;创建了一个仓库&#xff0c;想从本地把一些最近做的东西传上来(git add . > git commit -m “xxx” > git push)&#xff0c;结果发现东西是成功传上来了&#xff0c;但是图片没…

简单好用的C++日志库spdlog使用示例

文章目录 前言一、spdlog的日志风格fmt风格printf风格 二、日志格式pattern三、sink&#xff0c;多端写入四、异步写入五、注意事项六、自己封装了的代码usespdlog.h封装代码解释使用示例 前言 C日志库有很多&#xff0c;glog&#xff0c;log4cpp&#xff0c;easylogging, eas…

PDF为何成为职场必备?编辑不求人,这几款工具助你一臂之力

不管是工作和学习&#xff0c;我们使用PDF文档的频率非常高&#xff0c;但是说起为什么要用PDF&#xff0c;却又只知其一不知其二。 为什么我们需要PDF&#xff1f; PDF&#xff0c;全称为Portable Document Format&#xff08;可移植文件格式&#xff09;&#xff0c;是一种…

【电机】PID参数整定方法

1 试凑法 采样周期的选择&#xff0c;要根据所设计的系统的具体情况&#xff0c;用试凑的方法&#xff0c;在试凑过程中根据各种合理的建议来预选采样周期&#xff0c;多次试凑&#xff0c;选择性能较好的一个作为最后的采样周期。早整定参数时必须要认真的观察系统的相应情况…

低代码专题 | 低代码开发平台怎么收费,价格多少?一文揭秘!

低代码开发平台近几年真的火得一塌糊涂&#xff0c;不少企业都开始关注并尝试这种新的开发方式。 然而&#xff0c;关于低代码开发平台的收费问题&#xff0c;却是众说纷纭、信息零散。为了帮助大家更清晰地了解低代码开发平台的收费情况&#xff0c;这篇文章将进行全面的解读…