继2022年11月,OpenAI发布旗下AI聊天机器人应用ChatGPT后,大模型逐渐走入公众视野。2023年被视为中国大模型的发展元年。
这一年里,中国本土厂商、各大科技巨头、科研院所、初创公司都纷纷下场,部署自己的大模型。从优化算法全面追赶头部大模型水平到创新应用落地全面开花,国产AI正待走出一条属于自己独特节奏的发展之路。
01
起步-AI学术研究
从学术猜想到应用发展,当前已经进入规模化应用阶段。1950年图灵在其论文《论数字计算在决断难题中的应用》提出了著名的“图灵测试”,测试能否使机器模仿人类思考模式和行为,标志着人工智能行业开始迎来发展。
• 1956年举办的达特茅斯会议上“人工智能”(Artificial Intelligence)的概念被首次提出,人工智能,即AI正式进入公众视野。
02
发展-AI初步应用
上世纪八十年代初,日本富士通公司推出了世界上第一台具备语音识别功能的PC,开启了AI在语音识别领域商业化应用的序幕。
• 1984年,苹果和IBM相继推出预装如语音识别、专家系统等AI软件的AppleMacintosh和IBM PC面世,也标志着AI开始进入家庭应用市场。
• 九十年代至二十一世纪初,神经网络的发展也推动AI在图像识别领域的应用,同时经AI赋能的搜索引擎也成为互联网行业在此阶段实现大发展的标志性产物 。
03
突破-AI大模型风起云
21世纪初,随着计算能力的提升和大数据的崛起,AI大模型从无到有,从简到繁快速被发掘和发展。
• 专家系统:根据系统中的知识与经验,进行推理和判断,模拟人类专家的决策过程。• 决策树:采用树形结构,使用层层推理来实现最终的分类。
• SVM:用于分类和回归问题,通过在特征空间中找到最大边距的超平面。• 深度学习架构:优化神经网络的结构,提高计算效率和模型的准确率,使得神经网络在各种任务中表现更优。通过发掘一系列大模型架构的潜力,最终向仿生的形态演化。
主流AI大模型类别
OpenAI打响发令枪,国内厂商奋起直追
OpenAI 在 2019 年发布了GPT-2 大模型,国内互联网科技厂商也集中在 2020-2022 三年期间相继发布了自己的大模型。ChatGPT 的发布,掀起一波发展热潮,席卷国内科技圈和投资圈。很快,各大科技巨头、科研院所、初创公司都纷纷下场,部署自己的大模型。自此开始,相关技术迭代日新月异,行业趋势不断变化。
2023年3月16日,百度正式推出了基于百度新一代大语言模型的生成式AI产品“文心一言”,此后,阿里、华为、腾讯、京东、科大讯飞、360、字节跳动等科技公司纷纷发布了自家的大模型。科研院所及创业公司同样有“悟道”、“书生”、”智谱“等大模型问世。截止2024年4月,中国的大模型数量已近200个,通用大模型数量40个左右。
多方协力奋起追赶,应用层面寻求突破
ChatGPT的发布让国内科技圈看到了差距,也促使国产AI大模型加快了前进的速度。在过去的一年里,几乎所有科技公司都押注大模型,加之政策与监管层面的大力扶持,与代表了官方科研力量的科研院所也加入其中。
App Store中国大陆地区已上线AI大模型应用(截止2024年6月15日)
中国大陆地区已上线AI大模型应用下载榜(2024H1)
中国大陆地区已上线AI大模型应用月活榜(2024H1)
AI商业应用
实际案例与数据分析
智能医疗
辅助诊断:例如,谷歌旗下的DeepMind开发的“Streams”AI系统,能够自动扫描和识别MRI和CT等医学图像数据,提高医疗诊断的准确率和速度。据相关数据显示,使用AI辅助诊断系统可以将诊断准确率提升95%,并缩短诊断时间。
医疗
1.2个性化治疗:OncologyAI系统能够根据患者的病情特点和基因信息,为医生提供个性化的治疗建议。这种定制化的治疗方案有望提高治疗效果,减少副作用。
智能交通
自动驾驶:特斯拉、谷歌旗下的Waymo等公司已经在自动驾驶领域取得了显著进展。自动驾驶汽车通过AI技术识别、感知和决策,能够自主行驶,减少交通事故,提高行车效率。据统计,自动驾驶汽车在某些测试区域已经成功减少了交通事故率30%。
特斯拉等公司的自动驾驶系统已经迭代至较高版本,不仅提升了驾驶安全性,还标志着向完全无人驾驶迈进了一大步。然而,自动驾驶技术的商业化应用仍面临诸多挑战。根据美国国家公路交通安全管理局(NHTSA)的数据,尽管自动驾驶汽车在测试阶段已经表现出了较高的安全性,但在复杂道路和恶劣天气条件下的表现仍有待提高。
交通
智慧城市交通管控:某市建立的基于AI技术的智慧城市交通管控系统,通过实时采集和分析路口车流、人流等数据,优化红绿灯控制策略,成功提高了道路资源利用率,使交通拥堵问题减少了25%,平均行车速度提高了15%。
智能家居
智能控制:通过智能家居系统,人们可以通过智能语音助手或手机APP实现家庭灯光、温度等设备的智能控制。例如,宜家的智能台灯可以学习用户的睡眠习惯,自动调整光线和色温,提升居住舒适度。
家居
3家务自动化:具有AI智能的扫地机器人、洗衣机等产品能够节省用户的时间和精力。据统计,使用智能家居设备后,家庭日常清洁时间可减少40%。
在智能家居领域,小米、亚马逊等公司推出的智能家居系统已经能够将手机作为家居控制中心,支持智能家电控制、智能门锁等功能。然而,随着智能家居设备的普及,如何确保用户隐私和数据安全成为了一个亟待解决的问题。据一项调查显示,超过60%的用户对智能家居设备的隐私保护表示担忧。
教育
个性化学习:智能辅导系统能够根据学生的知识水平、理解能力和学习风格,为每个学生提供个性化的学习内容和建议。比如,英国一家在线语言学校使用的AI辅导系统,通过分析学生的回答情况,针对性地选择合适的单词难度,提高了学生的学习效率。
在一项涉及1000名学生的研究中,使用智能辅导系统的学生在数学成绩上平均提高了15%,而传统教学方法下的学生提高仅为8%。
人工智能
自动评估与指导:AI技术在作文评分方面有着广泛的应用。中国一家在线写作平台使用AI算法对英语写作进行评分,能够快速准确地分析文章中的错误,并给出改进建议。
某在线写作平台应用AI评分系统后,用户写作能力的提升速度是传统方法的两倍,且用户满意度高达95%。
金融
风险管理:AI系统可以快速、准确地评估借款人的信用风险,帮助金融机构做出更明智的决策。据数据显示,使用AI进行信用评估的金融机构,其不良贷款率降低了1.5%。
量化交易:AI技术可以分析市场数据和历史数据,自动识别市场趋势和交易信号,提高交易的准确性和效率。据统计,使用AI进行量化交易的投资者,其投资回报率提升了20%。
金融
AI技术在医疗、交通、家居、教育和金融等多个领域都有广泛的应用,并且已经取得了显著的成效。随着技术的不断进步,AI将在更多领域发挥巨大潜力。
AI技术的未来发展趋势充满了无限可能性和挑战。从与人类智力的融合到自主决策能力的提升,AI正逐渐改变我们的生活方式和工作模式。然而,随着技术的进步,我们也需要关注隐私与安全、伦理与道德以及就业与产业结构调整等挑战。通过跨学科合作和广泛的社会讨论,我们可以共同应对这些挑战,推动AI技术的可持续发展。
技术创新推动大模型向多模态升级
算力即实力,更多的模态信息让人工智能更智能
2023年,点燃AI赛道的ChatGPT吸引了太多的目光,有所标的的情况下,中国的AI大模型也将重心放在语言大模型之上,聊天机器人应用遍地开花。
然而就在年末,文生视频应用Pika的爆火以及谷歌发布多模态大模型Gemini,乃至今年年初OpenAI旗下Sora所带来的亿点点震撼无不为国产AI大模型的下一个发展阶段指明了方向,即多模态大模型。多模态大模型是结合文本、图像、音频等多种模态信息进行学习和理解的人工智能模型。而推动模型向多模态升级的关键则取决于相关技术的创新与发展。
就目前而言,国产AI大模型对于文本、图像这两个模态的信息处理已经发展到了相对成熟的阶段,而随着技术的互通与整体发展,面对更多样性以及更高质量的数据。唯有坚持技术创新,优化算法和结构以解决智能算力短板,方能有底气以应对和覆盖更多的应用场景。
随着多模态技术的不断迭代进步,大模型将在具身智能、自动驾驶等领域开拓新的应用场景。相比较于其他国家,中国在这些领域拥有更丰富的市场基础和数据资源,这或将成为国产AI大模型应用发展的优势。
产品化加速,应用向垂直领域发展
越来越多细分场景拥抱AI,大模型创业转向产品创业
与社交、游戏等互联网行业的发展脉络相同,基础大模型未来可能是少数几家寡头的游戏,更多的机会蕴藏在应用层当中。红杉美国在关于大模型的报告中指出,在大模型的首年,“第一幕”是从技术出发,发现了基础大模型这个新的“锤子”,目前市场正在进入“第二幕”,将端到端地解决人类问题。这便是产品和应用场景。
所以对于后来者以及规模较小的创业公司而言,先找准一个市场上还没有的功能与产品,抓住窗口期,通过运营手段快速推广获利,再循环往复。这样的产品创业或许才是最优解。随着行业的发展和扩大,势必会有越来越多的创业者入局,一方面或许会有少数的“幸运儿”成为了技术创新的先驱,引领一波行业的进步。另一方面,则更多地是从垂直领域进行产品的落地和研发,加速产品化发展,发掘并实现更多细分领域和应用场景与AI技术的结合,“AI+”或许也将成为热词。
商业化水平加速重构产品创业模式
探索更好的收费模式,是提速AI产品商业化的基础
当前国产AI大模型落地产品尚集中在需求单一、容错率高、任务简单的休闲场景,在更具价值的严肃场景、工作场景、专业场景等方面的应用尚待技术升级才能实现进一步拓展。
因而当前大多数产品尚处在收费模式单一,转化、留存率较为低下的低商业化水平阶段。产品创业模式在国外没有更好参照对象的情况下依旧采取的是传统互联网产品的经验模式。
比如字节的《豆包》,所采取的商业模式便如同移动互联网时代的应用,即早期通过免费争夺用户市场,而后再逐步通过提供性能更强大的收费版本、分流算力等方法开始盈利。而对于垂直领域的产品创业者而言,自身情况并不允许和支持他们采取这种细水长流,经营周期较长的模式。但现有案例里,也并未出现更好的创业模式,参考较近的几个爆火的AI产品收费模式,以妙鸭相机举例,刚推出便受到了市场的追捧,从第一天便开始收费,但市场的热度也很快就降了下来。或许在未来,技术创新取得突破,多模态大模型大行其道或许能带来更多可能性,为当下的困难提供解题思路。但就目前而言,探索出一种更好、更合适的收费模式,不仅能够为现有产品挖掘更多潜在价值,更能改变现有产品创业模式,推动商业化水平加速,从而拓宽整个行业赛道。
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。