AI浪潮方兴未艾,距chatgpt引爆的变革已过去一年,AI行业发生哪些变化?
4月16日,斯坦福大学“以人为本”人工智能研究所HAI,发布长达501页的《2024年人工智能指数报告》,披露了2023年全球人工智能的发展趋势和现状。
该报告是HAI研究所迄今为止发布的最全面的报告,涵盖研发、技术表现、经济、科学医学、教育政策和治理和公众舆论等多方面内容。
以下是报告要点:
中国在AI专利数据和工业机器人采用方面处于领先地位,2022年中国以61.1%的比例领先全球AI专利,显著超过美国的20.9%。
产业界继续主导AI前沿研究,更多底层大模型和开源模型涌现,同时先进AI模型训练成本也在飙升,烧钱最猛的谷歌Gemini Ultra达到1.91亿美元,是GPT-4训练成本的2.5倍。
开源与闭源较量结果初现端倪,从性能表现来看闭源模型要优于开源模型,开源平均性能优势为24.2%。
生成式AI投资一路飙升,较2022年增长了近八倍达252亿美元,去年获得新融资的生成式AI初创公司数量达到99家。
AI几乎成了所有500强公司财报电话会的“流行词”,同时调查显示AI已在企业中发挥降本增收作用,42%受访者表示采用AI后成本降低,59%受访者表示收入增加了。
“AI焦虑症”在全球盛行,2/3的人预计AI将在未来几年内深刻改变他们的日常生活。此外,AI安全性、相关法律法规的制定也日益增加。
中国专利数全球第一、顶级AI模型多来自美国
在人工智能专利数量上,中国处于领先的地位。
报告显示,从2021年到2022年,全球人工智能专利授权量大幅增长62.7%,自2010年以来获得授权的人工智能专利数量增长了31倍以上。
2022年,中国以61.1%的比例领跑全球人工智能专利来源国,显著超过占比为20.9%的美国。自2010年以来,美国人工智能专利份额从54.1%一路下降。
不过,在顶级人工智能模型方面,美国仍领先与欧盟和英国等全球其他国家。
2023年,61款著名人工智能模型来自美国,数量远远超过欧盟的21款。
工业界主导前沿AI研究、谷歌正主导基础模型竞赛
由于训练基础模型通常需要大量资源,因此现在大部分模型都是由工业界研发出,学术界只提供少量模型。
2023年,大多数基础模型(72.5%)源自工业界,只有18.8%的基础模型源于学术界。自2019年以来,工业界产出的基础模型就开始超出学术界。
具体来看,去年工业界生产了51个知名模型,而学术界只贡献了15个,产学研合作产生的知名模型也达到21个,创历史新高。
工业界发布基础模型既是为了推动最新技术的发展,也是为了给开发人员提供一个构建产品和服务的基础。
谷歌在2023年发布的基础模型最多,达到18个,其次Meta达11个、微软为9个,发布最多的学术机构是加州大学伯克利分校 (3个)。
自2019年以来累计来看,谷歌发布的基础模型数量最多,共有40个,其次是OpenAI为20个,清华大学为7个,而斯坦福大学为5个。
前沿模型训练成本愈发高昂 谷歌Gemini Ultra达到1.91亿美元
报告指出,先进AI模型的训练成本显著增加,已达到了前所未有的水平,普遍高达数百万美元。
去年,OpenAI的GPT-4花了7800万美元进行训练,谷歌Gemini Ultra的训练成本更是高到1.91亿美元,是GPT-4的2.5倍。
值得一提的是,AI模型训练成本与模型参数呈正相关,更大的模型往往需要更高的成本。
谷歌2017年的transformer 模型(该模型引入了支撑当今几乎所有大模型的架构)的训练费用仅为930美元。
超六成基础模型开源,但闭源性能明显优于开源
当今人工智能讨论中的一个重要话题是开源和闭源的争论,一些人激烈地争辩说开源模型是危险的,而另一些人则坚持认为开源模型能推动创新。
2023年总共发布了149个基础模型,是2022年发布数量的2倍多。其中,98个是开放的,23个通过API提供了部分访问权限,28个是闭源。
这意味着在新发布的模型中,65.7%是开源的,而2022年和2021年分别只有44.4%和33.3%。
不过,在一系列常用的基准测试中,闭源模型都优于开源模型,平均性能优势为24.2%。
分析指出,开源和闭源最大争论通常是风险,关于性能权衡的讨论较少。
出于对风险控制等因素的考虑,基础模型们采用了不同的开放策略,像BLOOM、GPT-J等完全开源,PaLM、Imagen等则完全闭源。
生成式AI投资激增 降本增效效果显现
尽管去年总体AI私人投资下降,但对生成式AI的投资却大幅增长,比2022年增长了近八倍,达到252亿美元。
去年GAI占整体AI私人投资的四分之一以上。
2023年新获得投资的AI公司数量飙升至1812家,比上年增长40.6%。
而获得新融资的生成式AI初创公司数量去年达到99家,2022年为56个,2019年为31个。
企业也已经意识到AI的重要性,市场情报公司Quid分析500强财报电话会议得出,近80%的公司在电话会中讨论了人工智能,提及了人工智能、AI、机器学习、ML和深度学习等词。
企业领导者担心,如果他们不使用这项技术,就会错失良机。报告中的另一张图表显示,在麦肯锡的一项调查中,55%的公司至少在一个业务部门运用AI技术。
AI不仅仅是企业的流行语,麦肯锡的同一项调查显示,整合人工智能企业成本下降,收入增加。总体而言,42%的受访者表示成本降低了,59%的受访者表示收入增加了。
此外,研究还表明,虽然每个员工都能从AI中受益,但人工智能对低技能员工的帮助要大于对高技能员工的帮助。
AI加速科技创新 尤其是在医疗领域
AI加速科技创新,2022年标志着AI开始在科学发现领域发挥作用的一年。而到了2023年,更多与科学紧密相关的AI应用相继问世,例如AlphaDev,它通过优化算法排序提升效率;还有GNoME,它加速了材料发现的过程。
尤其是在医疗领域的创新,2023年推出多个重要AI医疗系统应用,包括EVEscape,它增强了对大流行病的预测能力;以及AlphaMissence,它辅助AI进行突变分类,这些都是推动医疗进步的关键技术。
AI系统在MedQA基准测试中的表现突飞猛进,这是衡量AI临床知识水平的关键指标。2023年,出色模型GPT-4 Medprompt的准确率达到了90.2%,较2022年的最高分提升了22.6%。自2019年该基准测试推出以来,AI在MedQA上的性能几乎翻了一番。
2022年,FDA批准了139种人工智能相关医疗器械,比2021年增长了12.1%。自2012年以来,FDA批准的人工智能相关医疗器械数量增加了45倍以上。人工智能越来越多地用于现实世界的医疗目的。
AI还不能完全打败人类 更好的数据意味着更好的AI
AI在图像分类、视觉推理、英语理解等基准上的表现超过了人类。但在更复杂的任务上,比如竞赛水平的数学、视觉常识推理和规划落后了。
数据对于AI技术的改进至关重要,使用AI创建更多数据增强了当前的能力,并为未来的算法改进铺平了道路,特别是在更难的任务上。
传统AI系统的适用范围有限,语言模型在文本理解方面表现出色,但在图像处理方面表现不佳,反之亦然。而多模态模型正在兴起,例如谷歌的Gemini和OpenAI的GPT-4。这些模型展示了灵活性,能够处理图像和文本,在某些情况下甚至可以处理音频。
“AI焦虑症”盛行
全球各地的人们认识到了AI的潜在影响,也更加焦虑。
益普索(Ipsos)的一项调查显示,31个国家的22816 名成年人(年龄在 16 岁至 74 岁之间)参与了调查。去年,认为人工智能将在未来三到五年内极大影响他们生活的人比例从 60% 上升到 66%。
此外,52%的人表示对AI产品和服务感到焦虑,较2022年上升了13个百分点。
在美国,皮尤研究中心的数据显示,52%的美国人表示对AI感到更担心而不是兴奋,这一比例高于2022年的38%。
不同人群的观点存在显著差异,年轻人更倾向于乐观地看待AI。
有趣的是,对人工智能持悲观情绪大多来自西方发达国家,印度尼西亚和泰国等地的受访者则预计人工智能的益处将大于弊端。
全球AI立法进程提速 AI风险成为企业关注问题
全球立法程序中提到AI的次数几乎翻了一番,从2022年的1247次增加到2023年的2175次。每个大洲至少有1个国家在2023年讨论了AI,这突显了AI政策话语的全球影响力。
在过去的一年和五年里,美国与AI相关的法规数量显著增加。到2023年,AI相关法规从2016年的一项增加到25项。仅去年一年,AI相关法规总数就增长了56.3%。
研究人员还将法案分为旨在增强国家AI能力的扩张性法律和对AI应用和使用施加限制的限制性法律,发现虽然许多法案都在继续促进人工智能的发展,但限制性立法已成为全球趋势。
一项关于负责任的AI的全球调查强调,企业最关心的AI问题包括隐私、安全、可靠性。调查显示,企业已经开始采取措施来降低这些风险。然而,在全球范围内,大多数公司迄今只减轻了这些风险的一部分。