参考国内主流AI 大模型架构及应用场景深度分析 2024
1 厂商总览
1.1 国外
(1)Open AI:GPT-4【美国旧金山的人工智能研究公司】
GPT-4于2023年3月14日发布,是千亿级参数的多模态预训练模型,能够支持图像和文本的输入。
(2)Anthropic(人类的):Claude【美国人工智能初创公司】
Claude于2023年3月14日发布,是Anthropic开发的类似ChatGPT的聊天机器人,使用的是constitutional(宪法的)AI的偏好模型。
(3)Google:PaLM-E【美国的跨国科技企业】
PaLM-E于2023年3月10日发布,是一种多模态视觉语言模型(VLM),具有5620亿个参数,集成了可控制机器人的视觉和语言能力。
(4)Naver:HyperCLOVA【韩国最大门户网站】
与三星电子合作,于2021年5月发布,超过2000亿个参数的超大规模模型;97%使用的是韩文语料,计划23H1基于大模型推出Search GPT。
(5)Kakao:KoGPT【韩国互联网巨头】
于2021年发布,专注于开发基于AI的图像创建技术和医疗保健技术。
(6)LG:Exaone【韩国第四大财团LG集团】
于2022年12月发布,拥有3000亿参数,使用图像和文本数据的多模态模型,是目前韩国参数规模最大的模型,用于生物医药和智能制造行业。
(7)Meta:SAM、LLaMA【美国加利福尼亚州原名Facebook】
视觉模型SAM:于2023年4月发布,通过精细标注,识别分割画面上的指定物体。
大语言模型LLaMA:于2023年2月发布,包括4种参数规模。
1.2 国内
2 评价门槛
本次评估模型设立“中国市场落地”“全栈能力”“商业基础”、“产品市场”、四项基线,同时满足这四项基线要求的大模型厂商,将入围竞争力评估。
(1)中国市场落地:截止目前,海外大模型厂商尚未在中国落地,其产品服务和生态圈打造等关键能力在中国市场均有缺失,而非官方渠道使用相关服务的企业将面临高风险。例如,OpenAI尚未向中国用户开放ChatGPT及GPT-4服务,类似的情况同样出现在谷歌、Meta等大模型厂商提供的相应服务上。相较而言,接入国产及自主研发的大模型更加现实、稳定且具有可控性。
(2)全栈能力:大模型服务考核厂商从算力基础设施、深度学习框架到算法设计优化的全栈大模型解决方案能力,以及相应的工程化和运营经验与水平。因此,入围的厂商应具备相关全栈能力,如应有自建且自运营的算力基础设施、领先的算法设计等能力。
(3)商业基础:大模型厂商在技术层保持投入的同时,还应拥有大模型商业输出能力的积累,将