新技术前沿-2024-国内主流AI大模型架构及应用场景深度分析

参考国内主流AI 大模型架构及应用场景深度分析 2024

1 厂商总览

在这里插入图片描述

1.1 国外

(1)Open AI：GPT-4【美国旧金山的人工智能研究公司】
GPT-4于2023年3月14日发布，是千亿级参数的多模态预训练模型，能够支持图像和文本的输入。
(2)Anthropic(人类的)：Claude【美国人工智能初创公司】
Claude于2023年3月14日发布，是Anthropic开发的类似ChatGPT的聊天机器人，使用的是constitutional(宪法的)AI的偏好模型。
(3)Google：PaLM-E【美国的跨国科技企业】
PaLM-E于2023年3月10日发布，是一种多模态视觉语言模型(VLM)，具有5620亿个参数，集成了可控制机器人的视觉和语言能力。
(4)Naver：HyperCLOVA【韩国最大门户网站】
与三星电子合作，于2021年5月发布，超过2000亿个参数的超大规模模型；97%使用的是韩文语料，计划23H1基于大模型推出Search GPT。
(5)Kakao：KoGPT【韩国互联网巨头】
于2021年发布，专注于开发基于AI的图像创建技术和医疗保健技术。
(6)LG：Exaone【韩国第四大财团LG集团】
于2022年12月发布，拥有3000亿参数，使用图像和文本数据的多模态模型，是目前韩国参数规模最大的模型，用于生物医药和智能制造行业。
(7)Meta：SAM、LLaMA【美国加利福尼亚州原名Facebook】
视觉模型SAM：于2023年4月发布，通过精细标注，识别分割画面上的指定物体。
大语言模型LLaMA：于2023年2月发布，包括4种参数规模。

1.2 国内

在这里插入图片描述

2 评价门槛

本次评估模型设立“中国市场落地”“全栈能力”“商业基础”、“产品市场”、四项基线，同时满足这四项基线要求的大模型厂商，将入围竞争力评估。
在这里插入图片描述

(1)中国市场落地：截止目前，海外大模型厂商尚未在中国落地，其产品服务和生态圈打造等关键能力在中国市场均有缺失，而非官方渠道使用相关服务的企业将面临高风险。例如，OpenAI尚未向中国用户开放ChatGPT及GPT-4服务，类似的情况同样出现在谷歌、Meta等大模型厂商提供的相应服务上。相较而言，接入国产及自主研发的大模型更加现实、稳定且具有可控性。

(2)全栈能力：大模型服务考核厂商从算力基础设施、深度学习框架到算法设计优化的全栈大模型解决方案能力，以及相应的工程化和运营经验与水平。因此，入围的厂商应具备相关全栈能力，如应有自建且自运营的算力基础设施、领先的算法设计等能力。

(3)商业基础：大模型厂商在技术层保持投入的同时，还应拥有大模型商业输出能力的积累，将

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/567537.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！