🔥博客主页:西瓜WiFi
🎥系列专栏:《大语言模型》
❤️感谢大家点赞👍 收藏⭐ 评论⭐
🎥大语言模型LLM基础-系列文章:
【大语言模型LLM】-大语言模型如何编写Prompt?
【大语言模型LLM】-如何使用大语言模型提高工作效率?
【大语言模型LLM】-使用大语言模型搭建点餐机器人
⭐持续更新中…
通用类大模型集合
资源名(Name) | 公司 | 描述(Description) | 链接 |
---|---|---|---|
ChatGPT | OpenAI | OpenAI开发的一种基于GPT架构的对话生成模型。它使用大规模的文本数据进行预训练,具有生成自然、流畅的文本对话的能力。ChatGPT可以用于各种对话场景,包括问答、闲聊、客服等,能够与用户进行智能对话,并提供相关信息和建议。ChatGPT在语言理解和生成方面取得了显著的进展,为人机交互提供了更加智能和自然的体验。 | ChatGPT |
Copilot | Microsoft | Copilot是一个多功能的AI助手,由微软开发并集成在Windows 11操作系统中。它利用大语言模型(LLM)技术,能够理解和执行人类的指令,完成各种任务。Copilot可以在不同的应用程序中使用,例如Word、Excel、Outlook、PowerPoint等,帮助用户编写文本、分析数据、管理邮件、创建演示文稿等。它还可以通过BusinessChat功能访问用户的邮件、文档和演示文稿,以提供更个性化的服务。 | Copilot |
LLaMA | Meta | LLaMA 是 Meta AI 发布的包含 7B、13B、33B 和 65B 四种参数规模的基础语言模型集合,LLaMA-13B 仅以 1/10 规模的参数在多数的 benchmarks 上性能优于 GPT-3(175B),LLaMA-65B 与业内最好的模型 Chinchilla-70B 和 PaLM-540B 比较也具有竞争力。 | LLaMA |
ChatGLM | 智普AI | ChatGLM-6B 是一个开源的、支持中英双语问答的对话语言模型,基于 General Language Model (GLM) 架构,具有 62 亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需 6GB 显存)。ChatGLM-6B 使用了和 ChatGLM 相同的技术,针对中文问答和对话进行了优化。经过约 1T 标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持,62 亿参数的 ChatGLM-6B 已经能生成相当符合人类偏好的回答。 ChatGLM-6B 权重对学术研究完全开放,在填写问卷进行登记后亦允许免费商业使用。 | ChatGLM |
文心一言 | 百度 | 文心一言(英文名:ERNIE Bot)是百度全新一代知识增强大语言模型,文心大模型家族的新成员,能够与人对话互动、回答问题、协助创作,高效便捷地帮助人们获取信息、知识和灵感。文心一言从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。 | 文心一言 |
通义千问 | 阿里巴巴 | 通义千问,是阿里云推出的一个超大规模的语言模型。于2023年9月13日正式向公众开放。属于(AI Generated Content,AIGC)领域。是一个MaaS(模型即服务)的底座。通义,取自《汉书》中的“天地之常经,古今之通义也”,有“普遍适用的道理与法则”之意。通义千问功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。 | 通义千问 |
盘古大模型 | 华为 | 盘古大模型是华为旗下的一系列AI大模型,包括自然语言处理(NLP)大模型、计算机视觉(CV)大模型和科学计算大模型。 | 盘古大模型 |
混元大模型 | 腾讯 | 由腾讯研发的大语言模型,具备强大的中文创作能力,复杂语境下的逻辑推理能力,以及可靠的任务执行能力 。 | 混元大模型 |
豆包 | 字节跳动 | 豆包是字节跳动公司基于云雀模型开发的AI工具,提供聊天机器人、写作助手以及英语学习助手等功能,它可以回答各种问题并进行对话,帮助人们获取信息,支持网页 Web 平台,iOS 以及安卓平台,但 iOS 需要使用 TestFlight 安装。 | 豆包 |
360 智脑 | 360 | 360智脑是360自研认知型通用大模型,依托360多年积累的大算力、大数据、工程化等关键优势,集成360GPT大模型、360CV大模型、360多模态大模型技术能力,具备生成创作、多轮对话、逻辑推理等十大核心能力、数百项细分功能,重塑人机协作新范式。为服务产业数字化,360发布企业级AI大模型战略,以人为本,构建安全可信大模型。 | 360 智脑 |
星火认知 | 科大讯飞 | 讯飞星火认知大模型是科大讯飞发布的大模型。该模型具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模交互,该模型对标ChatGPT 。 | 星火认知 |
商量SenseChat | 商汤科技 | 商汤科技旗下的中文语言大模型,“商量SenseChat”在活动现场展示了多轮对话和超长文本的理解能力。包括:编程助手,可帮助开发者更高效地编写和调试代码;健康咨询助手,为用户提供个性化的医疗建议;PDF文件阅读助手,能轻松从复杂文档中提取和概括信息。 | 商量SenseChat |
紫东太初 | 中国科学院 | “紫东太初”是由中国科学院自动化研究所研发的跨模态通用人工智能平台。这个平台的特点是它的全球首个图文音(视觉-文本-语音)三模态预训练模型,具备跨模态理解与生成能力。它基于全栈国产化基础软硬件平台,旨在支持全场景AI应用。 | 紫东太初 |
百川大模型 | 百川智能 | Baichuan3 超千亿模型,基础能力全面跃升,在众多权威通用及医疗评测中的中文表现超越GPT-4。突破“迭代式强化学习”技术,大幅提升语义理解和生成能力,融汇古今智慧,展现卓越文采。 | 百川大模型 |
天工AI | 昆仑万维和奇点智源 | “天工 3.0”采用 4000 亿级参数 MoE(混合专家模型),官方称是全球模型参数最大、性能最强的 MoE 模型之一,性能超过 Grok 1.0。“天工 3.0”号称全球首个多模态“超级模型”,集成了 AI 搜索、AI 写作、AI 长文本阅读、AI 对话、AI 语音合成、AI 图片生成、AI 漫画创作、AI 图片识别、AI 音乐生成、AI 代码写作、AI 表格生成等多项能力,官方称其为“大模型时代的超级应用”。 | 天工AI |
kimi | 月之暗面 | Kimi是一款由月之暗面开发的国产人工智能大模型,主要用于自然语言处理、图像识别、语音识别等多个领域。这款人工智能产品在应用方面表现出色,在智能客服、智能家居、自动驾驶等多个领域都取得了显著的突破。例如,在智能客服领域,Kimi能够准确理解用户的意图和需求,提供高效个性化的服务;在智能家居领域,Kimi可以实现家居设备的智能控制和联动,为用户打造更加便捷舒适的生活环境;在自动驾驶领域,Kimi能够通过感知、决策和执行等环节实现车辆的安全高效行驶。 | kimi |