强推!大语言模型『百宝书』,一文缕清所有大模型!

图片

 夕小瑶科技说 原创
 作者 | 王思若

最近,大型语言模型无疑是AI社区关注的焦点,各大科技公司和研究机构发布的大模型如同过江之鲫,层出不穷又眼花缭乱。

让笔者恍惚间似乎又回到了2020年国内大模型“军备竞赛”的元年,不过那时候大模型海量算力需求限制了这注定只是少数科技公司的赛场,如今用少量资源即可在基础模型上做指令微调、人类反馈以应用到某个垂直领域,LLMs领域当前呈现出‘吊诡’的繁荣,模型和数据集存储库Hugging Face中已经有近16000个文本生成模型,社区每周都会有数百个新的模型发布,Hugging Face从2022/12到2023/6的六个月内就新增了10万个模型,一方面投资者鼓吹落地,似乎新的范式已到,另一方面,各色研究机构生怕赶不上潮流,都试图在大模型领域留下自己的一个身位。

无论如何,舞台的聚光灯早已汇聚到大模型上,在这寸‘你方唱罢,我登场’的舞台上,笔者细捋一下大型语言模型的师承和脉络,略有偏颇,欢迎小伙伴在评论区留言补充~

github地址:
https://github.com/WangHuiNEU/llm

大模型可以分为基座模型和在基座模型上进行指令微调、人类反馈对齐等instruction-tuning之后的微调模型。但实际上,正如艾伦研究所的文章‘How Far Can Camels Go?’所指明的:不同的指令微调数据集可以释放或者增强特定的能力,但并没有一个数据集或者组合可以在所有的评估中提供最佳性能,因此,我们需要一个更大强大的基座模型。

大模型研究测试传送门

GPT-4能力研究传送门(遇浏览器警告点高级/继续访问即可):(https://gpt4test.com)

实际上,更简单的可以理解为,指令微调并不会为模型增加新的能力,基座模型本身奠定了应用的范畴,指令微调只是用极少量的数据快速激发出某个领域范畴的能力强弱。实际微调过一些大模型的小伙伴可能会对此感触颇深,因此,更加合理的大模型故事线是围绕基座模型。下面将针对Google系、Meta系、OpenAI系和其他科技公司的基座模型,和基于基座的一些微调模型进行详细展开。

图片

大模型的进化树

一、Google系模型

Google在大模型赛道一直是最受关注的存在,但尴尬的是,面对着ChatGPT的强势猛攻,占据搜索领域绝大部分份额的Google在新型的检索生成竞赛中不可能猛然转身去动其核心的搜索广告业务,但在大模型领域,Google有着最为深厚的积累,例如,在2017年提出Transformer架构,2021年提出的Pathways架构在笔者看来更是将工程优化推到了极致。

Google原本分别有两个研究小组:Google Brain和Deepmind,但在今年4月合并为了 Google Deepmind,但这里依然分开去讲述。

1. 基座模型

Google Brain

模型名称时间是否开源参数规模
T52019-1013B
LaMDA2021-05137B
PaLM2022-04540B

有趣的是,LaMDA是Google早在2020年就被开发和推出的对话式语言模型,但Google考虑安全问题拒绝对公众开放,首席研究员 Daniel De Freitas 和 Noam Shazeer 因此沮丧地离开了公司【去年9月,这两位成立了基于 LLM 的聊天机器人网站Character.AI,也算是一直坚持自己的目标了】,Google在对话生成方向起了个大早,赶了个晚集,手动狗头~

PaLM是基于Google提出的高效模型训练的下一代AI架构Pathways构建的超大语言模型,5400亿的参数量,是目前最大的稠密Transformer模型,也是目前综合性能最强大的基座语言模型。

DeepMind

模型名称时间是否开源参数规模
Gopher2021-12280B
Chinchilla2022-0470B

Chinchilla是DeepMind重新思考了大模型的scaling laws(缩放定律),实证研究分析得出数据规模和参数规模一样重要,因此,训练得到的Chinchilla用仅Gopher1/4参数量反而性能显著超越Gopher,训练数据规模和训练参数一样重要!

Google DeepMind

模型名称时间是否开源参数规模
PaLM 22023-05340B(小道消息,未证实~)

4月,Google决定集中力量办大事,Google Brain和DeepMind合并为Google DeepMind。5月,谷歌I/O 2023大会,Google提出了更为强大的PaLM 2,合理的大模型缩放法则+多样化的数据集,PaLM 2无疑是Google在这波浪潮中保持头部地位的底气所在。

2. 指令微调模型

单位模型名称基座模型是否开源
Hugging FaceT0T5
GoogleFLANT5
GoogleFlan-T5/Faln-PaLMT5/PaLM
GoogleBard(生成人工智能聊天机器人)之前是LaMDA,后面是PaLM 2

基于基座模型,进行instrucion-tuning可赋予模型强大的对齐能力。这里有趣的是,2 月 6 日,Google 宣布推出 Bard,这是一款由 LaMDA 提供支持的对话式生成人工智能聊天机器人,但刚开始推出时,相对于ChatGPT差劲的性能一度让Google的股价下跌了8%,后续Google基于更强大的LaMDA做了改进,但无论内部和外部都质疑声不断,5月,Google I/O大会宣布基于PaLM 2模型对Bard做了更新。

Bard无疑是Google面对ChatGPT的回应,但检索广告占其总收入的60%,Google做不到像Bing一样直接将检索生成加入到浏览器结果中,。Google在这里选择了不同的道路,将检索和Bard做成两款互补的产品,目前Bard也一直在 bard.google.com 这块小空间里圈地自萌,目前Google计划结合基于AlpaGo中使用的技术开发出更为强大的模型Gemini。

二、Meta系模型

Meta可是所有巨头中最为拥抱开源的科技公司,Meta AI基础人工智能研究院团队首席人工智能科学家Yann LeCun表示:让AI平台安全良善实用的唯一方法就是开源。当然,Meta的开源模型也造福了国内绝大多数的大模型玩家们,再次手动狗头~

1. 基座模型

模型名称时间是否开源参数规模
OPT2022-05125M-175B
LLaMA2023-027B-65B

开源先行者Meta在OpenAI选择闭源GPT-3的情况下,对标GPT-3,直接开源千亿参数的OPT模型,但OPT相对比GPT-3模型性能差一些。之后,启发于DeepMind发现的缩放法则,Meta缩小了模型参数在更大的数据集上训练了LLaMA(Large Language Model Meta AI),130亿参数的模型与GPT-3性能大致相当,650亿参数的模型性能可以媲美Chinchilla-70B和PaLM-540B,大模型开启驼系(LLaMA)时代~

2. 指令微调模型

单位模型名称基座模型是否开源
MetaOPT-IMLOPT-175B
StanfordAlphacaLLaMA
StanfordVicunaLLaMA

LLaMA无疑最常被大家当做基座模型用来做指令微调适配到法律、医学等专业领域,特别是7月19日,Meta AI发布可免费商用的开源模型LLaMA 2, 包括7B, 13B和70B三种规模,动手快的已经用中文数据做了指令微调,例如,Llama2-chinese几天时间star数飙升1.7k,拼手速的时候到了~

图片

图片

LLaMA变体,图来源于《A Survey of Large Language Models

LLaMA的徒子徒孙们,有驼系(羊驼Alpaca, 小羊驼Vicuna),动物园系(考拉Koala,山羊Goat,熊猫Panda),神话系(姜子牙Ziya,白泽Baize),逐渐从动物园走向了神话传说~

三、OpenAI系模型

1. 基座模型

图片

如果追溯GPT系列发展的时间线,我们会发现这是一项横跨五年的技术探索,从GPT-2到GPT-3,其实也只是在几乎不改变模型框架的基础上从15亿的参数量迭代到1750亿,不同于Google推出T5、Switch Transformer和PaLM等一系列大模型的赛马机制,OpenAI‘矢志不渝’地坚持着GPT路线。

2. 指令微调模型

图片

2017年OpenAI提出RLHF(人类反馈强化学习,Reinforcement Learning from Human Feedback)技术;2022年,OpenAI将RLHF应用于GPT-3并开发出InstructGPT,相对于GPT-3更善于遵循用户意图,虽然参数量只有1.3B,比175B GPT-3模型参数少了100多倍,微调成本更是只有GPT-3的2%。

3月14日,GPT-4发布,OpenAI给出了技术报告和3分钟的预告片。GPT-4支持多模态,能够识图、生成歌词、做网站,并且刷爆了人类社会各个领域的考试,已经达到了哈佛、斯坦福等顶尖高校的水平。现已集成到微软New Bing和ChatGPT Plus。

微软Microsoft 365全面引入生成式AI助手Copilot,将GPT-4集成到了Word、Excel、PowerPoint、Outlook和Teams等应用中,用户可以提出问题并提示AI撰写草稿、制作演示文稿、编辑电子邮件、制作演示文稿、总结会议等。

四、开源社区、研究院和一些科技公司构建的大模型

1. 基座模型

为了打破 OpenAI 和微软对自然语言处理 AI 模型的垄断,前OpenAI研究副总裁Dario Amodei带领一批从OpenAI出走的员工创立了致力于提高AI安全和可解释性的人工智能安全和研究公司Anthropic。

Connor Leahy、Leo Gao 和 Sid Black 创立了专注于人工智能对齐、扩展和开源人工智能研究的组织EleutherAI。

之后Hugging Face 社区带头成立了BigScience项目,这是一个包容、开放、协作共享的大型语言模型(LLM)社区,围绕研究和创建超大型语言模型的开放式协作研讨会,由HuggingFace、GENCI和IDRIS发起的开放式合作,汇集了全球 1000 多名研究人员。

国内的包括北京智源人工智能研究院BAAI、清华和百度等也都打造了自己的基座模型。

组织模型名称时间是否开源参数规模
AnthropicAnthropic-LM v4-s32021-1252B
北京智源人工智能研究院天鹰Aquila2023-067B/33B
BaiduERNIE 3.02021-12260B
清华GLM2022-8130B
EleutherAIGPT-Neo2021-032.7B
EleutherAIGPT-J2021-066B
EleutherAIGPT-NeoX2022-0420B
BigScienceBLOOM2022-11176B

2. 指令微调模型

单位模型名称基座模型是否开源
北京智源人工智能研究院AquilaChat-7BAquila-7B
北京智源人工智能研究院AquilaChat-33BAquila-33B
BigScienceBLOOMZBLOOM
EleutherAIGPT-NeoXGPT-Neo
Baidu文心一言ERNIE 3.0
AnthropicClaude  2Anthropic-LM v4-s3

总结

本文总结了主流的基座模型以及对应的指令微调模型,希望社区的小伙伴多多讨论,一起努力构建更为强大的中文社区的语言模型~

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/52548.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

DSA之图(4):图的应用

文章目录 0 图的应用1 生成树1.1 无向图的生成树1.2 最小生成树1.2.1 构造最小生成树1.2.2 Prim算法构造最小生成树1.2.3 Kruskal算法构造最小生成树1.2.4 两种算法的比较 1.3 最短路径1.3.1 两点间最短路径1.3.2 某源点到其他各点最短路径1.3.3 Dijkstra1.3.4 Floyd 1.4 拓扑排…

【前端知识】React 基础巩固(三十六)——RTK中的异步操作

React 基础巩固(三十六)——RTK中的异步操作 一、RTK中使用异步操作 引入RTK中的createAsyncThunk,在extraReducers中监听执行状态 import { createSlice, createAsyncThunk } from "reduxjs/toolkit"; import axios from "axios";export cons…

第七篇:k8s集群使用helm3安装Prometheus Operator

安装Prometheus Operator 目前网上主要有两种安装方式,分别为:1. 使用kubectl基于manifest进行安装 2. 基于helm3进行安装。第一种方式比较繁琐,需要手动配置yaml文件,特别是需要配置pvc相关内容时,涉及到的yaml文件太…

程序员做项目必用的工具【更新中...】

每个程序员多多少少都会有自己简化项目的小工具,我采访了我们公司所有的工程师总结了程序员必备工具篇。 一.unisms 官网:https://unisms.apistd.com/ 不会有人这年头写注册登录还是自己写验证码模块吧? 你该得拥有一个短信验证码平台了&…

【GUI】基于开关李雅普诺夫函数的非线性系统稳定(Matlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

pytest 入门

1,安装pytest 打开终端或命令提示符窗口,在终端中运行以下命令来安装pytest: pip install pytestpip install -i https://pypi.tuna.tsinghua.edu.cn/simple pytest 确保您的系统上已经安装了Python。您可以在终端中运行以下命令来检查Python的安装情况: pytest --version…

汽车分析,随时间变化的燃油效率

简述 今天我们来分析一个汽车数据。 数据集由以下列组成: 名称:每辆汽车的唯一标识符。MPG:燃油效率,以英里/加仑为单位。气缸数:发动机中的气缸数。排量:发动机排量,表示其大小或容量。马力&…

伦敦金在非农双向挂单

对伦敦金投资有一定经验的投资者都知道,在非农时期,伦敦金市场会出现很大的波动,那么我们如何才能抓住这些波动呢?答案是很难的。但是,有些投资者在多年实践中发明了一种双向挂单的方法,这里和大家一切分享…

使用easyui的tree组件实现给角色快捷分配权限功能

这篇文章主要介绍怎么实现角色权限的快捷分配功能,不需要像大多数项目的授权一样,使用类似穿梭框的组件来授权。 具体实现:通过菜单树的勾选和取消勾选来给角色分配权限,在这之前,需要得到角色的菜单树,角色…

vue实现flv格式视频播放

公司项目需要实现摄像头实时视频播放,flv格式的视频。先百度使用flv.js插件实现,但是两个摄像头一个能放一个不能放,没有找到原因。(开始两个都能放,后端更改地址后不有一个不能放)但是在另一个系统上是可以…

盛元广通实验室教学仪器设备综合信息管理系统LIMS

实验室作为学生以及教师进行科研教学环境,对于实验室设备的使用情况、维护、借还、台账管理、盘点、报废等需要得到有效的管理,以促进科研教学工作的高质量开展,介于传统手动管理方式越发不能满足现代科研的飞速发展需要,实验室的…

使用Django自带的后台管理系统进行数据库管理的实例

Django自带的后台管理系统主要用来对数据库进行操作和管理。它是Django框架的一个强大功能,可以让你快速创建一个管理界面,用于管理你的应用程序的数据模型。 使用Django后台管理系统,你可以轻松地进行以下操作: 数据库管理&…

MySQL高级篇第4章(逻辑架构)

文章目录 1、逻辑架构剖析1.1 服务器处理客户端请求1.2 Connectors1.3 第一层:连接层1.4 第二层:服务层1.5 第三层:引擎层1.6 存储层1.7 小结 2、SQL执行流程2.1 MySQL 中的 SQL执行流程2.2 MySQL8中SQL执行原理2.3 MySQL5.7中SQL执行原理2.4…

分享一个jquery重复绑定事件的问题

这篇文章主要分享一下前端在使用jQuery给元素绑定click事件时遇到的一点小问题。 今天在通过JS代码动态绑定元素的点击事件时遇到一点问题,如上图所示,需要实现动态控制低级内丹格子的解锁,每种宠物造型都有一个内丹数量。如图,忘…

Python Web 开发及 Django 总结

title: Python Web 开发及 Django 总结 date: 2023-07-24 17:26:26 tags: PythonWeb categories:Python cover: https://cover.png feature: false Python 基础部分见:Python 基础总结 1. 创建项目 1.1 命令行 1、下载安装 Django 在终端输入 pip install djan…

【CNN-BiLSTM-attention】基于高斯混合模型聚类的风电场短期功率预测方法(Pythonmatlab代码实现)

💥💥💞💞欢迎来到本博客❤️❤️💥💥 🏆博主优势:🌞🌞🌞博客内容尽量做到思维缜密,逻辑清晰,为了方便读者。 ⛳️座右铭&a…

【iOS】Frame与Bounds的区别详解

iOS的坐标系 iOS特有的坐标是,是在iOS坐标系的左上角为坐标原点,往右为X正方向,向下为Y正方向。 bounds和frame都是属于CGRect类型的结构体,系统的定义如下,包含一个CGPoint(起点)和一个CGSiz…

【云原生系列】云计算概念与架构设计介绍

1 什么是云计算 云计算是一种基于互联网的计算模式,在这个模式下,各种计算资源(例如计算机、存储设备、网络设备、应用程序等)可以通过互联网实现共享和交付。云计算架构设计的主要目标是实现高效、可扩展、可靠、安全和经济的计算…

Spring优雅的在事务提交/回滚前后插入业务逻辑

业务背景 业务那边想要统计下我们这边每天注册商户成功和失败的数量,你看看怎么给他弄下这个功能 功能实现 TransactionSynchronizationManager.registerSynchronization,发现这是spring事务提供的注册回调接口的方法。 在事务注解方法中&#xff0c…

【双评价笔记】农业指向之水资源评价

农业指向水资源单项评价是基于区域内及邻近地区气象站点长时间序列降水观测资料,通过空间插值得到多年平均降水量分布图层,降水量按照200,400,800,1200这个间断点分为好(很湿润),较好(湿润),一般(半湿润),较差(半干旱),差(干旱)5 个等级。 本次实验过程采用的评价分…