ScratchLLMStepByStep：一步一步构建大语言模型教程

ScratchLLMStepByStep：一步一步构建大语言模型教程

article2025/3/9 23:36:24/文章来源:https://blog.csdn.net/xiaojia1001/article/details/144024695

前言

在学习大语言模型的时候，总会遇到各种各样的名词，像自注意力、多头、因果、自回归、掩码、残差连接、归一化等等。这些名词会让学习者听的云里雾里，觉得门槛太高而放弃。

本教程将会带你从零开始，一步一步的去构建每一个组件，揭开它们的神秘面纱，并最终用这些组件组装成一个迷你版的大语言模型。在构建过程中，我们会从实现原理的角度去剖析这些组件都是做什么的，又是怎么被设计出来的，做到知其然，知其所以然。

不仅如此，本专栏还会带你从零开始一步一步训练这个语言模型，经过预训练(Pretrain)、监督微调(SFT)、偏好学习（DPO）最终训练出一个可以进行对话聊天的大语言模型。整个过程会像探宝一样，你会因为将一个又一个新知识收入囊中而充满惊喜，也会因为弄懂了一个又一个的内部原理而持续收获到原来如此。

专栏内容

本教程大体上可以分为四部分，分别如下：

第一部分是关于语言模型的基本认识、分词器和嵌入；
第二部分是关于多头因果自注意力、transformer块、GPT模型构建；
第三部分是关于预训练、监督微调、偏好学习以及相关训练的数据集处理；
最后一部分是关于自回归文本生成、kvcache、推理加速相关的内容；

教程具有清晰的章节结构，完整目录如下：

ScratchLLMStepByStep：带你从零认识语言模型
ScratchLLMStepByStep：带你从零认识Tokenizer
ScratchLLMStepByStep：带你从零训练tokenizer
ScratchLLMStepByStep：词嵌入和位置嵌入
ScratchLLMStepByStep：带你从零认识自注意力
ScratchLLMStepByStep：带你实现因果注意力机制
ScratchLLMStepByStep：带你实现多头注意力
ScratchLLMStepByStep：带你构建TransformerBlock
ScratchLLMStepByStep：带你构建MiniGPT
ScratchLLMStepByStep：带你构建高效数据加载器
ScratchLLMStepByStep：带你进行模型预训练（制作中）
ScratchLLMStepByStep：带你进行分类监督微调（制作中）
ScratchLLMStepByStep：带你进行指令监督微调（制作中）
ScratchLLMStepByStep：带你开始DPO偏好学习（制作中）
ScratchLLMStepByStep：带你评估模型推理性能（制作中）
ScratchLLMStepByStep：带你压测模型推理性能（制作中）
ScratchLLMStepByStep：带你实现选词算法（制作中）
ScratchLLMStepByStep：带你加速模型推理（制作中）

前面几章带链接的已经制作完成，剩下的将会以每周两篇的频率更新。

本系列教程有如下特点：

可运行的代码示例：每个章节都附有运行示例，帮助您更好地理解理论与实践的结合。
一步一步的演示：课程中对每个组件的实现过程都进行了逐步拆解和演示。
-
详细的解释：对每一步用到的相关深度学习知识，都进行了解读和拓展说明。

如何开始？

如果没有模型基础，可以先从认识模型开始，这篇教程会带你逐层解剖模型生成文本的过程：

带你从零认识模型

如果不会搭建环境，可以参考下面两篇教程来搭建自己的环境：

conda&pytorch环境搭建笔记
vLLM&cuda安装笔记

如果没有使用过jupyter，这里有一篇笔记可以带你入门：

jupyter学习笔记

最后，感谢你的阅读。这个专栏能够帮助到你，欢迎订阅、评论和转发，如果你有任何问题或需要进一步的帮助，欢迎随时交流！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/928554.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

[MacOS] [kubernetes] MacOS玩转虚拟化最佳实践

[MacOS] [kubernetes] MacOS玩转虚拟化最佳实践

❓ 为什么不在MacOS本机安装呢？因为M系列芯片是Arm架构，与生产环境或者在本地调试时候，安装虚拟镜像和X86不同，造成不必要的切换环境的额外成本，所以在虚拟化的x86调试步骤 & 详情一: 安装OrbStack & 并配置…

阅读更多...

MySQL的用户管理和密码管理

MySQL的用户管理和密码管理

用户的密码管理给用户改密码初始化mysql后设置初始密码 mysqladmin -uroot password wzy666 改变已有密码 mysqladmin -uroot -pwzy666 password wzy999 SQL语句改，前提是已经进入数据库 alter user rootlocalhost identified by 123456; # 利用数据库服务…

阅读更多...

SQLite：DDL（数据定义语言）的基本用法

SQLite：DDL（数据定义语言）的基本用法

SQLite：DDL（数据定义语言）的基本用法 1 主要内容说明2 相关内容说明2.1 创建表格（create table）2.1.1 SQLite常见的数据类型2.1.1.1 integer（整型）2.1.1.2 text（文本型）2…

阅读更多...

STM32--基于STM32的智能家居设计与实现

STM32--基于STM32的智能家居设计与实现

本文详细介绍基于STM32F103C8T6的智能家居设计与实现，详细设计资料见文末链接一、功能模块介绍智能家居系统系统图如下所示，主要包括温湿度传感器、OLED液晶显示，WIFI物联网模块、人体红外预警模块、烟雾传感器模块、蜂鸣器模块 &#…

阅读更多...

基于Java Springboot校园导航微信小程序

基于Java Springboot校园导航微信小程序

一、作品包含源码数据库设计文档万字PPT全套环境和工具资源部署教程二、项目技术前端技术：Html、Css、Js、Vue、Element-ui 数据库：MySQL 后端技术：Java、Spring Boot、MyBatis 三、运行环境开发工具：IDEA/eclipse微信开发…

阅读更多...

在 uniapp 项目中使用 Iconify 字体图标库

在 uniapp 项目中使用 Iconify 字体图标库

本文示例在 uniapp 项目中对 Iconify 字体图标库的安装和使用（Iconify 字体图标库是一个免费开源的图标库，它拥有超过20万个开源矢量图标。） 注：本文示例使用的是其 vue3 版本安装 npm install --save-dev iconify/vue 注&am…

阅读更多...

WPF+LibVLC开发播放器-LibVLC播放控制

WPF+LibVLC开发播放器-LibVLC播放控制

接上一篇： LibVLC在C#中的使用实现LibVLC播放器播放控制界面界面上添加一个Button按钮用于控制播放 <ButtonGrid.Row"1"Width"88"Height"24"Margin"10,0,0,0"HorizontalAlignment"Left"VerticalAlignme…

阅读更多...

ffmpeg安装及配置简单教程

ffmpeg安装及配置简单教程

这是ffmpeg官方网站：https://ffmpeg.org/ 这是ffmpeg提供了其他版本的网站：Builds - CODEX FFMPEG gyan.dev 这是ffmpeg提供了提前编译好的可执行文件的github托管网站： https://github.com/BtbN/FFmpeg-Builds/releases 一般windows版本…

阅读更多...

Qt-界面优化QSS

Qt-界面优化QSS

QSS介绍先说下CSS： 在⽹⻚前端开发领域中, CSS 是⼀个⾄关重要的部分. 描述了⼀个⽹⻚的 "样式". 从⽽起到对⽹⻚美化的作⽤。 Qt 仿照 CSS 的模式, 引⼊了 QSS, 来对 Qt 中的控件做出样式上的设定。 CSS的功能很强大，QSS要逊色一些&#…

阅读更多...

后端-一对一的数据封装的两种写法对比

后端-一对一的数据封装的两种写法对比

方式一特点：上面的普通封装可以删掉，也可以留着。注意⚠️：下面的特殊封装的property的值是属性.字段。（category.id...) column是sql重命名之后的字段，如果没有重命名是数据库中的值。方式二特点：上面的…

阅读更多...

CTF之密码学（密码特征分析）

CTF之密码学（密码特征分析）

一.MD5,sha1,HMAC,NTLM 1.MD5：MD5一般由32/16位的数字(0-9)和字母(a-f)组成的字符串 2.sha1：这种加密的密文特征跟MD5差不多，只不过位数是40（sha256：64位；sha512:128位） 3.HMAC：这…

阅读更多...

网络安全框架及模型-PPDR模型

网络安全框架及模型-PPDR模型

网络安全框架及模型-PPDR模型概述：为了有效应对不断变化的网络安全环境，人们意识到需要一种综合性的方法来管理和保护网络安全。因此，PPDR模型应运而生。它将策略、防护、检测和响应四个要素结合起来，提供了一个全面的框架来处理网络安全问题。工作原理： PPDR模型的…

阅读更多...

QT6学习第八天 QFrame 类

QT6学习第八天 QFrame 类

QT6学习第八天 QFrame 类族QLabel 标签部件按钮部件QLineEdit 行编辑器部件QAbstractSpinBoxQAbstractSlider 今天来学一学 QFrame 类。 QFrame 类族 QFrame 类是带有边框的部件的基类。它的子类包括常用的标签部件 QLabel、以及 QLCDNumber、QSplitter、QStackedWidget、QToo…

阅读更多...

c++预编译头文件

c++预编译头文件

文章目录 c预编译头文件1.使用g编译预编译头文件2.使用visual studio进行预编译头文件2.1visual studio如何设置输出预处理文件（.i文件）2.2visual studio 如何设置预编译（初始创建空项目的情况下）2.3 visual studio打开输出编译时…

阅读更多...

简单快速的上手python

简单快速的上手python

前言 python是一门可以快速上手的语言，原因是它语法简单，api容易使用自由灵活当我们需要安装任何的三方库时，只需要执行 pip install XX 之后在代码里面import xxx就可以使用python啦。并且python的代码自由灵活，使用缩进区…

阅读更多...

【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势？

【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势？

【NLP高频面题 - LLM架构篇】旋转位置编码RoPE相对正弦位置编码有哪些优势？ 重要性：⭐⭐⭐ 💯 NLP Github 项目： NLP 项目实践：fasterai/nlp-project-practice 介绍：该仓库围绕着 NLP 任务模型的设计、训练…

阅读更多...

论文：IoU Loss for 2D/3D Object Detection

论文：IoU Loss for 2D/3D Object Detection

摘要：在2D/3D目标检测任务中，IoU (Intersection-over- Union)作为一种评价指标，被广泛用于评价不同探测器在测试阶段的性能。然而，在训练阶段，通常采用常见的距离损失(如L1或L2)作为损失函数，以最小化预测值…

阅读更多...

STM32 HAL库开发学习1.STM32CubeMX 新建工程

STM32 HAL库开发学习1.STM32CubeMX 新建工程

STM32 HAL库开发学习1.STM32CubeMX 新建工程一、 STM32 CubeMX 下载二、CubeMX 功能介绍1. 固件包路径设置2. 新建工程三、创建项目实例1. 新建项目2. GPIO 管脚设置3. GPIO 窗口配置4. 调试设置5. 时钟配置6. 项目管理（1）项目信息（2&#…

阅读更多...

Qt的定时器应用案例 || Qt的图片添加显示

Qt的定时器应用案例 || Qt的图片添加显示

目录 1.ui界面 2.头文件 3.cpp源文件 4.main文件 5.关于ui_mytimerevent.h的代码编译错误 6.图片的添加展示方式 7.结果展示 8.参考文章 1.ui界面 2.头文件 #ifndef MYTIMEREVENT_H #define MYTIMEREVENT_H#include <QMainWindow> #include <QTime> //#in…

阅读更多...

Linux中的常用基本指令(下)

Linux中的常用基本指令(下)

Linux常用基本指令 Linux中的基本指令12.head指令13.tail指令简单解释重定向与管道(重要) 14.date指令(时间相关的指令)15.cal指令(不重要)16.find指令(灰常重要）17.grep指令(重要)18.which指令和alias指令19.zip/unzip指令：20.tar指令（重要&…

阅读更多...

最新文章