XTuner微调LLM：1.8B、多模态和Agent-笔记四

XTuner微调LLM：1.8B、多模态和Agent-笔记四

article2024/12/24 11:26:56/文章来源:https://blog.csdn.net/qq_46576562/article/details/138232914

本次课程由XTuner 贡献者李剑锋、汪周谦、王群老师讲解【XTuner 微调 LLM：1.8B、多模态和 Agent】课程

课程视频：http:// https://b23.tv/QUhT6ni

课程文档：https://github.com/InternLM/Tutorial/blob/camp2/xtuner/readme.md

两种Finetune范式

增量预训练：让基座模型学习到一些新知识，如某个垂类领域的常识
指令跟随微调：让模型学会对话模板，根据人类指令进行对话

若直接用预训练的模型或增量预训练模型，可能不能回答用户的问题；经过该领域的指令微调，模型以对话的方式准确回答用户的问题。例如：

数据处理流程：

原始数据->标准格式数据->添加对话模板->Tokenized数据->添加Label

高效微调方法：LoRA、QLoRA

XTuner:

多种微调算法,多种微调策略与算法，覆兰各类 SFT 场景
适配多种开源生态,支持加载 HuggingFace、 Modelscope 模型或数据集
自动优化加速,开发者无需关注复杂的显存优化与计算加速细节

LLaMa-Factory和Xtuner性能对比

Xtuner快速上手示例

InternLM2 1.8B模型

InternLM2-1.88:具有高质量和高适应灵活性的基础模型，为下游深度适应提供了良好的起点。
InternLM2-Chat-1.8B-SFT:在 InternLM2-1.88 上进行监督微调(SFT)后得到的对话模型。
InternLM2-Chat-1.88:通过在线 RLHF 在 InternLM2-Chat-1.8B-SFT 之上进一步对齐。InternLM2-Chat-1.88 表现出更好的指令跟随、聊天体验和函数调用,推荐下游应用程序使用。(模型大小仅为3.78GB)

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/587667.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

border-image-slice详细说明

border-image-slice详细说明

上一篇文章我们介绍了 border-image的用法，其中border-image-source、border-image-width、 border-image-outset都比较简单好理解，这边文章我们重点学一下border-image-slice 属性，它用于定义边框图像如何被切割并应用到元素的边框上。这个属…

阅读更多...

JavaScript 动态网页实例 —— 数值处理对象

JavaScript 动态网页实例 —— 数值处理对象

前言 Math对象用于进行数学运算。其属性是数学中一些常见的常数值，在程序中可以直接使用。Math对象的方法很多，主要完成一些常见的数学运算，如三角函数计算、乘方、开方、求对数等。在 Math 对象的方法中，除了random()之外的所有方法都需要一个或几个参数，并且其用法基本…

阅读更多...

【数据结构】为了节省空间，对于特殊矩阵我们可以这样做……

【数据结构】为了节省空间，对于特殊矩阵我们可以这样做……

特殊矩阵的压缩存储导读一、数组与矩阵1.1 数组1.2 数组与线性表1.3 数组的存储结构1.4 矩阵在数组中的存储1.4.1 行优先存储1.4.2 列优先存储二、特殊矩阵及其压缩存储三、对称矩阵及其存储3.1 方阵与对称矩阵3.2 对称矩阵的存储3.3 压缩存储的手动实现3.3.1 行优先存储3.3.…

阅读更多...

修改Ubuntu远程登录欢迎提示信息

修改Ubuntu远程登录欢迎提示信息

无论何时登录公司的某些生产系统，你都会看到一些登录消息、警告或关于你已登录服务器的信息，如下所示。修改方式 1.打开ubuntu终端,进入到/etc/update-motd.d目录下面可以发现目录中的文件都是shell脚本, 用户登录时服务器会自动加载这个目录中的文件…

阅读更多...

大白话理解IoC和DI

大白话理解IoC和DI

引言 Spring是Java领域最受欢迎的开发框架之一，其核心功能之一就是Spring容器，也就是IoC容器。这篇文章，我们就来聊聊Spring的两大核心功能，控制反转（IOC）和依赖注入（DI）。文章思…

阅读更多...

Go 语言基础（二）【数组、切片、指针、map、struct】

Go 语言基础（二）【数组、切片、指针、map、struct】

1、数组特别需要注意的是：在 Go 语言中，数组长度也是数组类型的一部分！所以尽管元素类型相同但是长度不同的两个数组，它们的类型并不相同。 1.1、数组的初始化 1.1.1、通过初始化列表{}来设置值 var arr [3]int // int类型的数…

阅读更多...

09_Scala函数和对象

09_Scala函数和对象

文章目录函数和对象1.函数也是对象 scala中声明了一个函数等价于声明一个函数对象2.将函数当作对象来用，也就是访问函数，但是不执行函数结果3.对象拥有数据类型(函数类型)，对象可以进行赋值操作4.函数对象类型的省略写法，也就是…

阅读更多...

SCI一区 | MFO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测（Matlab）

SCI一区 | MFO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测（Matlab）

SCI一区 | MFO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测（Matlab） 目录 SCI一区 | MFO-CNN-LSTM-Mutilhead-Attention多变量时间序列预测（Matlab）预测效果基本介绍程序设计参考资料预测效果基本介绍 1.Matlab实现MFO-CNN…

阅读更多...

常见公式的几何解释

常见公式的几何解释

本文旨在深入探讨常见数学公式的几何意义，通过直观的图形和解释，帮助读者更好地理解并掌握这些公式的本质。文章首先概述了公式与几何图形之间的紧密联系，然后选取了几个典型的数学公式，进行详细解析。每个公式都将配以相应的几何…

阅读更多...

vuex的学习

vuex的学习

首先下载vuex，然后建立一个目录在vueX中接着在index。js文件夹中引入引入后导出这个文件在main.js文件中导入，这样vue就有了状态管理接着我创建了2个组件，在里边规定了一个num:0 在打印出来就可以看见映射函数mapState，必…

阅读更多...

数据结构算法——链表带环问题——数学深度解析

数据结构算法——链表带环问题——数学深度解析

前言:本节内容主要是讲解链表的两个问题 ：1、判断链表是否带环； 2、一个链表有环， 找到环的入口点。本节内容适合正在学习链表或者链表基础薄弱的友友们哦。我们先将问题抛出来，友友们可以自己去力扣或者牛客网去找相应题目&…

阅读更多...

基于SSM的个人博客系统（四）

基于SSM的个人博客系统（四）

目录 5.3 博客类别管理模块 5.3.1 添加博客类别 5.3.2 修改博客类别 5.3.3 删除博客类别 5.3.4 显示博客类别 5.4 评论管理模块 5.4.1 审核评论 5.4.2 删除评论前面内容请移步基于SSM的个人博客系统（三） 个人博客系统的设计与实现免费源码…

阅读更多...

头歌：Spark GraphX—寻找社交媒体中的“影响力用户”

头歌：Spark GraphX—寻找社交媒体中的“影响力用户”

第1关：认识Pregel API 简介 Spark GraphX中提供了方便开发者的基于谷歌Pregel API的迭代算法，因此可以用Pregel的计算框架来处理Spark上的图数据。GraphX的Pregel API提供了一个简明的函数式算法设计，用它可以在图中方便的迭代计算，如最短路径、关键路径、n度关系等，也可以…

阅读更多...

【C++】STL学习之优先级队列

【C++】STL学习之优先级队列

🔥博客主页： 小羊失眠啦. 🎥系列专栏：《C语言》《数据结构》《C》《Linux》 ❤️感谢大家点赞👍收藏⭐评论✍️ 文章目录前言一、优先级队列的使用1.1 基本功能1.2 优先级模式切换1.3 相关题目二、模拟实现优先级…

阅读更多...

AI赋能不应贵气：深度解读AI助力企业渡过经济寒冬以及如何落地AI的路径

AI赋能不应贵气：深度解读AI助力企业渡过经济寒冬以及如何落地AI的路径

AI很棒可是给人感觉“很贵”因此我不敢用继GPT4后Dalle3、Sora、GPT4.5、GPT5的消息以及前天突然出现的GPT 2.0（GPT二代，有人说这就是OPEN AI的新产品：Q*）但凡涉及到AI的一系列新闻给人予很震撼的感觉。放眼望去AI正在欣欣向荣。…

阅读更多...

$洛谷 P5854：【模板】笛卡尔树$

洛谷 P5854：【模板】笛卡尔树

【题目来源】https://www.luogu.com.cn/problem/P5854【题目描述】给定一个 1∼n 的排列 p，构建其笛卡尔树。即构建一棵二叉树，满足： 1.每个节点的编号满足二叉搜索树的性质。← 优先级 pri 满足二叉搜索树（BST）的性…

阅读更多...

强化学习(Reinforcement learning)基本概念

强化学习(Reinforcement learning)基本概念

概念： 强化学习是在与环境互动中为达到一个目标而进行的学习过程三层结构： 基本元素：agent、environment、goal agent：可以理解为玩家，即某个游戏的参与方 environment：环境本身，可以理…

阅读更多...

Web后端开发中对三层架构解耦之控制反转与依赖注入

Web后端开发中对三层架构解耦之控制反转与依赖注入

内聚与耦合内聚比如说我们刚刚书写的员工的实现类在这里我们仅仅书写的是和员工相关的代码而与员工无关的代码都没有放到这里说明内聚程度较高耦合以后软件开发要高内聚低耦合提高程序灵活性扩拓展性分析代码如何解耦创建容器提供一个容器存储东西存储E…

阅读更多...

基于FPGA的数字信号处理（5）--Signed的本质和作用

基于FPGA的数字信号处理（5）--Signed的本质和作用

前言 Verilog中的signed是一个很多人用不好，或者说不太愿意用的一个语法。因为不熟悉它的机制，所以经常会导致运算结果莫名奇妙地出错。其实了解了signed以后，很多时候用起来还是挺方便的。 signed的使用方法主要有两种，其中一种…

阅读更多...

Android View事件分发面试问题及回答

Android View事件分发面试问题及回答

问题 1: 请简述Android中View的事件分发机制是如何工作的？ 答案: 在Android中，事件分发机制主要涉及到三个主要方法：dispatchTouchEvent(), onInterceptTouchEvent(), 和 onTouchEvent(). 当一个触摸事件发生时，首先被Activity的…

阅读更多...

最新文章