第八节课《大模型微调数据构造》

第八节课《大模型微调数据构造》

article2025/1/23 4:56:49/文章来源:https://blog.csdn.net/fanre/article/details/138512316

大模型微调数据构造（补充课程）_哔哩哔哩_bilibili

Tutorial/FineTune at main · Focusshang/Tutorial · GitHub

一、大模型训练数据介绍

预训练：
- 网络、论文数据，无标签数据
- transform算法
- base model
- 典型：GPT
监督微调
- 对话数据：prompt和response，
- 人工标注或者模型生成，规模小但是质量高
- SFT Model：xtuner
RHF
- 一般不涉及，人工排序、打分，数据少，质量高
- 二分类算法
- reward model
强化学习
- prompts：问题，模型提供输出revive model排序打分
- 强化学习算法
- RL model

二、微调是什么

预训练：无标签、规模大、质量低、内容杂
微调：规模小、质量高、面向特定任务场景，人工或模型标注的问答对

三、指令微调

大模型微调fine-tuning：特定领域问题回答的不好
指令微调instruction tuning：特定任务指令

四、微调目的

预训练无法满足需求：专业问答、组织自身信息
prompt engineering局限性：输入过长、推理成本高、效果不理想
数据安全问题：企业内部数据，敏感数据
需要个性化服务：微调轻量级模型

五、微调方式

六、微调步骤☆☆☆☆

七、微调数据分类

八、微调数据质量

九、微调结果评价

十、微调实践

Tutorial/FineTune at main · Focusshang/Tutorial · GitHub

标注工具：

OpenDataLab · GitHub

OpenDataLab 引领AI大模型时代的开放数据平台

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/597158.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

【C语言】整数，浮点数数据在内存中的存储

【C语言】整数，浮点数数据在内存中的存储

Tiny Spark get dazzling some day. 目录 1. 整数在内存中的存储1.1 原码、反码、补码1.1 大小端存储1.2.1 字节序分类1.2.2 判断字节序 2. 浮点数在内存中的存储2.1 浮点数的存储形式2.2 浮点数的 “ 存 ”2.2.1 S2.2.2 E2.2.3 F 2.3 浮点数的 “ 取 ”2.3.1 S2.3.2 E、F 3. 浮…

阅读更多...

ISIS的基本概念

ISIS的基本概念

1.ISIS概述 IS-IS是一种链路状态路由协议，IS-IS与OSPF在许多方面非常相似， 例如运行IS-IS协议的直连设备之间通过发送Hello报文发现彼此，然后建立邻接关系，并交互链路状态信息。 CLNS由以下三个部分组成： CLNP&#xf…

阅读更多...

新的项目springboot

新的项目springboot

buybuyshenglombok <dependency><groupId>org.projectlombok</groupId><artifactId>lombok</artifactId></dependency> 添加依赖 lombok package com.example.demo.pojo;import lombok.AllArgsConstructor; import lombok.Data; import …

阅读更多...

LLM应用：prompt提示让大模型总结生成Mermaid流程图；充当角色输出

LLM应用：prompt提示让大模型总结生成Mermaid流程图；充当角色输出

1、prompt提示让大模型总结生成Mermaid流程图生成内容、总结文章让大模型Mermaid流程图展示： mermaid 美人鱼, 是一个类似 markdown，用文本语法来描述文档图形(流程图、时序图、甘特图)的工具，您可以在文档中嵌入一段 mermaid 文本来生成 …

阅读更多...

项目实战 | 如何恰当的处理 Vue 路由权限

项目实战 | 如何恰当的处理 Vue 路由权限

前言哈喽，小伙伴你好，我是嘟老板。最近接了一个成本千万级的前端项目运维工作，本着知己知彼的态度，我将整个前端的大致设计思路过了一遍。不看不知道，一看…吓一跳。光是路由权限这块儿的设计，都让我…

阅读更多...

linux上Redis安装使用

linux上Redis安装使用

环境centOS8 redis是缓存数据库，主要是用于在内存中存储数据，内存的读写很快，加快系统读写数据库的速度一、Linux 安装 Redis 1. 下载Redis 官网下载Downloads - Redis 历史版本Index of /releases/ 本文中安装的版本为：h…

阅读更多...

Celery + redis 异步分布式任务队列安装测试

Celery + redis 异步分布式任务队列安装测试

Celery 异步分布式任务队列 Celery 5.4.0 官方文档环境：3台 centos7.9 普通用户 redisSchedulerworkerdp951dp96111dp971 文章目录 Celery 异步分布式任务队列1、Celery 介绍2、安装部署2.1 安装消息中间件（broker）2.2 安装Celery 3、功能…

阅读更多...

mac 本地使用docker 运行es,kibana

mac 本地使用docker 运行es,kibana

1.下载 m芯片一些版本不支持.踩过坑.翻看官网才知道只有部分镜像支持m芯片 https://hub.docker.com/添加链接描述 docker pull elasticsearch:7.17.21 docker pull kibana:7.17.21镜像已经下载下来了 2.创建文件映射-挂载 /Users/lin/dev/dockerMsg 其中lin是自己的用户名…

阅读更多...

【数据结构/C语言】单链表的实现

【数据结构/C语言】单链表的实现

目录一、单链表的基本概念单链表的简介单链表的特点二、预备知识三、单链表的基本结构四、单链表的基本操作 1.链表打印 2.申请节点 3.头插 4.尾插 5.头删 6.尾删 7.查找节点 8.指定位置之前插入 9.指定位置之后插入 10.删除给定节点 11.删除给定节点之…

阅读更多...

90、动态规划-最长的有效括号

90、动态规划-最长的有效括号

思路： 找出有效括号并且是最长的有效括号 dp[i]表示以i结尾的括号最长是多少然后从1开始因为从0位置不管是左括号还是右括号都是无法形成一个完成的括号。所以dp[0]0； 当i1时候，判断括号是否是）如果不是那么无法结尾&#x…

阅读更多...

cmake进阶：变量的作用域说明一（从函数作用域方面）

cmake进阶：变量的作用域说明一（从函数作用域方面）

一. 简介如同 C 语言一样，在 cmake 中，变量也有作用域的概念，本文我们就来聊一聊关于 cmake 中变量作用域的问题。接下来从三个方面进行介绍：函数作用域、目录作用域以及全局作用域。二. 函数作用域我把这个作用域叫做函数…

阅读更多...

pycharm安装pandas包

pycharm安装pandas包

import pandas时提示未安装pandas，点击下图红框选项，进行pandas安装 pycharm底部会有安装中的提示 pycharm底部提示红框的内容，说明安装成功这个时候就可以看到import pandas不再报错了

阅读更多...

LeetCode 611. 有效三角形的个数

LeetCode 611. 有效三角形的个数

原题链接：611. 有效三角形的个数 - 力扣（LeetCode） 题目说，给定一个包含非负整数的数组 num，返回其中可以组成三角形三条边的三元组个数。示例： nums [4, 2, 3, 4]； 有效组合如下：…

阅读更多...

NIO和NIO.2对比

NIO和NIO.2对比

Java NIO (New Input/Output) 是从Java 1.4版本开始引入的一个新的I/O API，用于替代原来的BIO（Blocking I/O）API。NIO提供了更加灵活和高效的网络通信方式，特别适合于高吞吐量的网络编程。NIO的主要特点是非阻塞模式，它…

阅读更多...

数据结构（C）：玩转顺序表

数据结构（C）：玩转顺序表

🍺0.前言 🎷1.线性表 🎸2.顺序表 📀动态顺序表的实现 💿初始化 💿检查容量是否满了，进行扩容 💿插入：头插和尾插 💿删除：头删和尾删 &…

阅读更多...

Python实现2048游戏

Python实现2048游戏

提供学习或者毕业设计使用，功能基本都有，不能和市场上正式游戏相提比论，请理性对待！在这篇博客中，我们将使用 Python 和 Pygame 库来编写经典的 2048 游戏。2048 是一个益智类游戏，通过在 4x4 网格上滑动方块并合并它们来创建一个新的数字，直到获得数字 2048 或者无法继…

阅读更多...

bfs之走迷宫

bfs之走迷宫

文章目录走迷宫广度优先遍历代码Java代码打印路径走迷宫给定一个 nm 的二维整数数组，用来表示一个迷宫，数组中只包含 0或 1，其中 0表示可以走的路，1表示不可通过的墙壁。最初，有一个人位于左上角 (1,1) 处&#…

阅读更多...

leetcode-岛屿数量-99

leetcode-岛屿数量-99

题目要求思路 1.使用广度优先遍历，将数组中所有为1的元素遍历一遍，遍历过程中使用递归，讲该元素的上下左右四个方向的元素值也置为0 2.统计一共执行过多少次，次数就是岛屿数量代码实现 class Solution { public:int solve(vec…

阅读更多...

mac电脑如何安装python及环境搭建

mac电脑如何安装python及环境搭建

（1）进入官网：Download Python | Python.org，根据自己电脑选择python (2)这里我选择的是mac,点击：macos，选择最近版本并点击进入 (3)选择mac版本： (4)点击就可以进入下载： (5)下载好之…

阅读更多...

网站防御XSS攻击的有效策略与实施步骤

网站防御XSS攻击的有效策略与实施步骤

随着互联网应用的普及与发展，网站安全已成为众多企业关注的焦点，而XSS（Cross-Site Scripting）攻击作为最常见的Web安全漏洞之一，对用户数据安全构成严重威胁。本文将详细介绍网站如何有效防御XSS攻击，并提供…

阅读更多...

最新文章