大模型微调常见方法

article2025/2/22 23:47:31/文章来源:https://blog.csdn.net/wshlchl/article/details/139374135

0， prefix tuning

prefix-tuning 跟 soft prompt tuning 类似，只不过，soft prompt tuning 仅仅针对 transformer模型的输入进行，而prefixt-tuning 是针对每一个 transformer block进行

soft prompt tuning 跟 hard prompt tuning区别在于后者的拼接的话术是固定的(离散的，不能沟通过梯度下降进行训练)，而soft那个是可变的，两者都是 transformer模型的输入进行的。

1， lora

2, adapter

3, prompt-tuning(soft prompt, hard prompt)

adapter 和 soft prompt区别是啥，如下图，

adapter 本质上是在ffn之后，增加了一些层（一般也是ffn，可能是ffn+激活+ffn这样搞起来），改变了模型的结构，adapter网络结构可以自定义
soft prompt 是对于输入 x 后，多头自注意力之前进行了操作，soft promt 经过ffn 之后再和 x进行相加，从代码上体现来看，两者区别如下图

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/668514.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

AI预测体彩排3采取888=3策略+和值012路一缩定乾坤测试6月1日预测第8弹

今天继续基于8883的大底进行测试，今天继续测试，好了，直接上结果吧~ 首先，888定位如下： 百位：8,9,7,6,4,3,2,0 十位：4,5,3,2,7,8,0,9 个位：3,4,5,2,…

【Python系列】Python 中方法定义与方法调用详解

💝💝💝欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan 的首页,持续学…

处理3D数据的强大工具 CloudCompare （多平台兼容）

CloudCompare 是一个开源的3D点云（Point Cloud）和网格（Mesh）处理软件，广泛应用于地理信息系统（GIS）、计算机图形学、测绘、考古、建筑和工程等领域。自2004年由Daniel Girardeau-Montaut开发以来…

记录深度学习GPU配置,下载CUDA与cuDnn,安装tensorflow

目标下载: cuda 11.0.1_451.22 win10.exe cudnn-11.0-windows-x64-v8.0.2.39.zip Anaconda的安装请看别的博主的,这里不再赘述看看自己电脑的cuda 方法一:打开英伟达面板查看方法二:使用命令行随便找个文件夹,在顶部路径输入"cmd" 输入下面命令 nvidia-smi 我…

使用QtCreator C++编写串口调试助手

100编程书屋_孔夫子旧书网 1.首先看一下我设计的界面（我这里比较简单，大家可根据自己的需求进行设计） （界面设计的过程中，每一个控件的名称最好进行修改，便于后续控件太多不好区分，给控件命名的…

Linux目录的基本结构（RHEL8系统基本使用之文件操作）

1.Linux的目录树结构 2.各目录的功能介绍 3.理解文件路径表示方法 Who？——>当前登录的用户 Where?——>路径我要在哪儿创建文件？ 我要删除什么地方的什么文件？ 我所要查看的文件在哪里？ What?——>操作命令 Ho…

黑马程序员——Spring框架——day03

目录： AOP AOP简介问题导入AOP简介和作用【理解】AOP的应用场景为什么要学AOPAOP入门案例【重点】问题导入AOP入门案例思路分析AOP入门案例实现AOP中的核心概念AOP工作流程【理解】问题导入AOP工作流程AOP核心概念在测试类中验证代理对象AOP切入点表达式问题导…

双指针练习：快乐数

1.题目链接：202.快乐数 2.题目描述： 编写一个算法来判断一个数 n 是不是快乐数。「快乐数」定义为： 对于一个正整数，每一次将该数替换为它每个位置上的数字的平方和。然后重复这个过程直到这个数变为 1，也可能是无…

丛林生存法则其实就两个字：输出

不管你是在上班，还是在灵活就业，现在的大环境下，你要想活下来，生存下去，一定要记住这两个字：输出。如果你能记住更多的字，那便是持续高水平的输出。你如果是大厂程序员，你肯定发现…

会议管理系统（含源码+sql+视频导入教程）

👉文末查看项目功能视频演示获取源码sql脚本视频导入教程视频 1 、功能描述会议管理系统拥有两种角色管理员：部门管理、员工管理、会议管理、会议室管理、预订会议、添加员工、注册员工审批等用户：个人通知中心、预订会议、查看所有会议…

Java网络编程(下)

White graces：个人主页 🙉专栏推荐:Java入门知识🙉 🙉 内容推荐:Java网络编程🙉 🐹今日诗词:姑苏城外寒山寺，夜半钟声到客船🐹 ⛳️点赞 ☀️收藏⭐️关注💬卑微小博主…

es的总结

es的collapse es的collapse只能针对一个字段聚合（针对大数据量去重），如果以age为聚合字段，则会展示第一条数据，如果需要展示多个字段，需要创建新的字段，如下 POST testleh/_update_by_query {…

PTA 计算矩阵两个对角线之和

计算一个nn矩阵两个对角线之和。输入格式: 第一行输入一个整数n(0<n≤10)，第二行至第n1行，每行输入n个整数，每行第一个数前没有空格，每行的每个数之间各有一个空格。输出格式: 两条对角线元素和，输出格式见样例…

音视频开发—H264码流组成

本文包含了编码过程的相关概念，如果不了解编码过程，请看这篇文章：H264相关概念和压缩原理详解 H.264视频编码标准将视频编码过程分为两个主要层次：视频编码层（VCL, Video Coding Layer）和网络抽象层&#x…

Vue：Bin Code Editor格式化JSON编辑器

最终效果如下图所示， Bin Code Editor安装 npm或yarn安装命令如下， npm i bin-code-editor -S # or yarn add bin-code-editor 组件注册全局注册在 main.js 中写入导入以下内容， import Vue from vue; import CodeEditor from bin-cod…

0、机器学习知识点

机器学习知识点知识点汇总知识点汇总 https://blog.csdn.net/seagal890/article/details/105352987 https://blog.csdn.net/fengdu78/article/details/115878843

el-table超过宽度强制显示滚动条

使用css强制显示： .el-table .el-table__body-wrapper::-webkit-scrollbar {display: block; }

看图猜成语微信小程序源码

后台可以自行设置关卡、等级、也可以一键部署， 开通流量主之后实现躺赚，你懂得。个人号也可以开通，审核一次性必过。类目选择教育，源码仅供您参考！ 源码下载 https://download.csdn.net/download/huayula/8938579…

【RS】哨兵系列新网站无法下载的问题及解决办法（Sentinel-2）

最近有些小伙伴留言说哨兵数据无法下载，网站打开后会有一层蒙版，无法选取研究区等信息，今天就跟大家分享一下如何解决这个问题。还知道如何下载的小伙伴可以移步到之前的文章：【RS】欧空局Sentinel-2卫星数据下载(哨兵1、2、3、5P…

DNF手游6月5日更新亮点全解析！

在即将到来的6月5日更新中，《DNF手游》将迎来一系列令人振奋的新内容和玩法。本文将详细介绍本次更新的主要内容，包括新增的组队挑战玩法“罗特斯入门团本”，新星使宠物的推出，宠物进化功能的开放，以及六月下旬即将落地…

大模型微调常见方法

相关文章