llamafactory大模型微调教程(周易大模型案例)

1.环境说明

操作系统:ubuntu 20
基础模型:Qwen2.5-1.5B-Instruct
工具:llamafactory
GPU:四张4090

2、环境部署

2.1 下载基础模型

# 1、下载 modelscope
pip install modelscope

#2、模型下载
cd /data/
cat >> download.py <<EOF
from modelscope import snapshot_download
model_dir = snapshot_download('Qwen/Qwen2.5-1.5B-Instruct')
EOF
python download.py

#等待下载完成即可

2.2 下载llamafactory工具

#1.克隆仓库
git clone https://github.com/hiyouga/LLaMA-Factory.git
#2.下载依赖
cd LLaMA-Factory
pip install -e .[torch,metrics]
#3、执行需要使用的显卡,运行web
CUDA_VISIBLE_DEVICES=0,1,2,3 python src/webui.py
或者
CUDA_VISIBLE_DEVICES=0,1,2,3 llamafactory-cli webui

3、模型微调训练

3.1 数据准备

1.1 制作数据
LLaMA-Factory/data/ 下面有很多数据格式demo,我们参考这种的就行alpaca_zh_demo.json

下面我们把周易的数据制作成下面的格式:
LLaMA-Factory/data/zhougong.json

[
  {
    "instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来",
    "input": "梦见体育教练是什么意思",
    "output": "梦见体育教练有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见体育教练的详细解说吧。  体育教练的职责是自己出力而让学生获得巨大成功, 所以在梦境中自己充当着教练的角色,或者梦见教练在训练的情景, 这都提示着梦者自己的投资不会获得直接利润。  别人的成功也就是自己的成功,只有这样才能得到心理平衡。梦中教练的身份还提示着不合理冲动、攻击的间接性表达,这类教练都是攻击性、竞技性比较强烈的项目教练,如拳击、击剑,足球、篮球教练等。  梦到体育教练,暗示你的投资不会有利润。  商人梦见体育教练,表示最近自己的事业不会盈利,但是对社会有很大的贡献。  梦见受著名的体育选手指导,健康方面将有不韦。尤其社团活动时,发生事故或受伤的可能性很大。 这个时候,最好避免练球练得太晚。  梦见体育教练的案例分析  梦境描述:不知道为什么,这一个星期来,不论是睡午觉还是晚上睡觉,都会梦见我的体育教练,梦见他对我笑,然后我跟他像好朋友似的,一起玩,一起逛街,为什么呢?如果说这种是恋师,那我又不喜欢他,而且他长得又不算好看,而且还有些讨厌他呢!  梦境解析:很多感情的萌牙都是在不知不觉中进行的,明明自己讨厌着他,不知不觉却离不开他了,只是你现在还没察觉而已。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"
  },
  {
    "instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来",
    "input": "梦见贵人是什么意思",
    "output": "梦见贵人有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵人的详细解说吧。    做这种梦见贵人的梦不多,能够梦见贵人表示你能够出人头地的机会很大,未来有一番作为。  如果梦见领袖,则表示心灵上得到安详;如果梦见领袖在行事,则会受到赏识。  一般人梦见自己在贵人面前,表示将会出人头地;但若梦中与贵人为对等地位,则有忧事将至。  原版周公解梦  贵人走马,官事明。《周公解梦》  来见贵人,不得凶。《周公解梦》  梦贵人入家。凡梦官吏人门,富贵大吉。梦欲见贵人官吏而不得见者凶,得见者贵。梦与贵人亲近者吉利,拜谒贵人者主有扶持之力,事无不吉。 《梦林玄解》  梦见拜贵人,吉利。《敦煌本梦书》  梦见贵人赐饭,主病。《敦煌本梦书》  梦见贵人坐,欲贵。《敦煌本梦书》  梦见人拜贵人,吉。《敦煌本梦书》  梦见屋中有贵人,大吉。《敦煌本梦书》  梦见与贵人交往,吉。《敦煌本梦书》  一切贵人,皆吉利。《周公解梦》  做贵人卫兵,主吉。《周公解梦》  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"
  },
  {
    "instruction": "你是一个周文王,周易的作者,擅长通过梦境去推演现在过去未来",
    "input": "梦见贵族是什么意思",
    "output": "梦见贵族有现实的影响和反应,也有梦者的主观想象,请看下面由(周公解梦官网)小编帮你整理的梦见贵族的详细解说吧。  贵族大多是人们对上层阶级的统称,也大多泛指在社会上享有特权的阶层。  一般贵族代表了身份的高贵,也是财富与社会地位的象征。  梦见与贵族说话,若平静的说话,表示会发生烦恼的事。  梦见贵族人士骂你,表示你的幸运即将来临。  相反的,若是梦见你骂贵族人士,则为凶兆,预示可能会遭遇灾难。  梦见结交贵族,暗示你强烈的愿望并不是很正当的,因为你更喜欢炫耀和享乐,而不是追求心智方面的更高层次的修养。  对于年轻女子,梦见贵族,预示她将在选择伴侣时以貌取人,而不是明智地让品行优秀的男人做她的保护神。  梦见贵族的案件分析  梦境描述:梦见自己是欧洲中世纪贵族家的小姐,好像父亲是一个很有权势的人,家里有女佣,梦中我还有自己喜欢的人。  梦境解析:此梦反映了你热衷于享乐,而自己的实际情况被完全背离,做此梦是提醒你不要过度骄奢淫逸,更应该注重自己内心的修养。  【大师特色梦境分析】  以上解梦为通用解释,如需知晓具体事宜,可请大师结合您的生辰八字及做梦时的情景解梦:"
  },
  ...
  ]

3.2 注册数据集

LLaMA-Factory/data/dataset_info.json

{
  "zhougong": {
    "file_name": "zhougong.json"
  },
  "identity": {
    "file_name": "identity.json"
  },
  "alpaca_en_demo": {
    "file_name": "alpaca_en_demo.json"
  },
  ....
}

可以看到我注册了一个名字为zhougong的数据集

3.3 大模型训练

在这里插入图片描述
在这里插入图片描述
开始训练
在这里插入图片描述

在模型训练过程中,"loss值"指的是损失函数(Loss Function)计算出来的结果,它是衡量模型预测值与真实值之间差异的一个指标。损失值越小,意味着模型的预测结果与实际数据之间的误差越小,模型的表现就越好。

3.3 新模型验证

在这里插入图片描述
在这里插入图片描述
可以发现新模型已经有效果了,但是由于训练的数据集质量不太行(网上免费的数据,自己做的清洗),造成输出结果不太理想。

3.4 模型权重导出

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/983284.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

go切片定义和初始化

1.简介 切片是数组的一个引用&#xff0c;因此切片是引用类型&#xff0c;在进行传递时&#xff0c;遵守引用传递的机制。切片的使用和数组类似&#xff0c;遍历切片、访问切片的元素和切片的长度都一样。。切片的长度是可以变化的&#xff0c;因此切片是一个可以动态变化的数…

2025年03月07日Github流行趋势

项目名称&#xff1a;ai-hedge-fund 项目地址url&#xff1a;https://github.com/virattt/ai-hedge-fund项目语言&#xff1a;Python历史star数&#xff1a;12788今日star数&#xff1a;975项目维护者&#xff1a;virattt, seungwonme, KittatamSaisaard, andorsk, arsaboo项目…

蓝桥杯每日一题:第一周周四哞叫时间

蓝桥杯每日一题&#xff1a;第一周周四哞叫时间 疑惑&#xff1a;如何把复杂度控制在Q&#xff08;n&#xff09;&#xff0c;怎么枚举a和b&#xff0c;longlong的形式又该怎么输入&#xff08;考虑用string&#xff09; 思路&#xff1a;枚举倒数第二个b前面有多少个a 这是一…

常见排序算法鉴赏(原理剖析+动图演示)

目录 一、冒泡排序&#xff08;BubbleSort&#xff09; 二、选择排序&#xff08; SelectSort&#xff09; 三、插入排序&#xff08;InsertSort&#xff09; 四、希尔排序&#xff08;ShellSort&#xff09; 五、堆排序 六、快排&#xff08;QuickSort&#xff09; Hoa…

易基因特异性R-loop检测整体研究方案

大家好&#xff0c;这里是专注表观组学十余年&#xff0c;领跑多组学科研服务的易基因。 01.技术简述 R-loop是由DNA:RNA 杂交体和被置换的单链DNA组成的三链核酸结构&#xff0c;广泛参与基因转录、表观遗传调控及DNA修复等关键生物学过程。异常的R-loop积累会导致基因组不稳…

用低代码平台集成人工智能:无需专业开发也能实现智能化

引言&#xff1a;人工智能的普及与企业需求 随着人工智能&#xff08;AI&#xff09;技术的飞速发展&#xff0c;越来越多的企业开始意识到其在提升运营效率、优化客户体验和推动业务创新方面的巨大潜力。从智能客服到自动化决策支持&#xff0c;从数据分析到个性化推荐&#x…

原生android 打包.aar到uniapp使用

1.原生安卓里面引入uniapp官方提供的包文件&#xff1a; uniapp-v8-release.aar 2.提供uniapp调用的接口&#xff0c;新建类文件继承UniModule&#xff0c; package com.dermandar.panoramal;import com.scjt.lib.certlib;import io.dcloud.feature.uniapp.annotation.UniJSM…

K8s 1.27.1 实战系列(四)验证集群及应用部署测试

一、验证集群可用性 1、检查节点 kubectl get nodes ------------------------------------------------------ NAME STATUS ROLES AGE VERSION k8s-master Ready control-plane 3h48m v1.27.1 k8s-node1 Ready <none> …

OpenCV计算摄影学(18)平滑图像中的纹理区域同时保留边缘信息函数textureFlattening()

操作系统&#xff1a;ubuntu22.04 OpenCV版本&#xff1a;OpenCV4.9 IDE:Visual Studio Code 编程语言&#xff1a;C11 算法描述 cv::textureFlattening 是 OpenCV 中用于图像处理的一个函数&#xff0c;旨在平滑图像中的纹理区域&#xff0c;同时保留边缘信息。该技术特别适…

基于React.js 技术栈的服务端渲染框架Next.js 实战记录

自我简介&#xff1a;4年导游&#xff0c;10年程序员&#xff0c;最近6年一直深耕低代码领域&#xff0c;分享低代码和AI领域见解。 基于React.js 技术栈的服务端渲染框架Next.js 实战记录 本着学习的态度&#xff0c;将自己运用Next.js开发服务端渲染的项目复原总结出来&…

使用 Deepseek + kimi 快速生成PPT

前言 最近看到好多文章和视频都在说&#xff0c;使用 Deepseek 和 kimi 能快速生成精美的 ppt&#xff0c;毕竟那都是别人说的&#xff0c;只有自己尝试一次才知道结果。 具体操作 第一步&#xff1a;访问 deepseek 我们访问 deepseek &#xff0c;把我们想要输入的内容告诉…

CS144 Lab Checkpoint 1: stitching substrings into a byte stream

Putting substrings in sequence TCP报文在发送方会被分成许多数据报文&#xff0c;传输中可能出现顺序的重排以及丢失和重发等现象&#xff0c;所以需要重装数据报文到原来字节流的顺序。 在本实验中&#xff0c;要实现的是重组器Reassembler&#xff0c;它接受子字符串和其…

机器学习之强化学习

引言 在人工智能的众多分支中&#xff0c;强化学习&#xff08;Reinforcement Learning, RL&#xff09; 因其独特的学习范式而备受关注。与依赖标注数据的监督学习或探索数据结构的无监督学习不同&#xff0c;强化学习的核心是智能体&#xff08;Agent&#xff09;通过与环境…

笔记:代码随想录算法训练营day37:完全背包、518. 零钱兑换 II、377. 组合总和 Ⅳ、70. 爬楼梯 (进阶)

学习资料&#xff1a;代码随想录 文中含大模型生成内容 完全背包 52. 携带研究材料&#xff08;第七期模拟笔试&#xff09; 相比于之前的一个物品只能放一次&#xff0c;这次一个物品可以放多次了 递推公式变成了dp[i][j] max(dp[i - 1][j], dp[i][j - weight[i]] valu…

C/C++中函数指针和指针函数的原理和区别是什么,分别通过用例说明。

文章目录 函数指针和指针函数的区别函数指针指针函数区别 总结 函数指针和指针函数的区别 在C/C中&#xff0c;函数指针和指针函数是两个不同的概念&#xff0c;它们的用途和定义方式也有所不同。 函数指针 定义&#xff1a; 函数指针是一个指向函数的指针&#xff0c;它存储…

2025年主流原型工具测评:墨刀、Axure、Figma、Sketch

2025年主流原型工具测评&#xff1a;墨刀、Axure、Figma、Sketch 要说2025年国内产品经理使用的主流原型设计工具&#xff0c;当然是墨刀、Axure、Figma和Sketch了&#xff0c;但是很多刚入行的产品经理不了解自己适合哪些工具&#xff0c;本文将从核心优势、局限短板、协作能…

分布式事务 面试专题

分布式事务 面试专题 分布式事务与分布式锁的区别分布式事务场景核心理论分布式事务分类2PC&#xff08;标准XA模型&#xff09;3PC&#xff08;CanCommit、PreCommit、doCommit &#xff09;通知型事务异步确保型事务最大努力通知事务MQ事务消息方案本地消息表方案 补偿型TCC&…

颠覆传统软件测试!Browser Use WebUI+DeepSeek:软件测试行业的革命性突破

前置信息 硬件配置 处理器 : Intel(R) Core(TM) i5-8265U CPU 1.60GHz (四核 / 八逻辑处理器) 主板 : 20N8002UCD 内存 : 8GB(RMSA3260ME78HAF-2666 DDR4 2667 MT/s) 显示适配器 : Lexa PRO [Radeon 540/540X/550/550X / RX 540X/550/550X]/WhiskeyLake-U GT2 [UHD Graphics…

DFT之SSN架构

SSN&#xff08;Streaming Scan Network&#xff09;架构在DFT&#xff08;设计可测试性&#xff09;中的应用是一种先进的设计测试解决方案&#xff0c;旨在应对现代大规模片上系统&#xff08;SoC&#xff09;设计中的复杂测试挑战。以下是对SSN架构在DFT中应用的详细分析&am…

Elasticsearch:“Your trial license is expired”

目录标题 问题原因解决方案 问题 原因 ES的X-pack许可证是提供免费一个月的试用&#xff0c;到期之后就会报这个错误。 解决方案 查看license GET _license 开启试用license POST _xpack/license/start_trial?acknowledgetrue修改为基础license POST _xpack/license/start_…