如何将使用unsloth微调的模型部署到ollama？

如何将使用unsloth微调的模型部署到ollama？

article2025/4/2 2:29:51/文章来源:https://blog.csdn.net/naozibuok/article/details/145327400

目录

一、将模型保存为gguf格式

二、下载llama.cpp

三、生成 llama-quantize 可执行文件

四、使用llama-quantize

五、训练模型

六、将模型部署到ollama

一、将模型保存为gguf格式

在你的训练代码 trainer.train() 之后添加：

model.save_pretrained_gguf("model", tokenizer,)

二、下载llama.cpp

网址：GitHub - ggerganov/llama.cpp: LLM inference in C/C++

git clone GitHub - ggerganov/llama.cpp: LLM inference in C/C++ 或者下载.zip解压。注意llama.cpp需要与训练代码同目录。

三、生成 `llama-quantize` 可执行文件

①打开 PowerShell 或命令提示符

②切换到 llama.cpp 文件夹

cd llama.cpp

③创建构建目录并配置

mkdir build
cd build
cmake .. -DCMAKE_BUILD_TYPE=Release

④执行构建

cmake --build . --config Release

⑤生成的可执行文件应位于

...llama.cpp\build\bin\Release

四、使用llama-quantize

在 llama.cpp 下创建 llama-quantize 文件夹并将 Release 粘贴进 llama-quantize 文件夹。

五、训练模型

进入 train.py 所在路径 python train.py。

六、将模型部署到ollama

①启动ollama

ollama serve

②进入训练后生成的 model 目录

③部署模型到ollama

ollama create your-model-name -f Modelfile

④测试模型

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/958558.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

相关文章

【Hadoop面试题2025】

【Hadoop面试题2025】

文章目录简单题故障及相应的处理方法中等难度高难度小文件小文件的产生小文件问题的影响小文件治理方案推荐方案冷文件冷文件的产生冷文件问题的影响冷文件治理方案推荐方案简单题一、基础概念类什么是Hadoop？ 答案：Hadoop是一个开源的分布式计算框…

阅读更多...

2025.1.21——六、BUU XSS COURSE 1 XSS漏洞|XSS平台搭建

2025.1.21——六、BUU XSS COURSE 1 XSS漏洞|XSS平台搭建

题目来源：buuctf BUU XSS COURSE 1 目录一、打开靶机，整理信息二、解题思路 step 1：输入框尝试一下 step 2：开始xss注入 step 3：搭建平台 step 4：利用管理员cookie访问地址三、小结二编&#…

阅读更多...

[论文阅读] (36)CS22 MPSAutodetect：基于自编码器的恶意Powershell脚本检测模型

[论文阅读] (36)CS22 MPSAutodetect：基于自编码器的恶意Powershell脚本检测模型

《娜璋带你读论文》系列主要是督促自己阅读优秀论文及听取学术讲座，并分享给大家，希望您喜欢。由于作者的英文水平和学术能力不高，需要不断提升，所以还请大家批评指正，非常欢迎大家给我留言评论，学术路上期…

阅读更多...

IPhone16 Plus 设备详情

IPhone16 Plus 设备详情

目录产品宣传图内部图——前内部图——后设备详细信息产品宣传图内部图——前内部图——后设备详细信息信息收集于HubWeb.cn

阅读更多...

PyTorch入门 - 为什么选择PyTorch?

PyTorch入门 - 为什么选择PyTorch?

PyTorch入门 - 为什么选择PyTorch? Entry to PyTorch - Why PyTorch? by JacksonML $ pip install pytorch安装完毕后，可以使用以下命令，导入第三方库。 $ import pytorch

阅读更多...

Jmeter 动态参数压力测试时间段预定接口

Jmeter 动态参数压力测试时间段预定接口

🎯 本文档详细介绍了如何使用Apache JMeter进行压力测试，以评估预定接口在高并发场景下的性能表现。通过创建线程组模拟不同数量的用户并发请求，利用CSV文件动态配置时间段ID和用户token，确保了测试数据的真实性和有效性。文档中还…

阅读更多...

字节跳动自研HTTP开源框架Hertz简介附使用示例

字节跳动自研HTTP开源框架Hertz简介附使用示例

字节跳动自研 HTTP 框架 Hertz Hertz 是字节跳动自研的高性能 HTTP 框架，专为高并发、低延迟的场景设计。它基于 Go 语言开发，结合了字节跳动在微服务架构中的实践经验，旨在提供更高效的 HTTP 服务开发体验。 1. 背景介绍随着字节跳动业务…

阅读更多...

Spring Boot 自定义属性

Spring Boot 自定义属性

Spring Boot 自定义属性在 Spring Boot 应用程序中，application.yml 是一个常用的配置文件格式。它允许我们以层次化的方式组织配置信息，并且比传统的 .properties 文件更加直观。本文将介绍如何在 Spring Boot 中读取和使用 application.yml 中的配…

阅读更多...

HarmonyOS Next构建工具 lycium 原理介绍

HarmonyOS Next构建工具 lycium 原理介绍

HarmonyOS Next构建工具 lycium 原理介绍背景介绍 HarmonyOS Next中很多系统API是以C接口提供，如果要使用C接口，必须要使用NAPI在ArkTS与C间交互，这种场景在使用DevEco-Studio中集成的交叉编译工具，以及cmake构建工具就完全够用…

阅读更多...

数据结构（Java）——二叉树

数据结构（Java）——二叉树

1.概念二叉树是一种树形数据结构，其中每个节点最多有两个子节点，通常被称为左子节点和右子节点。二叉树可以是空的（即没有节点），或者由一个根节点以及零个或多个左子树和右子树组成，其中左子树和右子树也分…

阅读更多...

ansible自动化运维实战--script、unarchive和shell模块（6）

ansible自动化运维实战--script、unarchive和shell模块（6）

文章目录一、script模块1.1、功能1.2、常用参数1.3、举例二、unarchive模块2.1、功能2.2、常用参数2.3、举例三、shell模块3.1、功能3.2、常用参数3.3、举例一、script模块 1.1、功能 Ansible 的 script 模块允许你在远程主机上运行本地的脚本文件，其提供了一…

阅读更多...

【期末速成】Oracle数据库

【期末速成】Oracle数据库

选择题从中选 10 道。 Oracle的管理与开发工具不包括（ D ）。 A. OEM B. SQL*PLUS C. ONCA D. PHP PHP 是一种编程语言，不是 Oracle 的工具。下面文件属于物理文件的是（ C ）。 A. 概要文件 B. 闪回文件 C. 数据文件 D…

阅读更多...

auto的用法

auto的用法

文章目录一、auto 一、auto 在这里插入代码片在这里插入代码片感谢大家能看到这里，多多支持！

阅读更多...

UE求职Demo开发日志#7 强化属性完善

UE求职Demo开发日志#7 强化属性完善

1 实现思路设计定义一个结构体记录技能树一个单元的信息，命名为FStrengthenCellInfo，一个TArray记录技能树整体信息，需要以下信息： 1.TArray前置技能index 2.FString 描述文本 3.TArray<FMyItemInfo>激活需要的物品ID和…

阅读更多...

java常量池

java常量池

目录 1 Class常量池 2 运行时常量池 3 字符串常量池 3.1 为什么要设计字符串常量池 3.2 字符串对象三种创建姿势 3.3 字符串的操作 3.4 字符串的不可变性 4 包装类型常量池 1 Class常量池 class 文件的资源仓库javap命令可以查看class常量池主要包含字面量和符号引用字面量由…

阅读更多...

C语言-内存管理

C语言-内存管理

1、malloc()函数用于动态分配一块指定大小的内存，并返回指向这块内存的指针。如果分配失败， 返回 NULL。 int* ptr (int*)malloc(sizeof(int) * 10); // 分配一个包含 10 个整数的内存 if (ptr NULL) {printf("Memory allocation failed!\n&q…

阅读更多...

基于ESP32-IDF驱动GPIO输出控制LED

基于ESP32-IDF驱动GPIO输出控制LED

基于ESP32-IDF驱动GPIO输出控制LED 文章目录基于ESP32-IDF驱动GPIO输出控制LED一、点亮LED3.1 LED电路3.2 配置GPIO函数gpio_config()原型和头文件3.3 设置GPIO引脚电平状态函数gpio_set_level()原型和头文件3.4 代码实现并编译烧录一、点亮LED 3.1 LED电路可以看到&#x…

阅读更多...

YOLOv5训练自己的数据及rknn部署

YOLOv5训练自己的数据及rknn部署

YOLOv5训练自己的数据及rknn部署一、下载源码二、准备自己的数据集2.1 标注图像2.2 数据集结构三、配置YOLOv5训练3.1 修改配置文件3.2 模型选择四、训练五、测试六、部署6.1 pt转onnx6.2 onnx转rknn 七、常见错误7.1 训练过程中的错误7.1.1 cuda: out of memory7.1.2 train…

阅读更多...

MATLAB 如何避免复杂shp文件对inpolygon的影响

MATLAB 如何避免复杂shp文件对inpolygon的影响

**任务描述：**当我想用inpolygon函数将属于非洲的pixel选出来时，发现因为周边小岛的影响，pixel选取有问题，如下图。第一种解决办法： 首先将复杂shp文件查分成简单的shp文件，即将不相交的元素分离开 [QGIS…

阅读更多...

2025.01春节可用两个带源的TV直播软件

2025.01春节可用两个带源的TV直播软件

电视直播pro 2.612 论坛的分享: https://tieba.baidu.com/p/9183010315 我的网盘 http://pan.ezdial.cn/nasone/tvbox/%E7%94%B5%E8%A7%86%E7%9B%B4-pro.apk 这个软件挺牛逼的,因为虽然有直播购物,但是里面的频道是真好,有电影解说有电视剧, 最后还能自定义播放源. 唯一不足找…

阅读更多...

最新文章