Linux：ollama大模型部署

Ollama 是一个能在本地机器上轻松构建和运行大型语言模型的轻量级、可扩展框架，适用于多种场景，具有易于使用、资源占用少、可扩展性强等特点。

1.安装下载ollama

2.为 Ollama 创建一个用户

3.为ollama创建服务文件

4.启动ollama服务

5.拉取语言模型镜像

(1) pull一个语言模型

(2) 查看本地模型

(3) 本地运行测试模型

Ollama 是一个能在本地机器上轻松构建和运行大型语言模型的轻量级、可扩展框架，适用于多种场景，具有易于使用、资源占用少、可扩展性强等特点。

官网地址：https://ollama.com/

中文地址：https://ollama.fan/getting-started/

1.安装下载ollama


curl -L https://ollama.com/download/ollama-linux-amd64 -o /usr/bin/ollama

##如果拉取失败可以使用浏览器访问下载上传至服务器的/usr/bin/目录并名称改为ollama

chmod +x /usr/bin/ollama

2.为 Ollama 创建一个用户

useradd -r -s /bin/false -m -d /usr/share/ollama ollama

3.为ollama创建服务文件

cat <<EOF>> /etc/systemd/system/ollama.service

[Unit]                    

Description=Ollama Service

After=network-online.target



[Service]

Environment="OLLAMA_HOST=0.0.0.0:11434" ###默认只能本地回环地址可访问，添加此行所有地址均可访问

ExecStart=/usr/bin/ollama serve

User=ollama

Group=ollama

Restart=always

RestartSec=3



[Install]

WantedBy=default.target

EOF

4.启动ollama服务

#重新加载服务文件，启动并设置开机自启

systemctl daemon-reload

systemctl enable ollama --now

#到这里ollama就安装完成了！

5.拉取语言模型镜像

(1) pull一个语言模型

ollama pull qwen:0.5b

#由于模型镜像比较大拉取速度可能会有一些慢大概需要半个小时，当然速度取决于网速

(2) 查看本地模型

ollama list

(3) 本地运行测试模型

ollama run qwen:0.5b

#进入交互界面随便问一些问题

>>> 马上就要中考了，给所有考生写一份鼓励信

##CPU/GPU的性能越高模型响应速度越快

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：/a/771110.html

如若内容造成侵权/违法违规/事实不符，请联系我们进行投诉反馈qq邮箱809451989@qq.com，一经查实，立即删除！

Linux：ollama大模型部署

Ollama 是一个能在本地机器上轻松构建和运行大型语言模型的轻量级、可扩展框架，适用于多种场景，具有易于使用、资源占用少、可扩展性强等特点。

1.安装下载ollama

2.为 Ollama 创建一个用户

3.为ollama创建服务文件

4.启动ollama服务

5.拉取语言模型镜像

(1) pull一个语言模型

(2) 查看本地模型

(3) 本地运行测试模型

相关文章

6月28日华为云数据库斯享会上海站，NineData技术总监薛晓乐受邀并带来主题分享

2024年第十四届亚太地区大学生数学建模竞赛（中文赛项）B题洪水灾害的数据分析与预测论文和代码分析

uniapp+vue3+echarts编写微信小程序

用for语句实现九九乘法表

山西车间应用LP-LP-SCADA系统的好处有哪些

克隆gitee仓库，在vs2022创建文件夹开发项目操作步骤

LLaMA-Factory安装

Java WebService记

欧洲杯：高精度定位技术，重塑体育赛事新体验

CSS 背景效果

PyFluent入门之旅（3）网格划分

Appium自动化测试框架1

UE插件与云渲染：10个提升效率的选择

【论文速读】|FuzzAug：探索模糊测试作为神经网络测试生成的数据增强

Dungeonborne联机失败、延迟高、卡顿的解决方法

汽车电子工程师入门系列——AUTOSAR通信服务框架（下）

使用微信开发者工具连接gitee

【重磅】“一招”解决智能算法中不满足“预期”的问题【以微电网优化调度为例】

英国皇家物理学会(IOP)数据库简介及个人获取IOP文献的方法

论文学习笔记1:Federated Graph Neural Networks: Overview, Techniques, and Challenges