ollama教程(window系统)

前言

在《本地大模型工具哪家强?对比Ollama、LocalLLM、LM Studio》一文中对比了三个常用的大模型聚合工具优缺点,本文将详细介绍在window操作系统下ollama的安装和使用。要在 Windows 上安装并使用 Ollama,需要依赖 NVIDIA 显卡,并安装相关的驱动和 CUDA 工具链。以下是详细的分步骤指南:

一、安装ollama对硬件和软件的要求

1. 硬件要求:

  • NVIDIA 显卡,建议至少为 RTX 系列,显存 8GB 及以上。
  • 足够的磁盘空间(建议 40GB 以上)。
  • 推荐安装 SSD,提高性能。

2. 操作系统要求:

  • Windows 10 或更新版本(64 位)。

3. 软件依赖:

  • NVIDIA 驱动。
  • CUDA Toolkit(包含 cuDNN)。
  • Ollama 安装文件。

二、安装 NVIDIA 驱动

提示:一般情况下在安装操作系统的时候就会安装英伟达显卡的驱动了,如果已经安装了显卡驱动,可以跳过这一步。

1.检查显卡型号:

  1. 快捷键方式:按下“Windows”键+“X”键,从弹出的菜单中选择“设备管理器”。
  2. 在设备管理器窗口中,展开“显示适配器”选项。
  3. 在展开的列表中,就可以看到显卡的型号。例如,如果是NVIDIA的显卡,可能会显示为“NVIDIA GeForce GTX 1660 Ti”等类似的型号名称。
  4. 在“帮助”菜单中,查看“系统信息”中的显卡型号。

2.下载驱动:

  • 访问 NVIDIA 官方网站:https://www.nvidia.com/Download/index.aspx。
  • 输入你的显卡型号,选择系统版本,点击“搜索”并下载最新版本驱动程序。

3.安装驱动:

  • 双击下载的驱动程序文件。
  • 选择“自定义安装”,确保选中“清洁安装”以删除旧驱动残留。
  • 完成安装后,重新启动计算机。

三、安装 CUDA Toolkit

1. 下载 CUDA:

  • 访问 NVIDIA CUDA Toolkit 官方页面:https://developer.nvidia.com/cuda-downloads。
  • 选择你的操作系统、架构和版本,下载对应的安装包。

2. 安装 CUDA:

  • 双击安装包,按照安装向导进行安装。
  • 确保勾选“附加工具”(包括 nvcc 和相关库)。
  • 记下安装路径(默认是 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X)。

3. 配置环境变量:

  • 右键“此电脑”,选择“属性” > “高级系统设置” > “环境变量”。
  • 在“系统变量”中找到 Path,点击“编辑”。
  • 添加以下路径:
  C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\bin
  C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X\libnvvp
  • 点击“确定”保存。

4. 验证 CUDA 是否安装成功:

  • 打开命令提示符,运行:
   nvcc --version
  • 如果返回 CUDA 版本号,说明安装成功。

四、安装 cuDNN

提示:cuDNN 的核心作用是加速 Ollama 运行的底层深度学习框架,从而提升推理效率

1. 下载 cuDNN:

  • 访问 NVIDIA cuDNN 下载页面:https://developer.nvidia.com/cudnn。
  • 登录或注册 NVIDIA 开发者账号。
  • 下载与你的 CUDA 版本兼容的 cuDNN 压缩包。

2. 安装 cuDNN:

  • 解压下载的压缩包。
  • 将 bin、include 和 lib 文件夹的内容复制到对应的 CUDA Toolkit 安装目录下(例如 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\vXX.X)。

五、安装并运行 Ollama

1. 下载 Ollama:

  • 访问 Ollama 官方网站,下载适用于 Windows 的二进制文件。

2. 安装 Ollama:

  • 将二进制文件放到系统的某个目录(如 C:\Program Files\Ollama)。
  • 配置环境变量,将 Ollama 所在目录添加到 Path。

3. 运行 Ollama:

  • 打开命令提示符,运行:
 ollama --help
  • 如果显示帮助信息,说明安装成功。

4.查看可以下载的大模型

  • 访问 https://ollama.com/library

  • 搜索想要下载的大模型,
    在这里插入图片描述

  • 打开大模型详情页面,选择大模型版本,可以查看运行大模型的命令。
    在这里插入图片描述

5. 下载模型:

   ollama pull glm4:9b

其中glm4:9b是你下载的大模型名称。

6. 运行模型:

   ollama run glm4:9b

其中glm4:9b是你运行的大模型名称,如果没有下载大模型,会先下载大模型,下载完再运行这个大模型。

7. 查看已下载的模型:

   ollama list

8. 退出模型对话:

通过在对话命令行中输入/bye或使用快捷键Ctrl + d来退出。

六、常见问题

1、如何修改ollama存放大模型的文件夹?

  • ollama默认存放model文件的位置:C:\Users{用户名}.ollama

  • 修改ollama存放模型的默认位置只需在环境变量添加OLLAMA_MODELS=“E:\ollama”

  • 其中"E:\ollama"是你设置存放大模型的新位置。

2、ollama下载大模型太慢,怎么办?

如果使用ollama pull或ollama run下载大模型太慢,您可以手动从Hugging Face等网站下载模型文件(通常是.gguf格式),然后使用Ollama的create命令来创建模型。具体步骤如下:

  1. 创建一个文件夹来存放权重文件(例如gguf文件)。
  2. 从Hugging Face下载所需的.gguf文件,并将其放在创建的文件夹中。
  3. 创建一个构造文件(例如gemma-9b.modelfile),内容如下:
FROM ./gemma-2-9b-it-Q4_K_L.gguf
  1. 使用以下命令创建模型:
ollama create gemma-9b -f gemma-9b.modelfile
  1. 测试模型:
ollama run gemma-9b "hi who are u?"

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/952855.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Flink系统知识讲解之:容错与State状态管理

Flink系统知识之:容错与State状态管理 状态在Flink中叫作State,用来保存中间计算结果或者缓存数据。根据是否需要保存中间结果,分为无状态计算和有状态计算。对于流计算而言,事件持续不断地产生,如果每次计算都是相互…

DolphinScheduler自身容错导致的服务器持续崩溃重大问题的排查与解决

01 问题复现 在DolphinScheduler中有如下一个Shell任务: current_timestamp() { date "%Y-%m-%d %H:%M:%S" }TIMESTAMP$(current_timestamp) echo $TIMESTAMP sleep 60 在DolphinScheduler将工作流执行策略设置为并行: 定时周期调度设置…

ASP.NET Core 实现微服务 - Elastic APM

这次要给大家介绍的是Elastic APM ,一款应用程序性能监控组件。APM 监控围绕对应用、服务、容器的健康监控,对接口的调用链、性能进行监控。在我们实施微服务后,由于复杂的业务逻辑,服务之间的调用会像蜘蛛网一样复杂。有了调用链…

25/1/12 嵌入式笔记 学习esp32

了解了一下位选线和段选线的知识: 位选线: 作用:用于选择数码管的某一位,例如4位数码管的第1位,第2位) 通过控制位选线的电平(高低电平),决定当前哪一位数码管处于激活状…

IMX6U Qt 开发环境

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 前言 一、交叉编译 1. 安装通用 ARM 交叉编译工具链 2. 安装 Poky 交叉编译工具链 二、编译出厂源码 1. U-boot 2. 内核和模块 3. 编译出厂 Qt GUI 综合 Demo 前言…

【Oracle专栏】2个入参,生成唯一码处理

Oracle相关文档,希望互相学习,共同进步 风123456789~-CSDN博客 1.背景 业务需要:2个参数,如 aidbankid ,两个值是联合主键,需要生成一个固定唯一码,长度有限制32位,为了…

跨界融合:人工智能与区块链如何重新定义数据安全?

引言:数据安全的挑战与现状 在信息化驱动的数字化时代,数据已成为企业和个人最重要的资产之一。然而,随着网络技术的逐步优化和数据量的爆发式增长,数据安全问题也愈变突出。 数据安全现状:– 数据泄露驱动相关事件驱…

给DevOps加点料:融入安全性的DevSecOps

从前,安全防护只是特定团队的责任,在开发的最后阶段才会介入。当开发周期长达数月、甚至数年时,这样做没什么问题;但是现在,这种做法现在已经行不通了。 采用 DevOps 可以有效推进快速频繁的开发周期(有时…

CDP中的Hive3之Hive Metastore(HMS)

CDP中的Hive3之Hive Metastore(HMS) 1、CDP中的HMS2、HMS表的存储(转换)3、HWC授权 1、CDP中的HMS CDP中的Hive Metastore(HMS)是一种服务,用于在后端RDBMS(例如MySQL或PostgreSQL&a…

【算法】判断一个链表是否为回文结构

问: 给定一个单链表的头节点head,请判断该链表是否为回文结构 例: 1 -> 2 -> 1返回true;1 -> 2 -> 2 -> 1返回true;15 -> 6 -> 15返回true 答: 笔试:初始化一个栈用来…

Python双指针

双指针 双指针:在区间操作时,利用两个下标同时遍历,进行高效操作 双指针利用区间性质可以把 O ( n 2 ) O(n^2) O(n2) 时间降低到 O ( n ) O(n) O(n) 反向扫描 反向扫描: l e f t left left 起点,不断往右走&…

VMware虚拟机安装Home Assistant智能家居平台并实现远程访问保姆级教程

目录 前言 1. 安装Home Assistant 前言 本文主要介绍如何在windows 10 上用VMware Workstation 17 Pro搭建 Home Assistant OS Host os version:Windows 10 Pro, 64-bit (Build 19045.5247) 10.0.19045 VMware version:VMware Workstation 17 Pro 1. 安装Home …

【MySQL】SQL菜鸟教程(一)

1.常见命令 1.1 总览 命令作用SELECT从数据库中提取数据UPDATE更新数据库中的数据DELETE从数据库中删除数据INSERT INTO向数据库中插入新数据CREATE DATABASE创建新数据库ALTER DATABASE修改数据库CREATE TABLE创建新表ALTER TABLE变更数据表DROP TABLE删除表CREATE INDEX创建…

【Java回顾】Day5 并发基础|并发关键字|JUC全局观|JUC原子类

JUC全称java.util.concurrent 处理并发的工具包(线程管理、同步、协调) 一.并发基础 多线程要解决什么问题?本质是什么? CPU、内存、I/O的速度是有极大差异的,为了合理利用CPU的高性能,平衡三者的速度差异,解决办法…

自然语言转 SQL:通过 One API 将 llama3 模型部署在 Bytebase SQL 编辑器

使用 Open AI 兼容的 API,可以在 Bytebase SQL 编辑器中使用自然语言查询数据库。 出于数据安全的考虑,私有部署大语言模型是一个较好的选择 – 本文选择功能强大的开源模型 llama3。 由于 OpenAI 默认阻止出站流量,为了简化网络配置&#…

一学就废|Python基础碎片,文件读写

文件处理是指通过编程接口对文件执行诸如创建、打开、读取、写入和关闭等操作的过程。它涉及管理程序与存储设备上的文件系统之间的数据流,确保数据得到安全高效的处理。 Python 中的文件模式 打开文件时,我们必须指定我们想要的模式,该模式…

牛客网刷题 ——C语言初阶(6指针)——倒置字符串

1. 题目描述:倒置字符串 牛客网OJ题链接 描述 将一句话的单词进行倒置,标点不倒置。比如 I like beijing. 经过函数后变为:beijing. like I 输入描述: 每个测试输入包含1个测试用例: I like beijing. 输入用例长度不超…

YOLOv10改进,YOLOv10自研检测头融合HyCTAS的Self_Attention自注意力机制+添加小目标检测层(四头检测)+CA注意机制,全网首发

摘要 论文提出了一种新的搜索框架,名为 HyCTAS,用于在给定任务中自动搜索高效的神经网络架构。HyCTAS框架结合了高分辨率表示和自注意力机制,通过多目标优化搜索,找到了一种在性能和计算效率之间的平衡。 理论介绍 自注意力(Self-Attention)机制是HyCTAS框架中的一个重…

Web前端界面开发

前沿:介绍自适应和响应式布局 自适应布局:-----针对页面1个像素的变换而变化 就是我们上一个练习的效果 我们的页面效果,随着我们的屏幕大小而发生适配的效果(类似等比例) 如:rem适配 和 vw/vh适配 …

机器学习05-最小二乘法VS梯度求解

机器学习05-最小二乘法VS梯度求解 文章目录 机器学习05-最小二乘法VS梯度求解0-核心知识点梳理1-最小二乘法和梯度求解算法什么关系最小二乘法梯度求解算法两者的关系 2-最小二乘法可以求解非线性回归吗3-最小二乘法不使用梯度求解算法,给出一个简单的示例&#xff…