Windows下ollama详细安装指南

文章目录

    • 1、Windows下ollama详细安装指南
      • 1.1、ollama介绍
      • 1.2、系统要求
      • 1.3、下载安装程序
      • 1.4、安装步骤
      • 1.5、验证安装
      • 1.6、环境变量配置
      • 1.7、模型选择与安装【deepseek 示例】
        • 1.7.1、拉取并运行模型
        • 1.7.2、进阶使用技巧

1、Windows下ollama详细安装指南


1.1、ollama介绍

ollama是一个专为在本地环境中运行和定制大型语言模型而设计的工具。它提供了一个简单而高效的接口,用于创建、运行和管理这些模型,同时还提供了一个丰富的预构建模型库,可以轻松集成到各种应用程序中。ollama的目标是使大型语言模型的部署和交互变得简单,无论是对于开发者还是对于终端用户

1.2、系统要求

  • Windows 10/11 64位
  • 8GB RAM(推荐16GB+)
  • 10GB 可用存储空间
  • 已启用虚拟化(BIOS/UEFI设置)
  • 支持CUDA的NVIDIA GPU(可选,用于GPU加速)

1.3、下载安装程序

  1. 访问官方下载页面:

    1. 官方地址:https://ollama.com/download
    2. 百度网盘:https://pan.baidu.com/s/18X96ZrqZGF_kJlKLpuTZVA 提取码: byi8
  2. 选择 Windows 版本下载 在这里插入图片描述

  3. 保存安装文件到本地(默认名称为 OllamaSetup.exe

1.4、安装步骤

  1. 运行安装程序

    • 双击下载的 OllamaSetup.exe
    • 如果出现用户账户控制提示,点击"是"
      在这里插入图片描述
  2. 完成安装

    • 当出现"Installation Complete"提示时点击"Finish"

1.5、验证安装

  1. 打开 PowerShell 或 CMD

  2. 执行版本检查命令:

    ollama --version
    

    ✅ 正常输出示例:

    ollama version 0.1.20
    

1.6、环境变量配置

Ollama 的默认模型存储路径如下:C:\Users%username%.ollama\models,无论 C 盘空间大小,需要安装多少模型,都建议换一个存放路径到其它盘。

  1. 添加安装路径到PATH

    • 设置步骤:

      1. Win+S 搜索 “环境变量” → 编辑系统环境变量

      2. 点击"环境变量" → 系统变量 →新增

        • 变量名为:OLLAMA_MODELS
        • 变量值为:E:\Tools\ollama\models
          在这里插入图片描述
      3. 确定保存

  2. Ollama 退出重新启动

    Windows 右下角图标点击退出后,重新启动

1.7、模型选择与安装【deepseek 示例】

  • 硬件配置推荐表
R1模型版本CPUGPU内存存储
1.5BIntel Core i5/AMD Ryzen 5 及以上无强制要求,有 1GB 及以上显存可提升性能最低 8GB,推荐 16GB+至少 10GB,建议留更多缓存空间
7BIntel Core i7/AMD Ryzen 7 及以上无强制要求,有 4GB 以上显存更好,推荐 8 - 12GB最低 16GB,推荐 32GB+至少 12GB,建议 30GB+
8BIntel Core i7/AMD Ryzen 7 及以上无强制要求,有 4.5GB 以上显存更好,推荐 8GB+最低 16GB,推荐 32GB+至少 12GB,建议 30GB+
14BIntel Core i9/AMD Ryzen 9 及以上8GB 以上,推荐 12GB+,如 RTX 3080 及以上最低 32GB,推荐 64GB至少 15GB,建议 50GB+
32B高端多核,强多线程处理能力18GB 左右,建议 24GB+,如 NVIDIA A10032GB+,推荐 64GB+至少 20GB,建议 80GB+
70B服务器级 CPU,如 Intel Xeon 系列40GB 以上,如 NVIDIA H10064GB+,推荐 128GB+至少 30GB,建议 200GB+
  • 模型选择决策树
通用对话
代码生成
多模态任务
轻量化部署
中文优先
多语言支持
英文优先
Python
Java/C++
Web开发
文本+图像
纯文本
低性能设备
高性能设备
中等性能设备
开始选择模型
主要任务类型
语言支持
编程语言
输入类型
设备性能
DeepSeek-R1
Llama 3.3
Phi-4
DeepSeek-R1
Llama 3.3
Mistral
Gemma 2
Llama 3.3
Phi-4
Gemma 2
Mistral
1.7.1、拉取并运行模型
  1. ollama可拉取模型地址:

    1. ollama library : https://ollama.com/library
    2. 官网首页:https://ollama.com/

    在这里插入图片描述
    以deepseek-r1 为例,点击首页中 DeepSeek-R1

在这里插入图片描述

  1. 拉取并运行模型:

    • 拉取指令
    ollama run deepseek-r1:671b
    # ollama run 目标模型:大小
    

    ✅ 正常输出结果如下:
    在这里插入图片描述

    • 模型交互:

      在交互框中可直接输入问题

    ✅ 正常输出结果如下:
    在这里插入图片描述

  2. 查询已下载模型

    ollama list
    

    ✅ 正常输出结果如下:

    在这里插入图片描述

  3. 其他指令

    # 查询模型信息
    ollama show qwen2:0.5b
    
    # 删除模型
    ollama rm qwen2:0.5b
    
1.7.2、进阶使用技巧
  • API 调用

注意:python中有集成的ollama工具包,需Python 3.8及以上版本

  • Install
pip install ollama
  • Custom client 示例:
from ollama import Client
client = Client(
  host='http://localhost:11434'
)
response = client.chat(model='deepseek-r1:7b', messages=[
  {
    'role': 'user',
    'content': 'strawberry 中有几个r',
  },
])

print(response['message']['content'])

更多API详见:https://pypi.org/project/ollama

REST API详见:https://github.com/ollama/ollama/blob/main/docs/api.md

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/967214.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【算法】动态规划专题⑥ —— 完全背包问题 python

目录 前置知识进入正题模板 前置知识 【算法】动态规划专题⑤ —— 0-1背包问题 滚动数组优化 完全背包问题是动态规划中的一种经典问题,它与0-1背包问题相似,但有一个关键的区别:在完全背包问题中,每种物品都有无限的数量可用。…

基于自然语言处理的客服情感分析系统分析报告

1.大纲分析 基于自然语言处理的客服情感分析系统分析报告 引言 随着互联网的发展,企业的客服体系面临着巨大的挑战和机遇。传统的客服模式依赖人工接听电话和处理邮件,这种方式效率低下且难以满足日益增长的服务需求。为了提高服务质量和服务效率&…

Untiy3d 配置vs code开发环境

安装插件 2. 修改unity3d 的开发工具 问题处理,如果出现 visualstudiotoolsforunity.vstuc requested to download the .NET Runtime 并且一直在下载Downloading .NET version(s) 8.0.12~x64,可以手动去微软的官方下载安装.net sdk对应的版本 然后在项目…

第一财经对话东土科技 | 探索工业科技新边界

当前以ChatGPT、Sora等为代表的生成式人工智能快速发展,越来越多面向垂直场景的行业大模型涌现出来,并成为推动制造业智能化改造与数字化转型、加快推进新型工业化,进而培育发展新质生产力的新引擎。 在垂类场景的应用落地,是AI发…

win32汇编环境,结构体的使用示例二

;运行效果 ;win32汇编环境,结构体的使用示例二 ;举例说明结构体的定义,如何访问其中的成员,使用assume指令指向某个结构体,计算结构数组所需的偏移量得到某个成员值等 ;直接抄进RadAsm可编译运行。重要部分加备注。 ;下面为asm文件 ;>>…

C++ 设计模式 - 访问者模式

一:概述 访问者模式将作用于对象层次结构的操作封装为一个对象,并使其能够在不修改对象层次结构的情况下定义新的操作。 《设计模式:可复用面向对象软件的基础》一书中的访问者模式因两个原因而具有传奇色彩:一是因为它的复杂性&a…

deepseek本地部署-linux

1、官网推荐安装方法(使用脚本,我绕不过github,未采用) 登录ollama下载网站https://ollama.com/download/linux,linux下有下载脚本。 正常来说,在OS系统下直接执行脚本即可。 2、手动安装方法 2.1获取ol…

Spring Boot Actuator(官网文档解读)

定义 Spring Boot Actuator 是 Spring Boot 提供的一个用于监控和管理应用程序的模块。它能够提供各种生产级别的功能,如健康检查、度量指标收集、配置属性查看等,帮助开发者了解应用的内部状态并进行故障排查。 Actuator 引入 要启用 Actuator…

保姆级教程Docker部署Zookeeper模式的Kafka镜像

目录 一、安装Docker及可视化工具 二、Docker部署Zookeeper 三、单节点部署 1、创建挂载目录 2、命令运行容器 3、Compose运行容器 4、查看运行状态 5、验证功能 四、部署可视化工具 1、创建挂载目录 2、Compose运行容器 3、查看运行状态 一、安装Docker及可视化工…

【力扣】279.完全平方数

AC截图 题目 思路 总结动态规划方程得出的思路 找到最小子问题,涉及到当前数和上一个数的跨度,以及上一个数的结果如何变成当前数的结果这两个点。 1,当前数n和上一个数的跨度: 假设n12, 上一个数可以是11&#xff0c…

如何在WPS和Word/Excel中直接使用DeepSeek功能

以下是将DeepSeek功能集成到WPS中的详细步骤,无需本地部署模型,直接通过官网连接使用:1. 下载并安装OfficeAI插件 (1)访问OfficeAI插件下载地址:OfficeAI助手 - 免费办公智能AI助手, AI写作,下载…

使用Redis解决使用Session登录带来的共享问题

在学习项目的过程中遇到了使用Session实现登录功能所带来的共享问题,此问题可以使用Redis来解决,也即是加上一层来解决问题。 接下来介绍一些Session的相关内容并且采用Session实现登录功能(并附上代码),进行分析其存在…

【目标检测】模型验证:K-Fold 交叉验证

K-Fold 交叉验证 1、引言1.1 K 折交叉验证概述 2、配置2.1 数据集2.2 安装包 3、 实战3.1 生成物体检测数据集的特征向量3.2 K 折数据集拆分3.3 保存记录3.4 使用 K 折数据分割训练YOLO 4、总结 1、引言 我们将利用YOLO 检测格式和关键的Python 库(如 sklearn、pan…

深度学习系列--04.梯度下降以及其他优化器

目录 一.梯度概念 1.一元函数 2.二元函数 3.几何意义上的区别 二.梯度下降 1.原理 2.步骤 3.示例代码(Python) 4.不同类型的梯度下降 5.优缺点 三.动量优化器(Momentum) 适用场景 1.复杂地形的优化问题 2.数据具有噪声的问…

π0开源了且推出自回归版π0-FAST——打造机器人动作专用的高效Tokenizer:比扩散π0的训练速度快5倍但效果相当

前言 过去的半个多月 对于大模型 deepseek火爆全球,我对其的解读也写成了整整一个系列 详见《火爆全球的DeepSeek系列模型》,涉及对GRPO、MLA、V3、R1的详尽细致深入的解读 某种意义来讲,deepseek 相当于把大模型的热度 又直接拉起来了——…

导航守卫router.beforeEach

router.beforeEach 是一个全局前置守卫,在每次路由跳转之前都会触发。 //index.jsrouter.beforeEach((to, from, next) > {// 打印即将要进入的目标路由信息console.log(即将要进入的目标路由信息:, to)// 打印当前正要离开的路由信息console.log(当前正要离开的…

[ESP32:Vscode+PlatformIO]添加第三方库 开源库 与Arduino导入第三方库的区别

前言 PlatformIO与Arduino在添加第三方库方面的原理存在显著差异 在PlatformIO中,第三方库的使用是基于项目(工程)的。具体而言,只有当你为一个特定的项目添加了某个第三方库后,该项目才能使用该库。这些第三方库的文…

了解AI绘图,Stable Diffusion的使用

AI绘图对GPU算力要求较高。 个人电脑配置可参考: CPU:14600kf 盒装 显卡:RTX 4080金属大师 OC,16G显存 主板:z790吹雪d4 内存:芝奇皇家戟4000c18,162G 硬盘:宏基gm7000 1T 散热:追风…

linux环境自动化golang项目启动脚本解析

一.场景介绍 当在本地创建了golang项目,修改了代码功能,怎么在远程测试服务器上更新该功能呢,可以使用下面的步骤来解决该问题(这只是其中一种方法): (1).推送最新代码到远程仓库 (2).在测试服务器上创建该项目并拉取最新代码 (3).创建deploy.sh脚本 (4).运行deploy.sh脚本 二.…

归一化与伪彩:LabVIEW图像处理的区别

在LabVIEW的图像处理领域,归一化(Normalization)和伪彩(Pseudo-coloring)是两个不同的概念,虽然它们都涉及图像像素值的调整,但目的和实现方式截然不同。归一化用于调整像素值的范围&#xff0c…