Ollama 部署指南(Windows)

文章来源:Windows 部署文档 -- Ollama 中文文档|Ollama官方文档 

Ollama Windows

欢迎使用 Ollama for Windows。

不再需要 WSL!

Ollama 现在作为本机 Windows 应用程序运行,包括 NVIDIA 和 AMD Radeon GPU 支持。 安装 Ollama for Windows 后,Ollama 将在后台运行,并且 这ollama命令行在cmd,powershell或您的最爱 终端应用程序。像往常一样,Ollama api 将在http://localhost:11434.

系统要求

  • Windows 10 22H2 或更高版本、家庭版或专业版
  • NVIDIA 452.39 或更高版本的驱动程序(如果您有 NVIDIA 卡)
  • AMD Radeon 驱动程序 Drivers and Support for Processors and Graphics 您是否有 Radeon 卡

Ollama 使用 unicode 字符进行进度指示,在 Windows 10 中,这些字符可能会在某些较旧的终端字体中呈现为未知方块。如果您看到此内容,请尝试更改终端字体设置。

文件系统要求

Ollama 安装不需要 Administrator,默认情况下安装在您的主目录中。您至少需要 4GB 的空间来进行二进制安装。安装 Ollama 后,您将需要额外的空间来存储大型语言模型,其大小可能为数十到数百 GB。如果您的主目录没有足够的空间,您可以更改二进制文件的安装位置和模型的存储位置。

更改安装位置

要将 Ollama 应用程序安装在主目录以外的位置,请使用以下标志启动安装程序

OllamaSetup.exe /DIR="d:\some\location"

更改模型位置

要更改 Ollama 存储下载模型的位置而不是使用您的主目录,请设置环境变量OLLAMA_MODELS在您的用户帐户中。

  1. 启动设置 (Windows 11) 或控制面板 (Windows 10) 应用程序并搜索环境变量

  2. 单击 Edit environment variables(编辑您账户的环境变量)。

  3. 为您的用户帐户编辑或创建新变量OLLAMA_MODELS您希望存储模型的位置

  4. 单击 确定/应用 保存。

如果 Ollama 已在运行,请退出托盘应用程序并从 Start 菜单重新启动它,或者在保存环境变量后启动新终端。

API 访问

这是一个快速示例,显示了 API 访问powershell

(Invoke-WebRequest -method POST -Body '{"model":"llama3.2", "prompt":"Why is the sky blue?", "stream": false}' -uri http://localhost:11434/api/generate ).Content | ConvertFrom-json

故障 排除

Windows 上的 Ollama 将文件存储在几个不同的位置。您可以在 通过点击 资源管理器 窗口<Ctrl>+R并输入:

  • explorer %LOCALAPPDATA%\Ollama包含日志和下载的更新
    • app.log 包含来自 GUI 应用程序的大多数重新发送的日志
    • server.log 包含最新的服务器日志
    • upgrade.log 包含升级的日志输出
  • explorer %LOCALAPPDATA%\Programs\Ollama包含二进制文件(安装程序将此添加到您的用户 PATH)
  • explorer %HOMEPATH%\.ollama包含模型和配置
  • explorer %TEMP%在一个或多个ollama*目录

卸载

Ollama Windows 安装程序注册一个卸载程序应用程序。下Add or remove programs在 Windows 设置中,您可以卸载 Ollama。

[!注意] 如果您更改了OLLAMA_MODELS位置,安装程序将不会删除您下载的模型

独立 CLI

在 Windows 上安装 Ollama 的最简单方法是使用OllamaSetup.exe安装。它安装在您的帐户中,不需要管理员权限。 我们会定期更新 Ollama 以支持最新模型,此安装程序将 帮助您了解最新情况。

如果您想将 Ollama 安装或集成为一项服务,可以使用独立的ollama-windows-amd64.zipzip 文件仅包含 Ollama CLI 以及 Nvidia 和 AMD 的 GPU 库依赖项。这允许嵌入 Ollama 的 Pod 中,或者通过ollama serve使用 NSSM 等工具。

[!NOTE]
如果要从以前的版本升级,则应先删除旧目录。

文章来源:Windows 部署文档 -- Ollama 中文文档|Ollama官方文档 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/973580.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

数据结构:栈和队列详解(下)

目录 一.如何用队列实现栈 1.思路&#xff1a; 2.具体代码&#xff1a; 二.如何用栈实现队列 1.思路&#xff1a; 2.具体代码&#xff1a; 一.如何用队列实现栈 原题来源&#xff1a;https://leetcode.cn/problems/implement-stack-using-queues/description/ 前言&#xf…

DeepSeek智能测试知识库助手PRO版:多格式支持+性能优化

前言 测试工程师在管理测试资产时,需要面对多种文档格式、大量文件分类及知识库的构建任务。为了解决这些问题,我们升级了 DeepSeek智能测试知识库助手,不仅支持更多文档格式,还加入了 多线程并发处理 和 可扩展格式支持,大幅提升处理性能和灵活性。 主要功能亮点: 多格…

宝塔面板开始ssl后,使用域名访问不了后台管理

宝塔面板后台开启ssl访问后&#xff0c;用的证书是其他第三方颁发的证书 再使用 域名/xxx 的形式&#xff1a;https://域名:xxx/xxx 访问后台&#xff0c;结果出现如下&#xff0c;不管使用 http 还是 https 的路径访问都进不后台管理 这个时候可以使用 https://ip/xxx 的方式来…

机器学习_12 逻辑回归知识点总结

逻辑回归是机器学习中一种重要的分类算法&#xff0c;广泛应用于二分类和多分类问题。它不仅能够预测分类结果&#xff0c;还能提供每个类别的概率估计。今天&#xff0c;我们就来深入探讨逻辑回归的原理、实现和应用。 一、逻辑回归的基本概念 1.1 逻辑回归与线性回归的区别…

AI Agent实战:打造京东广告主的超级助手 | 京东零售技术实践

前言 自2022年末ChatGPT的问世&#xff0c;大语言模型&#xff08;LLM&#xff09;技术引发全球关注。在大模型技术落地的最佳实践中&#xff0c;智能体&#xff08;Agent&#xff09;架构显现出巨大潜力&#xff0c;成为业界的普遍共识&#xff0c;各大公司也纷纷启动Agent技…

【工具篇】【深度解析 DeepAI 工具:开启 AI 应用新体验】

一、DeepAI 基本信息 嘿,咱先来说说 DeepAI 这工具到底是啥。DeepAI 是一个综合性的人工智能平台,就像是一个装满各种 AI 魔法的百宝箱。它把好多先进的人工智能技术整合到一起,让咱们普通人也能轻松用上这些高大上的 AI 功能。 这个平台背后有一群超厉害的技术人员,他们…

C语言之typedef

目录 前言 一、基本数据类型定义 二、作用 自带阅读 封装复杂类型的描述过程 三、指针类型定义 ​ 四、函数类型定义 总结 前言 typedef是C语言中用来为已有数据类型取别名的关键字。通过使用typedef关键字&#xff0c;可以方便地为数据类型定义新的名称&#xff0c;提高代码的…

如何在 SpringBoot 项目使用 Redis 的 Pipeline 功能

本文是博主在批量存储聊天中用户状态和登陆信息到 Redis 缓存中时&#xff0c;使用到了 Pipeline 功能&#xff0c;并对此做出了整理。 一、Redis Pipeline 是什么 Redis 的 Pipeline 功能可以显著提升 Redis 操作的性能&#xff0c;性能提升的原因在于可以批量执行命令。当我…

【HBase】HBaseJMX 接口监控信息实现钉钉告警

目录 一、JMX 简介 二、JMX监控信息钉钉告警实现 一、JMX 简介 官网&#xff1a;Apache HBase ™ Reference Guide JMX &#xff08;Java管理扩展&#xff09;提供了内置的工具&#xff0c;使您能够监视和管理Java VM。要启用远程系统的监视和管理&#xff0c;需要在启动Java…

鸿蒙开发环境搭建-入门篇

本文章讲述如何搭建鸿蒙应用开发环境&#xff1a;新建工程、虚拟机运行、真机调试等。 开发工具: DevEco Studio 5.0.3.906 os系统: mac 参考文档&#xff1a;https://juejin.cn/post/7356143704699699227 官网鸿蒙应用开发学习文档&#xff1a;https://developer.huawei.com/c…

[OD E 100] 生成哈夫曼树

题目 题目描述 给定长度为 n 的无序的数字数组&#xff0c;每个数字代表二叉树的叶子节点的权值&#xff0c;数字数组的值均大于等于 1 。请完成一个函数&#xff0c;根据输入的数字数组&#xff0c;生成哈夫曼树&#xff0c;并将哈夫曼树按照中序遍历输出。 为了保证输出的二…

Linux-ubuntu系统移植之Uboot启动流程

Linux-ubuntu系统移植之Uboot启动流程 一&#xff0c;Uboot启动流程1.Uboot的两阶段1.1.第一阶段1.11.硬件初始化1.12.复制 U-Boot 到 RAM1.13.跳转到第二阶段 1.2.第二阶段1.21.C 语言环境初始化1.22. 硬件设备初始化1.23. 加载环境变量1.24. 显示启动信息1.25. 等待用户输入&…

ElasticSearch公共方法封装

业务场景 1、RestClientBuilder初始化&#xff08;同时支持单机与集群&#xff09; 2、发送ES查询请求公共方法封装&#xff08;支持sql、kql、代理访问、集群访问、鉴权支持&#xff09; 3、判断ES索引是否存在&#xff08;/_cat/indices/${indexName}&#xff09; 4、判断ES…

vertical-align

属性名&#xff1a; vertical - align 。 作用&#xff1a;用于指定 同一行元素之间 &#xff0c;或 表格单元格 内文字的 垂直对齐方式 。 常用值&#xff1a; 1. baseline &#xff08;默认值&#xff09;&#xff1a;使元素的基线与父元素的基线对齐。 2. top …

Markdown 与富文本语法对照全解析

原文&#xff1a;Markdown 与富文本语法对照全解析 | w3cschool笔记 Markdown 和富文本是两种广泛应用的文本格式。Markdown 以简洁易读的语法著称&#xff0c;而富文本则凭借其丰富的样式和强大的功能深受用户喜爱。本文将对 Markdown 和富文本的语法进行详细对照&#xff0c…

基于Django快递物流管理可视化分析系统(完整系统源码+数据库+详细开发文档+万字详细论文+答辩PPT+详细部署教程等资料)

文章目录 基于Django快递物流管理可视化分析系统&#xff08;完整系统源码数据库详细开发文档万字详细论文答辩PPT详细部署教程等资料&#xff09;一、项目概述二、项目说明三、研究意义四、系统设计技术架构 五、功能实现六、完整系统源码数据库详细开发文档万字详细论文答辩P…

vmvare kali如何配置桥接模式进行上网

注意点:虚拟机可以PING通物理机,但是PING不通其他的网站。经过收集资料,得知由于是校园网连接,所以DHCP只能分配一个授权的IP地址给连接的主机,由于KALI是桥接物理机,物理机已经获得了这个授权的IP,所以导致桥接的虚拟机无法上网。所以不是因为配置的有问题,而是网络的…

【数据挖掘】--算法

【数据挖掘】--算法 目录&#xff1a;1. 缺失值和数值属性处理1缺失值处理&#xff1a; 2. 用于文档分类的朴素贝叶斯3. 分治法&#xff1a;建立决策树4. 覆盖算法建立规则5. 挖掘关联规则6. 线性模型有效寻找最近邻暴力搜索&#xff08;Brute-Force Search&#xff09;kd树&am…

【数据库系统概论】第6章 (三)数据依赖的公理系统

推理规则 定理 函数依赖的其他五条推理规则。 (1) A4&#xff08;合并性规则&#xff09;&#xff1a;&#xff5b;X→Y&#xff0c;X→Z&#xff5d;| X→YZ。 (2) A5&#xff08;分解性规则&#xff09;&#xff1a;&#xff5b;X→Y&#xff0c;Z  Y&#xff5d;| X→Z …

1.22作业

1 Web-php-unserialize __construct()与$file、__destruct() __wakeup()检查 先绕过wakeup函数&#xff1a; O:4:"Demo":2:{s:10:"Demofile";s:8:"fl4g.php";}1.PHP序列化的时候对public protected private变量的处理方式是不同的 public无标…