本地快速部署DeepSeek-R1模型以及可视化工具

这里写目录标题

  • 安装 Ollama
  • 下载和部署DeepSeek模型
  • 可视化工具

安装 Ollama

Ollama 是一个轻量级的可扩展框架,用于在本地计算机上构建和运行语言模型。它提供了一个用于创建、运行和管理模型的简单 API,以及一个可在各种应用程序中轻松使用的预构建模型库。用于在本地轻松运行和部署大型语言模型。

Ollama 官网下载地址:https://ollama.com/downloadOllama下载官网

  1. 下载完成后点击 OllamaSetup.exe 安装 Ollama
  2. 配置环境变量(选配,不修改则使用默认配置)
    Ollama 环境变量配置表
环境变量名称默认值描述适用场景
OLLAMA_HOST127.0.0.1指定Ollama服务监听的IP地址需要远程访问Ollama服务时设置
OLLAMA_PORT11434指定Ollama服务监听的端口号端口冲突时修改
OLLAMA_MODELS-指定模型存储目录的路径自定义模型存储位置
OLLAMA_KEEP_ALIVE5m设置模型在内存中的保留时间(如10m表示10分钟)优化内存使用
OLLAMA_DEBUGfalse启用调试模式(设置为true时输出详细日志)排查问题时使用
OLLAMA_MAX_LOADED_MODELS1设置同时加载的最大模型数量多模型并行推理时调整
OLLAMA_GPU_LAYERS0设置使用GPU加速的层数(仅支持CUDA)启用GPU加速时配置
OLLAMA_THREADS自动检测设置CPU推理时的线程数优化CPU利用率
OLLAMA_MAX_VRAM-设置GPU显存的最大使用量(如4096表示4GB)限制GPU显存占用
OLLAMA_LOG_LEVELinfo设置日志级别(可选:debug、info、warn、error)调整日志输出详细程度
OLLAMA_NO_HISTORYfalse禁用历史记录(设置为true时不保存对话历史)隐私保护场景
OLLAMA_TEMP_DIR系统临时目录指定临时文件存储目录自定义临时文件位置
OLLAMA_HTTP_PROXY-设置HTTP代理服务器地址需要通过代理访问网络时配置
OLLAMA_HTTPS_PROXY-设置HTTPS代理服务器地址需要通过代理访问网络时配置
OLLAMA_NO_PROXY-设置不需要代理的地址列表(逗号分隔)排除特定地址的代理
OLLAMA_LLM_LIBRARYauto指定底层LLM库(如llama.cpp、transformers)切换底层推理引擎
OLLAMA_CACHE_DIR系统缓存目录指定模型缓存目录自定义缓存位置
OLLAMA_DISABLE_TELEMETRYfalse禁用遥测数据收集(设置为true时禁用)隐私保护场景
OLLAMA_API_KEY-设置API访问密钥(用于远程调用)启用API认证时配置
OLLAMA_AUTH_TOKEN-设置认证令牌(用于身份验证)启用身份验证时配置

例如:配置ollama的模型存储路径

  • 右键点击“此电脑” → 选择“属性” → 点击“高级系统设置”
  • 在“系统属性”窗口中,点击“环境变量”
  • 在“系统变量”部分,点击“新建”
  • 输入变量名和变量值,点击“确定”保存
    环境变量
  1. 安装完成后可在控制台运行命令,查看安装情况
ollama --version
  1. 运行启动命令(windows下载后、电脑开机时默认自动启动Ollama)
ollama serve
  1. 访问 http://localhost:11434 进行查看是否启动成功

下载和部署DeepSeek模型

  1. 下载DeepSeek模型
ollama pull deepseek-r1:8b  # 8B版本
ollama pull deepseek-r1:14b # 14B版本
ollama pull deepseek-r1:32b # 32B版本
DeepSeek模型版本介绍
轻量级部署1.5B版本适用于边缘计算设备,如工业控制终端、智能家居中枢
7B-8B版本适合个人开发者工作站,支持代码生成、文档处理等任务
企业级部署14B-32B版本满足企业知识管理、合同分析、报告生成等需求
70B版本适用于金融分析、医疗诊断等专业领域
科研级部署671B版本支持多模态大模型训练、复杂科学计算任务
  1. 下载完成后,可以使用以下命令查看已下载的模型列表:
ollama list

安装deepseek模型

  1. 使用命令运行模型
ollama run deepseek-r1:8b

启动DeepSeek
这里我们的deepseek模型已经在本地启动成功了,可以在命令行输入提问信息。如果想要像官网对话页面一样,可以下载可视化工具来达到同样的效果。

可视化工具

可视化工具可使用 Chatbox AI 、Page-Assist、LobeChat、Open WebUI 等。这里介绍 Chatbox AI (快速上手版) 。

Chatbox AI 是一款 AI 客户端应用和智能助手,支持众多先进的 AI 模型和 API,官网地址。

下载安装完成后

  1. 设置模型
    设置本地模型
  2. 设置完毕后开始提问
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/970837.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

hive高频写入小数据,导致hdfs小文件过多,出现查询效率很低的情况

问题描述 hive高频写入小数据,导致hdfs小文件过多,出现查询效率很低的情况分析过程 先复现现象 select count() from ads.ads_sdd_flow_managemlt_to_ids_mm;–15分钟,小文件10983 select max(mm) from ads.ads_sdd_flow_managemlt_to_ids…

Docker 部署 MySQL 8 详细图文教程

🚀 作者主页: 有来技术 🔥 开源项目: youlai-mall ︱vue3-element-admin︱youlai-boot︱vue-uniapp-template 🌺 仓库主页: GitCode︱ Gitee ︱ Github 💖 欢迎点赞 👍 收藏 ⭐评论 …

Pythong 解决Pycharm 运行太慢

Pythong 解决Pycharm 运行太慢 官方给Pycharm自身占用的最大内存设低估了限制,我的Pycharm刚开始默认是256mb。 首先找到自己的Pycharm安装目录 根据合适自己的改 保存,重启Pycharm

图像生成GAN和风格迁移

文章目录 摘要abstract1.生成对抗网络 GAN1.1 算法步骤 2.风格迁移2.1 损失函数2.2 论文阅读2.2.1 简介2.2.2 方法2.2.3 实验2.2.4 结论 3.总结 摘要 本周学习了生成对抗网络(GAN)与风格迁移技术在图像生成中的应用。首先介绍了GAN模型中生成器与判别器…

three.js+WebGL踩坑经验合集(8.1):用于解决z-fighting叠面问题的polygonOffset远没我们想象中那么简单

初八开工后,笔者又停了下来,今天总算又抽出来了一丢丢的时间继续。今天打算给大家聊聊困扰很多3D开发者的z-fighting叠面闪烁问题。 该问题从严格意义上说,是属于业务问题,因为现实中是不会有完全重叠的两个平面物体存在&#xf…

2025年-G4-Lc78--121. 买卖股票的最佳时机--(java版)

1.题目描述 2.思路 思路1: 做两轮排序,第一轮排序找到最小的那个数,然后再判断最小的那个数之后还有其他数吗,如果有在进行排序,选出最大的那个数,然后值相减。 问题要点: (1)你需要…

AI 编程工具—Cursor 进阶篇 数据分析

AI 编程工具—Cursor 进阶篇 数据分析 上一节课我们使用Cursor 生成了北京房产的销售数据,这一节我们使用Cursor对这些数据进行分析,也是我们尝试使用Cursor 去帮我们做数据分析,从而进一步发挥Cursor的能力,来帮助我们完成更多的事情 案例一 房产销售数据分析 @北京202…

【Python】错误异常

个人主页:Guiat 归属专栏:Python 文章目录 1. 错误和异常的概念1.1 错误1.2 异常 2. 常见的内置异常类型2.1 ZeroDivisionError2.2 IndexError2.3 KeyError2.4 TypeError 3. 异常处理机制3.1 try-except 语句3.2 try-except-else 语句3.3 try-except-fin…

ICASSP2023 | IE-FGSM | 通过增强欧拉方法提高对抗样本的可迁移性

Boosting Transferability of Adversarial Example via an Enhanced Euler’s Method 摘要-Abstract引言-Introduction相关工作-Related Work方法-Methodology实验-Experiments结论-Conclusion 论文链接 本文 “Boosting Transferability of Adversarial Example via an Enhan…

力扣 470. 用 Rand7() 实现 Rand10() 拒绝采样 等概率随机数生成

Problem: 470. 用 Rand7() 实现 Rand10() 文章目录 🍻 k 进制诸位生成 拒绝采样🍺 朴素版🍺 优化版 🍻 等概率生成任何数大法 🍻 k 进制诸位生成 拒绝采样 👩‍🏫 参考题解 ⏰ 时间复杂度&a…

Jvascript网页设计案例:通过js实现一款密码强度检测,适用于等保测评整改

本文目录 前言功能预览样式特点总结:1. 整体视觉风格2. 密码输入框设计3. 强度指示条4. 结果文本与原因说明 功能特点总结:1. 密码强度检测2. 实时反馈机制3. 详细原因说明4. 视觉提示5. 交互体验优化 密码强度检测逻辑总Html代码Javascript代码 前言 能…

无人机航迹规划: 梦境优化算法(Dream Optimization Algorithm,DOA)求解无人机路径规划MATLAB

一、梦境优化算法 梦境优化算法(Dream Optimization Algorithm,DOA)是一种新型的元启发式算法,其灵感来源于人类的梦境行为。该算法结合了基础记忆策略、遗忘和补充策略以及梦境共享策略,通过模拟人类梦境中的部分记忆…

【c++】【Linux】【进程】线程终止/崩溃 会导致进程终止/崩溃 吗?

【c】【Linux】【进程】线程终止/崩溃 会导致进程终止/崩溃 吗? 1.线程终止会导致进程终止吗? 在操作系统中,线程是进程的基本执行单元,一个进程可以包含一个或多个线程。 当一个子线程终止时,进程并不会因此自动终…

【动手学运动规划】5.5 基于PiecewiseJerk的路径优化方法

知我者,谓我心忧. 不知我者,谓我何求。— 佚名 黍离 🏰代码及环境配置:请参考 环境配置和代码运行! PiecewiseJerkOptimizer是Apollo中planning模块生成Path/Speed曲线的优化方法. 基于Frenet坐标系, 生成平滑, 安全的目标曲线. …

图论入门算法:拓扑排序(C++)

上文中我们了解了图的遍历(DFS/BFS), 本节我们来学习拓扑排序. 在图论中, 拓扑排序(Topological Sorting)是对一个有向无环图(Directed Acyclic Graph, DAG)的所有顶点进行排序的一种算法, 使得如果存在一条从顶点 u 到顶点 v 的有向边 (u, v) , 那么在排序后的序列中, u 一定…

英国学术论文规范,学术来源的基本知识

学术来源(scholarly source),指的是在某一特定的学术研究领域由专家所写,给同行或者对此专业领域有兴趣的人所阅读,提供相关分析素材的研究成果。在国外留学中,虽然平时学校要求完成的作业多为reports&…

Java运维实战:问题定位-CPU突增排查

java程序最常见的故障场景就是CPU徒增的情况了,本片文章为你讲解java程序CPU突增的情况怎么进行排查 1、获取CPU消耗高的线程ID top -Hp 进程ID 然后输入大写P(shiftp),就会将这个进程下的线程按照CPU消耗进行排序展示。 举例 然…

使用 Ansys MotorCAD 进行轴向磁通电机设计

新的 MotorCAD 机器拓扑:轴向磁通电机 轴向磁通量可用拓扑 Ansys MotorCAD支持3种不同的轴向磁通拓扑,包括(双转子 - 单定子)、(单转子 - 单定子)和(单转子 - 双定子) 双转子 - 单…

【深度学习】深度学习和强化学习算法——深度 Q 网络DQN

深度 Q 网络(Deep Q-Network, DQN) 详解 什么是DQNDQN 的背景DQN 训练流程 2 DQN 的核心思想2.1 经验回放(Experience Replay)2.2 目标网络(Target Network)2.3 ε-贪心策略(ε-Greedy Policy&a…

学习数据结构(10)栈和队列下+二叉树(堆)上

1.关于栈和队列的算法题 (1)用队列实现栈 解法一:(参考代码) 题目要求实现六个函数,分别是栈初始化,入栈,移除并返回栈顶元素,返回栈顶元素,判空&#xff0…