DeepSeek-R1 本地部署模型流程

 DeepSeek-R1 本地部署模型流程 
*****************************************************
环境准备
操作系统:Windows11
内存:32GB RAM
存储:预留 300GB 可用空间
显存:  16G
网络: 100M带宽
 
*****************************************************
setup1:  安装 Ollama

访问 Ollama 官网(https://ollama.com/ )
根据你的操作系统点击 “download” 下载安装包,然后进行安装。
确保github可访问 ( windows hosts配置github访问dns )

安装成功后: 
cmd命令行输入 ollamam 确认安装正确.(输出使用说明提示)
****************************************************

****************************************************
setup2: 下载 DeepSeek 模型
打开 Ollama 网址,找到 “models” 选项,进入后选择 “deepseek-r1”。(https://ollama.com/library/deepseek-r1)
本机16G显存 使用 ollama run deepseek-r1:14b 
--------------------------------------------
1.5b 版本:适用于一般文字编辑使用,需要 1.1GB 空余空间,命令为ollama run deepseek-r1:1.5b。
7b 版本:DeepSeek 的第一代推理模型,性能与 openal-01 相当,需要 4.7GB 空余空间,命令为ollama run deepseek-r1:7b。
8b 版本:需要 4.9GB 空余空间,命令为ollama run deepseek-r1:8b。
14b 版本:需要 9GB 空余空间,命令为ollama run deepseek-r1:14b。
32b 版本:需要 20GB 空余空间,命令为ollama run deepseek-r1:32b。
70b 版本:需要 43GB 空余空间,命令为ollama run deepseek-r1:70b。
671b 版本:需要 404GB 空余空间,命令为ollama run deepseek-r1:671b 。
(也可以在 DeepSeek 官网上,点击 “model”,进入最近的 “deepseekr1” 模型,点击 “复制” 按钮图标获取命令)
------------------------------------------------
复制粘贴命令到cmd命令行,等待即可.

下载结束后会出现 “verifyingsha256digest” 检查完整性,完成后若有 “success” 提示则表示部署完成。
其他命令:  
 ollama list 查看已部署模型
 ollama rm deepseek-r1:14b 删除模型
...
****************************************************

 ****************************************************
setup3: 开启对话
部署完成后,命令提示符输入位置会变成 “>>send a message for help” 提示,此时进入与人工智能对话场景,可以输入中文或英文进行交流

离线后重新进入对话:关闭 powershell 后,若想重新进入 DeepSeek 对话,通过CMD终端,输入 “ollama run deepseek-r1:14b” 。

搭建更便捷的操作界面(可选):如果想要更方便的操作界面,可以搭建 webui,需要安装 open - webui。(步骤略)
 ****************************************************

 ****************************************************
本地搭建大模型的意义(个人):
 自主可控 ,数据相对安全, 数据不会上传至云端,  用户对于包含商业机密、个人隐私等敏感数据的处理会更加放心。
 行业应用实时化, 降低使用门槛,无需依赖网络传输 , 配合企业/个人知识库+智能体应用,能拥有更合适自己的AI助手。

 ****************************************************

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/961677.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

实验三---基于MATLAB的二阶系统动态性能分析---自动控制原理实验课

一 实验目的 1、观察学习二阶控制系统的单位阶跃响应、脉冲响应 2、记录单位阶跃响应曲线、脉冲响应曲线 3、掌握时间响应分析的一般方法 4、掌握系统阶跃响应曲线与传递函数参数的对应关系 二 实验仪器 计算机 MATLAB软件 三 实验内容及步骤 1、作以下二阶系统的单位阶跃响应…

爬虫基础(一)HTTP协议 :请求与响应

前言 爬虫需要基础知识,HTTP协议只是个开始,除此之外还有很多,我们慢慢来记录。 今天的HTTP协议,会有助于我们更好的了解网络。 一、什么是HTTP协议 (1)定义 HTTP(超文本传输协议&#xff…

ZZNUOJ(C/C++)基础练习1011——1020(详解版)

1011 : 圆柱体表面积 题目描述 输入圆柱体的底面半径r和高h,计算圆柱体的表面积并输出到屏幕上。要求定义圆周率为如下宏常量 #define PI 3.14159 输入 输入两个实数,表示圆柱体的底面半径r和高h。 输出 输出一个实数,即圆柱体的表面积&…

【电工基础】2.低压带电作业定义,范围,工作要求,电工基本工具

一。低压带电作业 1.低压带电作业定义 低压带电作业是指在不停电的低压设备或低压线路上的工作。对于一些可以不停电的工作,没有偶然触及带电部分的危险工作,或作业人员使用绝缘辅助安全用具直接接触带电体及在带电设备外壳上的工作,均可进行…

SpringSecurity:There is no PasswordEncoder mapped for the id “null“

文章目录 一、情景说明二、分析三、解决 一、情景说明 在整合SpringSecurity功能的时候 我先是去实现认证功能 也就是,去数据库比对用户名和密码 相关的类: UserDetailsServiceImpl implements UserDetailsService 用于SpringSecurity查询数据库 Logi…

如何解压rar格式文件?8种方法(Win/Mac/手机/网页端)

RAR 文件是一种常见的压缩文件格式,由尤金・罗谢尔(Eugene Roshal)开发,因其扩展名 “rar” 而得名。它通过特定算法将一个或多个文件、文件夹进行压缩,大幅减小存储空间,方便数据传输与备份。然而&#xf…

锁升级过程与优化操作

前文我们学习了CAS自旋锁知道CAS对应的就是一条指令操作,属于一种轻量级锁,那么有轻必有重,从无锁到轻量级锁到重量级锁是一个升级过程,此文我们对锁升级的过程以及一些优化锁的操作一探究竟。 1. 锁升级 从前文 《程序员不可能不…

IoTDB 2025 春节值班与祝福

2025 春节快乐 瑞蛇迎吉庆,祥光映华年,2025 春节已近在眼前。社区祝福 IoTDB 的所有关注者、支持者、使用者 2025 新年快乐,“蛇”来运转! IoTDB 团队的春节放假时间为 2025 年 1 月 27 日至 2 月 4 日,1 月 25 日、26…

neo4j-community-5.26.0 install in window10

在住处电脑重新配置一下neo4j, 1.先至官方下载 Neo4j Desktop Download | Free Graph Database Download Neo4j Deployment Center - Graph Database & Analytics 2.配置java jdk jdk 21 官网下载 Java Downloads | Oracle 中国 path: 4.查看java -version 版本 5.n…

matlab中,fill命令用法

在 MATLAB 中,fill 命令用于创建填充多边形的图形对象。使用 fill 可以在二维坐标系中绘制填充的区域,通常用于绘制图形的背景或显示数据分布。 基本语法 fill(X, Y, C)X 和 Y 是同样长度的向量,定义了多边形的顶点坐标。C 是颜色&#xff0…

ThinkPHP 8 操作JSON数据

【图书介绍】《ThinkPHP 8高效构建Web应用》-CSDN博客 《2025新书 ThinkPHP 8高效构建Web应用 编程与应用开发丛书 夏磊 清华大学出版社教材书籍 9787302678236 ThinkPHP 8高效构建Web应用》【摘要 书评 试读】- 京东图书 使用VS Code开发ThinkPHP项目-CSDN博客 编程与应用开…

Java—三种遍历方式

迭代器遍历 特点&#xff1a;迭代器不依赖素引 迭代器使用案例一般在集合中使用 import java.util.ArrayList; import java.util.Collection; import java.util.Iterator;public class text1 {public static void main(String[] args) {Collection<String> collnew Arr…

线性调整器——耗能型调整器

线性调整器又称线性电压调节器&#xff0c;以下是关于它的介绍&#xff1a; 基本工作原理 线性调整器的基本电路如图1.1(a)所示,晶体管Q1(工作于线性状态,或非开关状态)构成一个连接直流源V和输出端V。的可调电气电阻,直流源V由60Hz隔离变压器&#xff08;电气隔离和整流&#…

leetcode——二叉树的最大深度(java)

给定一个二叉树 root &#xff0c;返回其最大深度。 二叉树的 最大深度 是指从根节点到最远叶子节点的最长路径上的节点数。 示例 1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;3 示例 2&#xff1a; 输入&#xff1a;root [1,null,2] 输…

K8S中高级存储之PV和PVC

高级存储 PV和PVC 由于kubernetes支持的存储系统有很多&#xff0c;要求客户全都掌握&#xff0c;显然不现实。为了能够屏蔽底层存储实现的细节&#xff0c;方便用户使用&#xff0c; kubernetes引入PV和PVC两种资源对象。 PV&#xff08;Persistent Volume&#xff09; PV是…

IVD设备-GB4793.1 安规理解笔记

IVD设备-GB4793.1 安规理解笔记 参考国标文档 GB4793.1接地电阻试验试验通过的标准 耐压试验试验通过的标准 浮地危险带电部分与可触及导电零部件之间耐压试验通过的标准 参考国标文档 GB4793.1 接地电阻试验 图1GB 4793.1-2007标准 附录F.2 ⌘根据F.1要求内容是关保护接地电…

“AI视频智能分析系统:让每一帧视频都充满智慧

嘿&#xff0c;大家好&#xff01;今天咱们来聊聊一个特别厉害的东西——AI视频智能分析系统。想象一下&#xff0c;如果你有一个超级聪明的“视频助手”&#xff0c;它不仅能自动识别视频中的各种元素&#xff0c;还能根据内容生成详细的分析报告&#xff0c;是不是感觉特别酷…

002-基于Halcon的图像几何变换

本节将简要介绍Halcon中有关图像几何变换的基本算子及其应用&#xff0c;主要涉及五种常见的二维几何变换形式&#xff1a;平移、镜像、旋转、错切和放缩。这几种变换可归结为一类更高级更抽象的空间变换类型&#xff0c;即仿射变换&#xff08;Affine transformation&#xff…

七、深入了解SpringBoot的配置文件

一、配置端口号 通过配置文件application.properties配置修改端口号 修改 application.properties 文件 #端口号修改成 9090 server.port9090运行结果&#xff0c;观察日志 二、配置文件格式 Spring Boot 配置⽂件有以下三种&#xff1a; • application.properties • ap…

【Kubernetes】Pod生命周期、初始化容器、主容器

一、Pod生命周期 Pod从创建到终止退出的时间范围称为Pod生命周期。 1、生命周期重要流程 创建基础容器&#xff08;pause container&#xff09;初始化容器&#xff08;init-X Containers&#xff09;主容器&#xff08;container&#xff09;启动后的钩子(post-start)启动探…