使用Ollama本地部署DeepSeek R1

前言

DeepSeek是一款开源的智能搜索引擎,能够通过深度学习技术提高搜索的智能化水平。如果你正在寻找一种方式来将DeepSeek部署在本地环境中,Ollama是一个非常方便的工具,它允许你在本地快速部署并管理各种基于AI的模型。

在本篇博客中,我们将一步一步地指导你如何使用Ollama工具在本地环境中部署DeepSeek模型。

本地部署是指将AI模型部署在用户自己的本地设备上,直接处理数据和任务,无需依赖云端服务器。
这种方式可以确保数据隐私和安全,适合对数据敏感性要求高的场景。

一、Ollama

Ollama是一个支持在WindowsLinuxMacOS上本地运行大语言模型的工具。它允许用户非常方便地运行和使用各种大语言模型,比如Qwen模型等。只需一行命令就可以启动模型。

1.1 下载Ollama

Ollama下载地址
选择对应操作系统进行下载.exe文件,这里以Windows为例:
在这里插入图片描述

1.2 安装Ollama

点击Install一键安装
在这里插入图片描述
安装完成后,查看Ollama版本,执行命令:ollama -vollama --version
查看下载的模型列表,执行命令:ollama list

在这里插入图片描述

1.3 常用命令

在这里插入图片描述
查看已部署的大模型:ollama list
查看正在运行中的大模型:ollama ps
部署或者运行一个大模型:ollama run <model_name>
停止在运行的大模型:ollama stop <model_name>

1.4 修改环境配置

在这里插入图片描述
模型存放地址默认在C:\Users\用户名\.ollama\models,若下载模型过多,会导致C盘存储不够用,建议修改

新建环境变量,OLLAMA_MODELS
在这里插入图片描述
新建环境变量,OLLAMA_HOST,默认端口为11434端口,若有端口冲突,自行修改【可选】
在这里插入图片描述
新建环境变量,OLLAMA_ORIGINS,【可选】
在这里插入图片描述
修改环境变量后,需要重启Ollama

找到Ollama小羊驼图标,右键 Quit Ollama
在这里插入图片描述
搜索找到Ollama,以管理员身份运行
在这里插入图片描述
重启后,黑窗口执行ollama -v检查一下是否启动成功
浏览器查看一下API服务:127.0.0.1:11434
在这里插入图片描述
若配置了OLLAMA_HOST,可在黑窗口执行ipconfig命令,查看本机IP,通过本机IP访问API服务
在这里插入图片描述

若连接不上,则自行检查环境变量,确保无误

二、下载DeepSeek R1模型

https://ollama.com/library/deepseek-r1

访问Ollama官网,点击左上角的Models按钮,找到DeepSeek R1模型
在这里插入图片描述
在黑窗口运行,下载模型,需要耐心等待
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

三、下载可视化界面 - Open WebUI

3.1 下载Chrome浏览器的插件 Page Assist【推荐】

在Chrome浏览器,点击竖着的… > 扩展程序 > 访问 Chrome 浏览器应用商店 > 搜索
在这里插入图片描述
下载完成后,快捷键 Ctrl + Shift + L 即可打开可视化页面【前提:先启动Ollama服务】

点击设置修改语言
在这里插入图片描述
选择模型
在这里插入图片描述
在这里插入图片描述
即可进行对话
在这里插入图片描述

3.2 使用python安装

亲测有效:史上最简单open-webui安装方式!!! ,但有点卡顿

3.3 使用docker安装

该方法最为繁琐,不推荐,但UI要美观些

github源码地址:https://github.com/open-webui/open-webui
在这里插入图片描述
找到Installation with Default Configuration
在这里插入图片描述
如果 Ollama 在您的计算机上

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

如果 Ollama 位于其他服务器上,请使用以下命令:
要连接到另一台服务器上的 Ollama,请将OLLAMA_BASE_URL更改为服务器的 URL:

docker run -d -p 3000:8080 -e OLLAMA_BASE_URL=http://192.168.2.6:11434 -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

这里我Ollama 位于其他服务器上,使用第二个命令
在这里插入图片描述

注意:访问不到,记得开放端口,参考Linux-开启端口

初次登录,注册一个账号,该账号默认为管理员
在这里插入图片描述
点击头像 > 设置 > 管理员设置
在这里插入图片描述
点击外部连接 > 设置Ollama API连接
在这里插入图片描述
选择一个模型,即可开始对话
在这里插入图片描述

总结

通过本地部署 DeepSeek R1,我们可以将 AI 模型和搜索引擎直接运行在自己的设备上,从而有效保护数据隐私和安全。在部署过程中,Ollama 提供了简单易用的工具,支持快速下载和管理模型,极大地简化了本地部署的流程。然而,值得注意的是,这种方式需要一定的硬件支持,并且部署过程中可能会涉及到科学上网配置相关问题。

尽管本地部署可能会比较繁琐,但它的优势在于:

  • 数据安全:通过本地环境运行 AI 模型,用户的数据不会暴露给云端服务,确保数据隐私。
  • 灵活控制:用户可以自由管理模型、调整配置、优化性能。
  • 离线使用:无需依赖外部服务,能够在没有网络的情况下使用模型。

对于需要高效且可定制的本地智能搜索引擎,DeepSeek R1 + Ollama + Open-WebUI 无疑是一个值得尝试的解决方案。

博主也在摸索阶段,有问题及时欢迎讨论!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/961763.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

libOnvif通过组播不能发现相机

使用libOnvif库OnvifDiscoveryClient类&#xff0c; auto discovery new OnvifDiscoveryClient(QUrl(“soap.udp://239.255.255.250:3702”), cb.Build()); 会有错误&#xff1a; end of file or no input: message transfer interrupted or timed out(30 sec max recv delay)…

Visual Studio使用GitHub Copilot提高.NET开发工作效率

GitHub Copilot介绍 GitHub Copilot 是一款 AI 编码助手&#xff0c;可帮助你更快、更省力地编写代码&#xff0c;从而将更多精力集中在问题解决和协作上。 GitHub Copilot Free包含哪些功能&#xff1f; 每月 2000 代码补全&#xff0c;帮助开发者快速完成代码编写。 每月 …

HTB:Forest[WriteUP]

连接至HTB服务器并启动靶机 分配IP&#xff1a;10.10.16.21 靶机IP&#xff1a;10.10.10.161 靶机Domain&#xff1a;forest.htb 目录 连接至HTB服务器并启动靶机 信息收集 使用rustscan对靶机TCP端口进行开放扫描 将靶机TCP开放端口号提取并保存 使用nmap对靶机TCP开放端…

项目集成GateWay

文章目录 1.环境搭建1.创建sunrays-common-cloud-gateway-starter模块2.目录结构3.自动配置1.GateWayAutoConfiguration.java2.spring.factories 3.pom.xml4.注意&#xff1a;GateWay不能跟Web一起引入&#xff01; 1.环境搭建 1.创建sunrays-common-cloud-gateway-starter模块…

STM32 PWM驱动直流电机

接线图&#xff1a; 代码配置&#xff1a; 根据驱动舵机的代码来写&#xff0c;与舵机不同的是&#xff0c;这次的引脚接到了PA2上&#xff0c;所以需要改一下引脚以及改为OC3通道。 另外还需在配置两个GPIO引脚&#xff0c;来控制电机的旋转方向&#xff0c;这里连接到了PA4与…

强大到工业层面的软件

电脑数据删不干净&#xff0c;简直是一种让人抓狂的折磨&#xff01;明明已经把文件扔进了回收站&#xff0c;清空了&#xff0c;可那些残留的数据就像牛皮癣一样&#xff0c;怎么也除不掉。这种烦恼简直无处不在&#xff0c;让人从头到脚都感到无比烦躁。 首先&#xff0c;心…

一分钟搭建promehteus+grafana+alertmanager监控平台

为什么要自己搭建一个监控平台 平时进行后端开发&#xff0c;特别是微服务的后端可开发&#xff0c;一定少不了对接监控平台&#xff0c;但是平时进行一些小功能的测试又没有必要每次都手动安装那么多软件进行一个小功能的测试&#xff0c;这里我使用docker-compose搭建了一个…

记一次STM32编译生成BIN文件过大的问题(基于STM32CubeIDE)

文章目录 问题描述解决方法更多拓展 问题描述 最近在一个项目中使用了 STM32H743 单片机&#xff08;基于 STM32CubeIDE GCC 开发&#xff09;&#xff0c;它的内存分为了 DTCMRAM RAM_D1 RAM_D2 …等很多部分。其中 DTCM 的速度是比通常的内存要快的&#xff0c;缺点是不支持…

前端-Rollup

Rollup 是一个用于 JavaScript 的模块打包工具&#xff0c;它将小的代码片段编译成更大、更复杂的代码&#xff0c;例如库或应用程序。它使用 JavaScript 的 ES6 版本中包含的新标准化代码模块格式&#xff0c;而不是以前的 CommonJS 和 AMD 等特殊解决方案。ES 模块允许你自由…

崇州市街子古镇正月初一繁华剪影

今天是蛇年正月初一&#xff0c;下午笔者步出家门&#xff0c;逛到了崇州市街子古镇井水街&#xff0c;想看看景象如何。结果看到的是车水马龙、人流如织&#xff0c;繁花似锦&#xff0c;热闹非凡&#xff0c;原来今天开始预订此地摆下的长街宴。心里高兴&#xff0c;便用手机…

【橘子Kibana】Kibana的分析能力Analytics简易分析

一、kibana是啥&#xff0c;能干嘛 我们经常会用es来实现一些关于检索&#xff0c;关于分析的业务。但是es本身并没有UI,我们只能通过调用api来完成一些能力。而kibana就是他的一个外置UI&#xff0c;你完全可以这么理解。 当我们进入kibana的主页的时候你可以看到这样的布局。…

python3+TensorFlow 2.x(二) 回归模型

目录 回归算法 1、线性回归 (Linear Regression) 一元线性回归举例 2、非线性回归 3、回归分类 回归算法 回归算法用于预测连续的数值输出。回归分析的目标是建立一个模型&#xff0c;以便根据输入特征预测目标变量&#xff0c;在使用 TensorFlow 2.x 实现线性回归模型时&…

OpenAI-Edge-TTS:本地化 OpenAI 兼容的文本转语音 API,免费高效!

文本转语音&#xff08;TTS&#xff09;技术已经成为人工智能领域的重要一环&#xff0c;无论是语音助手、教育内容生成&#xff0c;还是音频文章创作&#xff0c;TTS 工具都能显著提高效率。今天要为大家介绍的是 OpenAI-Edge-TTS&#xff0c;一款基于 Microsoft Edge 在线文本…

练习(复习)

大家好&#xff0c;今天我们来做几道简单的选择题目来巩固一下最近学习的知识&#xff0c;以便我们接下来更好的学习。 这道题比较简单&#xff0c;我们前面学过&#xff0c;在Java中&#xff0c;一个类只能继承一个父类&#xff0c;但是一个父类可以有多个子类&#xff0c;一个…

Meta推动虚拟现实:Facebook如何进入元宇宙时代

随着科技的不断进步&#xff0c;虚拟现实&#xff08;VR&#xff09;与增强现实&#xff08;AR&#xff09;技术的快速发展&#xff0c;世界正在逐步迈向一个全新的数字时代——元宇宙。而在这个革命性的转变中&#xff0c;Meta&#xff08;前身为Facebook&#xff09;作为全球…

go gin配置air

一、依赖下载 安装最新&#xff0c;且在你工作区下进行安装&#xff0c;我的是D:/GO是我的工作区&#xff0c;所有项目都在目录下的src&#xff0c; go install github.com/air-verse/airlatest 如果出现类似报错&#xff1a; 将图中第三行 github.com/air-verse/air 替换最…

Spring--SpringMVC使用(接收和响应数据、RESTFul风格设计、其他扩展)

SpringMVC使用 二.SpringMVC接收数据2.1访问路径设置2.2接收参数1.param和json2.param接收数据3 路径 参数接收4.json参数接收 2.3接收cookie数据2.4接收请求头数据2.5原生api获取2.6共享域对象 三.SringMVC响应数据3.1返回json数据ResponseBodyRestController 3.2返回静态资源…

FreeRTOS的任务创建和删除

1&#xff0c;任务创建和删除的API函数 任务的创建和删除本质就是调用FreeRTOS的API函数 动态创建任务&#xff1a; 任务的任务控制块以及任务的栈空间所需的内存&#xff0c;均由 FreeRTOS 从 FreeRTOS 管理的堆中分配。 静态创建任务&#xff1a; 任务的任务控制块以及任务的…

通过Ngrok实现内网穿透助力远程开发

在现代软件开发和网络应用的环境下&#xff0c;开发人员常常需要在本地搭建服务器进行调试、测试或演示。然而&#xff0c;传统的端口映射&#xff08;如使用 NAT 或 SSH 隧道&#xff09;配置繁琐&#xff0c;且并非所有环境都允许直接暴露本地服务。ngrok 作为一款强大的隧道…

Elasticsearch的索引生命周期管理

目录 说明零、参考一、ILM的基本概念二、ILM的实践步骤Elasticsearch ILM策略中的“最小年龄”是如何计算的&#xff1f;如何监控和调整Elasticsearch ILM策略的性能&#xff1f; 1. **监控性能**使用/_cat/thread_pool API基本请求格式请求特定线程池的信息响应内容 2. **调整…