使用服务器部署DeepSeek-R1模型【详细版】

文章目录

  • 引言
  • deepseek-r1
  • IDE或者终端工具
  • 算力平台
  • 体验deepseek-r1模型
  • 总结

引言

在现代的机器学习和深度学习应用中,模型部署和服务化是每个开发者面临的重要任务。无论是用于智能推荐、自然语言处理还是图像识别,如何高效、稳定地将深度学习模型部署到生产环境中,都是提升系统性能和用户体验的关键环节。在本文中,我们将详细介绍如何在服务器上成功部署DeepSeek-R1模型,帮助你一步步了解从环境搭建到模型上线的全过程。

deepseek-r1

最近热度十分高的DeepSeek-R1大家相比都听过,它是幻方量化旗下大模型公司 DeepSeek 研发的系列推理模型,于 2025 年 1 月 20 日正式发布并开源权重。它使用强化学习训练,推理时包含大量反思和验证,思维链长,在数学、代码、自然语言推理等复杂任务上表现出色,与 ==OpenAI o1 ==性能相当 ,在 AIME、MATH-500、SWE-Bench Verified 等基准测试中成绩优异,还能自我事实核查降低错误风险。模型参数达 6710 亿,也有 15 亿至 70 亿参数的蒸馏版本,最小版可在普通笔记本运行。
目前,DeepSeek-R1 已在多个平台接入部署,如数码视讯、天翼云、联通云、青云科技基石智算 CoresHub 等

在这里插入图片描述
下图是模型出处
https://www.modelscope.cn/models/deepseek-ai/DeepSeek-R1/summary
在这里插入图片描述

IDE或者终端工具

这里我们选择IDE(VScode或Pycharm)或者终端工具,都可以,这里我选择使用Pycharm,当然别的也行,这里可以自行选择

算力平台

算力平台,我这里选择蓝耕云智算

在这里插入图片描述
我们选择一个3090的显卡试试水
在这里插入图片描述

体验deepseek-r1模型

在体验之前,我们需要下载必要的文件,这里我给大家一个网址
https://github.com/1692775560/deepseek_project

在这里插入图片描述
我们只需要将其放到服务器上面,就可以完成体验了

根据我们之前下载好的IDE,我们现在连接一下,然后就可以开心愉快的使用喽~下面的具体的链接过程

第一步
复制账户密码
在这里插入图片描述

第二步
粘贴下图所示的位置,进行连接等待本地文件传输到服务器
在这里插入图片描述
备注:username填写root即可,host,填写@后面的即可
在这里插入图片描述
这样就是成功了,当然我们还有配置一下环境,这里参考我下面的三小步即可

在这里插入图片描述

第三步

接下来,我们只需要在终端输入代码进行体验,但是进入我们要记得进入那个文件夹里面哦,下图是进入终端的方法

在这里插入图片描述

在进入到对应文件夹内,我们记得下载库啊,pip install -r requirements.txt
下载完之后,运行python run_model.py即可
在这里插入图片描述

总结

大模型发展速度是真的很快,过去可能国外更加领先一点,但是如今我国的deepseek-r1模型甚至可以挤进了世界前三,对于我们大部分人来说,自己构建一个大模型可能需要庞大的算力,数据等等,但是若我们学会如何使用,如何部署那么对我们日常工作学习也是起到了一个 促进作用,希望我的视频对你有帮助~~~

文末附上服务器的注册地址https://cloud.lanyun.net//#/registerPage?promoterCode=0131

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/965384.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

25/2/6 <机器人基础> 运动学中各连杆的变换矩阵求法

变换矩阵 机器人通常包含多个关节和连杆,每个关节和连杆都有自己的局部坐标系。变换矩阵能够将一个点或向量从一个坐标系转换到另一个坐标系,从而实现对机器人各个部件位置和姿态的统一描述 变换矩阵能够将复杂的运动分解为旋转和平移的组合。通过矩阵乘…

CS 与 BS 架构的差异

在数字化的今天,选择软件架构模式对系统的性能、维护、安全和成本都有很大影响。BS架构和CS架构是最常见的两种模式,了解它们的区别和特点对开发人员和企业决策者都很重要。 CS架构最早出现,当时用户直接从主机获取数据。随着客户端和服务端…

Vuex 解析:从 Vue 2 到 Vue 3 的演变与最佳实践

Vuex 是 Vue.js 中的状态管理模式,广泛应用于 Vue 2 和 Vue 3 中,其内部实现存在一些差异。 1. 什么是 Vuex ? Vuex 是 Vue.js 官方提供的状态管理库,用于集中管理应用的所有组件的状态。主要是通过一种集中化的方式来管理共享状…

ip属地是手机号还是手机位置?一文理清

在数字化和网络化的今天,IP属地这一概念逐渐成为了人们关注的焦点。特别是在社交媒体和在线平台上,IP属地的显示往往让人联想到用户的地理位置。然而,关于IP属地到底与手机号还是手机位置有关,却存在着不少误解和混淆。本文将深入…

【C语言高级特性】预处理指令(二)

目录 一、取消宏定义(#undef) 1.1. 详细介绍 1.2. 代码示例 1.3. 使用场景 1.4. 注意事项 二、#line 指令 2.1. 详细介绍 2.2. 代码示例 2.3. 使用场景 2.4. 注意事项 三、#error 和 #warning 指令 3.1. #error 3.2. #warning 3.3 注意事项…

vim-plug的自动安装与基本使用介绍

vim-plug介绍 Vim-plug 是一个轻量级的 Vim 插件管理器,它允许你轻松地管理 Vim 插件的安装、更新和卸载。相较于其他插件管理器,vim-plug 的优点是简单易用,速度较快,而且支持懒加载插件(即按需加载) 自动…

华为支付-免密支付接入免密代扣说明

免密代扣包括支付并签约以及签约代扣场景。 开发者接入免密支付前需先申请开通签约代扣产品(即申请配置免密代扣模板及协议模板ID)。 华为支付以模板维度管理每一个代扣扣费服务,主要组成要素如下: 接入免密支付需注意&#x…

AI安全最佳实践:AI云原生开发安全评估矩阵(下)

上篇小李哥带大家一起了解了什么是AI应用云原生开发安全评估矩阵,并且介绍了利用该矩阵如何确定我们云上AI应用的安全评估范围,接下来我们将继续本系列的下篇,基于该安全评估矩阵设计和实施我们系统应具备的安全控制。 优先考虑的安全控制 …

新星杯进化史:个人发起到CSDN官方支持,创作活动的新篇章

❤️作者主页:小虚竹 ❤️作者简介:大家好,我是小虚竹。2022年度博客之星🏆,Java领域优质创作者🏆,CSDN博客专家🏆,华为云享专家🏆,掘金年度人气作者&#x1…

jjwt -- Token 生成解析技术指南

引言 JWT(JSON Web Token)是一种基于JSON的、用于双方之间安全传输信息的简洁的、URL安全的令牌标准。在现代Web应用程序中,JWT作为一种高效且安全的认证机制,被广泛应用于用户身份验证和信息交换场景。本文旨在详细介绍JWT Toke…

第 2 天:创建你的第一个 UE5 C++ 项目!

🎯 目标: 掌握 UE5 C 项目的创建流程,了解代码结构,并成功运行第一个 C 类! 1️⃣ 创建 UE5 C 项目 在 UE5 中,C 项目可以与蓝图(Blueprint)结合使用,让游戏逻辑更灵活…

RabbitMQ 从入门到精通:从工作模式到集群部署实战(二)

接上篇:《RabbitMQ 从入门到精通:从工作模式到集群部署实战(一)》 链接 文章目录 4.安装RabbitMQ Messaging Topology Operator 裸金属环境部署RabbitMQ部署单实例部署集群 4.安装RabbitMQ Messaging Topology Operator 使用 cer…

vs code 使用教程

一、定义 多行注释vs 找不到上层文件路径选择 或 创建python 虚拟环境git 远程克隆及推送vs code 文件路径vs 使用tensorboard 二、使用 学习网站:https://learn.microsoft.com/zh-cn/visualstudio/python/?viewvs-2022性能分析:https://learn.micros…

【Elasticsearch】terms聚合误差问题

Elasticsearch中的聚合查询在某些情况下确实可能存在误差,尤其是在处理分布式数据和大量唯一值时。这种误差主要来源于以下几个方面: 1.分片数据的局部性 Elasticsearch的索引通常被分成多个分片,每个分片独立地计算聚合结果。由于数据在分…

BUU22 [护网杯 2018]easy_tornado 1

打开题目以后出现三个文件,查看源代码,突破口在于这三个文件都有特殊的格式 python的tornado漏洞 Tornado 是一个用 Python 编写的 Web 框架(和flask一样,只不过flask是轻量级的,而tornado可以处理高流量&#xff09…

QT修仙之路1-1--遇见QT

文章目录 遇见QT二、QT概述2.1 定义与功能2.2 跨平台特性2.3 优点汇总 三、软件安装四、QT工具介绍(重要)4.1 Assistant4.2 Designer4.3 uic.exe4.4 moc.exe4.5 rcc.exe4.6 qmake4.7 QTcreater 五、QT工程项目解析(作业)5.1 配置文件(.pro)5.2 头文件&am…

寒假2.5

题解 web:[网鼎杯 2020 朱雀组]phpweb 打开网址,一直在刷新,并有一段警告 翻译一下 查看源码 每隔五秒钟将会提交一次form1,index.php用post方式提交了两个参数func和p,func的值为date,p的值为Y-m-d h:i:s a 执行fu…

计算机中数值表示:原码、反码、补码与移码

1 前言 计算机科学中,数字的表示方式至关重要,因为计算机内部只能识别处理二进制数据。为了在计算机中实现对整数的表示,提出了多种数值编码方式,其中最常用的是原码、反码、补码和移码。 2 原码 2.1 原码的定义 原码(Signed …

硬件实现I2C常用寄存器简单介绍

引言 在深入探讨I2C外设的具体案例之前,理解其核心寄存器的配置至关重要。这些寄存器不仅控制着I2C模块的基本操作模式,如数据传输速率和地址识别,还负责管理更复杂的通信需求,例如中断处理、DMA交互及错误检测与恢复。接下来的内…

分析用户请求K8S里ingress-nginx提供的ingress流量路径

前言 本文是个人的小小见解,欢迎大佬指出我文章的问题,一起讨论进步~ 我个人的疑问点 进入的流量是如何自动判断进入iptables的四表?k8s nodeport模式的原理? 一 本机环境介绍 节点名节点IPK8S版本CNI插件Master192.168.44.1…