寒武纪MLU370部署deepseek r1

文章目录

  • 前言
  • 一、平台环境准备
  • 二、模型下载
  • 三、环境安装
  • 四、代码修改
  • 五、运行效果


前言

DeepSeek-R1拥有卓越的性能,在数学、代码和推理任务上可与OpenAI o1媲美。其采用的大规模强化学习技术,仅需少量标注数据即可显著提升模型性能,为大模型训练提供了新思路。此外,DeepSeek-R1构建了智能训练场,通过动态生成题目和实时验证解题过程等方式,提升模型推理能力。该模型完全开源,采用MIT许可协议,并开源了多个小型模型,进一步降低了AI应用门槛,赋能开源社区发展

一、平台环境准备

镜像选择:pytorch:v24.12-torch2.5.0-torchmlu1.24.0-ubuntu22.04-py310
卡选择:任意一款MLU3系列及以上卡

二、模型下载

apt install git-lfs
git-lfs clone https://www.modelscope.cn/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B.git

三、环境安装

pip install transformers accelerate

四、代码修改

from transformers import AutoModelForCausalLM, AutoTokenizer
import torch###+
import torch_mlu###+
import torch_mlu.utils.gpu_migration###+
model_name = "/workspace/volume/guojunceshi2/DeepSeek-R1-Distill-Qwen-14B"

model = AutoModelForCausalLM.from_pretrained(
    model_name,
    torch_dtype=torch.float16,###+
    device_map="auto"
)
tokenizer = AutoTokenizer.from_pretrained(model_name)

prompt = "我只有3000元,帮我制定一份南京3天游"
messages = [
    {"role": "user", "content": prompt}
]
text = tokenizer.apply_chat_template(
    messages,
    tokenize=False,
    add_generation_prompt=True
)
model_inputs = tokenizer([text], return_tensors="pt").to(model.device)

generated_ids = model.generate(
    **model_inputs,
    max_new_tokens=512
)
generated_ids = [
    output_ids[len(input_ids):] for input_ids, output_ids in zip(model_inputs.input_ids, generated_ids)
]

response = tokenizer.batch_decode(generated_ids, skip_special_tokens=True)[0]
print(response)

五、运行效果

/torch/venv3/pytorch/lib/python3.10/site-packages/torch_mlu/mlu/__init__.py:379: UserWarning: Linear memory is not supported on this device. Falling back to common memory. (Triggered internally at /torch_mlu/torch_mlu/csrc/framework/core/caching_allocator.cpp:718.)
  torch_mlu._MLUC._mlu_init()
[WARNING][/torch_mlu/torch_mlu/csrc/utils/version.cpp:133][operator()][process:22535][thread:140454997248896]: Cambricon NEUWARE minimum version requirements not met! Require DRIVER minimum verion is 6.2.8-1, but current version is 5.10.29-1
Loading checkpoint shards: 100%|█████████████████████████████████████████████████████████████████████████████████████| 4/4 [00:13<00:00,  3.49s/it]
Setting `pad_token_id` to `eos_token_id`:151643 for open-end generation.
[2025-01-31 21:51:38.846151][CNNL][WARNING][22535][Card:0]: [cnnlGetReduceOpWorkspaceSize] is deprecated and will be removed in future release. Use [cnnlGetReduceOpWorkspaceSize_v2] instead.
[2025-01-31 21:51:38.846271][CNNL][WARNING][22535][Card:0]: [cnnlReduce] is deprecated and will be removed in future release. Use [cnnlReduce_v2] instead.
<think>
嗯,用户说他只有3000元,想让我帮他制定一份南京3天游的计划。首先,我得考虑他的预算情况,3000元在3天里怎么分配比较合理。通常,旅游费用包括交通、住宿、餐饮和景点门票,所以我要平衡这些部分。

他可能是一个独自旅行或者和朋友一起,不太清楚南京有哪些必去的景点,所以需要推荐一些经典的地方。南京作为六朝古都,有很多历史文化景点,比如中山陵、夫子庙、秦淮河这些,都是不能错过的。

交通方面,南京的地铁很方便,可以建议他买地铁一日票或者多日票,这样比较划算。另外,景点之间的距离可能有点远,所以交通费用需要考虑进去。

住宿的话,3000元大概可以住三星级到四星级的酒店,或者选择经济型连锁酒店,这样每天大概1000元左右。可能的话,住在新街口或者夫子庙附近,交通便利,方便游玩。

餐饮方面,南京的小吃很出名,比如盐水鸭、汤包等,预算要留出一部分来品尝当地美食。每顿饭大概控制在50-100元,这样3天下来餐饮费用大约500-800元。

景点门票方面,中山陵免费,夫子庙免费,但有些景点可能需要门票,比如明孝陵、总统府等,这些加起来可能需要300-500元。

接下来,我得安排每天的行程,尽量让行程紧凑但不过于劳累。第一天可以安排中山陵、明孝陵和紫金山天文台,这些地方都在紫金山附近,比较集中。第二天集中在老城区,夫子庙、秦淮河、南京博物馆,晚上可以去新街口和夫子庙附近逛逛。第三天安排总统府、南京大屠杀纪念馆和玄武湖公园,这样既有历史又有自然景观。

还要考虑一些小贴士,比如交通卡的购买,景点的开放时间,以及当地的美食推荐。这样用户在旅行中会更方便。

最后,检查一下总预算是否在3000元左右,可能需要做一些调整,比如住宿选择更便宜的选项,或者减少一些景点,但尽量让行程丰富又不超支。
</think>

好的!以下是一个适合预算约3000元的南京3天游行程建议。南京是一个历史悠久的城市,既有丰富的历史文化景点,也有现代化的城市风光。以下是详细的行程安排:

---

### **第一天:历史文化之旅**
**交通预算**:约100元(地铁或公交)
**住宿预算**:约1000元(经济型酒店或青年旅舍)
**餐饮预算**:约300元

#### 上午:
1. **中山陵**(免费)  
   - 南京的标志性景点,民国建筑的代表,登顶可以俯瞰南京全景。
   - 建议早晨前往,避免人流过多。

#### 下午:
2. **明孝陵**(门票:70元)  
   - 明代皇家陵寝,世界文化遗产,建筑宏伟,适合拍照。
   - 建议参观祾恩殿和石像生。

3. **紫金山天文台**(门票:20元)  
   - 如果时间充裕,可以顺便参观,感受科学与历史的结合。

#### 晚上:
4. **晚餐**:尝试南京特色美食,如盐水鸭、鸭血粉丝汤、小笼包等。推荐去新街口或夫子庙附近的餐厅。
5. **住宿**:建议住在夫子庙或新街口附近,方便第二天游玩。

---

### **第二天:古城与现代生活**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元

#### 上午:
1. **夫子庙秦淮风光带**(免费)  
   - 漫步秦淮河畔,感受古都风情,可以租一只小船在河上漂流(约50元/小时)。
   - 推荐在夫子庙附近购买一些南京特产,如云锦、雨花石等。

2. **南京博物馆**(免费)  
   - 如果时间充裕,可以参观,了解南京的历史文化。

#### 下午:
3. **总统府**(门票:80元)  
   - 近代历史的重要遗址,建筑风格中西合璧,适合拍照。

4. **鼓楼公园**(免费)  
   - 如果时间允许,可以顺便逛逛,感受南京的慢生活。

#### 晚上:
5. **新街口/夫子庙夜景**  
   - 晚上可以在夫子庙附近散步,欣赏夜晚的秦淮河灯光秀。
6. **晚餐**:尝试南京火锅或烤肉,推荐“巷子深”或“南京大牌档”。

---

### **第三天:自然与休闲**
**交通预算**:约80元
**景点预算**:约100元
**餐饮预算**:约300元

#### 上午:
1. **玄武湖公园**(免费)  
   - 南京最大的城市公园,适合散步、骑行或划船。
   - 可以租一辆共享单车(约3元/小时)或租船游湖(约40元/小时)。

2. **南京大屠杀纪念馆**(门票:免费)  
   - 了解历史,感受和平的重要性。

#### 下午:
3. **中山植物园**(门票:50元)  
   - 如果时间充裕,可以顺便参观,感受自然与植物的美妙结合。

#### 晚上:
4. **返程准备**  
   - 根据返程时间,前往南京南站或机场,结束愉快的南京之旅。

---

### **总预算估算**:
- **交通**:约300元(包括市内交通和景点之间交通)
- **住宿**:约1000元
- **餐饮**:约900元
- **景点门票**:约500元
- **其他**:约200元(纪念品、小吃等)

**总计**:约3000元

---

### **小贴士**:
1. 南京的地铁非常方便,可以购买地铁一日票(20元/人),覆盖大部分景点。
2. 南京的景点大多集中在主城区,步行或骑行即可。
3. 南京小吃种类繁多,记得尝试地道的盐水鸭和鸭血粉丝汤!

希望这份行程能帮助你玩转南京,祝你旅途愉快!
/opt/py3.10/lib/python3.10/tempfile.py:860: ResourceWarning: Implicitly cleaning up <TemporaryDirectory '/tmp/tmp0sdoxr7m'>
  _warnings.warn(warn_message, ResourceWarning)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/962461.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Office / WPS 公式、Mathtype 公式输入花体字、空心字

注&#xff1a;引文主要看注意事项。 1、Office / WPS 公式中字体转换 花体字 字体选择 “Eulid Math One” 空心字 字体选择 “Eulid Math Two” 使用空心字时&#xff0c;一般不用斜体&#xff0c;取消勾选 “斜体”。 2、Mathtype 公式输入花体字、空心字 2.1 直接输…

Baklib对比其他知识管理工具的优势及应用效果全面分析

内容概要 Baklib知识中台作为一种集成化的数字化平台&#xff0c;其核心功能围绕知识的高效管理、共享以及运用展开。这一平台不仅为企业提供了统一的知识管理架构&#xff0c;还依托智能化技术&#xff0c;使得组织内外的知识资源能够实现流畅的交互与利用。通过Baklib&#…

python:洛伦兹变换

洛伦兹变换&#xff08;Lorentz transformations&#xff09;是相对论中的一个重要概念&#xff0c;特别是在讨论时空的变换时非常重要。在四维时空的背景下&#xff0c;洛伦兹变换描述了在不同惯性参考系之间如何变换时间和空间坐标。在狭义相对论中&#xff0c;洛伦兹变换通常…

Janus-Pro 论文解读:DeepSeek 如何重塑多模态技术格局

Janus-Pro&#xff1a;多模态领域的璀璨新星——技术解读与深度剖析 一、引言 在人工智能的浩瀚星空中&#xff0c;多模态理解与生成模型犹如耀眼的星座&#xff0c;不断推动着技术边界的拓展。Janus-Pro作为这一领域的新兴力量&#xff0c;以其卓越的性能和创新的架构&#x…

稀疏混合专家架构语言模型(MoE)

注&#xff1a;本文为 “稀疏混合专家架构语言模型&#xff08;MoE&#xff09;” 相关文章合辑。 手把手教你&#xff0c;从零开始实现一个稀疏混合专家架构语言模型&#xff08;MoE&#xff09; 机器之心 2024年02月11日 12:21 河南 选自huggingface 机器之心编译 机器之心…

被裁与人生的意义--春节随想

还有两个月就要被迫离开工作了十多年的公司了&#xff0c;不过有幸安安稳稳的过了一个春节&#xff0c;很知足! 我是最后一批要离开的&#xff0c;一百多号同事都没“活到”蛇年。看着一批批仁人志士被“秋后斩首”&#xff0c;马上轮到我们十来个&#xff0c;个中滋味很难言清…

AVL搜索树

一、介绍 高度平衡的搜索二叉树&#xff0c;保证每个节点的左右子树高度差不超过1&#xff0c;降低搜索树的高度以提高搜索效率。 通过平衡因子和旋转来保证左右子树高度差不超过1 二、插入节点 1、插入规则 &#xff08;1&#xff09;搜按索树规则插入节点 &#xff08;…

unity导入图片素材注意点和AI寻路模块导入

当我们导入了图片资源&#xff0c;我们需要设置为Sprite类型 UI资源的位置通常是Rect Transform 要进行转化&#xff1a; (imgHP.transform as RectTransform).sizeDelta new Vector2((float)hp / maxHP * hpW,74); RectTransform 是Unity中用于UI元素的特殊变换组件&#…

中国网络安全产业分析报告

网络安全是总体国家安全观的重要组成部分&#xff0c;切实维护网络空间安全&#xff0c;筑牢国家网络安全屏障&#xff0c;已成为关系我国发展全局的重大战略任务。近年来&#xff0c;我国网信相关部门深入推进网络安全治理&#xff0c;网络安全政策法规体系更加健全&#xff0…

kimi,天工,gpt,deepseek效果对比

偶然间碰到的这个问题&#xff0c;这个问题感觉有点意思&#xff0c;他不是定义性的问题&#xff0c;而是不同概念之间的区别对比&#xff0c;我觉得这个效果立竿见影&#xff0c;一看就能看出来回答问题水平的层次。 单纯这个问题的答案&#xff0c;deepseek远超gpt&#xff…

Github 2025-01-30 Go开源项目日报 Top10

根据Github Trendings的统计,今日(2025-01-30统计)共有10个项目上榜。根据开发语言中项目的数量,汇总情况如下: 开发语言项目数量Go项目10Ollama: 本地大型语言模型设置与运行 创建周期:248 天开发语言:Go协议类型:MIT LicenseStar数量:42421 个Fork数量:2724 次关注人…

MySQL查询优化(三):深度解读 MySQL客户端和服务端协议

如果需要从 MySQL 服务端获得很高的性能&#xff0c;最佳的方式就是花时间研究 MySQL 优化和执行查询的机制。一旦理解了这些&#xff0c;大部分的查询优化是有据可循的&#xff0c;从而使得整个查询优化的过程更有逻辑性。下图展示了 MySQL 执行查询的过程&#xff1a; 客户端…

【4Day创客实践入门教程】Day3 实战演练——桌面迷你番茄钟

Day3 实战演练——桌面迷你番茄钟 目录 Day3 实战演练——桌面迷你番茄钟1. 选择、准备元件、收集资料2. 硬件搭建3.编写代码 Day0 创想启程——课程与项目预览Day1 工具箱构建——开发环境的构建Day2 探秘微控制器——单片机与MicroPython初步Day3 实战演练——桌面迷你番茄钟…

leetcode 2300. 咒语和药水的成功对数

题目如下 数据范围 示例 注意到n和m的长度最长达到10的5次方所以时间复杂度为n方的必然超时。 因为题目要求我们返回每个位置的spell对应的有效对数所以我们只需要找到第一个有效的药水就行&#xff0c;这里可以先对potions排序随后使用二分查找把时间复杂度压到nlogn就不会…

Android Studio 正式版 10 周年回顾,承载 Androider 的峥嵘十年

Android Studio 1.0 宣发于 2014 年 12 月&#xff0c;而现在时间来到 2025 &#xff0c;不知不觉间 Android Studio 已经陪伴 Androider 走过十年历程。 Android Studio 10 周年&#xff0c;也代表着了我的职业生涯也超十年&#xff0c;现在回想起来依然觉得「唏嘘」&#xff…

互斥锁/信号量实现5个线程同步

互斥锁 实现同步 互斥锁保证在同一时刻&#xff0c;只有一个线程可以访问共享资源&#xff0c;从而实现了线程同步。 思路 1 创建互斥锁(1个) pthread_mutex_t mutex; 2 初始化互斥锁 所有线程开始执行前&#xff0c;pthread_mutex_init(&mutex, …

WordPress Web Directory Free插件本地包含漏洞复现(附脚本)(CVE-2024-3673)

免责申明&#xff1a; 本文所描述的漏洞及其复现步骤仅供网络安全研究与教育目的使用。任何人不得将本文提供的信息用于非法目的或未经授权的系统测试。作者不对任何由于使用本文信息而导致的直接或间接损害承担责任。如涉及侵权&#xff0c;请及时与我们联系&#xff0c;我们将…

系统学习算法: 专题七 递归

递归算法简而言之就是当一个大问题拆分为多个子问题时&#xff0c;如果每个子问题的操作步骤都一样&#xff0c;就可以用递归&#xff0c;其中递归在递的时候要有结束条件&#xff0c;不能一直递下去&#xff0c;结束条件后就归 这里不建议学习递归的时候抠细节&#xff0c;还…

单片机基础模块学习——PCF8591芯片

一、A/D、D/A模块 A——Analog 模拟信号:连续变化的信号(很多传感器原始输出的信号都为此类信号)D——Digital 数字信号:只有高电平和低电平两种变化(单片机芯片、微控制芯片所能处理的都是数字信号) 下面是模拟信号和连续信号的区别 为什么需要进行模拟信号和数字信号之…

从未标记图像中生成有标记图像特征的半监督分割方法

今天看到一篇文章很有意思&#xff0c;给大家分享一下。现在传统半监督分割网络训练时往往有标注数据与未标注数据分开训练&#xff0c;导致模型不好。这篇文章作者提出了一个很有意思的想法。它通过通道注意力从未标记的特征中重新加载标记的特征。这篇文章是AllSpark。 大家感…