大模型系列课程学习-基于2080TI-22G魔改卡搭建双卡大模型训练平台(双系统)

1.选择合适的硬件配置

再配置电脑之前,需要确认自己需要的显存大小、主板、内存条、电源、散热等核心配件。经过前期调研,选择的硬件配置如下:
(1)主板:华南X99_F8D(DDR4主板),因为需要支持双卡,综合价格等多种因素,选择了该主板,
在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ebd4a0df02c4571b0fbc33e50d19274.png
(2)CPU:E5-2680V42(线程28个)价格便宜,且线程多
在这里插入图片描述
(3)内存条:16G
4 (DDR4),这里面选三星或者国产内存条均可
(4)显卡: 2080ti-22G魔改卡 *2【显卡之间nvlink连接】,一般情况,单卡全卡功耗在250W左右
在这里插入图片描述
(5)散热:散热器 4铜管 或 6铜管
(6)电源:选择了1250W的模块化电源【CPU:240W+GPU:500W+主板、散热器、风扇等,留有余量,选择大点的】
(7)电脑机箱:这里一定要根据主板和显卡大小选择,我选择的是宙斯盾的,稍微贵了一些,之前选的坦克机箱和航佳机箱都没货了。
(8)存储:NVME固态+SATA固态(分别安装windows和ubuntu系统)

2.硬件组装- X99主板安装基础硬件设施

x99主板的硬件外围图如下:
在这里插入图片描述
实物图如下:
在这里插入图片描述

2.1 CPU安装:

CPU的安装、散热器的安装可以移步至x99主板安装视频
在这里插入图片描述

2.2 显卡安装

显卡安装需要注意,建议一张一张卡的安装,先把系统点亮后再安装另一个显卡,因为显卡厚度原因,建议PCIE显卡安装为主如下图所示
在这里插入图片描述
在这里插入图片描述
显卡安装实物图如下(建议先安装一个卡,系统正常运行后再逐步添加卡):
在这里插入图片描述

2.3 电源安装(这里使用的是全模组电源,主要是方便)

在这里插入图片描述
接线示意图如下
在这里插入图片描述

3.电脑系统安装(Windows11 + ubuntu系统)

3.1windows电脑系统安装

windows系统安装比较简单,大概的步骤就是弄一个U盘,然后使用大白菜弄个启动盘,然后安装系统即可,可以参考windows系统U盘安装教程,一般购买硬盘,店家都会给你预装,想省事的话可以让店家把你预装一个,然后再自己去官网下载个系统盘,直接执行安装即可windows11安装系统
因为windows系统大家都比较熟悉,安装的时候记得自己安装在哪个硬盘即可
在这里插入图片描述
需要注意,window显卡驱动需要单独从官网下载安装,此外,因为本次使用的显卡为涡轮卡,需要设置显卡风扇速度,避免显卡过热(可以通过bios或者NVIDIA Inspector 进行设置)链接

3.2 Ubuntu系统安装

ubuntu系统安装同winodows比较类似,唯一不同的是这里的显卡驱动在安装系统时可以选择自动安装,我这里面参考的教程如下ubuntu系统安装
过程中遇到不少问题:
a.ERROR:BIOS/LEGACY BOOT OF UEFI-ONLY MEDIA
在这里插入图片描述

原因:启动盘的引导项是用于uefi模式启动,但是服务器的引导启动方式为legacy ,所以导致报错。
解决方案:重新弄启动U盘,或者查找系统安装位置是否正确,可以参考链接
b.界面无显示,系统之前已经成功,但是无显示(可能是显卡驱动安装不对)
c.主板液晶屏显示报错,相关报错码如下:
在这里插入图片描述
在这里插入图片描述
系统安装完毕后,再次安装另一个显卡和nvlink

3.3 显卡及NVLINK的设置(以ubuntu系统为例)

(1)在上述安装完双系统后,需要对显卡和nvlink的配置进行设置,确保显卡散热正常
(2)一般windows系统中NVIDIA Inspector设置风扇速度这块为灰色,无法设置,建议使用ubuntu进行设置,一般情况下代码在linux的环境下,使用更为方便
(3)显卡风扇配置
a. sudo nvidia-settings
在这里插入图片描述
b.安装完毕后打开软件,设置风扇速度为最大
在这里插入图片描述

(4)打开命令行界面,首先查看显卡是否正常:nvidia-smi
在这里插入图片描述
(5)查看nvlink连接是否正常:nvidia-smi topo -m
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/760024.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

1Panel运维利器:功能详解与实操指南

官网地址:https://1panel.cn/ 1Panel简介 1Panel是杭州飞致云信息科技有限公司旗下产品,是一款现代化、开源的Linux服务器运维管理面板,于2023年3月推出。 名称:1Panel开源Linux面板 所属公司:杭州飞致云信息科技有限公司 编写语…

基于HarmonyOS NEXT开发智能提醒助手

目录 目录 目录 前言 关于HarmonyOS NEXT 智能提醒助手需求分析 智能提醒助手设计 1、系统架构 2、功能模块 智能提醒助手的应用场景 智能提醒助手的竞争力 具体技术实现 未来展望 结束语 前言 随着智能设备的普及和物联网技术的飞速发展,人们对于智能…

忙忙碌碌的混沌之中差点扑了个空而错过年中这条线

文章目录 前言初见端倪混沌初始力不从心心力交瘁拾遗补缺总结 前言 突然意识到过完这个周末已经7月份了,他预示着我的2024年已经过半了,过年回家仿佛还是昨天的事情,怎么转眼间已经到了年中了。心里还是不愿承认这件事,翻开自己2…

Nacos配置中心客户端源码分析(一): 客户端如何初始化配置

本文收录于专栏 Nacos 推荐阅读:Nacos 架构 & 原理 文章目录 前言一、NacosConfigBeanDefinitionRegistrar二、NacosPropertySourcePostProcessor三、AbstractNacosPropertySourceBuilder总结「AI生成」 前言 专栏前几篇文章主要讲了Nacos作为服务注册中心相关…

github主页这样优化,让人眼前一亮

我的主页(一之十六) 1. 创建与账户ID同名的仓库 注意:记得勾选Add a README file 2. markdown语法自定义README.md 3. 辅助工具 优秀profile:https://zzetao.github.io/awesome-github-profile/动态文字:https://r…

SpringMVC(1)——入门程序+流程分析

MVC都是哪三层?在Spring里面分别对应什么?SpringMVC的架构是什么? 我们使用Spring开发JavaWeb项目,一般都是BS架构,也就是Browser(浏览器)-Server(服务器)架构 这种架构…

谷歌开发者新号上架攻略:开发者实战经验分享

前段时间,不少开发者朋友们在纷纷在吐槽新账号没法上架成功。以前谷歌对新号是真的很严格,但现在情况似乎有所好转。 今天,和大家聊聊如何在新号成功上架上“快人一步”,以及怎样增加账号权重提高上架成功率。 首先,我…

成绩发布背后:老师的无奈与痛点

在教育的广阔天地里,教师这一角色承载着无数的期望与责任。他们不仅是知识的传播者,更是学生心灵的引路人。而对于班主任老师来说,他们的角色更加多元,他们不仅是老师,还必须是“妈妈”。除了像其他老师一样备课、上课…

Linux文件系统与设备文件

一、Linux文件操作 Linux的文件系统API主要涉及创建、打开、读写、定位、关闭文件 创建 int creat(const char *filename, mode_t mode);mode: 代表新建文件的存取权限,需要和umask相与才能确定最终权限(mode&umask)。 umask代表文件在创建时需要去掉的存取…

8.12 矢量图层面要素单一符号使用十(箭头线渲染边界)

前言 本章介绍矢量图层线要素单一符号中箭头线渲染边界的使用说明:文章中的示例代码均来自开源项目qgis_cpp_api_apps 箭头线渲染边界(Outline: Arrow) Outline系列只画边界,不填充内容以protected_areas.shp为例,图…

Spring 动态增强逻辑执行分析

1、假如UserService中存在被增强的public 普通方法,那么spring ioc时就会创建对应的代理对象放置到容器中; 2、那么Controller中注入的userService就是代理对象; Service public class UserService {Transactionalpublic void f2(String us…

【训练篇】MLU370-M8 完成 qwen1.5-7b-chat-lora训练及推理

文章目录 前言一、平台环境配置二、环境 or 模型准备1.模型下载2.环境准备2.1 modelscope2.2 transformers2.3 accelerate2.4 deepspeed2.5 peft2.6 环境代码修改 3训练代码准备4 代码修改 三,训练后推理验证四.推理效果展示1.微调前2.微调后 前言 本期我们采用魔塔…

【雷达原理】雷达测角原理及实现方法

目录 一、雷达测角原理1.1 测角研究历史和现状1.2 测角方法总结1.3 3DFFT测角1.3.1 基本原理1.2.2 测角性能 二、MATLAB仿真案例参考文献 一、雷达测角原理 1.1 测角研究历史和现状 (1)早期采用窄波束对准目标,目标的角度对应于天线的角度读…

【高性能服务器】服务器概述

🔥博客主页: 我要成为C领域大神🎥系列专栏:【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞👍收藏⭐评论✍️ 本博客致力于知识分享,与更多的人进行学习交流 ​ 服务器概述 服…

[深入理解DDR] 总目录

依公知及经验整理,原创保护,禁止转载。 专栏 《深入理解DDR》 蓝色的是传送门,点击链接即可到达指定文章。 图。 DDR 分类 导论 [RAM] DRAM 导论:DDR4 | DDR5 | LPDDR5 | GDRR6 | HBM 应运而生 运存与内存?内存与存…

Golang-GMP

GMP调度 golang-GMP语雀笔记整理 GMP调度设计目的,为何设计GMP?GMP的底层实现几个核心数据结构GMP调度流程 设计目的,为何设计GMP? 无论是多进程、多线程目的都是为了并发提高cpu的利用率,但多进程、多线程都存在局限性。比如多进程通过时…

第三方服务提供商的五大风险

亚马逊如何应对网络安全挑战 关键网络安全统计数据和趋势 移动优先世界中安全和隐私策略 当今数字时代网络安全的重要性 用户无法停止犯安全错误的 3 个原因 首席安全官可能过于依赖 EDR/XDR 防御 随着业务流程变得越来越复杂,公司开始转向第三方来提高其提供关…

Unity动画系统(1)

6.1 动画系统基础1-5_哔哩哔哩_bilibili 模型信息 Generic非人型 Configure 虚线圈可以没有,实线圈必须有,15个骨骼是必须的 p313 尾巴、翅膀属于非人型 p314 一般使用create from this model 游戏对象不再旋转 游戏对象不再发生位移 调整中心位置

WP黑格导航主题BlackCandy

BlackCandy-V2.0全新升级!首推专题区(推荐分类)更多自定义颜色!选择自己喜欢的色系,焕然一新的UI设计,更加扁平和现代化! WP黑格导航主题BlackCandy

springcloud第4季 分布式事务seata实现AT模式案例2【经典案例】

一 seata案例 1.1 背景说明 本案例使用seata的at模式,模拟分布式事务场景:【下订单,减库存,扣余额,改状态】 AT模式原理:是2pc方案的演变, 一阶段:业务数据和回滚日志记录在同一…