Ubuntu 20.04 for NVIDIA V100 GPU安装手册

安装Ubuntu 20.04.3 LTS版本

image.png

image.png

安装Ubuntu 20.04按照安装提示,仔细选择每一项,基本默认即可。

系统中查看GPU信息

系统安装完成之后,进入系统,使用lspci 命令查询一下GPU是否存在、型号信息是什么。

bpang@bobpang:\~$ sudo lspci |grep -i nvidia

2f:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

86:00.0 3D controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)

下载NVIDIA Tesla V100驱动

通过lspci查询到GPU的型号之后,可以按照如下选择,选择产品类型、系列、型号、然后根据自己的操作系统来选择。

注意:如果操作系统是Linux,尽量选择Linux 32-bit/Linux 64-bit,不需要选择详细的Linux发行版本。测试是发现选择详细的Linux发行版本,安装驱动之后,找不到nvidia-smi命令。

image.png

image.png

image.png

image.png

安装gcc等依赖包

当安装GPU驱动时,提示缺少相关的依赖包,在此,我们需要提前安装相关的依赖包,目前需要用到的是gcc , g++ , make :

bpang@bobpang:\~$ sudo apt install gcc g++ make

屏蔽nouveau开源版本的GPU驱动

当系统安装完成之后,会安装系统开源的NVIDIA驱动版本,名称为nouveau。下面将屏蔽该驱动。

首先,创建/etc/modprobe.d/blacklist-nouveau.conf文件,

bpang@bobpang:\~$ sudo vim /etc/modprobe.d/blacklist-nouveau.conf

将下面内容添加进去:

blacklist nouveau

blacklist lbm-nouveau

options nouveau modeset=0

alias nouveau off

alias lbm-nouveau off

创建/etc/modprobe.d/nouveau-kms.conf文件,将options nouveau mdeset=0添加进去:

bpang@bobpang:\~$ echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

更新一下initramfs:

bpang@bobpang:\~$ sudo update-initramfs -u

重启服务器:

bpang@bobpang:\~$ sudo reboot

查看nouveau模块是否加载,不显示的话就表示已经禁用:

bpang@bobpang:\~$ sudo lsmod | grep nouveau

image.png

image.png

安装NVIDIA GPU驱动

安装下载的GPU驱动:NVIDIA-Linux-x86\_64-510.47.03.run ,目前驱动版本为:510.47.03,如下执行该驱动文件,即可安装。

bpang@bobpang:\~$ ./ NVIDIA-Linux-x86\_64-510.47.03.run

安装完成之后,可以使用lspci看到GPU的驱动信息:

image.png

image.png

使用nvidia-smi命令查看GPU的信息

bpang@bobpang:\~$ nvidia-smi

image.png

image.png

安装CUDA 11.6

访问nvidia官网,下载CUDA,cuda的链接为:CUDA Toolkit 12.3 Update 1 Downloads | NVIDIA Developer

选择runfile文件来安装。

image.png

image.png

bpang@bobpang:\~$ wget https://developer.download.nvidia.com/compute/cuda/11.6.0/local\_installers/cuda\_11.6.0\_510.39.01\_linux.run

bpang@bobpang:\~$ sudo sh cuda\_11.6.0\_510.39.01\_linux.run

如下图,Driver选项不要勾选了,前面已经安装GPU驱动了。

image.png

image.png

image.png

image.png

创建环境变量,编辑\~/.bashrc文件:

bpang@bobpang:/data/cuda$ vim \~/.bashrc

将下面命令追加到文件最后面:

export CUDA\_HOME=/usr/local/cuda

export PATH=$PATH:$CUDA\_HOME/bin

export LD\_LIBRARY\_PATH=/usr/local/cuda-11.6/lib64${LD\_LIBRARY\_PATH:+:${LD\_LIBRARY\_PATH}}

为nvcc命令创建一个软连接到/usr/bin目录:

bpang@bobpang:/data/cuda$ sudo ln -s /usr/local/cuda/bin/nvcc /usr/bin/nvcc

使用nvcc命令查看cuda的版本:

bpang@bobpang:/data/cuda$ nvcc --version

image.png

image.png

验证CUDA是否安装成功

下载CUD实例文件。因为CUDA 11.6版本中 /usr/local/cuda/samples里面没有实例文件,只有一个README文件,内容中告诉你需要从github下载,因为github太慢,所以从gitee中下载实例文件:

bpang@bobpang:\~$ git clone liwuhao/cuda-samples

bpang@bobpang:\~$ mv cuda-samples/Samples/* /usr/local/cuda/samples/*

bpang@bobpang:\~$ cd /usr/local/cuda/samples/1\_Utilities/deviceQuery

$ sudo make

$ ./deviceQuery

image.png

image.png

image.png

image.png

安装cuDNN

CUDA Deep Neural Network (cuDNN) | NVIDIA Developer 从官网下载cudnn

image.png

image.png

image.png

image.png

下载的文件名为:cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

文件拷贝到服务器。然后安装:

bpang@bobpang:/data$ tar xvf cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive.tar.xz

bpang@bobpang:\~$ cd /usr/local/cuda

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/include/cudnn*.h include/

bpang@bobpang:/usr/local/cuda$ sudo cp -p /data/cudnn-linux-x86\_64-8.3.2.44\_cuda11.5-archive/lib/libcudnn* lib64/

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/include/cudnn.h

bpang@bobpang:\~$ sudo chmod a+r /usr/local/cuda-11.6/lib64/libcudnn*

Centos 7 安装V100 驱动

1. 安装依赖环境

yum install kernel-devel gcc -y

一定要确保kernel-devel版本和系统kernel版本一样,否则后期安装驱动会出现问题

2. 屏蔽系统自带的nouveau

[root@localhost home]# vi /lib/modprobe.d/dist-blacklist.conf

修改dist-blacklist.conf文件:

vim /lib/modprobe.d/dist-blacklist.conf

将nvidiafb注释掉:

\#blacklist nvidiafb

然后添加以下语句:

blacklist nouveau

options nouveau modeset=0

屏蔽前:

image.png

image.png

系统重启后,如果屏蔽成功后,显示未:

image.png

image.png

3. 重建initramfs image

mv /boot/initramfs-$(uname -r).img /boot/initramfs-$(uname -r).img.bak

dracut /boot/initramfs-$(uname -r).img $(uname -r)

image.png

image.png

4.修改运行级别为文本模式

systemctl set-default multi-user.target

image.png

image.png

5.重启系统

版权说明

转载请注明365文档,更多技术文档请访问365文档

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/207206.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C语言中一些有关字符串的常见函数的使用及模拟实现(2)

在编程的过程中,我们经常要处理字符和字符串,为了⽅便操作字符和字符串,C语⾔标准库中提供了\n⼀系列库函数,接下来我们就学习⼀下这些函数。 在上一篇博客中已经讲解了strlen,strcpy,strcmp,st…

XXL-Job详解(二):安装部署

目录 前言环境下载项目调度中心部署执行器部署 前言 看该文章之前,最好看一下之前的文章,比较方便我们理解 XXL-Job详解(一):组件架构 环境 Maven3 Jdk1.8 Mysql5.7 下载项目 源码仓库地址链接: https://github.…

el-drawer抽屉组件弹窗遮挡问题解决

更多ruoyi-nbcio功能请看演示系统 gitee源代码地址 前后端代码: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址:RuoYi-Nbcio后台管理系统 1、根据需要,需要在下面窗口里弹出抽屉组件,但出现遮挡问题,如下&…

阿里云刚崩完又崩了?部分地域云数据库控制台访问异常

11月27日,阿里云发布公告:您好!北京时间2023年11月27日 09:16起,阿里云监控发现北京、上海、杭州、深圳、青岛 、香港以及美东、美西地域的数据库产品(RDS、PolarDB、Redis等)的控制台和OpenAPI访问出现异常…

【Openstack Train安装】一、虚拟机创建

Openstack是一个云平台管理的项目,它不是一个软件。这个项目由几个主要的组件组合起来完成一些具体的工作。Openstack是一个旨在为公共及私有云的建设与管理提供软件的开源项目。它的社区拥有超过130家企业及1350位开发者,这些机构与个人将 Openstack作为…

【Windows】内网穿透实现hMailServer远程发送邮件

目录 前言1. 安装hMailServer2. 设置hMailServer3. 客户端安装添加账号4. 测试发送邮件5. 安装cpolar6. 创建公网地址7. 测试远程发送邮件8. 固定连接公网地址9. 测试固定远程地址发送邮件 前言 hMailServer 是一个邮件服务器,通过它我们可以搭建自己的邮件服务,通过cpolar内网…

【RedisTemplate】SpringDataRedis(Spring中对Redis模块的整合)

SpringDataRedis简介: SpringData是Spring中数据操作的模块,包含对各种数据库的集成,其中对Redis的集成模块就叫做SpringDataRedis。 官网地址:https://spring.io/projects/spring-data-redis 提供了对不同Redis客户端的整合&a…

C++学习之路(十四)C++ 用Qt5实现一个工具箱(增加一个Base64图片编码预览功能)- 示例代码拆分讲解

上篇文章,我们用 Qt5 实现了在小工具箱中添加了《Base64加解密功能》功能。为了继续丰富我们的工具箱,今天我们就再增加一个平时经常用到的功能吧,就是「 Base64图片编码预览 」功能。下面我们就来看看如何来规划开发一个这样的小功能并且添加…

Redis的高可用模式

1. 什么是高可用? 高可用(High Availability, HA)是指在信息技术中确保系统、服务或应用程序在绝大多数时间内都是可操作和可访问的能力。这通常涉及以下几个关键方面: 最小化停机时间: 高可用系统的目标是减少因硬件故障、系统升…

无mac电脑生成uniapp云打包私钥证书的攻略

uniapp顾名思义是一个跨平台的开发工具,大部分uniapp的开发者,其实并没有mac电脑来开发,但是生成ios的证书,官网的教程却是需要mac电脑的,那么有没有办法无需mac电脑即可生成uniapp云打包的私钥证书呢? 下…

小白都能看懂的手把手详细Git安装教程

什么是Git Git是一个源代码管理系统,旨在帮助开发人员协同工作。它是一个分布式的版本控制系统,可以有效地将代码库分支、合并和版本控制,同时还可以跟踪文件的更改、修改内容并保留历史记录。Git能够让多个开发人员同时对同一代码库进行协作…

Linux基础篇-开机自动挂载

目录 开机挂载的几种方法/etc/fstab/etc/rc.local或/etc/rc.d/rc.local 开机挂载的几种方法 修改配置文件/etc/fstab (如果是磁盘信息输错,那么系统重启时会进入维护模式,影响操作系统的正常运行.) 在/etc/rc.local内添加挂载命令…

基于ASP.NET MVC技术的图书管理系统的设计与实现

基于ASP.NET MVC技术的图书管理系统的设计与实现 摘要:图书管理系统是一套高新科学技术和图书知识信息以及传统历史文化完美结合的体现。它改变了传统图书收藏的静态书本式图书服务特征,实现了多媒体存取、远程网络传输、智能化检索、跨库无缝链接、创造…

WebSocket入门介绍及编程实战

HTTP的限制 全双工和半双工: 全双工:全双工(Full Duplex)是允许数据在两个方向上同时传输。 半双工:半双工(Half Duplex)是允许数据在两个方向上传输,但是同一个时间段内只允许一个…

三维模型的顶层合并构建的轻量化技术方法探讨

三维模型的顶层合并构建的轻量化技术方法探讨 倾斜摄影超大场景的三维模型的顶层合并构建通常会生成庞大的数据量,给存储、传输和处理带来很大的挑战。为了解决这个问题,可以采用轻量化处理技术,以减小数据体积、提高处理效率,并方…

GAN:WGAN-GP-带有梯度惩罚的WGAN

论文:https://arxiv.org/pdf/1704.00028.pdf 代码:GitHub - igul222/improved_wgan_training: Code for reproducing experiments in "Improved Training of Wasserstein GANs" 发表:2017 WGAN三部曲的终章-WGAN-GP 摘要 WGAN在…

APITable免费开源的多维表格与可视化数据库本地部署公网远程访问

APITable免费开源的多维表格与可视化数据库公网远程访问 文章目录 APITable免费开源的多维表格与可视化数据库公网远程访问前言1. 部署APITable2. cpolar的安装和注册3. 配置APITable公网访问地址4. 固定APITable公网地址 前言 vika维格表作为新一代数据生产力平台&#xff0c…

QQ小程序分销商城源码系统 带完整的搭建教程

互联网的快速发展,电商行业也迅速崛起,如今线上购物已经成为许多人日常生活的一部分。然而,随着竞争的加剧,电商企业需要不断创新和优化,以吸引更多的消费者和提高销售额。在这个背景下,我们开发了QQ小程序…

JavaEE——简单认识CSS

文章目录 一、简单了解什么是 CSS二、CSS 选择器1.标签选择器2.类选择器3.ID 选择器4.后代选择器5.子选择器6.伪类选择器 三、字体属性1.设置字体家族2.设置字体大小3.设置字体粗细4.文字倾斜 四、文本属性1.文本对齐2.文本装饰3.文本缩进4.背景设置 五、圆角矩形六、CSS 盒子模…

将不同时间点的登录状态记录转化为不同时间段的相同登录状态SQL求解

题目 有不同时间点的登录状态记录表state_log如下 请使用sql将其转化为如下表的不同时间段的相同登录状态记录 思路分析: 此类问题需要用到lag或lead函数取上下行对应的数据,然后对前后结果做比较打标签(0或1),再…