Ubuntu24.04安装NVIDIA驱动及工具包
- 安装nvidia显卡驱动
- 安装cuda驱动
- 安装cuDNN
- 安装Anaconda
安装nvidia显卡驱动
NVIDIA 驱动程序(NVIDIA Driver)是专为 NVIDIA 图形处理单元(GPU)设计的软件,它充当操作系统与硬件之间的桥梁,使得计算机能够正确识别和使用 GPU 的功能。驱动程序对于确保 GPU 的稳定运行、性能优化以及支持最新的图形技术至关重要。以下是 NVIDIA 驱动程序的一些关键点:
-
硬件兼容性:NVIDIA 驱动程序确保了 GPU 可以被操作系统正确识别,并提供必要的接口来让应用程序和游戏与 GPU 进行交互。
-
性能优化:新的驱动程序版本通常包含性能改进,可以提高游戏帧率或加速专业应用中的图形渲染和其他计算任务。
-
功能更新:随着新技术的发展,如实时光线追踪、DLSS(深度学习超级采样)、Reflex 等,NVIDIA 会通过驱动程序更新来引入这些新功能的支持。
-
稳定性修复:驱动程序更新经常包含对已知问题的修复,以提高系统的整体稳定性和可靠性。
-
安全更新:有时,驱动程序更新也会解决可能存在的安全漏洞,保护用户免受潜在的安全威胁。
-
兼容性:不同的驱动程序版本可能适用于特定的操作系统版本(例如 Windows 或 Linux),并且需要与特定型号的 NVIDIA GPU 兼容。
-
Game Ready Drivers:针对即将发布或已经发布的热门游戏,NVIDIA 会推出 Game Ready Drivers,这类驱动经过特别优化,以确保最佳的游戏体验。
-
Studio Drivers:面向创作者和专业人士,NVIDIA 提供 Studio Drivers,这些驱动经过认证,以确保在创意应用(如 Adobe Premiere Pro、Blender 等)中提供稳定的性能和兼容性。
ubuntu 24.04与nvidia有专门的支持,若通过到nvidia官网下载的版本来安装,不能使用,需要通过系统的软件和升级功能来安装 ,Additional Drivers,选择一个版本来安装。
安装成功后,在terminal中执行nvidia-smi,正常显示显卡的信息
安装cuda驱动
CUDA(Compute Unified Device Architecture)是 NVIDIA 推出的并行计算平台和应用程序接口(API)。它允许软件开发者通过使用 CUDA C、CUDA C++ 或其他支持 CUDA 的语言和工具,直接利用 NVIDIA 图形处理单元(GPU)进行通用计算(GPGPU, General Purpose computing on GPU)。CUDA 使开发者可以编写程序来执行复杂的计算任务,如图像处理、视频编码、科学模拟、深度学习等,并将这些任务分配给 GPU 处理,从而加速计算过程。
CUDA 的核心特性包括:
-
线程层次结构:CUDA 将计算任务分解为多个线程块(blocks),每个线程块又包含多个线程(threads)。线程之间可以在同一块内协作,并且线程块可以被组织成一维、二维或三维网格(grid)。
-
内存模型:CUDA 提供了不同类型的内存,包括全局内存、共享内存、常量内存和纹理内存等。每种内存类型都有其特定的访问特性和用途,以优化数据传输和存储。
-
指令集架构:CUDA 提供了一组专门针对 GPU 并行计算设计的指令,使得开发者能够更好地控制硬件资源。
-
库和工具:NVIDIA 提供了一系列的库(如 cuBLAS、cuFFT 等)和开发工具(如Nsight、CUDA-GDB等),用于简化编程和调试过程。
-
兼容性与扩展性:随着 GPU 架构的发展,CUDA 不断更新以支持新的硬件特性,并保持向后兼容旧版本的代码。
要使用 CUDA,通常需要安装 CUDA Toolkit,这是一个包含了编译器、库和工具的软件包,用于开发和优化基于 CUDA 的应用。此外,运行 CUDA 应用程序还需要一台配备了支持 CUDA 技术的 NVIDIA GPU 的计算机。
通过apt来安装
sudo apt install nvidia-cuda-toolkit
安装成功后,执行nvcc -V 来确认。
安装cuDNN
CuDNN(CUDA Deep Neural Network library)是 NVIDIA 提供的一个用于深度神经网络的 GPU 加速库。它旨在为深度学习开发者提供高性能的构建模块,简化并加速深度学习应用的开发过程。CuDNN 是 CUDA 的一部分,它优化了深层神经网络中最常用的原语(primitives),如卷积、池化、激活函数和归一化等操作。
CuDNN 的主要特点包括:
-
性能优化:CuDNN 针对 NVIDIA GPU 进行了高度优化,能够显著加快训练和推理的速度。它利用了 GPU 的并行计算能力,并针对不同型号的 GPU 优化了算法实现。
-
易用性:通过提供简单易用的 API,CuDNN 使得开发者可以轻松地将高效的深度学习操作集成到他们的应用程序中,而无需深入了解底层硬件细节或编写复杂的 CUDA 代码。
-
广泛的框架支持:大多数流行的深度学习框架(如 TensorFlow、PyTorch、Caffe 等)都内置了对 CuDNN 的支持,这意味着用户可以在这些框架中直接使用 CuDNN 来加速模型训练和推理。
-
自动调优:CuDNN 能够根据不同的网络结构和数据类型自动选择最优算法,以确保最佳性能。对于某些操作,它还可以在运行时动态调整参数,进一步提升效率。
-
跨平台兼容性:尽管 CuDNN 主要设计用于 Linux 和 Windows 操作系统上的 NVIDIA GPU,但它也提供了 Docker 容器镜像等形式的支持,方便开发者在多种环境中部署深度学习应用。
为了使用 CuDNN,你需要先安装 CUDA Toolkit,然后下载并安装与你的 CUDA 版本相匹配的 CuDNN 库。安装完成后,你就可以在你的深度学习项目中启用 CuDNN 支持,从而享受 GPU 加速带来的性能提升。
到官网下载https://developer.nvidia.com/cudnn-downloads
选择对应的平台版本等,页面会显示对应步骤,按照步骤执行。
wget https://developer.download.nvidia.com/compute/cudnn/9.6.0/local_installers/cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.6.0_1.0-1_amd64.deb
sudo cp /var/cudnn-local-repo-ubuntu2404-9.6.0/cudnn-*-keyring.gpg /usr/share/keyrings/
sudo apt update
sudo apt -y install cudnn
# 如果安装的是CUDA 11,那么执行如下
sudo apt -y install cudnn-cuda-11
# 如果安装的是CUDA 12,那么执行如下
sudo apt -y install cudnn-cuda-12
安装Anaconda
从中国科学技术大学 https://mirrors.ustc.edu.cn/anaconda/archive/ 下载相应版本。
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --set show_channel_urls yes