【深度学习环境配置】一文弄懂cuda,cudnn,NVIDIA Driver version,cudatoolkit的关系

【深度学习环境配置】一文弄懂cuda,cuDNN,NVIDIA Driver version,cudatoolkit的关系

  • NVIDIA Driver version(NVIDIA驱动程序)
  • CUDA
  • cuDNN
  • cudatoolkit
  • 深度学习环境配置顺序

今天突然发现配置的环境有些问题,意识到对于cuda,cuDNN,NVIDIA Driver version,cudatoolkit的关系理解不够透彻,特记录一下
【注】:本文的前提在于要有Nvidia的独显GPU,本文的图片一部分来自我之前在windows下配置的博客配置深度学习环境:在Windows(Win10)中安装CUDA,CUDNN,Pytorch GPU版,另一部分为ubuntu下配置截取的

NVIDIA Driver version(NVIDIA驱动程序)

  • NVIDIA驱动程序(NVIDIA Driver)是安装在计算机上的软件,用于管理NVIDIA GPU的运行和功能。它是连接操作系统与GPU之间的桥梁,负责驱动GPU的操作,并提供对GPU硬件的访问接口。
  • windows下查看NVIDIA Driver version版本方法为:桌面 --》 鼠标右键 --》NVIDIA控制面板–》系统信息–》组件 --》NVCUDA64.DLL 在产品名称栏
    在这里插入图片描述
    在这里插入图片描述
  • **Ubuntu下查看NVIDIA Driver version版本方法为:应用菜单栏–》软件和更新–》附加驱动 525即是我的驱动版本 **
    在这里插入图片描述
  • ubuntu安装nvidia driver显卡驱动可查看这里3分钟安装ubuntu20.04显卡驱动
  • nvidia-smi用于查询和监控NVIDIA GPU的状态和信息。它可以显示诸如GPU型号、驱动程序版本、GPU使用率、温度、显存使用情况等信息。
  • 使用命令nvidia-smi也可查看driver版本,525.125.06我安装的具体版本
  • 使用命令nvidia-smi看到的CUDA Version,是指该NVIDIA驱动程序所支持的最高CUDA版本,下图显示的即为支持的最高CUDA版本为12.0
    在这里插入图片描述
  • CUDA提供了两种API,分别是运行时API(CUDA Runtime API)和驱动API(Driver API)
  • 驱动API(Driver API)的版本对应nvidia-smi显示的CUDA Driver结果(该NVIDIA驱动程序所支持的最高CUDA版本)
  • 运行时API(CUDA Runtime API)对应于nvcc -V显示的结果
  • 一般情况下,nvcc -V显示的版本号是小于等于nvidia-smi所显示的cuda版本,这就是二者显示版本不一致的原因所在

CUDA

  • CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种并行计算平台和编程模型,它允许开发者使用NVIDIA的GPU(图形处理单元)进行高性能的计算操作。
  • CUDA为开发者提供了一套扩展的C/C++编程语言,使得他们能够在GPU上实现并行计算,从而显著加速科学计算和图形渲染等任务。
  • 通常情况下,当提到CUDA时,指的是CUDA Runtime版本。CUDA Runtime是一组库和工具,用于在应用程序中进行并行计算,提供了一系列API和函数,用于在NVIDIA GPU上执行并行计算任务。
  • CUDA Runtime的版本通过nvcc -V查询
  • 选择安装的CUDA Runtime版本取决于显卡GPU的算力和NVIDIA Driver version显卡驱动版本
  • 显卡算力与CUDA Runtime的对应关系 请查看这里,先搜索显卡型号查找算力,再根据算力选择CUDA Runtime

在这里插入图片描述

  • 查看自身显卡的算力,在此网站中搜索显卡型号,可以看到我显卡对应的算力是7.5

  • 该网站的后面有CUDA版本和算力的对应关系,查看显卡算力支持的CUDA版本

在这里插入图片描述

  • 算力7.5支持的CUDA版本有10.0-10.2,11.0,11.1-11.4,11.5–11.7.1,11.8,12.0
  • CUDA Runtime版本与NVIDIA Driver version显卡驱动版本的关系,请查看这里
    在这里插入图片描述
  • ubuntu下安装的cuda,一般在/usr/local下的cuda路径下
  • cuda官网下载地址CUDA Toolkit Archive

cuDNN

  • cuDNN(CUDA Deep Neural Network library)是由NVIDIA提供的一个用于深度学习的GPU加速库。它包含了一系列针对深度神经网络的优化算法和函数,能够大幅提升深度学习模型的训练和推理速度
  • cuDNN已经被集成在Pytorch中,无需单独安装,但是如果需要从源码编译就还是需要安装cuDNN,具体链接如下
  • cuDNN官网下载链接
    在这里插入图片描述

写这篇文章的起因就是突然发现自己没有安装cuda,cudnn,在安装了pytorch gpu版之后也可以使用gpu运行代码
https://discuss.pytorch.org/t/how-to-check-if-torch-uses-cudnn/21933/3
这篇帖子解释了原因,但我个人觉得cuda runtime还是要安装的

cudatoolkit

  • CUDA Toolkit是用于开发和优化CUDA应用程序的软件开发工具包。它包含了一系列的工具、库和文档,以及与硬件驱动程序和其他库(如cuDNN、cuBLAS等)兼容的开发环境
  • 在安装pytorch的时候,通常后面都会跟着安装 cudatoolkit

在这里插入图片描述

  • CUDA Toolkit提供了必要的工具和库,使PyTorch能够与GPU进行交互,并在GPU上执行计算任务
  • CUDA Toolkit使PyTorch能够利用GPU的并行计算能力,加速模型的训练和推理过程,从而提高效率和性能

深度学习环境配置顺序

  1. **安装显卡驱动NVIDIA Driver **
  2. 根据显卡算力和NVIDIA Driver version显卡驱动版本选择适合的CUDA runtime版本
  3. 安装CUDA runtime,cuDNN可跳过不进行安装
  4. 安装anaconda
  5. 创建虚拟环境
  6. 安装pytorch/tensorflow等深度学习框架

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/520701.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

使用阿里云试用Elasticsearch学习:2.6 深入搜索——控制相关度

处理结构化数据(比如:时间、数字、字符串、枚举)的数据库,只需检查文档(或关系数据库里的行)是否与查询匹配。 布尔的是/非匹配是全文搜索的基础,但不止如此,我们还要知道每个文档与…

java日志框架简介

文章目录 概要常用日志框架常见框架有以下:slf4j StaticLoggerBinder绑定过程(slf4j-api-1.7.32 )JCL 运行时动态查找过程:(commons-logging-1.2)使用桥接修改具体日志实现 一行日志的打印过程开源框架日志…

【图论】【分类讨论】LeetCode3017按距离统计房屋对数目

本文涉及的知识点 图论 分类讨论 本题同解 【差分数组】【图论】【分类讨论】【整除以2】3017按距离统计房屋对数目 LeetCode3017按距离统计房屋对数目 给你三个 正整数 n 、x 和 y 。 在城市中,存在编号从 1 到 n 的房屋,由 n 条街道相连。对所有 …

服务效率飙升!2024最新Zoho Desk功能解析

2024年,立足于服务经济浪潮,如何为您的客户提供优质服务,高效解决客户工单,赢得客户美誉度,是当下各行企业的着力点。 在企业中,与客户发生最直接接触的就是客户服务部门。规范化客服部门业务流程&#xf…

【JavaWeb】Day36.MySQL概述——数据库设计-DDL(三)

查询 关于表结构的查询操作,工作中一般都是直接基于图形化界面操作。 1.查询当前数据库所有表 2.查看指定表结构 3.查询指定表的建表语句 注意:23版的点击导航中的转到DDL 修改 关于表结构的修改操作,一般也是直接基于图形化界面操作。 添…

LeetCode---127双周赛

题目列表 3095. 或值至少 K 的最短子数组 I 3096. 得到更多分数的最少关卡数目 3097. 或值至少为 K 的最短子数组 II 3098. 求出所有子序列的能量和 一、或值至少k的最短子数组I&II 暴力的做法大家都会,这里就不说了,下面我们来看看如何进行优化…

彩虹易支付接口配置

支付通道配置 基本概念 彩虹易支付系统有强大的支付接口扩展能力,首先需要明白以下几个概念。 支付方式: 支付方式用于定义发起支付的调用值(在前台开发文档里面显示)与支付方式名称。目前系统自带6种支付方式,它们的…

腾讯云最新活动及优惠券领取指南

随着云计算技术的不断发展和普及,越来越多的企业和个人选择将业务迁移到云端。腾讯云作为国内领先的云计算服务提供商,经常推出各种优惠活动,以帮助用户降低成本、提高效率。本文将为大家详细介绍腾讯云的最新活动及优惠券领取指南&#xff0…

猫头虎分享已解决Bug || **Error (通用错误)** 全景剖析

博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的宝典!《IDEA开发秘籍》 — 提升你的IDEA技能!《100天精通鸿蒙》 …

数学杂谈之一:数学的形态

数学杂谈之一:数学的形态 数学的形态可以根据不同的角度和视角进行分类和描述。下面是从数学的发展和应用的不同角度进行的分类: 原始形态:原始形态是指数学的发展和应用起源的形态。它涉及到数学的理论构建、证明和发现过程,是数…

目标追踪StrongSORT——基于DeepSORT重大升级提高多目标跟踪的准确性和鲁棒性

1、概述 1.1 DeepSORT DeepSORT算法是在SORT基础上发展起来的一种多目标跟踪算法。SORT算法结合了目标检测器和跟踪器,其中跟踪器的核心是卡尔曼滤波和匈牙利算法。卡尔曼滤波用于预测目标在下一帧的位置和状态,而匈牙利算法则用于将预测状态与实际检测…

【Linux】Linux C 编程

在 Windows 下编程首先就是安装对应的 IDE ,然后在 IDE 里面进行代码编写和编译,但是在 Linux 下,这两个部分是分开的,比如我们可以使用 vim 编辑器编写代码,然后用 gcc 编译器编译代码。Ubuntu 下有一些可以进行编程的…

Azkaban集群模式部署详细教程

序言 Azkaban是一个用于工作流程调度和任务调度的开源工具,它可以帮助用户轻松地管理和监控复杂的工作流程。Azkaban的架构设计旨在提供高度可扩展性和可靠性,同时保持易用性和灵活性。 Azkaban的架构可以分为三个主要组件:Executor、Web Server和db数据…

Python-VBA编程500例-033(入门级)

角色定位(Role Positioning)在编程中的实际应用场景主要体现在以下几个方面: 1、权限管理:在开发企业级应用或复杂的系统时,角色定位用于定义和管理用户的权限。例如,一个系统可能有管理员、普通用户、访客等不同角色&#xff0c…

Linux网络管理类命令

ping -c:指定次数 -i n:指定发送频率 n 秒 -t:指定 TTL 值 -s:指定发送包的大小 ifconfig iproute netstat -anltp ss ssh 主机名 SCP wget nmap -A: 全面扫描 -p :端口 80 22-80 80,25,443 -sP &#xf…

利用native的方式实现跨线程调用

简介 在OpenHarmony应用开发实践中,经常会遇到一些耗时的任务,如I/O操作、域名解析以及复杂计算等。这些任务如果直接在主线程中执行,将会严重阻塞主线程,影响后续任务的正常流程,进而导致用户界面响应延迟甚至卡顿。…

【学习笔记】Elsevier的Latex模板文件(附网址)

注:这是一篇没有技术含量的水文,主要是看有人下载下来,居然当成资源需要积分才能下载。我觉得不行,故提供原始下载地址供查阅使用。 链接: 上述图片所示网址:链接直达

Redis(性能管理、主从复制、哨兵模式)概述及部署

目录 一、性能管理 1、查看Redis内存使用 2、内存碎片率 3、跟踪内存碎片率 4、内存使用率 5、内回收key 二、Redis集群有三种模式 三、Redis主从复制 1、主从复制的概念 2、主从复制的作用 3、主从复制的流程 4、搭建Redis主从复制 1.环境准备 2.安装Redis&#…

在团队管理过程中,怎样能够让员工更容易接受和执行反馈呢?

让员工更容易接受和执行反馈,关键在于建立一种开放、积极且互相尊重的沟通氛围。 确保反馈的针对性和具体性是关键。 员工需要清楚了解他们的表现如何,以及他们需要改进的地方在哪里。因此,反馈内容应具体明确,避免模糊或笼统的表…

Python零基础到精通

Python入门指南 欢迎进入 Python 领域。作为程序员,我们总是在寻找能提高效率、编写优雅的代码的工具,而 Python 正是其中之一。你即将探索一种强大而灵活的编程语言,它被广泛应用于各种领域,从网站开发到数据科学,再到…