极智芯 | GPU架构与计算能力

欢迎关注我的公众号 [极智视界],获取我的更多经验分享

大家好,我是极智视界,本文分享一下 GPU架构与计算能力。

邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码和资源下载,链接:https://t.zsxq.com/0aiNxERDq

每款发布的 NVIDIA GPU 产品 或者说 每代 GPU 架构都有自己的几个身份标识,比如架构 (GPU Architecture),比如计算能力 (Compute Capability),这里咱们就来讲讲这俩标识。

NVIDIA GPU 更新迭代比较快,现在一般就是两年更新一代的节奏,比如目前最新的 Hopper 架构是在 2022 年 3 月份的 NVIDIA GTC 2022 大会上发布的,按这个节奏,应该明年的 GTC 大会就会发布下一代了。在发布新一代 GPU 的时候一般就会给个代号,NVIDIA 习惯用伟大科学家的名字来作 GPU 架构的代号,比如特斯拉 Tesla、比如开普勒 Kepler、比如图灵 Turing。而计算能力不像架构这么 "张扬",计算能力会相对 "隐蔽" 一些,可能真正只有要用 GPU,要用 CUDA 去编程的人才会留意,因为可能在用 NVCC 编译的时候需要指定 GPU 的计算能力。而一般来说,GPU 架构和 计算能力 之间是会存在一定的对应关系的,一般的规律是 GPU 的架构越新,它的计算能力也会更加高,比如现在最新的 Hopper 架构也拥有着最高的计算能力。

下面我整理了 NVIDIA 目前所有 GPU 架构代号、对应的 GPU 计算能力、发布的时间与代表产品,如下,

其中的计算能力一栏有 X、X.Y 之分,意思是 X 代表主版本号,而 Y 代表次版本号,通常情况下主版本号 X 就代表一代 GPU 的架构。这样,可以看到表格里面有几个 "显眼包",解释一下,对于图灵架构,它的计算能力为 7.5,虽然主版本和 Volta 一样都是 7,但是因为 Turing 架构的影响太大、产品之多 (特别是 Tesla T4 计算卡,前几年一直都是 AI 计算推理卡的首选),一般咱们也会把它独立为一代。而对于 Ada 架构,目前也基本是把它看成独立的一代产品,它的主力产品 Tesla L4 是用来替代 Tesla T4 的存在,在未来的 AI 推理领域会很重要。

目前最新的就是 Hopper 架构,H100 是神仙一般的存在,而不久的 2024,NVIDIA 的新一代 GPU Blackwell 就将发布,预计会采用台积电 3nm 工艺,性能估计又会飙升,可怕 ...

前面说到,用 CUDA 去编程的人会留意 GPU 的计算能力,这是因为不同架构的 GPU 之间的硬件资源、GPU 指令集会有较大的差异,因此编译出的二进制可执行文件 (.cubin) 在不同的架构之间是不可以混用的,也就是说 GPU 不同架构之间的 cubin 兼容性存在很大的问题 (这也是为什么咱们在用 TensorRT 生成模型 Engine 的时候,在不同架构的 GPU 之间不通用的原因)。比如在 Turing 上编译的可执行程序,很可能在 Ampere 架构上是执行不了的,反之也一样。

而对于 Volta 和 Turing 这两代架构,它们的主版本是一致的,Turing 的次版本更高,对于这种情况,一般认为只是存在较少的配置差异,仅仅会导致在功能、性能上会有些差异,它们之间的差异还是比较小的。次版本高的 GPU 可以运行同一主版本号的、次版本号较低的 GPU 上编译的程序,这么说的话在 Turing GPU 上就可以运行 Volta GPU 编译出的可执行程序。

这里还有个误区,对于刚了解 GPU 的来说,可能会想当然地认为:GPU 计算能力越高,那么它的算力也越高、性能也越好,这个想法是非常危险的。罗列一组 GPU 参数性能数据对比进行说明,如下,

可以看到,计算能力更低的 Volta 架构的 Tesla V100、Pascal 架构的 Tesla P100,它们的算力都是要比计算能力更高的 Turing 架构的 RTX 2080Ti 反而更高,这么看之前 "想当然" 的认为就被推翻了。这里面其实又会涉及专业计算卡、消费级显卡、笔记本显卡锁算力之类的,这里就不多说了,反正就是不能想当然的认为 计算能力越高就是性能越强 就对了

好了,以上分享了 GPU架构与计算能力,希望我的分享能对你的学习有一点帮助。


【极智视界】

《极智芯 | GPU架构与计算能力》

畅享人工智能的科技魅力,让好玩的AI项目不难玩。邀请您加入我的知识星球,星球内我精心整备了大量好玩的AI项目,皆以工程源码形式开放使用,涵盖人脸、检测、分割、多模态、AIGC、自动驾驶、工业等。一定会对你学习有所帮助,也一定非常好玩,并持续更新更加有趣的项目。https://t.zsxq.com/0aiNxERDq

​​​

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/138279.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【.汇编语言基础入门】—— 汇编的基础介绍

文章目录 一、机器语言二、汇编语言三、CPU 与 CPU 内存1、CPU 对存储器的读写 四、CPU 的典型构成1、寄存器2、通用寄存器3、物理地址的计算方法4、CS5、DS6、SS SP 一、机器语言 在学习汇编语言之前,我们应该先了解一下什么是机器语言。机器语言是机器指令的集合&…

索引下推(ICP)是什么意思?如何理解?

目录 1. 索引下推概述 2. 索引下推举例 3. ICP 的主要作用 1. 索引下推概述 ICP 全称 Index Condition Pushdown,是MySQL5.6之后的一个新特性,它是一种在存储引擎层使用索引过滤数据的一种优化方式。 2. 索引下推举例 下面是数据库的一张 employee…

色彩与心情:浴室的宁静氛围

创造宁静氛围 在浴室中,我们可以找到一片宁静的天地,让我们远离繁忙的日常生活,所以考虑一些舒缓并有助于提升幸福感的颜色。这包括从明亮和中等色调的绿色,到淡粉色和温馨的白色。 追求宁静与平静 浴室不再仅仅是日常卫生的地…

思维导图软件 Xmind mac中文版软件特点

XMind mac是一款思维导图软件,可以帮助用户创建各种类型的思维导图和概念图。 XMind mac软件特点 - 多样化的导图类型:XMind提供了多种类型的导图,如鱼骨图、树形图、机构图等,可以满足不同用户的需求。 - 强大的功能和工具&#…

leetcode:876. 链表的中间结点

一、题目 函数原型: struct ListNode* middleNode(struct ListNode* head) 二、思路 要找到链表的中间结点,有两种思路: 暴力解法:先遍历一遍链表,计算出链表的长度,再次遍历链表,找到中间结点。…

【正点原子STM32连载】 第五十一章 汉字显示实验 摘自【正点原子】APM32F407最小系统板使用指南

1)实验平台:正点原子stm32f103战舰开发板V4 2)平台购买地址:https://detail.tmall.com/item.htm?id609294757420 3)全套实验源码手册视频下载地址: http://www.openedv.com/thread-340252-1-1.html## 第五…

手把手教你数据流图如何画,轻松搞定!

数据流图是一种强大的工具,用于可视化和分析系统中的数据流动和处理过程。它不仅能够帮助我们更好地理解系统的功能和流程,还能够帮助我们发现和解决潜在的问题。在本篇文章中,我们将手把手教你掌握数据流图。 一、数据流图的概念和构成元素 …

稀疏数组如何帮助我们节省内存,提升性能

本文由葡萄城技术团队发布。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 什么是稀疏矩阵 稀疏矩阵是指矩阵中大部分元素为零的矩阵。在实际应用中,很多矩阵都是稀疏的&#xff0c…

线性回归预测波士顿房价 loss为NAN原因 画散点图找特征与标签的关系

波士顿房价csv文件 链接: https://pan.baidu.com/s/1uz6oKs7IeEzHdJkfrpiayg?pwdvufb 提取码: vufb代码 %matplotlib inline import random import torch import matplotlib.pyplot as plt import numpy as np import pandas as pd import torch从CSV中取出数据集 # 加载数…

SAP ABAP列表格式及表格输出

REPORT YTEST001. DATA wa LIKE spfli. WRITE: /. WRITE: 10航班承运人,40航班连接,60国家代码,80起飞城市,100起飞机场. SELECT * INTO wa FROM spfli.WRITE: / wa-carrid UNDER 航班承运人,wa-connid UNDER 航班连接,wa-countryfr UNDER 国家代码,wa-cityfrom UNDER 起飞城市…

保洁行业上门预约小程序源码系统 轻松预约 避免排队 源码开源可二开 带完整部署教程

生活节奏的逐步加快,人们对家庭保洁服务的需求日益增长。为了满足这一需求,我们为您打造了一款保洁行业上门预约小程序源码系统。这款系统让您轻松预约保洁服务,避免排队等待,同时源码开源可进行二次开发,还带有完整的…

详解Python中单引号双引号三引号的用法(适合小白)

单引号和双引号的使用 python 中单引号和双引号都是用来表示字符串,在一般情况下两者没有任何差别,在编码时统一规则即可 str1hello python! str2"hello python!" print(str1) print(str2) 有的时候我们需要在输出的字符串中输出双引号或者…

上课笔记(11.11之前笔记)

一.数据结构的分类 1.数据结构中分为四大类:线性表,哈希表,树,图。 2.线性表(line table):呈现线性结构的一种数据结构。具有顺序性,也就是所有数据都是有序的; 数组&…

【无标题】111

这里写自定义目录标题 欢迎使用Markdown编辑器新的改变功能快捷键合理的创建标题,有助于目录的生成如何改变文本的样式插入链接与图片如何插入一段漂亮的代码片生成一个适合你的列表创建一个表格设定内容居中、居左、居右SmartyPants 创建一个自定义列表如何创建一个…

通讯协议学习之路(实践部分):UART开发实践

通讯协议之路主要分为两部分,第一部分从理论上面讲解各类协议的通讯原理以及通讯格式,第二部分从具体运用上讲解各类通讯协议的具体应用方法。 后续文章会同时发表在个人博客(jason1016.club)、CSDN;视频会发布在bilibili(UID:399951374) 本文…

Javascript享元模式

Javascript享元模式 1 什么是享元模式2 内部状态与外部状态3 享元模式的通用结构4 文件上传4.1 对象爆炸4.2 享元模式重构 5 没有内部状态的享元模式6 对象池7 通用对象池实现 1 什么是享元模式 享元(flyweight)模式是一种用于性能优化的模式&#xff0…

数据恢复工具推荐,高效恢复,这4款很实用!

很多电脑用户都会选择将文件直接保存在电脑上,但是在实际的操作过程中,数据丢失的情况难免会出现。而实用的数据恢复工具或许能有效帮助我们找回丢失的数据。电脑上有哪些使用效果比较好的数据恢复工具呢? 今天小编总结了几款好用的工具&…

leetcode:21. 合并两个有序链表

一、题目 函数原型: struct ListNode* mergeTwoLists(struct ListNode* list1, struct ListNode* list2) 二、思路 合并两个有序链表为一个新的升序链表,只需要遍历两个有序链表并比较结点值大小,依次将较小的结点尾插到新链表即可。 三、代码…

C#中.NET Framework 4.8控制台应用通过EF访问已建数据库

目录 一、创建.NET Framework 4.8控制台应用 二、建立数据库 1. 在SSMS中建立数据库Blogging 2.在VS上新建数据库连接 三、安装EF程序包 四、自动生成EF模型和上下文 1.Blog.cs类的模型 2.Post.cs类的模型 3.BloggingContext.cs数据库上下文 五、编写应用程序吧 我们…

Vatee万腾数字化引领未来,vatee创新思维

随着数字化时代的全面来临,Vatee万腾正以其独特的创新思维,为未来描绘出令人瞩目的数字化画卷。在这个充满变革和机遇的时代,Vatee万腾所展现的数字化引领力和创新思维,成为业界的翘楚。 Vatee万腾的创新思维贯穿于其数字化战略的…