老黄自己卷自己!GPU要一年更新一代!预告新动作:AI工厂将吞噬一切

站在 AI 时代风口浪尖的弄潮儿英伟达又为大家带来了一场科技饕餮盛宴

昨晚 7 点,坐标中国台湾大学体育场,英伟达 CEO 黄仁勋为世界带来了一场名为 The Dawn of a New Industrial Revolution (揭开新工业革命序幕)的演讲。

在整个演讲中,老黄重新理解了英伟达与人工智能浪潮的关系,重磅剧透了下一代的 GPU 架构,并且从英伟达一系列“新动作”出发,点明了演讲题目:“AI 时代将会驱动下一场工业革命”

  3.5研究测试:
hujiaoai.cn

4研究测试:
askmanyai.cn

Claude-3研究测试:
hiclaude3.com

从 CPU 到 GPU,老黄挑战摩尔定律

到底是 GPU 架构催生了深度学习革命,还是 AI 发展挖掘出了 GPU 的潜力?在这次演讲中,老黄丝毫不谦虚的给出了英伟达的答案:

如果没有我们精心打造的打造的各类特定领域的库,全球深度学习科学家们就无法充分利用潜力。CUDA就像OpenGL之于计算机图形学,SQL之于数据分析。

人工智能崛起之所以有可能,完全因为我们相信只要让强大的计算变得越来越便宜,总会有人找到巨大的用途。

将 AI 领域这十余年间的锋芒毕露做一个归纳,老黄将一切都归因于 GPU 的发展。伴随着需求计算量指数级的增长,CPU 性能的增长速度已经几乎被证明无法满足「计算通胀」,而真正使得目前我们可以张口闭口谈论天文级别数据量与模型规模的核心,正是来源于英伟达与它的 GPU

图片

老黄如此使用数据描述英伟达芯片过去的成绩:

过去 8 年,英伟达的芯片算力提升了 1000 倍,单位能耗降低至原来的 1/350

如果我们再贴上摩尔定律的内容:

集成电路上可以容纳的晶体管数目在大约每经过18个月到24个月便会增加一倍

图片

恐怕我们也不会惊讶于英伟达的自信:

正因为我们利用特定算法将计算边际成本降低了100万级别,今天使用互联网上的所有数据来训练大模型才成为了所有人默认合乎逻辑的选择,不再有人怀疑和质疑这个做法

One-Year-Rhythm,下一代 GPU 就在一年后?

这场发布会非常吸引人眼球的一点,来源于黄教主提出的「One-Year-Rhythm」的节奏,老黄在演讲中提到:

英伟达新的GPU架构将从两年一次迭代,加速到以一年为周期推出

这个速度非常夸张,要知道英伟达上次革新自己的 GPU 架构不是在三年前而是在三个月前的 GTC大会中推出的 Blackwell。而在仅仅三个月后,黄教主又马不停蹄的给出了新的规划:2025 年,Blackwell Ultra ——> 2026 年,Rubin ——> 2027 年,Rubin Ultra

图片

这种革新速度已经不能用「市场竞争」来形容了,作为 GPU 领域独孤求败的英伟达,现在只能和自己想象中的风车巨人进行搏斗。

而关于此,黄教主只能如是说:

我们的基本理念非常简单,我们要建立整个数据中心,再将它分解,并以一年的节奏部分卖给用户。我们将一切推向技术极限。无论是什么 TSMC 工艺,技术都会把它推向绝对极限,无论是什么封装技术,都将它推向绝对极限,无论是什么存储技术,都将它推向绝对极限,无论是网络技术,光学技术,一切都将被推向极限。

揭开新工业革命序幕

关注大模型的每一位估计都对 Token 这个词并不陌生,而在昨天,老黄给予了它一个中文翻译——词元。

图片

词元,是大模型处理一切“知识”的最小单位,Token 将不同模态的信息进行统一

当然有些词元它可能是影像,它可能是线图,可能是表格、歌曲、演讲、视讯、影片,有可能是任何形式,只要是有意义的,都算是,甚至包括蛋白质、化学分子等等。

而在这个 AI 时代,词元成为了一切的载体,老黄这样说:

几乎所有的事情都可以把它转换成Token,Token是非常有价值的。我们现在所处的不是AI时代,而是一个生成式AI时代。

黄教主将这样一个时代比喻为一个 AI 工厂,它正在生产一种「新形态的大宗商品」,这种产品每个产业都用得到,具有无与伦比的价值。这种工厂将会带来一场工业革命,为许多行业创造一种新的商品,而这种商品,正是「词元」

今年 3 月,英伟达就推出了他们的「推理即服务」产品——NVIDIA NIM,作为一个软件平台,英伟达希望通过 NIM 去简化定制和预先训练的 AI 模型在生产环境中的部署。

图片

整个 NIM 事实上是一个大的容器,这个容器里面打包优化好了各种“软件”,而这个容器可以将企业部署 AI 应用程序的时间,从几天压缩到几分钟:

这些容器,这些container里头有非常多很棒的软件。在这个容器里头有CUDA、cuDNN、TensorRT Triton,它是推理即服务,它是在云端上的一个堆叠。

图片

AI 工厂是一个基础概念,而向上,它几乎可以产生无限的可能,从数字人、物理世界到真正的 Physical AI,伴随着“AI 工厂化”转型,作为 Token 的真正意义上的“生产者”,也难怪于英伟达写出 The Dawn of a New Industrial Revolution 这样一个自负的标题了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/676758.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

IDEA 常用技巧

1、代码块整体移动 选中,tab整体右移选中,shifttab整体左 移 2、统一修改变量 3.方法分割线 seting >> editor >> apperance >> show method separators 4、快捷键 构造器、set与get方法、方法重写、toString 等快捷操 鼠标停留在…

微信公众号开发(五):私信日志记录

之前的开发内容里,基本是基本配置和回复设置,为了之后看用户/粉丝什么样的功能使用的最多,需要增加私信的日志记录: 1、日志表 首先,要在mysql里建表 主要字段:用户id、公众号id、时间、私信类型、私信内…

SQL Developer 小贴士:备份和恢复连接信息

问题与概念 有时候SQL Developer需要重装,能备份和恢复连接信息就比较重要。 SQL Developer提供连接的导出和导入功能。 导出连接 第一步:选择连接。 第2步:指定输出文件,例如sqldconns.json 第3步:因为连接中可…

一文读懂数据库中的DB、DBMS、DBS、DBAS

目前数据库的应用非常广泛,几乎各行各业都在直接或间接地与数据库打交道,例如网上购物、银行业务、铁路购票和酒店住宿等。在实际应用中,数据库、数据库管理系统、数据库系统和数据库应用系统经常被统称为数据库,而实质上这4个概念是不一样的,它们具有不同的定义和含义。下…

16.FreeRTOS直接任务通知 Notification

FreeRTOS 直接任务通知 Notification 介绍 在嵌入式系统开发中,任务间的通信和同步是非常重要的一部分。而FreeRTOS就提供了多种机制来实现这些,比如队列、信号量和事件组。不过,使用这些机制都需要创建一个通信对象,不能直接把事…

【Unity Shader入门精要 第10章】高级纹理(一)

1. 立方体纹理原理 立方体纹理由6张图片组成,每张图片分别对应立方体的一个面。这6张图片代表沿世界空间下的轴线(上下左右前后)观察所得的图像 立方体的应用主要分为两类: 单纯利用6张图片的展示功能,为我们提供一…

怎么下载 jar 包

一、在Maven仓库里面下载 Maven仓库 网址:https://mvnrepository.com/ 二、搜索需要的 jar 包(以 druid 为例) 三、找到 druid jar包,点进去 四、找到自己需要的版本,点进去 五、 点 jar 下载

数字化前沿:Web3如何引领未来技术演进

在当今数字化时代,随着技术的不断发展和创新,Web3作为一种新兴的互联网范式,正逐渐成为数字化前沿的代表。Web3以其去中心化、加密安全的特性,正在引领着未来技术的演进,为全球范围内的科技创新带来了新的可能性和机遇…

第二讲笔记:隐私计算助力数据要素流通

1、数据要素流转与数据 2、数据外循环中的信任 焦虑 信任焦虑背后的代表性案例 内鬼门 : 2023 年 , 美国科技公司 Ubiquiti在2021年1月曝出数据泄露事 件, “攻击者”在随后的“谈判”中试 图向该企业勒索近200万美元(50比特 币&…

.Net Core Console 项目如何使用 HttpClient 与 Web 服务通信

前言 HttpClient 类是在 .NET Framework 4.5 和 .NET Core 中引入的新的 HTTP 客户端类,是 .NET 用于发送和接收 HTTP 请求的类,相比之前的 WebRequest 和 HttpWebRequest, 它提供了现代的、易用的 API,并且具有更好的性能和扩展…

【Spring Cloud】微服务链路跟踪Sleuth

目录 为什么要使用微服务链路跟踪微服务的现状多服务协同工作复杂的调用链条容易出错 微服务链路跟踪需要实现的需求实现监控决策避免技术债务快速定位故障 微服务链路跟踪的技术要求低消耗应用透明延展性可控采样率可视化 Spring Cloud Sleuth简介Spring Cloud Sleuth的4个特点…

‘yarn’不是内部或外部命令,也不是可运行的程序或批处理文件。

目录 问题点 解决方式 # 安装 # 版本 # 本地发生变化(了解) # 安装项目依赖 新问题 解决方式 问题点 在vscode中,点击dev运行,项目报错【Q1】 * 正在执行任务: yarn run dev yarn : 无法将“yarn”项识别为 cmdlet、函数…

代码随想录算法训练营第26天(py)| 回溯 | 39. 组合总和、40.组合总和II、131.分割回文串

39. 组合总和 力扣链接 给定一个无重复元素的数组 candidates 和一个目标数 target ,找出 candidates 中所有可以使数字和为 target 的组合。 candidates 中的数字可以无限制重复被选取。 说明: 所有数字(包括 target)都是正整数…

利用MaxKB+Ollama:搭建智能问答系统_Ubuntu部署maxkb

Docker方式,不建议使用 即使maxKB和ollama在同一目录下,API域名也显示无效。 Ollama下载网址:Download Ollama on Linux Linux下载:curl -fsSL https://ollama.com/install.sh | sh The Ollama API is now available at 127.0.…

PE文件结构详解之头信息解析

PE文件结构详解 一、前言1.概述2.PE文件结构3.所用工具 二、DOS头(DOS Header)解析1.作用2.图例3.参数详解4.总结 三、DOS Stub1.作用2.图例 四、NT头(NT Header)解析1.作用2.PE标识图例3.文件头(COFF头)图…

TinyMCE 富文本编辑器:打造个性化编辑体验

本文由ScriptEcho平台提供技术支持 项目地址:传送门 TinyMCE 富文本编辑器:打造个性化编辑体验 应用场景介绍 TinyMCE 是一款功能强大的富文本编辑器,广泛应用于网站内容管理、博客创作、在线文档编辑等场景。它提供了一系列丰富的编辑功…

LightDB pro*c迁移指南(游标模块)

文章目录 一、不使用SQLDA描述符范围的游标操作1.1 oracle 案例1.1.1 使用游标获取数据1.1.2 对于fetch结果集怎么去利用 1.2 LightDB 案例1.2.1 使用游标获取数据1.2.2 对于fetch结果集怎么去利用 3 总结:不同项 二、使用SQLDA描述符范围的游标操作2.1 Oracle样例2…

基于java的CRM客户关系管理系统(五)

目录 第五章 系统的详细设计与实现 5.1 持久层设计 5.1.1 创建关系映射 5.1.2 与数据库的连接 5.1.3 Hibernate的ORM映射 5.1.4 Struts的配置文件 5.1.5 Spring 的配置文件 5.1.6 DAO层设计 5.2 逻辑业务层设计 5.2.1 业务逻辑类的实现 前面内容请移步 基于java的C…

Jmeter干货分享:当你的Log viewer不显示日志时,可能是引入的Jar包冲突导致

问题描述 近期使用Jmeter时发现了一个非常奇怪的问题,就是Jmeter是可以正常使用运行脚本,但是在Log viewer中确没有任何日志,如下图: 问题排查过程 真是百思不得其解啊,在网上各种获取资料,大多数都是说跟…

001----flask

flask---001 flask与django对比今日概要问答今日详细1.flask快速使用1.2 快速使用flask1.3 用户名密码登录 flask与django对比 django是个大而全的框架,flask是一个轻量级的框架。 django内部为我们提供了非常多的组件:orm/session/cookie/admin/from/mo…