intel新CPU性能提升68%!却在内存上违反祖训

前几天的台北电脑展「Computex」,各家都拿出了看家本领。

图片

老朋友 AMD 在会展上发布了最新的锐龙 9000 系列和自己家移动处理器 HX AI 系列,IPC 和能效都取得了不错的进步。

当然隔壁蓝厂 intel 也没闲着,当即就掏出了下一代的低功耗移动端处理器架构——Lunar Lake

图片

Lunar Lake核心封装,来源:intel

也就是下一代的酷睿 Ultra 系列的其中一个「小部门」。而新的 Arrow Lake 桌面端处理器,预计会在今年下半年 10 月发售。

但今天的重头戏还是 Lunar Lake,来看看 intel 又搞了哪些升级。

首先是封装工艺和模块设计。

图片

来源:intel

从图上不难看出,最显眼的就是这次晶圆旁边两颗内存颗粒。

没错,它真的来了,intel 首次把内存镶嵌到处理器封装中了。

目前 intel 为其配备了 LPDDR5X 8533MT/S 的内存,每颗 4x16bit 的通道,有两种容量 16GB/32GB 可选。

看到这里,是不是很熟悉?

图片

没错,它就是苹果 M 系处理器的路数,把内存和其他处理器部件封装在一起,以便有更好的电气信号和传输速度。

图片

众所周知,x86 架构在面对复杂多任务的时候游刃有余,但面对低功耗这一方面就显得有点力不从心了,而 ARM 架构却是恰恰相反的。

或许是感到骁龙 X 带来的压力,所以迫使 intel 也不得不走上这条不归路。

图片

当然了,优点是降低了 40% 的物理层功耗,内存传输速率比苹果的 7500MT/s 还要高上不少,意味着能够带来更高的吞吐量和更好的核显性能。

图片

来源:intel

缺点就是不再支持 SO-DIMM 接口。用户无法升级,OEM 厂商也无法升级了。内存供应商和规格完全是 intel 一手拿捏。

图片

这是被 AMD 打的节节败退,准备从内存搞点收入吗?

而晶圆模块方面,和上一代 Meteor Lake 一样,Lunar Lake 也采用了模块化设计。

图片

来源:极客湾

intel 此次采用了三种不同的工艺,上方最大的 Tiles 集成了所有包含 CPU、GPU、NPU、媒体引擎等所有计算单元,使用了台积电目前最先进 N3B(3nm)工艺。

Intel 终于也算吃上了制程先进的红利。

图片

而下方的长条形 Tiles 集成了蓝牙、Wi-Fi、雷电4、USB等模块,采用了台积电 N6(7nm)工艺。

而 intel 只负责提供下面的基板和左下角用来当垫片分担散热片压力的空硅片,具体工艺嘛,预估自然是自家便宜的上了。

图片

其次是具体性能方面。

采用了 4 个 P 核 +4 个 E 核的组合丛集,12MB 的共享 L3 级缓存,但加入了 8MB 的 MSC 缓存,可供 NPU、CPU 灵活调用。

图片

来源:极客湾

外频控制也更加精细,间隔从 100MHz 大幅缩小到 16.7MHz,调频策略会更加灵活,这也是为了省电做下的准备。

图片

来源:intel

率先砍掉 P 核的超线程以及砍掉了超低功耗的 E 核,引入了新的低功耗岛(Low Power Island),将所有模块都纳入这个「岛」统一管理,提高效率,进一步降低功耗。

CPU 性能方面,P 核架构终于从 12 代以来直到 Ultra100 系列一直不变的  Golden Cove 演变成了 Lion Cove

图片

大核架构示意图,来源:intel

相对于上一代提升了 14% 的 IPC 性能,性能提升只能说中规中矩,而在能效方面,因为做了以上种种的减法,能效比提升最高达到了 20%。

图片

大核IPC提升,来源:intel

大核只能说提升平平,但这次 intel 做的最大改变是小核。

图片

小核架构示意图,来源:intel

和 P 核一样增加了更深更宽的解码引擎和无序执行,共享 4MB 的二级缓存。相比于上代,最多提升了 38% 的整数 IPC 性能和 68% 的浮点 IPC 性能

能效比对比上代提升 2 倍

图片

图片

与 Meteor Lake 对比,来源:intel

这种迭代升级的规模上一次还是 Ryzen 初代的 52%。

牙膏挤爆了。

图片

但这样说同学们可能没有个具体概念,但在 intel 的介绍中,这颗 E 核比 14 代桌面端 CPU 的 P 核 Raptor Cove 架构 IPC 还要高出 2%

做到 Bigger than Bigger。

而核显方面,intel 也带来了全新的 Xe2 架构,也是下一代独立显卡 Battlemage 的架构。

图片

来源:intel

Xe2 架构使用了 8 个 Xe2 核心,还有全新的 XMX 单元,也就是类似于 NVIDIA 的 Tensor Core。

此前只运用在 intel 的独立显卡 Arc 上面。

提高了 XeSS 单元、矢量引擎等。最终让这颗 GPU 拥有 67 TOPS 以及相较于上代 50% 的能效提升

图片

图片

能效曲线提升,来源:intel

NPU 方面,众所周知啊,AI PC 是 intel 最先提出的。

但是尴尬的是目前除了搭载骁龙 X 的 PC 以外,还没有厂商能达到微软提出的 Copilot+PC 的 NPU 算力(40 TOPS)要求。

图片

关于 Copilot+PC 的概念,感兴趣的同学可以移步至咱们之前的文章介绍,微软AI PC革命Windows,游戏竟带头开挂

而新的 NUP,相比于上一代,直接从双核进化到 6 核心神经计算引擎。

12 个增强的 SHAVE DSP、能效优化的 MAC 阵列带来了 48 TOPS 的算力,相对于上代 11TOPS,实现了 4 倍的增长。

那这可以说是 intel 真正意义上第一代的 AI PC 了。

图片

来源:intel

最后总结。

综合以上的表现,可以看出来 intel 其实还是想做那个引领 AI 处理器的领头羊,也非常清晰的认识到自己的移动端弱点在哪。

所以跟着苹果 M 系列有样学样。但这三板斧下来究竟是否能实际落地,咱们就期待今年下半年产品的实际表现吧!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/698534.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【SQL边干边学系列】05高级问题

文章目录 前言回顾高级问题32.高价值客户33.高价值的客户-总订单数34.高价值的客户-带有折扣35.月末订单36.具有许多详细信息行的订单 答案32.高价值客户33.高价值的客户-总订单数34.高价值的客户-带有折扣35.月末订单36.具有许多详细信息行的订单 未完待续 前言 该系列教程&am…

GaussDB技术解读——GaussDB架构介绍(二)

上篇图文,从GaussDB关键架构目标、GaussDB分布式架构、数据计算路由层(Coordinator)关键技术方案等三方面对GaussDB架构进行了介绍。本篇将从数据持久化存取层(DataNode)关键技术方案、全局事务管理层(GTM)关键技术方案…

大一学生分享网络编程聊天室-简单私聊

每天过得充实,你将不会焦虑 ---同行者联盟 Socket 是一种规范(标准),封装了TCP协议的通信细节,使得我们使用它就可以完成与远端计算机的TCP链接,以及数据的传输。并且可以完成数据传输基于双向流的读写操作,Java语言…

揭秘:全自动阅读挂机项目,号称自动阅读一天窗口10-50+(脚本+教程)

首先,我们需要对全自动阅读挂机项目有一个基本的认识。这是一个高效利用时间和精力,使阅读成为一种被动行为的新型项目。它将阅读与电脑操作结合,通过挂机的方式,使得在忙碌的生活中仍能保持高效学习。 1.全自动阅读挂机项目背后…

G5 - Pix2Pix理论与实战

🍨 本文为🔗365天深度学习训练营 中的学习记录博客🍖 原作者:K同学啊 目录 理论知识图像翻译CGANU-NetPix2Pix损失函数模型结构生成器差别器 模型效果总结与心得体会 理论知识 前面已经学习了GAN与CGAN,这节开始学习P…

linux使用crontab定时执行url

在Linux操作系统中,Crontab是一个非常实用的工具,可以帮助用户定时执行任务,以达到自动化管理系统的目的。而在使用Crontab时,有时候我们可能需要让系统定时访问某个URL,以实现特定的功能或操作。本文将介绍如何使用Cr…

斯坦福新研究:RAG能帮助LLM更靠谱吗?

近年来,大型语言模型(LLM)在自然语言处理领域取得了显著的进展,但它们也存在一些问题,如容易产生幻觉和无法提供最新的知识。为了解决这些问题,研究人员提出了一种名为检索增强生成(RAG&#xf…

猫头虎分享:2024应届生择业在大模型和智能机器人之间该如何选择?

猫头虎分享:2024应届生择业在大模型和智能机器人之间该如何选择? 博主猫头虎的技术世界 🌟 欢迎来到猫头虎的博客 — 探索技术的无限可能! 专栏链接: 🔗 精选专栏: 《面试题大全》 — 面试准备的…

快速入门链路追踪sleuth整合zipkin(代码演示)

1、演示项目背景 2、pom.xml 3、启动项目 4、测试 5、保存数据到数据库 6、通过mq保存数据到mysql 7、通过mq保存数据到es 1、演示项目背景 下载zipkin,建议使用2.x版本的,3.x版本的要求jdk高版本。如果自己是1.8,就下载2.x的 下载地…

Postman环境变量以及设置token全局变量!

前言百度百科解释: 环境变量(environment variables)一般是指在操作系统中用来指定操作系统运行环境的一些参数,如:临时文件夹位置和系统文件夹位置等。 环境变量是在操作系统中一个具有特定名字的对象,它…

Ubuntu server 24 (Linux) 安装部署 Zabbix 7.0 LTS

一 安装Mysql 8.03 testtest:~$ mysqld --version /usr/sbin/mysqld Ver 8.0.36-2ubuntu3 for Linux on x86_64 ((Ubuntu)) #mysql 大于8.03.x ,启动zabbix-server会报错如下 Unable to start Zabbix server due to unsupported MySQL database version (8.04.00). Must not…

英伟达最新GPU和互联路线图分析

Nvidia在计算、网络和图形领域独树一帜,其显著优势在于雄厚的资金实力及在生成式人工智能市场的领先地位。凭借卓越的架构、工程和供应链,Nvidia能够自由实施创新路线图,引领行业未来。 到 21 世纪,Nvidia 已经是一个非常成功的创…

GStreamer学习2.1----获取mp4中的图片

这里通过获取mp4中的图片例子来加深Gstreamer的理解,问问AI实现这样功能的命令, 得到 gst-launch-1.0 filesrc locationtest.mp4 ! qtdemux ! queue ! h264parse ! avdec_h264 ! videoconvert ! jpegenc ! multifilesink locationoutput_image_%03d.jp…

大福利!微信付费进群源码

微信付费进群源码 前言效果图搭建教程源码领取下期更新预报 前言 1、修复SQL表 2、修复支付文件 3、修复支付图标不显示 4、修复定位、分销逻辑、抽成逻辑 5、新增支持源支付、易支付的支付接口 6、修复官方微信、支付宝支付接口文件 本来早就可以完工的,电脑…

MEGALODON:突破传统,实现高效无限上下文长度的大规模语言模型预训练和推理

在人工智能领域,尤其是在自然语言处理(NLP)中,大模型(LLMs)的预训练和推理效率一直是研究的热点。最近,一项突破性的研究提出了一种新型神经网络架构——MEGALODON,旨在解决传统Tran…

Redis 7.2.x 主从复制+哨兵模式

IP操作系统服务版本192.168.140.153CentOS 7redis-master,sentinel7.2.5192.168.140.156CentOS 7redis-slave,sentinel7.2.5192.168.140.159CentOS 7redis-slave,sentinel7.2.5 一、安装Redis 配置主从复制 参考下面文档: Redis 7.2.x 主从复制-CSDN博客文章浏览…

论文略读:Onthe Expressivity Role of LayerNorm in Transformers’ Attention

ACL 2023 研究了LayerNorm在 Transformers 中对注意力的作用LayerNorm为Transformer的Attention提供了两个重要的功能: 投影,projection LayerNorm 帮助 Attention 设计一个注意力查询,这样所有的Key都可以平等地访问通过将Key向量投影到同一…

pinctrl 和 gpio 子系统实验学习

pinctrl 子系统主要工作内容如下: ①、获取设备树中 pin 信息。 ②、根据获取到的 pin 信息来设置 pin 的复用功能 ③、根据获取到的 pin 信息来设置 pin 的电气特性,比如上/下拉、速度、驱动能力等。 对于我们使用者来讲,只需要在设备树里面…

【计算机网络基础】OSI七层网络模型 TCPIP四层网络模型

文章目录 ISO介绍网络模型介绍OSI七层模型OSI七层模型介绍OSI七层特点一、TCP/IP四层模型介绍二、TCP/IP四层模型TCP/IP协议簇一次C/S通信 🌈你好呀!我是 山顶风景独好 🎈欢迎踏入我的博客世界,能与您在此邂逅,真是缘分…

人工智能和机器学习这两个概念有什么区别?

什么是人工智能? 先来说下人工智能,人工智能(Artificial Intelligence),英文缩写为AI,通俗来讲就是用机器去做在过去只有人能做的事。 人工智能最早是由图灵提出的,在1950年,计算机…