芯片工程系列(6)Chiplet封装

0 英语缩写

  • chiplet是一个合成词,由chip和let两个单词组合而成。它的意思是“小芯片”,通常指的是一种集成电路中的小型芯片
  • 系统级封装(System in a Package,SiP)
  • 系统级芯片(System on a Chip,SoC)
  • 图形处理器(Graphics Processing Unit,GPU)
  • 高性能计算(High performance computing,HPC)
  • 裸片尺寸(Die Size)
  • MCM(Multi-chip module)
  • 高带宽存储器(High Bandwidth Memory,HBM)
  • 中介层(Interposer)

Chiplet封装

1 系统级封装与系统级芯片

目前电路集成化的实现主要有系统级封装(System in a Package,SiP)和系统级芯片(System on a Chip,SoC)两条技术路径。

  • SoC是将具有不同功能的元器件整合在单个芯片中的技术,一颗芯片即为一个高度集成系统,其信息传递效率更高、 体积更小,缺点在于其设计开发的周期更长,技术性要求更高,开发成本更高,因此多应用于对运算功能要求高的高单价 GPU、HPC 等。
  • SiP是将单颗功能复杂的 SoC集成芯片剥离成多个具有特定功能的小芯片或芯粒(Chiplet),再采用 TSV、interposer 等工艺形成多功能异质异构的封装,其开发周期更短、良率更高、成本更低,是目前平衡功能与经济效益的最优选择。

image-20240404133550906

image-20240404133628809

算力芯片的 die size(裸片尺寸) 通常要远大于过去的消费级产品。随着先进制程推进,研发生产成本持续走高

  • 大面积单颗 SOC 良率日益下降
  • 芯片做得越大,就越容易浪费造成侧边的浪费

image-20240203171453605

image-20240203171504113

2 Chiplet含义

Chiplet 即小芯粒,它将一类满足特定功能的 die(裸片),通过 die-to-die 内部互联技术将多个模块芯片与底层基础芯片封装在一起,形成一个系统芯片。

  • 该工艺将不同工艺节点的小芯粒通过先进封装技术互联形成大芯片,将大面积芯片成本从晶圆制造环节转嫁到封装环节,提升大面积芯片良率
  • 大幅度降低设计复杂程度,降低芯片的设计和制造成本,加速了芯片迭代速度。
  • 解决的不是如何进一步提高连接密度的问题,而是如何在保证连接密度的情况下,减少芯片制造的难度

image-20240203171529705

image-20240203171541189

3 Chiplet如何实现

实现形式上,die-to-die 的高速互连是 Chiplet 实现的基础。

Chiplet 的小芯粒可以通过载板或 Interposer 互联,而 Interposer 的材质又分为硅基、有机两种。

它把一块SOC芯片拆解成多个小芯片,这些小芯片通过TSV技术和硅中介层连接,它们之间的信息传输速率和一块完整的SOC芯片几乎接近。

image-20240203171558048

下图对使用硅通孔堆叠的系统级芯片和系统级封装的信号传输路径进行了比较。当信号从系统级芯片的一端传输到对角的另一端时,将系统级芯片分为9个部分并使用硅通孔技术进行堆叠时,传输路径会短得多。

在对系统级封装和系统级芯片的性能进行比较时,人们原本以为系统级芯片在单个芯片上实现,因而其电气特性会更优异。然而,随着芯片堆叠技术(如硅通孔技术)的发展,系统级封装的电气特性与系统级芯片旗鼓相当。

image-20240203171612241

4 Chiplet的优势

4.1 成本大幅下降

大面积单颗 SOC 良率很低,而小芯片的制造工艺成熟,良率会高很多。这样就把晶圆的制造成本降下来了,技术门槛也降下来了;

image-20240203171632033

4.2 技术难度大幅下降

SOC芯片的开发周期长,设计难度高,而chiplet只需要分开设计各个功能模块的小芯片,难度大大降低,可以加速芯片迭代升级的速度;

image-20240203171647737

4.3 灵活度更高

同一块SOC芯片,各个功能模块的纳米制程都是一样的,比如统一为5nm。而chiplet可以兼容多种工艺制程,CPU芯片是5nm的,而存储芯片可以是22nm。SOC芯片只要有一个功能区域坏了,整个芯片就废了。而chiplet封装的芯片,如果一个功能区坏了,只需要把相应的模块换掉,甚至你还可以自定义升级,比如说把内存芯片换成一块儿容量更大的。

image-20240203171709443

2017年,AMD公司推出第一代EPYC(霄龙)处理器Naples,把四个同类型的CPU,通过chiplet方案封装在一起,虽然它传统比单一的一块处理器芯片多出10%的面积,但是节约了41%的成本,在性能上对标当时英特尔的白金至强xeon。

AMD 于 2023 年 6 月发布了 MI300 产品,该芯片拥有 13 个小芯片,共包括 9 个 5nm 的计算核心(6 个 GCD+3 个 CCD),4 个 6nm 的 I/O die 兼 Infinity Cache(同时起到中介层的作用,位于计算核心和 interposer 之间),同时还搭载了累计 8 颗共计 128GB 的 HBM3 芯片。

image-20240203171732289

5 Chiplet的局限

5.1 连接问题

多年来,业内一直在寻找一种“真正的互连”,以便在芯片组中实现从裸片到裸片(Die-to-Die)的通信,更好的完成数据存储、信号处理、数据处理等丰富的功能。如何让芯粒之间高速互联,是Chiplet技术落地的关键,也是全产业链目前面临的一大全新挑战。

芯片设计公司在设计芯粒之间的互联接口时,首要保证的是高数据吞吐量。另外,数据延迟和误码率也是关键要求,还要考虑能效和连接距离。

到目前为止,已经成功商用的Die-to-Die互连接口协议多达十几种,主要分为

  • 串行接口协议:LR、MR、VSR、XSR、USR等SerDes串行互连技术,PCIe、NVLink,用于Cache一致性的CXL、CCIX、TileLink、OpenCAPI,以及中国Chiplet产业联盟(CCLL)推出的ACC接口标准等
  • 并行接口协议:AIB/MDIO(Intel)、LIPINCON(TSMC)、Infinity Fabric(AMD)、OpenHBI(Xilinx)、BoW(OCP ODSA)、INNOLINK(Innosilicon),以及用于存储芯片堆叠互联的HBM接口等…

比较而言,串行接口一般延迟比较大,而并行接口可以做到更低延迟,但也会消耗更多的Die-to-Die互连管脚,而且因为要尽量保证多组管脚之间延迟的一致,所以每个管脚不易做到高速率。

可以看到,这些芯片巨头们在积极探索Chiplet技术,但同时大家又各自为战,推动自己的高速互联协议标准。

目前市面上部分现有互联标准对比如下:

image-20240203171804892

有观点指出,不同工艺、功能和封装的芯片之间没有统一的通信接口,会造成严重的资源浪费。

5.2 封装问题

在芯片尺寸不断增大、架构变得复杂的情况下,封装结构由原先的二维发展至三维。按封装介质材料和封装工艺划分,Chiplet的实现方式主要包括以下几种:MCM(Multi-chip module)、2.5D封装、3D封装。目前台积电拥有CoWoS/InFO、英特尔拥有EMIB、Fovores 3D等,Chiplet使用的先进封装多种多样,且新的封装形式和结构还在不断演进。随着Chiplet技术的发展终究会使小芯片间的互联达到更高的密度,一定程度上这将难度和成本转嫁到了封装工程上:

  • 要应对先进封装功能和密度的不断提升,散热、应力和信号传输等都是重大的考验。目前头部的IDM厂商、晶圆代工厂以及封测企业都在积极推动不同类型的先进封装技术,以抢占这块市场。
  • 但是在高性能、短距离互连领域,一般要通过Interposer(中介层)或者Silicon Bridge(硅桥)进行互连,封装成本比较高。

例如,在片间互连中的高线密度可能要求使用支持线密度很高的基板或桥接技术。高带宽存储器(HBM)的启用可能是这一趋势的最好证明——因为HBM只能与ASIC集成在同一个封装中,而且此时只能在2.5D的硅中间层配置中集成。

虽然硅基封装技术已经发展为批量制造解决方案,但成本和复杂性可能会阻止它们成为大多数低端应用的解决方案。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/515320.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【并发编程】CountDownLatch

📝个人主页:五敷有你 🔥系列专栏:并发编程 ⛺️稳中求进,晒太阳 CountDownLatch 概念 CountDownLatch可以使一个获多个线程等待其他线程各自执行完毕后再执行。 CountDownLatch 定义了一个计数器,…

4.7 数组的读取和写入,type指令和一些杂项

4.7 数组的读取和写入,type指令和一些杂项 可以通过word ptr将db转为dw,然后按照dw的方式去存储数据 1. 段名也可以把其地址赋给变量 assume cs:codesg,ds:data,ss:stack data segmentdb 12,34dw 12,34db hello world data ends stack segmentdb 10 dup…

YOLOv5改进 | 低照度检测 | 2024最新改进CPA-Enhancer链式思考网络(适用低照度、图像去雾、雨天、雪天)

一、本文介绍 本文给大家带来的2024.3月份最新改进机制,由CPA-Enhancer: Chain-of-Thought Prompted Adaptive Enhancer for Object Detection under Unknown Degradations论文提出的CPA-Enhancer链式思考网络,CPA-Enhancer通过引入链式思考提示机制,实现了对未知退化条件下…

Shell GPT:直接安装使用的chatgpt应用软件

ShellGPT是一款基于预训练生成式Transformer模型(如GPT系列)构建的智能Shell工具。它将先进的自然语言处理能力集成到Shell环境中,使用户能够使用接近日常对话的语言来操作和控制操作系统。 官网:GitHub - akl7777777/ShellGPT: *…

OpenCV4.9开发之Window开发环境搭建

1.打开OpenCV所在github地址 2.点击opencv仓库,进入仓库详情,点击右下方的OpenCV 4.9.0进入下载页面 3.点击opencv-4.9.0-windows.exe下载 开始下载中... 下载完成 下载完成后,双击运行解压,默认解压路径,修改为c:/

企业家升维认知:引领企业持续发展的关键

一、引言 在快速变化的时代背景下,企业家面临着前所未有的挑战与机遇。新东方教育科技集团董事长俞敏洪曾深刻指出:“企业家本身要不断升维自己的认知,才能带领企业持续发展。”这句话不仅揭示了企业家认知升维的重要性,也为我们…

JRT简化开发环境

JRT是完全前后端分离的项目,实际工程是逻辑上完全前后端分离,代码层级和工程是不离的。这样就可以做到一键启动,同时又有分离的好处。开始页面后缀都沿用aspx,最开始考虑过修改后缀为html,当时觉得搞aspx也不错&#x…

Qt 的发展历史、现状与启示

Qt 最早在1991年由挪威的两位程序员 Eirik Chambe-Eng 和 Haavard Nord 开发,他们在1994年创立 Trolltech 公司(奇趣科技)正式经营软件业务。Qt 的第一个公众预览版于1995年面世,之后在2008年被诺基亚收购;2011年到201…

【Oracle篇】expdp/impdp高效完成全部生产用户的全库迁移(第四篇,总共四篇)

☘️博主介绍☘️: ✨又是一天没白过,我是奈斯,DBA一名✨ ✌✌️擅长Oracle、MySQL、SQLserver、Linux,也在扩展大数据方向的知识面✌✌️ ❣️❣️❣️大佬们都喜欢静静的看文章,并且也会默默的点赞收藏加关注❣️❣️…

SEO必备,网站词库拓展建设

我以前做网站是没有词库这个概念的,今天恰巧和站长交流的时候提到了词库的建设,大致问题就是如何增加词库。其实我也不是特别明白,只是听说使用长尾关键词挖掘然后拓展,至于怎么用,也没有聊到。 所以我的求知欲让我去…

Spring Boot:Web开发之视图模板技术的整合

Spring Boot 前言Spring Boot 整合 JSPSpring Boot 整合 FreeMarkerSpring Boot 整合 ThymeleafThymeleaf 常用语法 前言 在 Web 开发中,视图模板技术(如 JSP 、FreeMarker 、Thymeleaf 等)用于呈现动态内容到用户界面的工具。这些技术允许开…

CSS设置网页背景

目录 概述: 1.background-color: 2.background-image: 3.background-repeat: 4.background-position: 5.background-attachment: 6.background-size: 7.background-origin: 8.background-…

SAP_MM模块-无价值物料管理实现思路

无价值物料管理实现思路 业务背景一: 对于工具类的物料,本来想通过无物料号,收货时直接消耗在成本中心的方式来处理,这样,工程部和采购部都比较方便。 但财务部提出这部分工具物料还需要进行库存管理,但…

【Python异常处理】

在Python无法正常处理程序时就会发生异常,此时我们需要捕捉并处理它,否则程序就会终止执行。 例如: x 1 / 0 print(x)运行结果: ZeroDivisionError: division by zero #此时程序终止执行Python提供了三个非常重要的功能来处理…

ubuntu20.04下搜狗输入法的安装

1、安装 fcitx 输入法的框架 sudo apt install fcitx-bin sudo apt-get install fcitx-table 2、Ubuntu下的默认浏览器火狐搜索 搜狗输入法 搜狗输入法linux-首页 (下载x86_64) 3、安装依赖 sudo apt install libqt5qml5 libqt5quick5 libqt5quickwidgets5 qml-modu…

【漏洞复现】万户 ezOFFICE wf_printnum SQL注入漏洞

免责声明:文章来源互联网收集整理,请勿利用文章内的相关技术从事非法测试,由于传播、利用此文所提供的信息或者工具而造成的任何直接或者间接的后果及损失,均由使用者本人负责,所产生的一切不良后果与文章作者无关。该…

【学习心得】Numpy学习指南或复习手册

本文是自己在学习Numpy过后总是遗忘的很快,反思后发现主要是两个原因: numpy的知识点很多,很杂乱。练习不足,学习过后一段时间不敲代码就会忘记。 针对这两个问题,我写了这篇文章。希望将numpy的知识点织成一张网&…

JavaScript高级应用

学习作用域、变量提升、闭包等语言特征,加深对 JavaScript 的理解,掌握变量赋值、函数声明的简洁语法,降低代码的冗余度。 理解作用域对程序执行的影响 能够分析程序执行的作用域范围 理解闭包本质,利用闭包创建隔离作用域 了解…

面试总结------2024/04/04

1.面试官提问:你说你在项目中使用springsecurity jwt 实现了登录功能,能简单讲一下怎么实现的吗? 2.使用RabbitMQ实现订单超时取消功能 订单状态定义 首先,我们需要定义订单的不同状态。在这个示例中,我们可以定义以下…

[COCI 2011/2012 #5] EKO / 砍树 (二分)不开龙永远的痛!

不开龙long永远的痛&#xff01; 不开龙long永远的痛&#xff01; 不开龙long永远的痛&#xff01; 不开龙long永远的痛&#xff01; 不开龙long永远的痛&#xff01; //应该以最高的树为基准二分 初次尝试&#xff1a; #include<algorithm> #include<iostream&g…