中科驭数第三代DPU芯片K2-Pro,专为数据中心打造的“六边形战士”

近日,中科驭数重磅发布第三代DPU芯片K2-Pro,是国内首颗面向量产的全功能芯片!

K2-Pro采用自主研发的Kernel Processing Unit架构,集网络、存储、安全及计算等多业务卸载功能于一体,包处理速率翻倍至80Mpps,最高支持200G网络带宽,具备高度可编程性,确保了系统的灵活扩展性,为数据中心的业务增长和算力扩容提供坚实基础。在处理复杂任务时,K2-Pro相比上一代芯片能耗降低30%。

作为一款纯国产的高性能解决方案, K2-Pro以其全面性能的均衡与卓越,成为数据中心战场上的“六边形战士”,可广泛适用于云计算、智能计算、及高性能计算等领域,也为数据中心的算力升级提供了全新解题思路。同时,K2-Pro也必将成为推动DPU芯片进入大规模量产的标杆之作。

自研KPU架构和KISA指令集

用创新的体系结构理论指导复杂的芯片架构设计

对于中科驭数来说,DPU的研发之路上,架构创新不是可选项,而是必选项。中科驭数在芯片研发领域持续深耕,从底层架构入手,致力于解决DPU芯片面临的高带宽、低延迟及复杂业务需求挑战的决心。

KPU架构——专用计算代表性架构

自主研发KPU芯片架构是中科驭数多年体系结构研究的结晶,基于软件定义硬件的技术路线,创新性地提出了面向专用计算统一计算架构KPU。该架构采用异构计算核作为基本单位,根据上层应用的具体需求定制化设计,具有软件可定义、超高并行处理能力、超强处理性能三大优势,配合数据流驱动的运算激活机制,确保了系统灵活性与高效运行的完美平衡,为DPU芯片设计打造新标杆。

KISA指令集——业界首个DPU指令集架构

以此为基础,中科驭数进一步推出了首个专为DPU设计的指令集架构——KISA,旨在解决专用计算领域编程范式的碎片化问题。不同于传统的CPU指令集,KISA紧密贴合DPU的特性,强调数据处理而非控制流,高计算密度型而非低计算密度型,采用数据流而非字节作为基本操作单元。更重要的是,KISA首次在指令集层次支持敏捷异构,用一套统一的指令实现了多种异构处理核进行管理调度。

目前,KISA指令集涵盖了KISA基础架构、以及面向DPU专用处理扩展指令,包含包解析、转发指令、以及表查询指令等。基于KISA已经覆盖25大类应用场景,累计数百个用例,得到非常充分验证。

KISA指令集的推出,将软件定义技术路线向着更加可落地、可执行的方向推进了一大步,系统性地解决了领域专用计算的编程范式混杂的难题,让开发变得更加简单高效,让每一行代码直达DPU算力。

实用制胜,量产为王

K2-Pro何以称为数据中心的“六边形战士”?

基于以上两大底层技术创新,不仅打破了传统DPU设计,更推动了DPU芯片向更高性能、更强灵活性和更低功耗方向发展。相较于单一性能的极致追求,中科驭数在DPU设计上秉持全面卓越的理念,致力于打造“全能冠军”而非“单项冠军”。

因此,K2-Pro在立项之初就把“实用制胜,量产为王”作为研发目标,确保技术创新与市场需求紧密结合。历经深度优化以及融合了对数据中心未来中心场景的深入理解,K2-Pro最终实现以下六个方面的极致优化:

K2-Pro是先进、好用的网络芯片

对于DPU来说,首先是一个网卡,才能再谈进一步拓展其复杂业务的处理能力。为此,中科驭数团队在基础网络功能上苦下工夫,将K2-Pro打造成综合能力强悍的网卡芯片。

一方面,在实现基础网络卸载功能上,K2-Pro集成了高通量DMA以及硬件虚拟化技术,并通过丰富的软件显著增强了运维能力,这一进步在国产网卡领域中尤为突出,直接对标国外主流产品。

另一方面,K2-Pro着重在网络延时、高阶包处理能力上做了增强。通过优化设计,K2-Pro将端到端网络延迟控制在1.2微秒以下,处理带宽达到200Gbps,做到业界领先水平,成功填补了国内低延迟网卡市场的空白。

同时,结合其可编程的包处理引擎,K2-Pro打破了传统网络处理局限于二层包的框架,赋予用户更高的灵活性去执行包解析和深度数据分析任务,根据自身需求设计特定的安全策略、流量优化方案等等,让用户在硬件层面实现个性化配置,极大提升了数据中心网络的智能化和定制化程度。

K2-Pro是高通量数据处理芯片

K2-Pro芯片,作为一款面向数据中心的高性能数据处理核心,其优势在于如何高效且有序地管理复杂多变的基础设施层服务。

DPU业务里面有非常鲜明的特点:一是业务类型繁多且性质各异,涵盖网络、存储及各类用户特定应用,每种业务不仅要求精确解析,还需定制化处理逻辑,加之不同业务的处理时延各异,极易引发处理顺序混乱等难题。二是并发级别极高,应对千万级别的数据流、管理动辄数百上千的虚拟机,是数据中心面临的运营常态。三是对延迟高度敏感,与GPU的批处理加速模式不同,DPU要求在严格的时间窗口内完成任务,任何延误都将导致数据丢失。

鉴于此,K2-Pro的高通量数据处理能力成为其核心竞争力,其背后的关键技术在于精细的流调度与隔离机制。经过深入研究与优化,K2-Pro从流的精准识别到并发处理能力均实现了显著提升,确保在极端并发场景下仍能维持高水平性能,几乎不受流量洪峰影响。最终做到了在承载千万级并发流、服务上千租户、处理千万级流表及数十种不同租户配置的复杂业务之下,稳定输出200Gbps数据吞吐率及40Mpps包处理能力的领先性能,让数据处理更加“游刃有余”。

K2-Pro是强业务卸载芯片

在复杂的云服务环境中,尤其是面对如服务网格这类高控制复杂度的业务,现有DPU技术往往难以有效承担,其业务卸载效率低下,通常不足20%。业界普遍采取的应对策略是增强控制层面的资源配置,极端时甚至采用服务器级CPU来维系控制功能。但这不仅未能从根本上改善服务质量和降低延迟问题,反而可能导致资源浪费。

基于上述挑战,中科驭数团队一直认为DPU必须轻控制,而非盲目追求与CPU相匹敌的控制能力。在此理念指导下,K2-Pro在设计上实现了多项关键技术突破,包括但不限于精密的流调度技术、高效数据交互协议,以及专门设计的网络卸载、表项卸载、存储卸载、RDMA卸载等重要引擎,将原本在DPU上难以卸载的业务比例从低于20%显著提升至90%以上,大幅减轻了控制面的压力。

服务治理场景下,K2-Pro也实现了量级的跃迁,将原先400us以上的治理延时降到了30us以内,显著优于当前市场上的解决方案,为确保高性能、低延迟的云服务环境提供了强大的技术支持。

K2-Pro是灵活可扩展处理芯片

虽然DPU出现时间不长,但是它的潜力在加速显现。随着更多业务向DPU转移,以及协议迭代和任务类型的增加,DPU的扩展能力成为关键。因此,K2-Pro芯片在三个维度上实现了独特性的可扩展性设计,让业务与同构算力、异构算力灵活扩展:

可编程与卸载能力:K2-Pro自身不仅配备了高性能的可编程引擎,还融入了协议分析引擎(PPP)与通用算法引擎(CAE),确保了对不断演进的协议和复杂算法的有效支持。中科驭数在金融领域做过一个尝试,通过全面卸载特定的金融通信协议和业务算法至DPU,性能相比现有方案提升了十倍以上,刷新了行业认知。

芯片级联与算力自由扩展:为满足日益增长的算力需求,中科驭数创新设计了DPU间的高速互联技术,支持芯片级联,使多个DPU能够无缝串联,实现DPU算力自由扩展。这一方案与行业标准接轨,为大规模数据中心的算力部署提供了高效路径。举例而言,通过多芯互联,能够轻松部署高性能的NAT网关解决方案,为数据中心的网络架构升级和业务扩展打开了新的可能性。

开放的外接算力集成策略:K2-Pro还致力于与其他类型算力芯片的协同工作,提供了多元化的集成方案,既展现了DPU在构建综合性解决方案中的灵活性,也预示着未来将有更多跨领域的创新合作案例涌现,进一步拓宽DPU的应用边界。如中科驭数在与安全芯片厂商的合作中,共同打造了处理能力达到百Gbps级别的安全解决方案。

K2-Pro是稳如磐石的“管理”芯片

DPU在一般认知中常被视作辅助或“副手”角色,负责任务卸载,然而实际上,它在数据中心扮演着更为关键的主角身份。DPU不仅参与虚机的生命周期管理、资源调配等核心任务,还必须保证全天候稳定运行,是数据中心最中心的处理核心。

中科驭数对稳定性给予了高度重视,对K2-Pro进行了深度优化:纳秒至毫秒级的分级异常恢复机制确保快速响应;系统与核心间的异常隔离设计,即使内部模拟攻防,也能维持运行不中断。配备的实时状态监测系统,对芯片内每个数据包、每个子系统的状态进行不间断监测,及时发现并预警潜在问题,实现了芯片内每个环节的全天候精准监控。截至目前,这种级别的监测精细度和系统稳定性在同类DPU产品中尚属罕见。

K2-Pro是极致能效比的网络芯片

能耗考验也是DPU在设计时面临着的又一大难题。尽管DPU承担的任务远超传统网卡,但在服务器架构中,其安装位置和功耗预算仍旧受限,类似于网卡的配置要求。鉴于此,中科驭数团队深知,要想实现DPU的广泛应用,必须在能效比上取得突破。

中科驭数不仅采用了诸多成熟的低功耗技术,更从应用层面进行了深度优化,通过精细的电源管理策略,实现了在不影响性能的前提下,对芯片面积和运行频率的精准调控,这一过程虽充满挑战,近乎苛刻,却也体现了团队对技术极限的不懈追求。最终,DPU在多种应用场景下展现出了显著的能效优势,相比上一代功耗降低30%,与国际DPU产品相比也有更为出色的能效表现,为DPU的大规模部署奠定了坚实的能效基础。

中科驭数高级副总裁、CTO卢文岩博士表示,正是我们坚持自主研发,突破技术壁垒,我们才能开发出自主知识产权的KPU架构与KISA指令集,为DPU领域贡献了我们的创新成果;正是这份对六个关键领域“死磕到底”的决心,我们才能在造“芯”路上厚积薄发,见证这个数据中心“六边形战士”的诞生;也正是我们坚持技术与市场的紧密结合,将量产与应用视为同等重要,我们才能见证K2-Pro成为了一款真正可落地、可推广的高性能DPU芯片。相信K2-Pro的问世,将会是数据中心算力技术革新的重要里程碑。期待见到它走向各行各业,未来在数据中心乘风扬帆,在算力征途上破浪前行!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/752897.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

vue3+ts+vite项目报错:找不到名称“GC”。ts-plugin(2304)

GC变量通过script标签引入的第三方引入&#xff0c;但是ts-plugin并不知道&#xff0c;需要明确声明这个变量的类型 /// <reference types"vite/client" />declare module "*.vue" {import type { DefineComponent } from "vue";// eslint…

代表与民众的联系如何通过数字人大平台加强?正宇软件有方法

在数字时代的大潮中&#xff0c;数字中国建设已成为国家战略&#xff0c;数字人大平台作为战略中的组成部分&#xff0c;正逐步展现出其独特价值和重要作用。随着国家政策的引导与推动&#xff0c;数字人大平台不仅为人大代表履职提供了新工具&#xff0c;更为加强人大代表与民…

ctfshow web入门 sqli-labs web517--web524

web517 注入点id ?id-1’union select 1,2,3– 确认是否能够注入 ?id-1union select 1,database(),3-- 爆出库名 security爆出表名 ?id-1union select 1,(select group_concat(table_name) from information_schema.tables where table_schemasecurity),3-- emails,refer…

墨刀原型-单选按钮场景交互

画原型过程中&#xff0c;会遇到单选或多选的交互场景 这时就可以直接在基础组件部分&#xff0c;拉取单选按钮直接使用&#xff0c;只需要完成对应的交互事件就可实现交互 首先先说单选按钮实现交互 拉取一个单选组件&#xff0c;右侧可调整样式尺寸&#xff0c;在选项部分&…

生命在于学习——Python人工智能原理(2.5.1)

五、Python的类与继承 5.1 Python面向对象编程 在现实世界中存在各种不同形态的事物&#xff0c;这些事物之间存在各种各样的联系。在程序中使用对象来映射现实中的事物&#xff0c;使用对象之间的关系描述事物之间的联系&#xff0c;这种思想用在编程中就是面向对象编程。 …

【数据结构】线性表之《队列》超详细实现

队列 一.队列的概念及结构二.顺序队列与链队列1.顺序队列2.链队列 三.链队列的实现1.创建队列2.初始化队列3.入队4.出队5.获取队头元素6.获取队尾元素7.队列的大小8.队列的判空9.清空队列10.销毁队列 四.队列的盲区五.模块化源代码1.Queue.h2.Queue.c3.test.c 六.栈和队列必做O…

解题思路:LeetCode 第 209 题 “Minimum Size Subarray Sum“

解题思路&#xff1a;LeetCode 第 209 题 “Minimum Size Subarray Sum” 在这篇博文中&#xff0c;我们将探讨如何使用 Swift 解决 LeetCode 第 209 题 “Minimum Size Subarray Sum”。我们会讨论两种方法&#xff1a;暴力法和滑动窗口法&#xff0c;并对这两种方法的时间复…

confluence集成LDAP

一、confluence的权限管理 在集成前&#xff0c;我们必须得知道confluence自身的权限管理是如何做的。 用户组对应空间权限&#xff0c;用户组可以是一个项目&#xff0c;也可以是一个部门或组。 一个用户组里的用户&#xff0c;可以读写本空间的页面&#xff0c;而把其他组隔离…

“文本比对基础:最短编辑距离算法的原理与实现“

最短编辑距离 给定两个字符串 &#x1d434; 和 &#x1d435;&#xff0c;现在要将 &#x1d434; 经过若干操作变为 &#x1d435;&#xff0c;可进行的操作有&#xff1a; 删除–将字符串 &#x1d434; 中的某个字符删除。插入–在字符串 &#x1d434; 的某个位置插入某…

有没有将音频转文字的app?盘点5款高效的音频转文字工具

在职场的快节奏生活中&#xff0c;时间就是金钱&#xff0c;效率就是生命。 我们常常在会议中奋笔疾书&#xff0c;却错过了关键的讨论&#xff1b;在电话会议中努力记忆要点&#xff0c;却难以捕捉每一个细节。 但别担心&#xff0c;有一种工具能让我们摆脱这些困扰——音频…

靶机渗透之DC-8

一、信息收集 扫一下子网段&#xff0c;发现靶机ip为192.168.145.130。 nmap -sP 192.168.145.* 进一步进行端口、系统等信息扫描&#xff0c;开放的端口为80、22&#xff0c;中间件为apache。 nmap -sT -T4 -sV -O -sC -p1-65535 192.168.145.130 再扫一下网站目录&#xf…

【方法分享】如何使用WinRAR将文件夹里的每个文件压缩

不知道大家是否会遇到这种情况&#xff0c;将文件夹内的多个文件或文件夹压缩成一个个压缩包文件&#xff0c;这种情况除了将文件夹中的文件一个个压缩&#xff0c;还有什么批量操作的方法呢&#xff1f;今天分享使用WinRAR批量压缩文件到每个单独的文件夹的方法。 方法如下&a…

一键vmp加固apk aar aab

简介 最近工作需要基于vpm加固封装了一套一键加固的方案,可以给apk aar aab文件实现一键加固&#xff0c;把所有的dex内容都封装到so库里面&#xff0c;加大了反编译破解的难度。 环境配置: 需要配置环境变量: ANDROID_NDK_HOME ANDROID_SDK_HOME CMAKE_PATH JAVA_HOME使用方…

高考填报志愿,是选就业前景?还是选自己的兴趣爱好?

一、 当前的就业形式 受yi情影响&#xff0c;全国的就业处于下滑趋势&#xff0c;互联网和实体企业呈现疲软势态&#xff0c;很多企业不得不裁员。大学毕业生人数几乎每年都会上涨&#xff0c;带来的是僧多粥少的就业状态。 考得好不如报得好 就业环境如此严峻的形势下&#…

如何实现数字人系统私有化部署?数字人源码部署教程简易版来了!

当前&#xff0c;数字人行业的市场前景和应用潜力不断显现&#xff0c;不少创业者都想要通过学习数字人源码部署教程来搭建属于自己的数字人系统&#xff0c;以此获得进军数字人行业的入场券。而事实上&#xff0c;该想法本身当然是固然值得鼓励的&#xff0c;但就目前的实践情…

深度学习Week18——学习残差网络和ResNet-50算法

文章目录 深度学习Week18——学习残差网络和ResNet-50算法 一、前言 二、我的环境 三、前期工作 1、配置环境 2、导入数据 2.1 加载数据 2.2 配置数据集 2.3 数据可视化 2.4 再次检查数据 四、构建ResNet-50网络模型 五、编译模型 六、训练模型 七、模型评估 八、指定图片预测 …

超详细的Stable Diffusion WebUI 安装!

前言 安装方式&#xff1a; 使用发行包在带有 NVidia-GPU 的 Windows 10/11 上安装 sd.webui.zip从v1.0.0-pre下载并解压其内容。 跑步update.bat。 跑步run.bat。 Windows 上自动安装 安装Python 3.10.6&#xff08;较新版本的Python不支持torch&#xff09;&#xff0…

stm32cubemx,adc采样的几种方总结,触发获取adc值的方法dma timer trigger中断

stm32cubemx adc采样的几种方总结&#xff0c;触发获取adc值的方法 timer trigger中断 方法1&#xff0c;软件触发方法2&#xff1a;,Timer触发ADC采集通过DMA搬运 触发获取adc值的方法 Regular Conversion launched by software 软件触发 调用函数即可触发ADC转换 Timer X Cap…

英伟达GB200系列AI芯片供不应求;阿里云通义灵码上线Visual Studio插件市场

&#x1f989; AI新闻 &#x1f680; 英伟达GB200系列AI芯片供不应求 摘要&#xff1a;英伟达GB200系列AI芯片供不应求&#xff0c;台积电和日月光等公司获追加订单。GB200芯片性能提升30倍&#xff0c;成本和能耗降至25分之一。预计2025年出货量突破百万颗&#xff0c;后段封…

收藏 | SSL证书无效的原因和解决办法

当浏览器访问一个使用SSL证书保护的网站时&#xff0c;会检查其证书的有效性。如果发现证书存在问题&#xff0c;浏览器会显示“SSL证书无效”的警告信息&#xff0c;提醒用户存在潜在的安全风险。 “SSL证书无效”的警告可能会导致用户离开站点&#xff08;并且永远不会返回&…