对话芯动科技 | 助力云游戏 4K级服务器显卡的探索与创新

2021年芯动科技推出了基于IMG BXT GPU IP的风华1号显卡。单块风华1号显卡可在台式机和云游戏中实现4K级别的性能,渲染能力达到5 TFLOPS,如果在服务器中同时运行两块显卡,性能还可翻倍。该显卡是为不断扩大的安卓云游戏市场量身定制的,通过云端提供卓越的成本优势与杰出的能效比,以获得完美的移动娱乐体验。

现在,芯动科技团队分享了他们在风华1号显卡上取得的最新成就:在一块显卡上同时支持44个实例,每款游戏的运行速度约为30帧/秒。

这是他们发展历程中的一个重要里程碑,彰显了他们产品的能力,以及数据中心企业探索更新的显卡解决方案对其服务的益处。在下面的访谈中,与芯动科技的SoC首席架构师何颖探讨了他们的愿景、如何取得这些成果以及下一步的发展方向。

1、芯动科技认为云游戏的最新趋势是什么?

游戏内容的多样化和质量的提高。游戏画面、交互方式、声音体验、延迟改进等等,都在不断升级,以满足用户对游戏体验越来越高的要求。

第二个趋势是多终端协同,即无论使用什么设备,都能实现无处不在的游戏体验:智能电视、平板电脑、个人电脑和智能手机都是云游戏的有效选择。

云游戏正在逐步融合其他技术领域,推动技术创新。目前,许多城市已经实现了 5G 覆盖,使游戏玩家能够以更快的速度、更低的延迟串流畅玩更多更精细的内容。令人信服的人工智能生成内容的出现,为游戏开发商提供了差异化游戏的新方法。新推出的元宇宙应用要求同类型的处理与交互基础设施,而这些需求在云端业已得到或者得到证明。

游戏开发商正在探索创建云原生内容的方法,而不仅仅只是向用户从云端提供传统游戏的服务能力,以提高每用户平均营收。这些内容可以利用云计算更强的处理能力,为高分辨率显示器提供更复杂、帧率更高的大型游戏渲染,或在游戏中渗透人工智能生成内容等高级功能,以改变游戏玩法。

 2、数据中心企业在为其服务选择合适的显卡时需要考虑哪些因素?

在挑选显卡时,数据中心运营商会考虑显卡供应商的生态系统及其在特定领域(如云游戏)的接受程度。他们会关注显卡的渲染运算、可实现的准确性、人工智能的训练和推断运算,以及显卡的目标应用和云基础功能。此外,绿色数据中心的趋势也在不断发展,它鼓励以安全、低能耗、环保的方式来满足企业的需求--从而反向通过降低功耗成本以获取更好的成本优势。

3、使用 IP 解决方案是如何帮助你们为客户打造最佳显卡的?

我们决定基于 Imagination 的 GPU IP开发我们的图形卡,以加快产品上市时间,并确保我们采用的基本图形架构是经过验证的领先技术。这一决定使我们的工程团队有时间专注为显卡添加新功能,帮助我们的产品在云游戏市场脱颖而出。

在我们的 GPU 研发过程中,GPU 设计部门和 IP 设计部门紧密合作,为 GPU 产品打造了一套高性能、高可靠性、低功耗和兼容性强的 IP 解决方案。

例如,风华二号采用的 LPDDR IP 不仅兼容 LPDDR4/4x/5/5x,我们还针对 GPU 的数据访问特性,设计并优化了 DDR 的内部请求调度机制。这为 GPU 核提供了更大的内存访问带宽,并降低了处理关键任务的时延。DDR 控制器的内部请求调度机制同样为 GPU  Core更大的内存访问带宽和更低的关键任务时延而提供了专用设计。

由于 CoreActive 拥有适用于不同代工厂不同工艺节点的成熟强鲁棒性的 IP 库,因此我们在设计 GPU 芯片时可以更灵活地选择工艺节点,而不受 IP 选型的限制。

4、您选择在哪些方面集中工程力量来创建适用于安卓云游戏的芯片?

为安卓云游戏调整芯片的重点包括支持虚拟化、支持新版本的 OpenGL® ES 或 Vulkan® API、优化多客户端场景的线性度和可靠性。

在硬件开发方面,我们集中了更多的架构、算法和设计资源,用于研究和实施虚拟化和 API 升级所需的硬件修改。其次,我们加大了对软件驱动程序开发部门的资源投入,为更高版本的安卓系统创建驱动程序,并优化其稳定性和性能。最后,我们将部分测试工作集中在新功能上,以确保在主流游戏场景中的可靠性和性能,从而保证硬件能够与安卓设备进行良好的通信和运行。

5、在扩大风华1号可容纳的游戏玩家数量方面有哪些挑战?你们是如何克服的?

对于我们的商业客户来说,扩大显卡可容纳的游戏玩家数量是一个重要目标,但也存在一些困难。主要挑战之一是软件调度的线性。随着客户数量的增加,发送到 GPU 的请求数量以及随之而来的数据也会呈指数级增长。我们的驱动程序工程师在优化数据处理调度方面投入了大量精力:最大限度地利用片上数据处理引擎,同时优化图形控制器的数据吞吐效量,缩小任务调度中的间隙和浪费,这也减少了系统 CPU 负载和等待时间。

客户端数据的隔离和保护是另一个需要解决的问题。为了保证多个客户端的数据互不干扰,我们设计了一种高效/灵活配置的内存映射机制来管理不同客户端的内存空间,从而在不降低访问效率的前提下实现客户端数据的物理隔离。我们的解决方案是 Imagination HyperLane 虚拟化技术的演进,它为每个核创建了多达八个独立的控制通道,每个通道都在内存中安全隔离,并采用灵活的性能管理技术。

6、IMG BXT 的哪些功能为风华1号带来了最大价值?

Imagination基于分块的延迟渲染架构以及硬件虚拟化技术为风华系列GPU带来了显著的能效优势,使我们能够在相同功耗水平下比竞争对手拥有更多方式支持云游戏。

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

 7、客户和市场对 "风华 1号 "的反响如何?

风华1号一经推出,就迅速获得了市场的好评。经过测试和评估,我们的客户发现,在典型的云游戏场景中,与竞争对手的解决方案相比,"风华1号 "在能效比、单卡支持客户数量和性价比方面都具有突出优势。

8、芯动创新的下一步计划是什么?

风华1号和风华2号只是开端,产品推出后效果非常好。我们下一步将继续开发两条产品线:一条面向低功耗市场,一条面向服务器市场。

在低功耗市场,除了继续提升性能外,我们还将积极探索不同行业的应用场景,推出更加注重节能、低成本、高性价比的产品。

在服务器市场,我们将继续推出技术更先进、性能更强大的产品。例如,我们将采用Chiplet (芯粒)技术,突破工艺瓶颈的限制,更好地提高性能。

END

欢迎加入Imagination GPU与人工智能交流2群

f7b990cd5e985aa164493c5b4c6edd48.jpeg

入群请加小编微信:eetrend89

(添加请备注公司名和职称)

推荐阅读

对话Imagination中国区董事长:以GPU为支点加强软硬件协同,助力数

在线课程 | Imagination中国区技术总监全面解读IMG DXD GPU

e5411286793f911aa78e866c38a20912.png


Imagination Technologies 是一家总部位于英国的公司,致力于研发芯片和软件知识产权(IP),基于Imagination IP的产品已在全球数十亿人的电话、汽车、家庭和工作 场所中使用。获取更多物联网、智能穿戴、通信、汽车电子、图形图像开发等前沿技术信息,欢迎关注 Imagination Tech!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/160128.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

代码随想录算法训练营第三十八天【动态规划part01】 | 动态规划理论基础、509. 斐波那契数、70. 爬楼梯、746. 使用最小花费爬楼梯

动态规划理论基础 什么是动态规划 动态规划 (Dynamic Programming, DP),是求解决策过程最优化的过程。 如果某一问题有很多重叠子问题,使用动态规划是最有效的。 所以动态规划中每一个状态一定是由上一个状态推导出来的,这一点就区分于贪…

Spring IOC - 推断构造方法

一、前言 上文解析了Bean生命周期的实例化阶段,其中bean真正开始实例化的核心代码位于方法AbstractAutowireCapableBeanFactory#createBeanInstance中,这里也是spring推断构造方法的核心所在。 二、整体介绍 首先看下方法的源码及注释如下,下…

“具有分布式能源资源的多个智能家庭的能源管理的联邦强化学习”文章学习四——基于联邦深度学习的多智能家居能源管理

一、用于家庭能源管理的FRL算法 在本节中,我们将阐述提出的FRL算法(算法1),该算法以分布式方式调度多个智能家庭的能量消耗。在提出的FRL框架中,LHEMS和GS相互迭代并有效训练LHEMS的模型。我们考虑了由LHEMS控制的空调…

vivado产生报告阅读分析7-时序报告3

1、“ Timing Summary Report ”详情 “ Timing Summary Report ” ( 时序汇总报告 ) 包含下列部分 : • “ General Information ”部分 • “ Timer Settings ”部分 • “ Design Timing Summary ”部分 • “ Clock Summary ”部…

公网使用PLSQL远程连接Oracle数据库【内网穿透】

文章目录 前言1. 数据库搭建2. 内网穿透2.1 安装cpolar内网穿透2.2 创建隧道映射 3. 公网远程访问4. 配置固定TCP端口地址4.1 保留一个固定的公网TCP端口地址4.2 配置固定公网TCP端口地址4.3 测试使用固定TCP端口地址远程Oracle 前言 Oracle,是甲骨文公司的一款关系…

Linux常用命令——bzcat命令

在线Linux命令查询工具 bzcat 解压缩指定的.bz2文件 补充说明 bzcat命令解压缩指定的.bz2文件,并显示解压缩后的文件内容。保留原压缩文件,并且不生成解压缩后的文件。 语法 bzcat(参数)参数 .bz2压缩文件:指定要显示内容的.bz2压缩文…

使用requests库进行网络爬虫:IP请求错误的解决方法

目录 引言 一、了解requests库 二、遇到的问题 三、解决方法 1、随机化IP地址 2、减少请求频率 3、使用User Agent模拟浏览器行为 4、使用Cookies 四、注意事项 五、使用代理池 六、总结 引言 在利用Python的requests库进行网络爬虫操作时,我们有时会遇…

Hangfire.Pro 3.0 Crack

Hangfire.Pro 有限的存储支持 Hangfire Pro 是一组扩展包,允许使用批处理创建复杂的后台作业工作流程,并提供对超快速Redis作为作业存储的支持 请注意,仅在使用Hangfire.SqlServer、Hangfire.Pro.Redis或Hangfire.InMemory包作为作业存储时才…

贝加莱MQTT功能

贝加莱实现MQTT Client端的功能库和例程 导入库和例程,AS Logical View中分别通过Add Object—Library,Add—Program插入MQTT库和例程。 将例程Sample放置于CPU循环周期中 定义证书存放路径,在AS Physical View 中,右击PLC—Con…

C++--STL总结

参考教程:黑马程序员匠心之作|C教程从0到1入门编程,学习编程不再难_哔哩哔哩_bilibili 软件界一直希望建立一种可重复利用的东西,C的面向对象和泛型编程思想,目的就是复用性的提升。 大多情况下,数据结构和算法都未能有一套标准,…

开关电源测试之输出暂态响应测试标准及方法详解

暂态响应是指在接收到输入信号后,输出信号在短时间内产生的变化。开关电源输出暂态响应测试是为了检测输出负载快速变化时,输出电压跟随变动的稳定性。 开关电源输出暂态响应怎么测试? 测试目的:测试S.M.P.S.输出负载快速变化时&a…

python django 小程序点餐源码

开发工具: PyCharm mysql5.7,微信开发者工具 技术说明: python django html 微信小程序 代码注释齐全,没有多余代码,适合学习(毕设),二次开发,包含论文技术相关文档。 功能介绍&#xff1a…

视百年眼科青少年近视防控中心正式启动,构建近视防控新格局

11月16日上午,广州视百年眼科青少年近视防控中心启动仪式在门诊顺利举行。视百年眼科董事长孙联合、技术院长李国保、视光中心负责人肖萧、视光主任刘得圳出席会议并对如何做好青少年近视防控工作作出了工作部署。 视百年眼科孙董事长在会上强调,青少年是…

什么是单域名SSL安全证书?

单域名证书是什么? 单域名证书是指只包含一个具体域名的SSL/TLS证书,它可以用于保护单个主机名的HTTPS通信。例如,如果您有一个网站http://www.example.com,则单域名证书将仅为该域名颁发。 这种证书在保护单个域的安全方面很有…

C++多态原理揭秘

🎈个人主页:🎈 :✨✨✨初阶牛✨✨✨ 🐻强烈推荐优质专栏: 🍔🍟🌯C的世界(持续更新中) 🐻推荐专栏1: 🍔🍟🌯C语言初阶 🐻推荐专栏2: 🍔…

天猫精灵/小爱同学+巴法云+Openwrt控制局电脑/群晖开关机

天猫精灵/小爱同学巴法云Openwrt控制局电脑/群晖开关机 事情的起因实战环境开始发车1.天猫精灵/小爱同学 连接 八法云 2.openwrt3.docker环节注意:sshpass 要先使用 ssh命令登陆一下你要唤醒或者远程关机的设备,不然可能因为一个登陆提示你是否登陆的yes/no导致程序没有反应,然…

任正非说:公司要逐步实行分灶吃饭,我们在管理上不能过于整齐划一,否则缺少战斗力。

你好!这是华研荟【任正非说】系列的第42篇文章,让我们聆听任正非先生的真知灼见,学习华为的管理思想和管理理念。 一、我们必须在混沌中寻找战略方向。规划就是要抓住机会点,委员会是火花荟萃的地方,它预研的方向是可做…

ESP32 MicroPython LCD显示实验⑤

ESP32 MicroPython LCD显示实验⑤ 1、实验目的2、实验平台3、实验内容4、参考代码5、实验结果 1、实验目的 LCD显示屏显示中英文字符、显示图片 2、实验平台 智能小车(配备显示屏) 3、实验内容 小车配有2.0寸的TFT彩屏,内置有中文GBK字库,可以显示中…

值得你一生收藏的BMW宝马汽车底盘代号各个版本说明,方便今后查阅使用!

很少有汽车品牌像宝马一样,本属于内部交流使用的底盘代号(Development Code),最终延伸为粉丝群体用以精准定位某一年代某一款车型的通用语。随着宝马加速推出新产品,每一年的底盘代号都在更新。你挚爱的强哥现将宝马所…

echarts 三角锥形柱状图 + 带阴影的折线图示例

该示例有如下几个特点: ①三角锥形折线图 ②折线图自带阴影 ③三角锥形鼠标放置时颜色改变 ④数据随着鼠标移动而展示 ⑤鼠标放置时tooltip样式自定义(echarts 实现tooltip提示框样式自定义-CSDN博客) 代码如下: this.options …