华为云渲染实践

  //  

编者按:云计算与网络基础设施发展为云端渲染提供了更好的发展机会,华为云随之长期在自研图形渲染引擎、工业领域渲染和AI加速渲染三大方向进行云渲染方面的探索与研究。本次LiveVideoStackCon 2023上海站邀请了来自华为云的陈普,为大家分享云渲染在垂直场景的一些应用。

文/陈普

整理/LiveVideoStack

大家下午好,今天非常荣幸和大家进行分享交流,本次分享的主题为华为云渲染实践——从2D图形到3D空间。

本人于2005年加入华为公司,自2007年至今曾先后负责华为云计算、自研桌面云和人工智能等技术的研发工作,目前正致力于华为云渲染服务的研发。

本次分享分为以下几部分:首先介绍渲染技术的范围和云渲染希望解决的问题,其次介绍华为云渲染在2D、3D和云原生渲染方面的一些实践,再到工业图像和AI加速渲染方面的实践。

-01-

渲染技术的范围

65d9d1c675b44e19be96062c2f939db4.png

提到云渲染,大家可能会直接联想到云游戏,实际上二者并不等同。华为云致力于将渲染技术应用于各个行业,目前主要包括实时渲染和离线渲染两大分支,实时渲染的落地场景包括虚拟展会、汽车展示、虚拟空间和数字人等等,离线渲染更注重逼真的效果,主要应用于设计效果图和影视等场景。

-02-

云渲染希望解决的问题

一部分人容易直接将渲染与3D图形划等号,因此首先解释一下渲染的概念。百度百科将渲染定义为CG的最后一道工序,这个解释偏向于离线渲染。维基和百度百科也曾在浏览器引擎、OpenGL中提及渲染,可以看到渲染的对象是包括2D和3D图形的。维基百科对渲染的定义是较为准确,它实际上指软件利用二进制和格式化数据生成图像的过程。

9b1cf5be9f8e81a6fd822804795463e1.png

我们将云渲染定义为:实现客户的图形渲染业务上云,整个流程从无图形到2d图形再到3D图形。

3937ff3d18a11dacaf85ad809ca0a85d.png

我们的现有图像渲染架构如上所示,3D技术最下层的GPU到显卡驱动、DX、OpenGL、Vulkan运行库、3D渲染引擎再到3D应用程序,直接使用底层API开发图形渲染程序难度较大。

另一条2D应用程序分支主要包含大家常见的Office等PC 2D应用程序,从GPU、显卡驱动、微软定义的GDI运行库、GUI框架再到2D应用程序。

-03-

2D渲染实践

668ecbc43bae1d311954e0c041a0de3a.png

接下来介绍我们的云端2D实践。标准的2D图形显示流程如上图所示,首先由应用程序调用GUI程序库,GUI库转化为底层GDI运行库调用,此时运行库还处于用户态,没有调用硬件。随后GDI运行库调用显卡驱动,显卡驱动调用显卡,完成图像渲染并输出至显示器。

d4b86883c2db12fe3fb3ce53c526d735.png

那么实现2D应用的远程显示是否只需要将渲染后的画面编码并传输到客户端?实际上这种方式存在编码效率低、视频带宽占用大和有损压缩导致颜色失真等缺点,并不适用于2D渲染上云。

我们设计的渲染流程是在显卡驱动获取2D图像渲染调用后,将图像渲染调用序列转化成数据,利用2D渲染指令处理程序对数据进行处理、编码后进行画面无损压缩,最终通过网络传输到客户端解码显示。以文字输入为例,输入的字符串通过字体驱动转为像素级文字,并且只需在屏幕上的小范围更新区域显示,传输的数据量不大,可以实现无损压缩。以上流程在Windows和Linux平台都有实现方案。

-04-

3D渲染应用上云实践

977460a12545a5ef68c450e531cbba19.png

3D云渲染架构和2D渲染类似。早期由于技术条件限制,我们选择使用GPU直通技术,将GPU与虚拟机绑定,虚拟机可以直接访问GPU,获得高性能图形渲染能力,再通过远程应用技术将画面传递至客户端。

这种方式的优点是虚拟机可以直接安装设备商的标准显卡驱动,保证了兼容性,使显卡接近于物理GPU性能。缺点是GPU与虚拟机绑定,失去了灵活性,并且成本较高。但它目前仍是主流的云上GPU使用方式。

ebbf3c387a9e51b0c451590fbc636680.png

我们于2012年尝试将渲染从云端转到客户端远程完成,本质上需要获取用户程序的3D指令流。

按照微软WDDM显卡驱动可以捕获到用户应用程序3D图像渲染的调用。在该架构下,驱动程序分为用户态和内核态,实现3D程序需要借助Direct运行库,它调用设备厂商提供的驱动,并通过内核态驱动与GPU进行交互。OpenGL也存在类似程序。

664a02e690dc80462c2719160171c772.png

于是我们将全部3D应用程序指令流处理后传输至客户端,在客户端重新进行渲染,经过50多款游戏测试,基本实现了渲染功能。但带宽存在不稳定性,实现难度和所需成本都比较高。

8f7ca5b878f2770165e6c7de69c9b544.png

2012年我们开始研发软件GPU虚拟化。它的基本原理通过两种虚拟机实现,一种是为客户服务的虚拟GPU虚拟机,另一种是前述的使用直通技术的物理GPU虚拟机。

我们在虚拟化平台对两种虚拟机构筑了内存通信,在虚拟GPU虚拟机安装虚拟显卡驱动,利用驱动捕获3D图像驱动调用,并利用共享内存传输至物理GPU虚拟机,在物理GPU虚拟机中利用直通物理显卡进行渲染,渲染后进行画面回传。

这种方式面临的挑战有两种,一是由于DirectX具有多种版本,驱动兼容实现难度大。二是内部共享内存传输还需进一步加速。存在的缺点是方案本身属于资源抢占模型,隔离能力较差,其次是对虚拟显卡驱动兼容性研发投入人力非常大。

01b95655a59c8941d4d75824c8eda9ac.png

2013年我们与英伟达合作,在虚拟化平台支持硬件GPU虚拟化,这种方式可以获得更好的隔离能力和驱动兼容性,缺点是Nvidia按照虚拟机单独收取License费用,成本较高。

-05-

云原生渲染实践

bba8c13f5e72aaf5651649d4bea29474.png

以上介绍的方案仅是围绕操作系统级别支持的底层图形渲染能力,对业务具体场景渗透的不够。从实际业务场景来看,华为云渲染的目标是帮助客户图形渲染场景上云,离线渲染场景主要服务于影视和高清设计图,由此衍生的应用级渲染技术包括AI渲染加速和华为云原生渲染引擎支持的离线光追渲染。

实时渲染场景服务于3D空间、数字孪生、实时设计和游戏等,主要分为现有3D应用无需修改直接上云和经过云原生优化后上云两套方案,分别包括3D应用实时渲染、云应用以及远程渲染、3D空间加速。

接下来介绍实时渲染场景下的云渲染技术,华为云通过提供云应用产品帮助实现现有应用直接上云,主要包括对CPU/GPU算力要求较高的3D设计类软件,这解决了软件下载安装耗时费力和销售价格昂贵的问题,例如CAD、CAE、CAM等设计、建模、仿真软件类软件。

41aaafa6907f1350a191900611077778.png

它的原理是利用Windows多会话技术来构建轻量级的隔离技术,使Windows Server同时服务多个客户端。它的优点是具备一定隔离能力,并且由于在虚拟机层面实现了多会话,每个会话都可以直接访问物理GPU。它本身是标准的Windows技术,和企业内部网络具备很好的互通性。缺点是GPU计算与显存处于多用户抢占模式,无法隔离。并且每个会话要独立付费Windows RDS License。

dc75dc29823d88871e2215605aced7e2.png

为了优化前面提到的License成本问题,我们通过将沙箱和Hook技术结合,让Windows不使用多会话技术运行多个应用,并服务于多个接入客户端,这也是目前云渲染的主流技术方案。它的优点是不依赖Windows多会话技术,降低了License成本,缺点是相对于GPU虚拟化,资源隔离能力有限。

bf2388f79d2198fc7fae86c96aefda6c.png

前面提到过的硬件GPU虚拟化也是一种主要的实现方式,但需要增加远程交互模块对3D应用进行管理。它的优势是隔离能力和兼容性好,缺点是Nvidia按照虚拟机单独收取License费用。

db944fc28d5aa4acb9c931566b6feb22.png

接下来对几种方案适用的场景进行介绍。选择云应用方案一般涉及强烈的企业内网互通(账号、权限)和应用兼容性诉求(2D、3D各种类型);选择3D应用实时渲染一般专注于3D渲染程序,如基于DirectX开发的3D展示应用、游戏等;GPU硬件虚拟化/物理直通方案一般配合云应用和3D应用实时渲染使用。

以上技术的共同点是把3D应用直接搬上云端进行计算,但单纯的云渲染能否实现应用不上云,仅渲染上云?

45032055ce31bb08cbf2732027181024.png

因此我们实现了一套基于云原生优化的上云方案,即远程渲染。它同时适用于Web、PC和移动端3D应用程序。应用程序实际在客户端侧运行,但渲染的计算被卸载,并通过远程渲染SDK在云端完成渲染,最终画面通过视频编码回传给端侧。

它的优点是云端只承担渲染职能,端侧的算力可以完成其他逻辑的运算,结合客户端实际情况还可以灵活选择本地、云端或混合渲染。缺点是应用需要基于远程渲染SDK进行改造,并且无法满足非常高的交互式实施场景需求(例如某些游戏)。

7eceaa7d63a67e20f2136b0f27b8d922.png

上图展示了用户使用远程渲染服务的具体流程。在开通服务并创建云渲染会话后,由远程SDK控制云端渲染,渲染后的画面通过华为RTC服务回传至客户端进行显示。

d85f9f40132eae8c5da7e237cfda2980.png

接下来对远程渲染效果进行演示。传统模式下,设计师需要通过离线渲染获得效果图后才能查看设计效果。利用华为云渲染,设计师可以实时查看设计效果,同时云端光追渲染可以更真实地还原现场光线环境。

bca1869ffdc9c64f041c57379c3954bb.png

那么渲染和云结合的具体优势是什么?和消费级显卡相比,云数据中心使用的硬件价格十分昂贵,高昂的造价实际带来了哪些利好呢?如上图所示,如果将云看做一个大机器,可以发现,云渲染支持同时服务于不同类型(手机、平板、主机等等)的多个用户,并且可提供一个应用能够被多用户使用的场景。它的硬件资源不绑定到用户,而是由用户使用时间决定。软件也无需在本地进行安装。

6f420f19aa06a009e0c419e241d1ff27.png

前面提到的几种3D应用上云方案本质上只是将本地程序部署上云,云仅仅提供本地资源的替代,计算资源按连接来调度,不同的应用间没有共享。

华为云通过对自研渲染引擎进行多用户接入改造实现了一些新的尝试,使单引擎在相同场景下可以同时接入多个用户,这种方式变相节省了部分场景加载的内存和显存,且用户之间共享的计算可以节省CPU、GPU。作为充分发挥云优势的云原生方案,它与前述的几种方案在本质上完全不同。经过实际测试,它可以提升0.5倍以上的效率。

-06-

工业图形渲染实践

接下来介绍我们在工业图形渲染领域的一些实践。工业图形渲染引擎可能与大家日常接触的渲染工作不同,它是计算机辅助设计(CAD)、计算机辅助制造(CAM)、计算机辅助工程(CAE)、建筑信息建模(BIM)等工业设计软件中的基础技术组件,决定了3D设计对象的真实呈现、保证前端设计的正确性。

cc78bb926be220323a3fc427391ffb40.png

目前国内缺乏自主研发的高质量工业图形渲染引擎,各大企业的自研引擎无法支持高质量和大场景图形渲染。业界较为出名的GPU渲染器基本都是国外的产品(如KeyShot和HOOP等)。

华为云在国家技术创新中心的支持下启动了工业图形渲染引擎研发项目,目标是历经2~3年的开发,产出达到世界先进水平的渲染引擎,满足CAD、CAE、CAM和EDA场景的工业图形渲染需求。

800ed27001a54cb51a9b00b1a4861d2b.png

上图展示了我们自研工业渲染管线近期的实时渲染效果,目前它已和部分中国三维CAD厂商完成了集成对接,2024年将陆续实现与其他企业设计软件的对接。

f6f64a65a6bc0173991802ebb2120a96.png

接下来对云端光追实时渲染进行展示,它侧重呈现材质、光影等效果。

-07-

AI加速渲染实践

ece4dbf0c4ecd128e703d48cb9640754.png

最后介绍华为云的AI加速离线渲染。我们原有的旧思路是通过自研渲染引擎来替代友商同类产品,由于生态壁垒过高,该思路并不可行。

现有离线渲染流程是客户端应用通过农场服务、农场调取器提交图形数据,确定计算节点并完成图形渲染。由于过程中的光追计算消耗量很大,导致整体所需时间也很长。因此我们希望通过引入AI技术对渲染进行加速,通过农场服务调整参数降低渲染的光追计算,从而降低纯CG端的计算,再通过专有的AI模型对渲染过程性输出CG数据进行AI推理计算。输出效果可以达到同等质量。

e6c3bf5d682bc79792033efc23b8fe7f.png

上图展示了华为云AI加速渲染的输出效果。可以看到,AI输出与原生渲染图在质量上基本一致。

114bff3708f68528348c40b09be9a616.png

上图展示了一个AI加速渲染影视番剧的实际案例。可以看到毛发等细节与原生渲染图基本一致,并且质量要求越高,提速效果越好。

接下来对我们的技术时间轴进行总结。2011年至今,我们的发展从2D渲染到自研3D空间云渲染,从GPU虚拟化到光追引擎和AI渲染加速,涉及的行业包括企业办公、数字人、影视、云游戏、工业设计等等。

我们的研发团队呈全球布局,依靠图形领域全球知名高校和产业基地,持续深耕云原生图形技术,支持产业升级。

352535cfb58c1b62da81efbfc3da7c96.png

接下来对我们的自研离线渲染视频进行演示,它主要面向家装设计场景,光影真实性比实时渲染更强,每帧渲染仅需要5~10秒。

80abf5b66b3ca0e92ab08d63bf5ce0c5.png

最后对我们的自研实时渲染进行视频演示,它基于华为自研渲染引擎构建。

本人认为渲染是技术也是工具,可以帮助用户达成预期效果的呈现,在此也希望与各位在座专家深入交流。我的分享就到这里,谢谢大家!


46d09a9a4de6ef73d07715fa5953b323.png

扫描图中二维码或点击“阅读原文 

直通LiveVideoStackCon 2023深圳站 8折购票通道

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/90022.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

百度“AI智障”到AI智能体验之旅

目录 前言一、百度PLATO1.抬杠第一名2.听Ta瞎扯淡3.TA当场去世了4.智障与网友的高光时刻 二、文心一言1.设计测试用例2.随意发问3.手机端约会神器 三、体验总结:四、千帆大模型 前言 最近收到了文心一言3.5大模型的内测资格,正巧之前也体验过它的前身&q…

Request对象和response对象

一、概念 request对象和response对象是通过Servlet容器(如Tomcat)自动创建并传递给Servlet的。 Servlet容器负责接收客户端的请求,并将请求信息封装到request对象中,然后将request对象传 递给相应的Servlet进行处理。类似地&…

SpringBoot入门篇1 - 简介和工程创建

目录 SpringBoot是由Pivotal团队提供的全新框架, 其设计目的是用来简化Spring应用的初始搭建以及开发过程。 1.创建入门工程案例 ①创建新模块,选择Spring初始化,并配置模块相关基础信息 ②开发控制器类 controller/BookController.jav…

短视频矩阵系统接口部署技术搭建

前言 短视频矩阵系统开发涉及到多个领域的技术,包括视频编解码技术、大数据处理技术、音视频传输技术、电子商务及支付技术等。因此,短视频矩阵系统开发人员需要具备扎实的计算机基础知识、出色的编程能力、熟练掌握多种开发工具和框架,并掌握…

全套解决方案:基于pytorch、transformers的中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据!

全套解决方案:基于pytorch、transformers的中文NLP训练框架,支持大模型训练和文本生成,快速上手,海量训练数据! 1.简介 目标:基于pytorch、transformers做中文领域的nlp开箱即用的训练框架,提…

开源网安受邀参加软件供应链安全沙龙,推动企业提升安全治理能力

​8月23日下午,合肥软件行业软件供应链安全沙龙在中安创谷科技园举办。此次沙龙由合肥软件产业公共服务中心联合中安创谷科技园公司共同主办,开源网安软件供应链安全专家王晓龙、尹杰受邀参会并带来软件供应链安全方面的精彩内容分享,共同探讨…

政府网站定期巡检:构建高效、安全与透明的数字政务

在数字时代,政府网站已不仅仅是一个信息发布窗口,更是政府与公众互动的桥梁、政务服务的主要渠道以及数字化治理的重要平台。因此,确保政府网站的高效运行、信息安全与透明公开就显得尤为重要。在此背景下,定期的网站巡检与巡查成…

xfs ext4 结合lvm 扩容、缩容 —— 筑梦之路

ext4 文件系统扩容、缩容操作 扩容系统根分区 根文件系统在 /dev/VolGroup/lv_root 逻辑卷上,文件系统类型为ext4,大小为10G,现在要将其扩容成20G。 给空闲空间分区# 调整分区类型为LVM,也就是8e类型 fdisk /dev/sdb# 选定分区后使…

2023年高教社杯 国赛数学建模思路 - 案例:FPTree-频繁模式树算法

文章目录 算法介绍FP树表示法构建FP树实现代码 建模资料 ## 赛题思路 (赛题出来以后第一时间在CSDN分享) https://blog.csdn.net/dc_sinor?typeblog 算法介绍 FP-Tree算法全称是FrequentPattern Tree算法,就是频繁模式树算法&#xff0c…

JavaScript函数调用其他函数

在JavaScript中,函数可以调用其他函数。这通常被称为函数组合,它允许你通过将较简单的函数组合在一起来创建更复杂的功能。 例如:还是以之前的水果加工举例,但是现在我们需要输出,这个苹果有几块,橘子有几块…

计算机竞赛 基于大数据的时间序列股价预测分析与可视化 - lstm

文章目录 1 前言2 时间序列的由来2.1 四种模型的名称: 3 数据预览4 理论公式4.1 协方差4.2 相关系数4.3 scikit-learn计算相关性 5 金融数据的时序分析5.1 数据概况5.2 序列变化情况计算 最后 1 前言 🔥 优质竞赛项目系列,今天要分享的是 &…

基于Java的旅游信息推荐系统设计与实现,springboot+vue,MySQL数据库,前后端分离,完美运行,有三万字论文。

基于Java的旅游信息推荐系统设计与实现,springbootvue,MySQL数据库,前后端分离,完美运行,有三万字论文。 前台主要功能:登录注册、旅游新闻、景区信息、美食信息、旅游线路、现在留言、收藏、预定旅游线路…

CAD打开对象捕捉设置的快捷键是什么?

CAD打开对象捕捉设置的快捷键是什么呢?今天就教大家如何操作。 方法 打开对象捕捉设置的快捷命令:SE。空格确定即可。 也可以输入快捷命令:DS也一样可以打开对象捕捉设置。血糖测试仪什么牌子好?盘点血糖检测仪的三大品牌! | 共…

visual studio 2022.NET Core 3.1 未显示在目标框架下拉列表中

问题描述 在Visual Studio 2022我已经安装了 .NET core 3.1 并验证可以运行 .NET core 3.1 应用程序,但当创建一个新项目时,目标框架的下拉列表只允许 .NET 6.0和7.0。而我在之前用的 Visual Studio 2019,可以正确地添加 .NET 核心项目。 …

【附源码】Axure RP Pro8.0安装教程|HTML|网页设计

软件下载 软件:Axure版本:8.0语言:简体中文大小:82.53M安装环境:Win11/Win10/Win8/Win7硬件要求:CPU2.0GHz 内存4G(或更高)下载通道①百度网盘丨下载链接:https://pan.baidu.com/s/…

力扣:74. 搜索二维矩阵(Python3)

题目: 给你一个满足下述两条属性的 m x n 整数矩阵: 每行中的整数从左到右按非递减顺序排列。每行的第一个整数大于前一行的最后一个整数。 给你一个整数 target ,如果 target 在矩阵中,返回 true ;否则,返…

C语言基础之——数组

前言:本篇文章,我们将对一维数组,和二维数组进行展开式的讲解,并进行实际应用。 目录 一.一维数组 1.一维数组的创建和初始化 (1)数组的创建 (2)数组的初始化 2.一维数组的使用…

Leetcode76. 最小覆盖子串

给你一个字符串 s 、一个字符串 t 。返回 s 中涵盖 t 所有字符的最小子串。如果 s 中不存在涵盖 t 所有字符的子串,则返回空字符串 "" 。 注意: 对于 t 中重复字符,我们寻找的子字符串中该字符数量必须不少于 t 中该字符数量。如果…

windows系统服务器在不解锁屏幕不输入密码的前提下,电脑通电开机启动程序。

在控制面板中找到“管理工具”中的 “任务计划程序”,打开“任务计划程序”窗口。如图: 双击打开任务计划程序,空白出右键创建基本任务,或者点击最右侧的创建基本任务。 输入名称,点击下一步。 先选择计算机启动时&a…

linux 性能分析之内存分析(free,vmstat,top,ps,pmap等工具使用介绍)

引言 学生时代经常听到老师和同学说到学习 linux 的重要性。但是当时看到这个命令行界面就头疼,也就草草地应付学了一下,哎嘛,还是游戏香! 但是当前两天自己捣鼓服务器的时候,发现自己部署的一个服务总是崩溃&#x…