《WebKit 技术内幕》之七(4): 渲染基础

4 WebKit软件渲染技术

4.1 软件渲染过程

        在很多情况下,也就是没有那些需要硬件加速内容的时候(包括但不限于CSS3 3D变形、CSS3 03D变换、WebGL和视频),WebKit可以使用软件渲染技术来完成页面的绘制工作(除非读者强行打开硬件加速机制),目前用户浏览的很多门户网站、论坛网站、社交网站等所设计的网页,都是采用这项技术来完成页面的渲染。

        要分析软件渲染过程,需要关注两个方面,其一是RenderLayer树,其二是每个RenderLayer所包含的RenderObject子树。首先来看WebKit如何遍历RenderLayer树来绘制各个层。

        对于每个RenderObject对象,需要三个阶段绘制自己,第一阶段是绘制该层中所有块的背景和边框,第二阶段是绘制浮动内容,第三阶段是前景(Foreground),也就是内容部分、轮廓(它是CSS标准属性,绘制于元素周围的一条线,位于边框边缘的外围)等部分。当然,每个阶段还可能会有一些子阶段。值得指出的是,内嵌元素的背景、边框、前景等都是在第三阶段中被绘制的,这是不同之处。

        下图描述了一个RenderLayer层是如何绘制自己和子女的,这一过程是一个递归过程。图中的函数名未来可能会发生变化,所以读者更多关注它们的含义。图中的调用顺序可以作如下理解:这里主要节选了一些重要步骤,事实上这一绘制过程还可能包含其他一些相对较小的步骤。图中有些步骤的操作并不是总是发生。这里是一个大致的过程,下面是详细分析。

                                图 绘制RenderLayer和它的子女的调用过程

  1. 对于当前的RenderLayer对象而言,WebKit首先绘制反射层(Reflectionlayer),这是由CSS定义的。
  2. 然后WebKit开始绘制RenderLayer对象对应的RenderObject节点的背景层(PaintBackground-ForFragments),也就是调用“PaintPhaseBlockBackground”函数,读者记住这里仅是绘制该对象的背景层,而不包括RenderObject的子女。其中“Fragments”的含义是可能绘制的几个区域,因为网页需要更新的区域可能不是连续的,而是多个小块,所以WebKit绘制的时候需要更新这些非连续的区域即可,下面也是一样的道理。
  3. 图中的“paintList”(z坐标为负数的子女层)阶段负责绘制很多Z坐标为负数的子女层。这是一个递归过程。Z坐标为负数的层在当前RenderLayer对象层的后面,所以WebKit先绘制后面的层,然后当前RenderLayer对象层可能覆盖它们。
  4. 图中“PaintForegroundForFragments()”这个步骤比较复杂,包括以下四个子阶段:首先进入“PaintPhaseChildBlockBackground”阶段,WebKit绘制RenderLayer节点对应的RenderObject节点的所有后代节点的背景,如果某个被选中的话,WebKit改为绘制选中区域背景(网页内容选中的时候可能是另外的颜色);其次,进入“PaintPhaseFloat”绘制阶段,WebKit绘制浮动的元素;再次,进入“PaintPhaseForeground”阶段,WebKit绘制RenderObject节点的内容和后代节点的内容(如文字等);最后,进入“PaintPhaseChildOutlines”绘制阶段,WebKit的目的是绘制所有后代节点的轮廓。
  5. 进入“PaintOutlineForFragments”步骤。WebKit在该步骤中绘制RenderLayer对象对应的RenderObject节点的轮廓(PaintPhaseOutline)。
  6. 进入绘制RenderLayer对象的子女步骤。WebKit首先绘制溢出(Overflow)的RenderLayer节点,之后依次绘制Z坐标为正数的RenderLayer节点。
  7. 进入该RenderObject节点的滤镜步骤。这是CSS标准定义在元素之上的最后一步。

        上面是从RenderLayer节点和它所包含的RenderObject子树来解释软件绘图这一过程,那么对于RenderLayer树包含的每个RenderObject而言,它们是如何被处理的呢?

        因为RenderObject类有很多子类,每个子类都不一样,不过很多子类的绘制其实比较简单,所以,为了能比较清楚地说明RenderObject绘制的过程,这里以典型的RenderBlock类为例来说明,因为它是以框模型为基础的类,下图给出了绘制RenderBlock类的过程。

                        图RenderBlock类的绘制过程

        在上图中,“paint”是RenderObject基类的绘图函数,用来绘制该对象的入口函数,在RenderBlock类中,它被重新实现了。一个RenderObject类的“paint”函数在绘制时可能会被多次调用,因为不同的绘制阶段(前面的一张图提到的)都需要调用它来绘制不同的部分,所以读者会发现上图右侧标记了在哪些阶段才会调用该绘制函数(或者是哪些阶段该函数不会被调用),至于这些阶段的顺序则是由RenderLayer对象中的调用过程来控制的。

        图中的“paintContents”函数主要用来遍历和绘制它的子女,在某些情况下,WebKit其实并不需要该函数,例如RenderLayer对象仅需要绘制对应的RenderObject子树的根节点的时候。

        对于其他类型的节点,绘制过程大致是这一过程的一个子集。例如RenderText类没有子女,也不需要绘制框模型的边框等,所以WebKit仅需要绘制自己的内容。

        在上面这一过程中,Webkit所使用的绘图上下文都是2D的,因为没有GPU加速,所以3D的绘图上下文没有办法工作。这意味着,每一层上的RenderObject子树中不能包含使用3D绘图的节点,例如Canvas 3D(WebGL)节点等。同时,每个RenderLayer层上使用的CSS 3D变形等操作也没有办法得到支持。

        最开始的时候,也就是WebKit第一次绘制网页的时候,WebKit绘制的区域等同于可视区域大小。而这在之后,WebKit只是首先计算需要更新的区域,然后绘制同这些区域有交集的RenderObject节点。这也就是说,如果更新区域跟某个RenderLayer节点有交集,WebKit会继续查找RenderLayer树中包含的RenderObject子树中的特定一个或一些节点,而不是绘制整个RenderLayer对应的RenderObject子树。下图描述了在软件渲染过程中WebKit实际更新的区域,也就是之前描述软件渲染过程的生成结果。

                                       图WebKit绘制网页的更新区域

          WebKit软件渲染结果的储存方式,在不同的平台上可能不一样,但是基本上都是CPU内存的一块区域,多数情况下是一个位图(Bitmap)。至于这个位图如何处理,如何跟之前绘制的结果合并,如何显示出来,都跟WebKit的不同移植相关。下面介绍一下Chromium是如何处理的。

4.2 Chromium的多进程软件渲染技术

        在Chromium的设计和实现中,因为设计者引入了多进程模型,所以Chromium需要将渲染结果从Renderer进程传递到Browser进程。

        先来看看Renderer进程。前面介绍了WebKit的Chromium移植的接口类是RenderViewImpl,该类包含一个用于表示一个网页的渲染结果的WebViewImpl类。其实,RenderViewImpl类还有一个作用就是同Browser进程通信,所以它继承自RenderWidget类。RenderWidget类不仅负责调度页面渲染和页面更新到实际的WebViewImpl类等操作,而且它负责同Browser进程的通信。另一个重要的设施是PlatformCanvas类,也就是SkiaCanvas(Skia是一个2D图形库),RenderObject树的实际绘制操作和绘制结果都由该类来完成,它类似于2D绘图上下文和后端存储的结合体。

        再来看看Browser进程。第一个设施就是RenderWidgetHost类,一样的必不可少,它负责同Renderer进程的通信。RenderWidgetHost类的作用是传递Browser进程中网页操作的请求给Renderer进程的RenderWidget类,并接收来自对方的请求。第二个是BackingStore类,顾名思义,它就是一个后端的存储空间,它的大小通常就是网页可视区域的大小,该空间存储的数据就是页面的显示结果。BackingStore类的作用很明显,第一,它保存当前的可视结果,所以Renderer进程的绘制工作不会影响该网页结果的显示;第二,WebKit只需要绘制网页的变动部分,因为其余的部分保存在该后端存储空间,Chromium只需要将网页的变动更新到该后端存储中即可。

        最后来看看这两个进程是如何传递信息和绘制内容的。两个进程传递绘制结果是通过TransportDIB类来完成,该类在Linux系统下其实是一个共享内存的实现。对Renderer进程来说,Skia Canvas把内容绘制到位图中,该位图的后端即是共享的CPU内存。当Browser进程接收到Renderer进程关于绘制完成的通知消息,Browser进程会把共享内存的内容复制到BackingStore对象中,然后释放共享内存。

        Browser进程中的后端存储最后会被绘制在显示窗口中,用户就能够看到网页的结果。下图显示的是软件渲染的架构图,其思想主要来源于Chromium的官方网站,但这里做了一些扩充。

                        图Chromium的多进程软件渲染结构图

        根据上面的组成部分,一个多进程软件渲染过程大致是这样的:RenderWidget类接收到更新请求时,Chromium创建一个共享内存区域。然后Chromium创建Skia的SkCanvas对象,并且RenderWidget会把实际绘制的工作派发给RenderObject树。具体来讲,WebKit负责遍历RenderObject树,每个RenderObject节点根据需要来绘制自己和子女的内容并存储到目标存储空间,也就是SkCanvas对象所对应的共享内存的位图中。最后,RenderWidgetHost类把位图复制到BackingStore对象的相应区域中,并调用“Paint”函数来把结果绘制到窗口中。

        后面我们会介绍在哪些时候请求绘制网页内容,这里先了解两种会触发重新绘制网页中某些区域的请求,如下面所示。

  • 前端请求: 该类型的请求从Browser进程发起的请求,可能是浏览器自身的一些需求,也有可能是X窗口系统(或者其他窗口系统)的请求。一个典型的例子就是用户因操作网页引起的变化。
  • 后端请求: 由于页面自身的逻辑而发起更新部分区域的请求,例如HTML元素或者样式的改变、动画等。一个典型的例子是JavaScript代码每隔50ms便会更新网页样式,这时样式更新会触发部分区域的重绘。

        下面逼仄来解释一下当有绘制或者更新某个区域的请求时,Chromium和WebKit是如何来处理这些请求的。具体过程下图所示,下面是其中主要的步骤。

                                图Chromium的软件渲染过程

  1. Renderer进程的消息循环(Message Loop)调用处理“界面失效”的回调函数,该函数主要调用RenderWidget::DoDeferredUpdate来完成绘制请求。
  2. RenderWidget::DoDeferredUpdate函数首先调用Layout函数来触发检查是否有需要重新计算的布局和更新请求。
  3. RenderWidget类调用TransportDIB类来创建共享内存,内存大小为绘制区域的高×宽×4,同时调用Skia图形库来创建一个SkCanvas对象。SKCanvas对象的绘制目标是一个使用共享内存存储的位图。
  4. 当渲染该页面的全部或者部分时,ScrollView类请求按照从前到后的顺序遍历并绘制所有RenderLayer对象的内容到目标的位图中。Webkit绘制每个RenderLayer对象通过以下步骤来完成:首先Webkit计算重绘的区域是否和RenderLayer对象有重叠,如果有,Webkit要求绘制该层中的所有RenderObject对象。图7-14中省略了该部分的具体内容,详情请参考代码。
  5. 绘制完成后,Renderer进程发送UpdateRect的消息给Browser进程,Renderer进程同时返回以完成渲染的过程。Browser进程接收到消息后首先由BackingStoreManager类来获取或者创建BackingStoreX对象(在Linux平台上),BackingStoreX对象的大小与可视区域相同,包含整个网页的坐标信息,它根据UpdateRect的更新区域的位置信息将共享内存的内容绘制到自己的对应存储区域中。

        最后Browser进程将UpdateRect的回复消息发送到Renderer进程,这是因为Renderer进程知道Browser进程已经使用完该共享内存,可以进行回收利用等操作,这样就完成了整个过程。

        细心的读者其实可以发现,这一过程需要一些内存方面的拷贝,这是因为网页的渲染和网页的显示是在两个不同的进程,而这些拷贝在下一章介绍的硬件加速渲染机制中可以避免。当然,硬件加速渲染机制也引入一些其他方面的问题。

4.3 实践:软件渲染过程

        为了直接理解Chromium的多进程软件渲染过程,本节中笔者使用Chromium项目提供的“about:tracing”工具来分析,该工具可以收集Chromium内部函数调用的时间分布等信息。具体步骤如下。

  1. 使用Chrome浏览器打开标签页输入“chrome://flags”,找到选项“对所有网页执行GPU合成Mac, Windows, Linux”,选择“停用”,这样确保使用了软件渲染机制。
  2. 打开网页http://www.chromium.org/developers/design-documents,并打开一个新的标签页,输入“chrome://tracing”。
  3. 在标签页“chrome://tracing”中单击“record”按钮并切换到第二步打开的网页“Design Document”,重新加载该网页,之后再切换到“chrome://tracing”标签页中,单击“stop tracing”按钮,这样数据收集完毕,读者会发现有很多如下图中下面的图层所示的信息,它们表示的是浏览器的各个进程和线程的信息。

                          图浏览器“chrome://tracing”结果和任务管理器

  1. 单击浏览器地址栏最右侧的“设置”按钮,选择“工具->任务管理器”,读者会发现三个任务(如果读者的浏览器没有安装其他Chrome扩展或者启动插件等),这三个任务分别是网页“Design Documents”(Renderer进程1)、标签页“chrome://tracing”(Renderer进程2)和浏览器(Browser进程)。下图中显示的任务管理器,读者看到三个任务的进程ID同“chrome://tracing”中一一对应。下面首先分析进程2312。
  2. 在进程2312中,选择线程“CrRendererMain”,通过放大数据图,读者可以看到下图所示的信息,这是Chromium的多进程模型绘制网页使用的一些函数和它们消耗的时间,读者可以将这些函数同图7-14中的Renderer进程中的调用过程作对比。

                               图“Design Documents”网页对应的Renderer进程

  1. 在进程3660中,选择线程“CrBrowserMain”,在Renderer进程完成图7-16中的操作之后,通过放大数据图,读者可以看到如图7-17所示的信息,这是Chromium更新共享内存的数据并把数据绘制到BackingStore对象中,最后绘制到窗口。读者同样可以将这些函数同下图中的Browser进程的调用过程作对比。

                        图“Design Documents”网页对应的Renderer进程

        至此,WebKit的基础部分已介绍完毕。通过前面的分析和介绍,读者应该可以对网页的基本知识和基本的渲染过程有了一些了解。同时,结合Chromium的实现,读者应该理解浏览器是如何使用WebKit和扩展浏览器能力的。当然,WebKit的能力远不止这些,在高级篇中会介绍更多有关WebKit的高级技术。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/338954.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Unity学习-逐帧图集动画制作

首先在文件部分创建一个Sprite Library Asset 然后点击创建出来的文件 点下面的加号添加对应的图 添加完成之后点一下Apply 然后新建一个物体 添加这三个组件 其中SpriteLibrary里面 把你刚刚创建的图集文件拉过来 Sprite Resolver选择对应的动作和图片 然后开始制作动画 An…

如何用“VMware安装Ubuntu”win11系统?

一、 下载Ubuntu 企业开源和 Linux |Ubuntu的 二、 安装 三、 启动虚拟机 选中Try or Install Ubuntu Server,按回车

【QT+QGIS跨平台编译】之三:【OpenSSL+Qt跨平台编译】(一套代码、一套框架,跨平台编译)

文章目录 一、OpenSSL介绍二、OpenSSL配置三、Window环境下配置四、Linux环境下配置五、Mac环境下配置 一、OpenSSL介绍 OpenSSL是一个开放源代码的软件库包,应用程序可以使用这个包来进行安全通信,避免窃听,同时确认另一端连接者的身份。这…

基于 Redis 实现高性能、低延迟的延时消息的方案演进

🎉欢迎来系统设计专栏:基于 Redis 实现高性能、低延迟的延时消息的方案演进 📜其他专栏:java面试 数据结构 源码解读 故障分析 🎬作者简介:大家好,我是小徐🥇☁️博客首页&#xff1…

HCIA vlan练习

目录 实验拓扑 实验要求 实验步骤 1、交换机创建vlan 2、交换机上的各个接口划分到对应vlan中 3、trunk干道 4、路由器单臂路由 5、路由器DHCP设置 实验测试 华为交换机更换端口连接模式报错处理 实验拓扑 实验要求 根据图划分vlan,并通过DHCP给主机下发…

Tomcat的maxParameterCountmaxPostSize参数

Tomcat的maxParameterCount&maxPostSize参数 Tomcat的maxParameterCount&maxPostSize参数1.问题1.1问题现象1.2 参数总结1.3 问题总结 2 Tomcat官网的解释2.1 到https://tomcat.apache.org/找到文档入口2.2 找到文档的Reference2.3 查看配置文件的参数 3 文档看不明白&…

上位机图像处理和嵌入式模块部署(开篇)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 图像处理是现实生活当中很实用的一门技术。工业上一般采用的是机器视觉,以传统算法和光源控制为主,部分采用了深度学习技术…

回溯算法理论基础

回溯算法介绍 回溯算法与递归函数相辅相成,它是一种纯暴力搜索,可以使用剪枝等方式进行优化 解决问题 组合问题切割问题子集问题排列问题棋盘问题 可视化理解 可以理解为一种 n 叉树型结构,树的最大宽度为遍历的元素数量,树的…

vivado JTAG链、连接、IP关联规则

JTAG链 这列出了定义板上可用的不同JTAG链。每个链都列在下面<jtag_chain>以及链的名称&#xff0c;以及定义名称和链中组件的位置&#xff1a; <jtag_chains> <jtag_chain name"chain1"> <position name"0" component"part0…

MySQL不同插入方式性能对比实验

最近负责的项目需要数据同步入库MySQL&#xff0c;为了测速那种入库方式效率比较高&#xff0c;为此进行了以下的对比实验&#xff0c;在此记录一下 实验表单数据格式 实验代码 共三种方法对比 mutiSqlInsert: 一条一条插入&#xff0c;最后一次提交 singleSqlInsert&…

黑马苍穹外卖Day10学习

文章目录 Spring Task介绍cron表达式入门案例 订单状态定时处理需求分析代码开发功能测试 WebSocket介绍入门案例 来单提醒需求分析代码开发 客户催单需求分析代码开发 Spring Task 介绍 cron表达式 入门案例 订单状态定时处理 需求分析 代码开发 新建一个task包里面编写代码…

像 Google SRE 一样 OnCall

在 Google SRE 的著作《Google运维解密》(原作名&#xff1a;Site Reliability Engineering: How Google Runs Production Systems)中&#xff0c;Google SRE 的关键成员们几乎不惜用了三个章节的篇幅描述了在 Google 他们是如何 OnCall 的。 Google SRE 实践中&#xff0c;有…

HFSS笔记/信号完整性分析(二)——软件仿真设置大全

文章目录 1、多核运算设置1.1 如何设置1.2 如何查看自己电脑的core呢&#xff1f;1.3 查看求解的频点 2、求解模式设置Driven Terminal vs Driven modal 3、Design settings4、自适应网格划分5、更改字体设置 仅做笔记整理与分享。 1、多核运算设置 多核运算只对扫频才有效果&…

Django 图片上传与下载

写在前面 在Web开发中&#xff0c;文件上传和下载是常见的功能之一。 Django 是一位魔法师&#x1fa84;&#xff0c;为我们提供了 FileField 和 ImageField 等神奇得字段类型&#xff0c;以及相应的视图和模板标签&#xff0c;使得处理文件变得十分便捷。本文以图片上传作为…

GPT-4 的决策在股市中进行量化投资

论文题目:Can Large Language Models Beat Wall Street? Unveiling the Potential of AI in Stock Selection 论文链接:https://arxiv.org/abs/2401.03737 博客地址:https://www.marketsense-ai.com/ 从本质上来说&#xff0c;股票选择是个价格发现机制&#xff0c;在股票投…

深入解析ESP32C3(2)- 存储类型和地址空间

ESP32C3芯片的存储资源 • 384 KB 的ROM&#xff1a;用于程序启动和内核功能调用 • 400 KB 片上SRAM&#xff1a;用于数据和指令存储&#xff0c;时钟频率可配置&#xff0c;最大160 MHz。400 KB SRAM 中&#xff0c;有16 KB 配置为cache 专用 • RTC 快速存储器&#xff1a;…

VC++中使用OpenCV进行形状和轮廓检测

VC中使用OpenCV进行形状和轮廓检测 在VC中使用OpenCV进行形状和轮廓检测&#xff0c;轮廓是形状分析以及物体检测和识别的有用工具。如下面的图像中Shapes.png中有三角形、矩形、正方形、圆形等&#xff0c;我们如何去区分不同的形状&#xff0c;并且根据轮廓进行检测呢&#…

初学python系列: pandas操作excel

媳妇工作中经常用到excel处理&#xff0c;想用python处理excel更高效&#xff0c;所以自学了python&#xff0c;觉得python比Java还是简单多了&#xff0c;没有变量类型声明&#xff0c;比Java也就多了元组&#xff0c;各种库很丰富。 需求是&#xff1a; 汇总两个excel中 列&…

【MySQL】一文总结MVCC多版本并发控制

目录 MVCC 介绍当前读和快照读当前读快照读 MVCC 原理解析隐式字段Undo Log版本链Read ViewRead View 可见性原则 RC 和 RR 下的 Read ViewRC 下的 Read ViewRR 下的 Read View小结RR 级别下能否防止幻读总结 MVCC 介绍 在当今高度并发的数据库环境中&#xff0c;有效的并发控…

系统架构设计师教程(十二)信息系统架构设计理论与实践

信息系统架构设计理论与实践 12.1 信息系统架构基本概念及发展12.1.1 信息系统架构的概述12.1.2 信息系统架构的发展12.1.3 信息系统架构的定义 12.2 信息系统架构12.2.1 架构风格12.2.2 信息系统架构分类12.2.3 信息系统架构的一般原理12.2.4 信息系统常用4种架构模型12.2.5 企…