文章目录
- 一、概述
- 二、硬件绘制与软件绘制模型
- 三、软件绘制刷新的逻辑
- 四、总结
- 五、参考
一、概述
从 Android 3.0(API 级别 11)开始,Android 2D 渲染管道支持硬件加速,也就是说,在 View 的画布上执行的所有绘制操作都会使用 GPU。启用硬件加速需要更多资源,因此应用会占用更多内存。
硬件加速的主要原理:通过将CPU不擅长的图形计算转换成GPU专用指令,让更擅长图形计算的GPU来完成渲染,从而提升了整体的渲染速度。
关联文章:
- 渲染机制(一):Android渲染机制的演进
- 渲染机制(二):Choreographer 源码解析
- 渲染机制(三):Vsync信号
- 渲染机制(四):硬件加速
页面渲染背景知识:
- 页面渲染时,被绘制的元素最终要转换成矩阵像素点(即多维数组形式,类似安卓中的Bitmap),才能被显示器显示。
- 页面由各种基本元素组成,例如圆形、圆角矩形、线段、文字、矢量图(常用贝塞尔曲线组成)、Bitmap等。
- 元素绘制时尤其是动画绘制过程中,经常涉及插值、缩放、旋转、透明度变化、动画过渡、毛玻璃模糊,甚至包括3D变换、物理运动(例如游戏中常见的抛物线运动)、多媒体文件解码(主要在桌面机中有应用,移动设备一般不用GPU做解码)等运算。
- 绘制过程经常需要进行逻辑较简单、但数据量庞大的浮点运算。
二、硬件绘制与软件绘制模型
- 从上图结构可以看出,CPU的控制器较为复杂,而ALU数量较少。因此CPU适合进行复杂的逻辑运算,但不擅长数学尤其是浮点运算。
- 和CPU不同的是,GPU就是为实现大量数学运算设计的。从结构图中可以看到,GPU的控制器比较简单,但包含了大量ALU。GPU中的ALU使用了并行设计,且具有较多浮点运算单元。
- 硬件加速的主要原理,就是通过底层软件代码,将CPU不擅长的图形计算转换成GPU专用指令,由GPU完成。
扩展:独显与集显 (GPU是显卡的重要组成部分)。
独显:计算机中的GPU 有独立显存,显存可以保存GPU指令等信息。
集显:没有独立显存则使用共享内存的形式,从内存中划分一块区域作为显存,显存可以保存GPU指令等信息。
三、软件绘制刷新的逻辑
-
默认情况下,View的clipChildren属性为true,即每个View绘制区域不能超出其父View的范围。如果设置一个页面根布局的clipChildren属性为false,则子View可以超出父View的绘制区域。
-
当一个View触发invalidate,且没有播放动画、没有触发layout的情况下:
-
对于全不透明的View,其自身会设置标志位PFLAG_DIRTY,其父View会设置标志位PFLAG_DIRTY_OPAQUE。在draw(canvas)方法中,只有这个View自身重绘。
-
对于可能有透明区域的View,其自身和父View都会设置标志位PFLAG_DIRTY。
- clipChildren为true时,脏区会被转换成ViewRoot中的Rect,刷新时层层向下判断,当View与脏区有重叠则重绘。如果一个View超出父View范围且与脏区重叠,但其父View不与脏区重叠,这个子View不会重绘。
- clipChildren为false时,ViewGroup.invalidateChildInParent()中会把脏区扩大到自身整个区域,于是与这个区域重叠的所有View都会重绘。
-
四、总结
-
CPU更擅长复杂逻辑控制,而GPU得益于大量ALU和并行结构设计,更擅长数学运算。
-
页面由各种基础元素(DisplayList)构成,渲染时需要进行大量浮点运算。
-
硬件加速条件下,CPU用于控制复杂绘制逻辑、构建或更新DisplayList;GPU用于完成图形计算、渲染DisplayList。
-
硬件加速条件下,刷新界面尤其是播放动画时,CPU只重建或更新必要的DisplayList,进一步提高渲染效率。
-
实现同样效果,应尽量使用更简单的DisplayList,从而达到更好的性能(Shape代替Bitmap等)。
五、参考
- Android硬件加速原理与实现简介
- Android硬件加速从基础到原理
- 硬件加速