除了 CPU(中央处理器)以外,SoC(System On a Chip:片上体系)另一个重要的组成部分是图画处理单元(Graphical Processing Unit),便是俗称的 GPU。咱们或许都知道玩 3D 游戏少不了它,但详细发挥什么作用或许说不清楚,这回咱们就来揭开 GPU 的奥秘面纱。
GPU 专门用于快速完结一些特定类型的数学运算,特别是关于浮点、矢量和矩阵的核算,能将 3D 模型的信息转化为 2D 表明,一起增加不同的纹路和暗影作用,所以 GPU 在硬件里也是比较特别的存在。
3D 模型是由许许多多小三角形组成的,经过 X、Y、Z 坐标界说每个三角形的极点。实践处理中,小三角形的极点会彼此重合,假如一个杂乱的模型由 500 个小三角形组成,终究需求界说的极点数并没有 1500 个那么多。而要将一个笼统的 3D 模型展示出来,三种要素不行短少:位移、旋转(三轴)和缩放,全部这些操作统称为转化(transformation)。为了不堕入杂乱繁琐的数学运算,处理转化(transformation)最佳的方法便是运用 4×4 的矩阵。
从 3D 建模到终究显现在屏幕上,GPU 烘托场景运用的是流水线操作。早些时候流水线操作是固定不能作任何改动的,整个操作由读取三角形的极点数据开端,接着 GPU 处理完后进入帧缓冲区(frame buffer),预备发送给显现器。GPU 也能对场景进行某些特定作用的处理,不过这些都是由工程师规划固定好的,能供给的选项很少。
可编程着色器(Programmable shaders)
在 Android 仍在萌发之时,桌面级的 GPU 就开端能够对流水线部分的操作进行编程。跟着 OpenGL ES 2.0 规范的推出,移动版的 GPU 也开端支撑可编程操作,这些可编程的部分被称作着色器(shaders),最重要的两个着色器是极点着色器(vertex shader)和片段着色器(fragment shader)。每个极点都会调用一次极点着色器,所以在烘托一个三角形时极点着色器需求被调用三次;而片段着色器,咱们能够简略的将每个片段(fragment)幻想成屏幕上的每一个像素点,因而每生成一个像素片段着色器就被会调用一次。
两个着色器充任不同的人物,极点着色器首要担任将 3D 模型的数据转化为实践国际中的方位以及纹路贴图或许光源,再进行转化(transformation);片段着色器则用于为每个像素设置相关的色彩。简略一点的阐明:极点着色器便是处理极点相关的信息,片段着色器便是处理画面的色彩信息。
仔细观察你会注意到每个极点的处理都是彼此独立的,相同每个片段的处理也是如此,这意味着 GPU 能够并行运转着色器,现实上 GPU 也是这么干的,绝大多数的移动 GPU 都有多个着色器中心(可编程履行着色器功用的独立单元称之为着色器中心),至于 GPU 厂商声称关于着色器调用优于别家则归于市场营销的问题了。
以 ARM 的 Mali GPU 为例,其系列 GPU 称号后缀的“MPx”中的 x 代表有多少个着色器中心,Mali T880 MP12 就代表有 12 个着色器中心。每一个中心里边都有一条杂乱的流水线,代表着每完结一个着色器操作,新的操作指令就会马上宣布,一起中心里边不止一个算术单元,所以在相同的时刻内能完结多个操作。ARM Mali GPU(包含 Mali T600、T700 和 T800 系列)能在每一条流水线每个时钟周期宣布一条指令,所以一个典型的着色器中心能并行宣布 4 条指令,Mali GPU 现在最高支撑 16 个中心,也便是说能够并行宣布最多 64 条指令。
全部的全部意味着 GPU 是并行处理很多数据的工作方法,与 CPU 十分不同,不是一般的次序操作。但这仅仅一个小问题,严峻的现实在于可编程的着色器中心代表着每个中心的实践体现不再由 GPU 工程师设定好,而是取决于 app 开发者。所以一个质量较差的着色器代码能让 GPU 的体现直线下降,走运的是大多数的 3D 游戏开发者都理解这个道理,会为着色器运转做最佳的优化。