简介
ARM Cortex-A 移动运用处理器产品线横跨了几代产品和三个首要产品类别。有些开发人员和 SoC 规划人员阅历了一款或多款新式 ARM 处理器的推出进程,他们知道该产品线怎么从单个高功用通用 CPU 规划演进成为三个不同产品线,别离面向高端、中端、入门级的移动设备 SoC 商场,这让他们收获颇丰。
Cortex-A8
ARM 在 2005 年向商场推出 Cortex-A8 处理器,是第一款支撑 armv7-a 架构的处理器。ARMv7 包含 3 个要害要素:NEON 单指令多数据 (SIMD) 单元、ARM trustZone 安全扩展、以及thumb2 指令集,经过 16 位和 32 位混合长度指令以减小代码长度。Cortex-A8 是 ARM 完成的第一个根据新ISA的超标量处理器:它完成了彻底双发射流水线,这意味着 cortex-a8 可以一起发出在指令流中先后呈现的任何两个没有数据依靠的指令。可是,它不能乱序来发射或吊销指令 –该功用在之后的规划中才被完成。
当咱们推出 Cortex-A8 时,许多协作伙伴以为这款处理器放在移动电话上是大材小用,他们很自然地质疑道,“客户会在手机上阅览互联网?不太或许吧。”可是,咱们和业界一些首要思维首领协作,向客户将会需求的产品跨进,特别是由于当 Cortex-A8 在 2008 年投入批量生产时,高带宽无线连接 (3G ) 现已面世,大屏幕也用于移动设备。立异的移动职业充分运用了该产品:Cortex-A8 芯片的推出正好赶上了智能手机出货量陡增的大好时机。
Cortex-A9
推出 Cortex-A8 之后不久,ARM 又推出了首款多核 ARMv7 CPU:cortex-a9。Cortex-A9 运用硬件模块来办理 CPU 集群中一至四个中心之间的高速缓存一致性,加入了一个外部二级高速缓存。理论上,客户可以规划不包含二级缓存的小型版别 Cortex-A9,这种规划答应除掉办理高速缓存一致性的逻辑模块,以完成尺度更小的单核规划。但实践上,大多数规划都选用双核个或更多中心并顺便二级高速缓存。此外,在2011 年末和 2012 年头,当移动 SoC 规划人员可以选用多个中心之后,进步功用的打破点从进步单核功用搬运到进步核的数量。旗舰级高端移动 CPU敏捷从开端的双核拓扑结构移至四核 Cortex-A9。
除了敞开了多核功用大门之外,与 Cortex-A8 比较,每个 Cortex-A9 处理器的单时钟周期指令吞吐量进步了大约 25%。这个功用的提高是在坚持相似功耗和芯片面积的前提下, 经过缩短流水线并乱序履行以及在流水线前期阶段集成neon SIMD 和浮点功用而完成的。
Cortex-A15
跟着智能手机商场开端加快开展,ARM 再次预见到了不断开展的移动体系对芯片功用提出的更高要求。为此ARM开发了一款功用上大幅提高的处理器,用以专门针对新的高端移动商场。在现已十分强壮的 Cortex-A9 的基础上,ARM 凭仗 cortex-a15 又将功用进步了 50% 以上。此外,Cortex-A15 引进了一系列架构扩展,然后完成了更大物理地址空间、硬件虚拟化支撑和扩展一致性。在 32 位体系中内存被划分为 2GB 设备内存和 2GB 一般内存,当设备的 RAM 超出2GB的时分,具有更大的物理地址空间就变得反常重要。ARM和其他协作伙伴也一直在探究虚拟化技能在商务移动体系和自带设备中的用户操作体系以及相似运用情形进行探究。。扩展一致性在 big.LITTLE 处理器技能中被运用的酣畅淋漓,它供给了一种下降均匀功耗并在功耗受限的条件下优化到达最大功用的办法。
Cortex-A15 集群集成了监听操控单元 (SCU) 以完成硬件一致性,每个集群包含一至四个 CPU 中心,并集成二级高速缓存操控器 – Cortex-A15 之后的一切 ARM Cortex-A 系列 CPU 都沿用了这种拓扑结构。
在移动设备中不断打破功用极限
比较 Cortex-A 系列高端处理器的功用,可以看到自从 Cortex-A8 1GH 处理器在 2008 年上市以来,功用有了大幅提高。
一致性扩展机制,完成为 AMBA ACE, 使下图所示的big.little SoC成为或许。在 big.LITTLE 体系中,一般完成一个“大”CPU 集群,并对其进行调理以满意高功用的要求,一起对“小”的 CPU 集群进行调理,满意对高能效。在典型作业负载中,LITTLE 处理器可以处理绝大部分作业,而“big”CPU 集群的激活时刻缺乏 10%,在许多情况下还达不到总 CPU 运转时刻的 1%。经过 CoreLink CCI-400 高速缓存一致性互连组件,CPU 集群可以监听其他集群的高速缓存,然后完成软件线程从一个集群到另一集群的快速搬运。
Cortex-A12
跟着智能手机商场的爆破式添加,SoC 供货商和 OEM 将该商场划分为旗舰高端等级、中端等级、低成本入门等级。跟着这些细分商场的呈现,ARM 一直在界说专门针对上述三个等级商场的不同处理器。cortex-a12 是选用全新微架构的一个全新处理器,专门面向快速开展的中端移动商场。下图显现了这些细分商场的规划,以及面向这些细分商场的 ARM Cortex-A 产品:
Cortex-A12 的规划面向中端移动 SoC,以满意这一细分商场关于芯片面积和功耗的要求。它运用无序双履行流水线,其功用比当时在许多中端移动 SoC 中运用的 Cortex-A9 高出 40%。Cortex-A12 在 2013 年中推向商场,有望在 2014 投入量产。它是一款 32 位处理器,具有与 Cortex-A15 相同的物理地址扩展和相关的架构特性。
Cortex-A12 可以在许多(但并非悉数)用例中供给挨近 Cortex-A15 的功用。Cortex-A12 还针对中端移动规划进行了优化,取消了一些企业功用,运用稍微简略的流水线,因而在横跨多个商场的高端设备上都可以找到Cortex-A15的身影,而 Cortex-A12 则专门面向中端移动规划。
Cortex-A57
cortex-a57 是 ARM 针对 2013 年、2014 年和 2015 年规划起点的 CPU 产品系列的旗舰级 CPU,它选用 armv8-a 架构,供给 64 位功用,而且经过 Aarch32 履行状况,坚持与 ARMv7 架构的彻底后向兼容性。在高于 4GB 的内存广泛运用之前,64 位并不是移动体系真实必需的,即使到那时也可以运用扩展物理寻址技能来处理,但尽早推出 64 位,可以完成更长、更顺利的软件搬迁,让高功用运用程序可以充分运用更大虚拟地址规模来运转内容创立运用程序,例如视频修改、相片修改和增强实践。新架构可以运转 64 位操作体系,并在操作体系上无缝混合运转 32 位和 64 位运用程序。ARMv8 架构可以完成状况之间的轻松转化。
除了 ARMv8 的架构优势之外,Cortex-A57 还进步了单个时钟周期功用,比高功用 的Cortex-A15 CPU 高出了 20% 至 40%。它还改善了二级高速缓存的的规划以及内存体系的其他组件,极大的进步了能效。Cortex-A57 将为移动体系供给史无前例的高能效功用水平,而凭借 big.LITTLE,SoC 能以很低的均匀功耗做到这一点。
高效率产品线:Cortex-A5、Cortex-A7、Cortex-A53
跟着智能手机商场的兴起,最早呈现的商场是入门级商场。在新式商场,移动设备没有取得无线运营商的补助,因而用户有必要付出全价来购买移动设备,而且按月付出合约的服务费用。新式商场的价格规模在 150 美元以下,并将很快降至 75 美元以下 – 咱们需求一种不同类型的 SoC 规划来满意这些商场的需求。在 Cortex-A9 发布之后不久,ARM 企图开发一款处理器来满意这一商场需求:这款产品的尺度和功耗与旧款 ARM926 等功用性手机处理器大致相同,但功用高于在第一代智能手机中运用的 arm11 系列。2009 年,咱们发布了 Cortex-A5,该规划经过有序单履行 8 级流水线完成了上述方针。运用这种简略流水线规划,咱们可将功耗坚持在十分低的水平。而简化的功用集,造就了ARM 有史以来最高效的(每 mW 功用)运用处理器。
在 cortex-a5 取得成功的基础上ARM又规划了现在已在入门级智能手机中得到很多运用cortex-a7 处理器,形成了一个充满活力的智能手机处理器细分商场。跟着 Cortex-A5 取得成功,下一个方针是开发可以匹配 Cortex-A15 的架构功用集的相似处理器,然后在 big.LITTLE 配对中将其与 Cortex-A15 结合运用。一起,该款处理器还应该在 Cortex-A5 的基础上提高功用,并具有与之相同的成效、和相似的功耗以及芯片巨细。Cortex-A7 经过添加部分双履行,添加TLB 和内存结构,一起集成二级高速缓存,将单时钟周期功用进步了 20%。
高能效 CPU 产品线的最新成员运用了相同的 8 级有序流水线,但经过多种方法明显提高了功用,包含彻底双履行流水线、更宽的内部总线、增强浮点和 SIMD 吞吐容量、更大的TLB,以及其他对存储器体系的改善。cortex-a53 包含可选 内部RAM ECC 维护,还供给外部总线选项,使得该处理器在移动和企业运用中都可以布置。
除了微架构功用改善之外,Cortex-A53 还添加了对 ARMv8 架构的支撑,为独立入门级移动芯片规划,和包含多个 Cortex-A53 集群的可扩展企业运用引进 64 位功用,一起在高端移动体系中,将Cortex-A53和功用更强的Cortex-A57在big.LITTLE体系规划中配对运用。
下图显现了接连几代高能效Cortex-A CPU 的功用比照。由于选用最新的规划 Cortex-A53 可以供给比只是几年前的旗舰级 CPU (Cortex-A9)超卓的多功用。下图显现的功用比较测验是在相同频率下进行的。在物理完成中,Cortex-A53、Cortex-A7 和 Cortex-A5 的 8 级流水线到达的频率和选用更长流水线的“big” Cortex-A CPU能到达的频率距离在15%之内。实践量产 SoC 频率存在很大差异,取决于流程选项和后端规划,咱们现已看到 Cortex-A7 在选用 28nm制程下可以到达 1.2GHz、1.5GHz 乃至更高的频率。
有关 ARM 的高效率产品线的更多信息,请参阅 Kinjal Dave 的博客 – 高效率、中端或高功用 Cortex-A – 差异安在?
有关 Cortex-A53 的更多信息,请参阅我前期的关于最新高效率 Cortex-A CPU 的博客 – 有关 Cortex-A53 的 5 大必备常识
移动运用处理器全面道路图
本道路图将上述一切处理器都会集在单个图表中,展现了 ARM所供给的高功用等级、中端等级、入门等级的移动运用程序处理器,以及所支撑的高速缓存一致性互联组件。
以上道路图展现了ARM 三个等级的移动运用处理器产品道路图,咱们未来产品的开发也将持续遵从这一道路。咱们专门针对高端、中端和高效率这三个细分商场的处理器规划,使咱们可以供给针对这三级智能手机和平板电脑商场的定制产品。
为恰当使命寻觅恰当处理器不再是难以决断的挑选
ARM 的 big.LITTLE 技能旨在为顾客供给最佳全体用户体会 – 包含按需动态功用、更高的能效、“不发热”的经用器材。商场上最早运用该技能的产品包含三星 GS4(国际版)和三星 Note 3(国际版)
下图显现了将在 2013 年和 2014 年推出的选用未来规划的高端移动 CPU 子体系,将在 2014 年和 2015 年的设备中运用。它选用 big.LITTLE 电源办理技能,运用 Cortex-A57 的强壮功用,而且供给高速缓存一致性互联 (cci) 功用,可以为GPU 核算供给的 IO 一致性的支撑。
有关 big.LITTLE 的更多详细信息,请拜见我近期在 ARM TechCon 2013上进行的有关 big.LITTLE 渠道丈量成果的演示(旨在展现功用改善和节能):big.LITTLE 技能向彻底异构大局使命调度跨进 – Techcon 演示文稿
别的,您或许期望阅览我前期论说该技能关键的博客 – 有关 big.LITTLE 的十大必备常识
以上体系示意图展现了最早进的移动 CPU 规划,它选用 Cortex-A57 和 Cortex-A53 处理器,而且结合最新的 mali_t760 GPU。请注意,它具有 2 个 big 中心。从咱们现已进行的功用测验来看,2 个 big 中心好像现已能满意当时作业负载。选用由Cortex-A15和Cortex-A7构成的当时最高端的移动 SoC的拓扑结构示意图和下图也是十分相似。Cortex-A50 系列处理器代表了将在 2014 年间面世的移动 SoC 的未来拓扑结构开展趋势 … 但 ARM 不会就此停步。咱们将持续在低功耗 CPU、GPU 和体系规划范畴开发新的立异技能,以此推进智能手机、平板电脑和新式设备类型的立异,完成高效移动核算,提高全球数十亿用户的日子质量。