我最近参加了the Linley Tech Mobile Conference (Linley Tech移动技能研讨会),这是每年在硅谷接连举行两天的技能研讨会,聚集于移动处理议题。参加的厂商包含Synopsys、英特尔、GLOBALFOUNDRIES、高通(容我弥补,这些都是Imagination日益壮大的生态体系同伴)以及其他许多公司。
本年,在圣塔克拉拉了解的风光和Hyatt Regency酒店中,这场盛会再度上台。这是让媒体、分析师、资深工程师和经理人等很多科技工业从业人员齐聚一堂的好地方。
我的简报是排在第三个议程,主题为移动CPU。我解说了为什么虽然一切的趋势都朝高端软件开发和笼统级开展,而不注重底层的CPU与GPU指令集架构(ISA)。可是当规划CPU、GPU和移动设备用的其他处理器时,运用从一开端就为可扩展性建构的高效处理架构仍是会带来明显的差异。
功率和日益缩短的产品开发周期 ─ 移动处理器的竞赛态势
移动产品开发现在面临着两个十分不同的应战,这些应战约束了运算技能开展的脚步,并又返过来直接影响到移动运用处理自身。
一方面,功率是每一家首要处理器IP和芯片供货商企图主导商场的终极战场。因而,体系规划人员有必要慎重在高效能和低功耗间取得平衡,这也影响着每个SoC规划的严重决议。此议题现已主导了28纳米规划,并将会持续影响20纳米以下的SoC规划。但更重要的是,散热议题已成为逾越移动运用领域,从嵌入式运算和移动运算扩大到网络、M2M和物联网等各种商场的要害考虑方面。
咱们遭受的另一个严重应战是产品开发周期越来越短。曩昔,18~24个月的开发周期是常态,但现在咱们看到有些客户将时刻缩短到每6~12个月就推出新款芯片。这需求投入巨大的规划作业,并且当产品要满意不同层级商场的需求时,消耗的研制精力会更大。
交融趋势使得一些传统以来不会快速推出新产品的商场也大幅加快了规划周期,像是智能电视、便携式游戏机或连网轿车都需求选用最新科技,才干取得已习惯于运用口袋卡片个人计算器的顾客喜爱。
不管是针对重复运用或是可以更妥善地在单一芯片上分配不同的运算资源,程序代码可移植性都是处理低功耗与缩短开发周期应战的处理计划。这是异构处理革新的根底,也是能将这一愿景变成实践的技能,一起可防止程序代码对低端硬件的依靠性。今日的CPU会履行许多通用软件,可是,现有SoC各功用方块的运用率有必要提高,才干习惯未来效能添加的需求。LLVM就是一个很好的比如,它免除了程序对底层ISA的依靠,并能完成程序代码横跨不同设备与架构的可移植性方针。
PowerVR GPU推升异构处理功率
Imagination的PowerVR ‘Rogue’ 架构 可为移动设备供给约1 TFLOPS的效能。界说体系效能和特性的一个重要部分F已与绘图和这些高度平行处理器的运算潜能有关。
传统以来,绘图效能首要是用来推进设备的显现功用。
但由于绘图处理具有了足虻墓δ埽所以提高SoC的功率将取决于发挥GPU的潜力。这可经过新的和增强的API、可扩大软件处理计划和一致的编程环境来完成。
重新认识RISC架构概念
虽然此趋势已逐步鼓起,CPU依然是体系中首要且最常用的通用可编程单元。Imagination的MIPS架构开展可追溯到30年前John Hennessy和他的团队将编译程序理论的专业知识带到单纯的RISC架构构建中,推进了优化编译程序的开展。
30年之后,这样的主意刚好与业界希望在运行期间选用JIT/动态编译程序技能,以向程序代码可移植搬运的趋势相同。MIPS ISA的特性包含每指令单一运算、简易寻址形式、非猜测履行或非整数条件位等,可为实践国际带来实践效益,以帮忙体系规划人员完成更高的效能,开宣布高频履行的高端、超标量、乱序CPU,并一起坚持低功耗特性。
也就是说,虽然这些技能能让业界脱离底层ISA的前史包袱,但固有的架构特性对动态编译效能、怎么有效地将架构构建在芯片中,以及支撑敞开规范与操作体系来说,依然十分重要。
proAptiv CPU是Imagination无须退让的MIPS架构怎么能带来高效能、低功耗CPU的最好比如。举例来说,架构中缺少猜测性指令可简化分支猜测办法的建构,这是proAptiv CPU具有抢先的同级猜测效能的首要原因。
进一步提高的架构功率与微架构规划挑选,使得此中心在推出时便能供给同类产品的最高CoreMark/MHz CPU分数,与竞赛性CPU计划比较,面积更是缩小了约60%。
移动CPU ─ 不仅是运用处理器
但运用处理器不仅是移动SoC中的CPU。其他的功用,像基带中的通讯处理,它与移动设备的网络功用有关,也十分重要,并且也能获益于其它的架构特性。多线程处理器能以与单中心CPU附近的面积与功耗供给更高效能。
这能经过内置的硬件调度器和输出限制器(yield qualifier)?,来完成更佳的实时/确定性处理需求和服务质量(QoS)。运用咱们的多线程和多核处理计划,客户能用咱们和合作同伴共同开发的优化LTE基带仓库和多家供货商供给的多线程RTOS来树立优异的基带处理计划。与选用单线程的内核比较,运用此技能能为LTE流量提高37~53%的数据处理量。
总归,异构运算的根本技能已开端用来推进移动运算的开展。Imagination供给广泛的IP产品组合,以拥抱可扩展、可移植、高度敞开和规范导向的未来。咱们信任,架构(CPU、GPU或其他)应根据它们的实在效能来相互竞赛,工业将不再像曩昔相同受限于单一ISA架构,而会有更快速的开展。