在美国有一家由两个青少年所创建的新公司 Rex Computing ,开发了一款平行架构处理器,希望能为高阶体系带来10倍的每瓦效能提高;该公司并计划将指令集架构转为敞开源码,以撮合支持者。
这家新创公司的大志不小,最近总算到了能够自己签公司合约年岁(18岁)的该公司履行长Thomas Sohmers的方针,是打造现在处理器与加速器的代替技能──现有的计划若要晋级至研究人员希望在未来十年到达的exaflop等级功用,要支付的价值太高(主要是功耗方面)。
Sohmers 表明,运算产业界面前是一条艰苦的长路;咱们广泛承受的是持续与英特尔(Intel)、Nvidia一同遵从摩尔定律(Moore’s Law)道路往下走:“现在有一个很好的时机能让咱们能提前完结exascale等级体系,咱们需求的是很新的东西,咱们也正在测验推行它,不过这是一桩 困难的生意,很多人抵抗新的东西。”
最近Sohmers当选为Facebook建议的敞开运估计画(Open Compute Project,OCP)高功用工作小组一同主席;他预期Rex最快能在下一年1月完结其Neo中心的开发,而且透过OCP将该处理器架构敞开:“咱们的主意是让它成为一个根底架构,让其他人能使用它打造未来的体系。”
Neo中心架构
Sohmers 泄漏这会是第一个全力完结晶片的OCP专案,其他成员将帮忙供给晶片互连、以及实践的Verilog、RTL等规划程序。3W的Neo处理器在80mm2 面积内包含256个中心(中心架构如上图),每个中心具有64位元ALU、128Kbyte容量的SRAM暂存记忆体。
每个Neo中心之间有16Gbyte/s的互连,晶片之间的总频宽约384 Gbytes/s。该处理器架构的创意来自于Adapteva 的Epiphany晶片,Sohmers 用它做出了第一代原型晶片,不过该原型的记忆体频宽不行、也达不到他想要的双倍精度。
Rex Computing规划的体系规划
Rex Computing规划了一个体系规划(如上图),只需使用三分之一的OCP 1U伺服器节点,选用4×4的晶片阵列,由一个次元件来操控──该公司计划一开始选用FPGA计划;Sohmers表明,该规划可到达50 Gflops/watt、双倍精度浮点运算。
履行Linux软体的操控晶片能供给Neo阵列存取功用,并能以C言语编写高度平行化的使用程式;不过Sohmers着重,要让新架构处理器充分发挥效能, 会需求用到一些新式的平行编程解决计划,例如Unified C或Erlang。该新架构体系确定的使用商场包含石油/天然气探勘、机器学习等等,Rex Computing正在筹募种子基金,为Neo处理器投片做准备。
在不久前的Supercomputing 2014大会上,Sohmers 与来自Cray、IBM、美国国家实验室的技能菁英们一同参加了一场座谈会,讨论exascale 等级体系的未来开展;有人以为,该类体系将会是远超过可预期的未来,部分原因是现在体系的功用都被高估了。
不过Sohmers以为,全球 百大超级电脑仍是使用已经有30年前史的Linpack基准,底子无法着重记忆体频宽或是模仿实践使用;而HPCG (high-performance conjugant gradient)基准是更实践的量测,选用该基准所列出的体系评比成果,只要Linpack基准功用的60分之一,因而如今最强壮的体系或许只要还构不上petaflop等级的一半:“这真的很糟糕。”