从 Falcon Mesa 到 Agile
英特尔的10纳米FPGA总算来了。在四月刚刚完毕的英特尔“以数据为中心创新日”中,从前代号为Falcon Mesa的英特尔最新一代10纳米FPGA正式露脸,并正式命名为Agilex™。
在本文中,小编将对Agilex的六大中心技能做全面的深化解读。
灵敏+灵敏=Agilex™ FPGA
Agilex是Agile(灵敏)和Flexible(灵敏)的合二为一,而这两个特色正是现代FPGA技能最为中心的两大关键。
具体来说,“灵敏性”便是指可编程性,它根据FPGA的中心技能——可编程逻辑阵列,能够灵敏的针对不同运用场景进行编程,并改动FPGA的逻辑结构和功用。
“灵敏性”指的是异构,它既能够是不同逻辑单元之间的异构,也能够是不同工艺的异构,或许两者兼而有之。如下图所示,不同类型的IP所对应的老练工艺与迭代时刻都不尽相同。只要选用异构架构,才干充分发挥不同IP和不同工艺节点的优势,扬长避短,在功用和本钱上获得杰出的平衡。因而异构FPGA也是现在和未来业界开展和研讨的首要方向。
在这个大布景下,Agilex™ FPGA应运而生。它既包括了传统FPGA灵敏的可编程性,又结合了现代FPGA根据异构架构的灵敏性,因而能够一起适用于许多运用范畴,并针对性的进行装备和快速迭代,如下图所示。
与进化多年的Stratix®、Arria®、Cyclone®、Max® 等FPGA产品系列比较,Agilex™ 是原FPGA巨子Altera在2015年底被英特尔收买、并成为其可编程计划事业部(PSG)后正式推出的一个全新的FPGA系列。正因如此,Agilex™ 无疑被英特尔寄予了更多的等待。
在这些等待背面,离不开来自英特尔的中心技能的加持。而这也将是区别Agilex™ 与它的前代产品、以及其他竞赛对手的最首要的优势。具体来说,Agilex™ 遗传自英特尔的中心竞赛优势有以下六点。
1、英特尔10纳米工艺
英特尔在半导体范畴称霸几十年,靠的便是两个独门绝技:第一是众所周知的x86架构,第二则是从前遥遥领先竞赛对手的半导体制作工艺。这也促成了英特尔闻名的“TIck-Tock”战略,即架构和工艺的更新逐年交织进行,一起还能坚持处理器功用的稳步增长。
不过,这家芯片巨子在10纳米工艺上遇到了阻止。现实上,英特尔也曾猜测10纳米的研制会比之前耗时更久,如下图所示,但或许没有人想到会是这么久。
结果是,就在曩昔的一两年中,从前被远远甩在死后的竞赛者纷繁在十纳米这个工艺节点完成了超车,台积电和三星都逐渐将自家的十纳米工艺投入量产。
总算,2019年头痛定思痛的英特尔一口气发布了四款根据10纳米工艺的芯片产品,涵盖了个人核算渠道、数据中心、5G网络等多个运用范畴,并将最快于年底正式出货量产。而这次发布的Agilex™ FPGA,也正是根据英特尔10纳米工艺的旗舰级FPGA产品。
关于芯片制程而言,在相同的工艺节点下,英特尔的工艺往往具有更优异的功用,这也是业界公认的现实。一旦英特尔的十纳米工艺到达安稳并量产,估计将会比竞赛对手带来20%-30%的功用和功耗优势,如下图所示。
2、体系级3D芯片
体系级3D芯片的异构集成和封装,也是英特尔的独门秘籍之一。这其间首要有两个首要技能,一个是EMIB(嵌入式多管芯互联桥接),用于供给多个异构晶片的高速互连;另一个则是2019年最新发布的Foveros 3D封装技能。
在Agilex™ FPGA中,运用了第二代EMIB技能,用以衔接可编程逻辑阵列以及周围的各类子芯片集(Chiplets)。因为EMIB不需求引进额定的硅中介层,因而不需求许多的硅通孔,这样显着降低了体系的制作复杂度。一起不需求在中介层中运用长导线,因而降低了不同晶片间的传输延时,减少了信号的传输搅扰。别的,在替换不同的子芯片集时愈加简略,而无需重做整个芯片体系。
3、CXL:CPU与FPGA互连的终极计划
当时,FPGA的一个首要运用场景是在数据中心里作为CPU的硬件加快器,用来加快各类运用,如深度学习的模型练习、金融核算、网络功用卸载等等。
在数据中心的CPU范畴,英特尔的Xeon® CPU一直是肯定的最强王者。作为数据中心加快器的FPGA,首要需求考虑的便是与Xeon® CPU的兼容性问题。很显着,作为具有“纯粹血缘”的Agilex™ FPGA,从出世伊始就比较竞赛对手占有了有利地势和有利地势。
缓存一起性问题一直是硬件加快器范畴亟需处理的中心问题之一。而处理这个问题的首要办法,便是清晰和遍及CPU与硬件加快器之间的内存互联协议,就好比我们熟知的用于CPU和加快器通讯的PCIe协议等等。
在本年3月,英特尔宣告联合微软、阿里、思科、戴尔EMC、Facebook、谷歌、惠普企业HPE和华为等公司,一起组件一个全新的互联规范,名为Compute Express Link – CXL,如下图所示。
风趣的是,CXL的发起者中有四个互联网巨子、两个服务器设备制作商、两个网络设备制作商。这种多元性立体的出现了CXL的方针运用范畴:互联网数据中心、通讯基础设施、云核算与云服务等等。而这些范畴也正是FPGA大显神通的重要渠道。
关于Agilex™ FPGA,它将原生支撑CXL协议,并将成为业界首款面向Xeon® 可扩展处理器的内存一起性硬件加快器。值得注意的是,CXL协议根据PCIe规划和扩展,如下图所示,这样能够彻底复用PCIe PHY和通道,与其他相似的协议比较有着显着的易用性。
因而,Agilex™ 对CXL的原生支撑,必然会在“有利地势”和“有利地势”的基础上,为它在数据中心的广泛运用带来巨大的“人和”优势。
4、可变精度DSP
FPGA在人工智能运用中的最大长处之一便是能够选用可变精度的字长表明和数学运算,然后带来巨大的功用提高。在现有的英特尔FPGA中,现已能够支撑固化的定点数以及FP32的DSP运算。
在Agilex™ FPGA中,又扩展支撑了FP8、FP16和BFLOAT16的DSP运算,一起也增加了9×9乘法器的数量,以及乘法器的装备办法等等,一些常用的DSP装备结构如下图所示。这些针对AI运用的改造,也会极大提高未来FPGA在AI范畴的运用范围。
5、增强版HyperFlex架构
HyperFlex的首要思维便是在FPGA的布线网络上,参加许多名为hyper-register的小型寄存器,这样能够把本来比较长的时序途径分割成多个较短的途径,然后到达频率提高的效果,如下图所示。
但在许多情况下,不是一切的hyper-register都会被运用。为了减小额定延时,对FPGA规划东西中的reTIming和主动流水线算法提出了更多的要求。
在英特尔的Agilex™ FPGA中,这个问题得到了针对性的补强,办法其实十分简略粗犷,便是尽量缩小hyper-register的旁路途径的延时(高达40%),如下图。这样当某些hyper-register不运用时,其对应的体系延时能够到达导线级的规范。
6、OneAPI:英特尔的大志
在2018年底的英特尔架构日上,英特尔的芯片首席架构师Raja Koduri对外发布了公司正在着力研制的一件“大事”:一个名为OneAPI的软件编程结构。
望文生义,OneAPI将会为英特尔的CPU、GPU、FPGA、以及各种AI和其他运用的硬件加快器供给一个一致的编程接口,使得开发者能够随意在底层硬件之间进行切换和优化。OneAPI的标语是“晶体管一个也不能少”,这也很好的总结了OneAPI的终极方针。
除了编程接口外,OneAPI想必还会包括一个完好的开发环境、库、驱动等必要的要素,它代表了英特尔最大的野心,便是将旗下一切的芯片和硬件产品经过这个软件体系衔接起来,并完成无缝切换。一起,能够预见英特尔还将环绕这个软件体系逐渐构建生态环境。因而这个体系一旦完成,将成为其他任何竞赛对手无法对抗的优势。
关于新发布的Agilex™ FPGA,它也将成为首款支撑OneAPI的英特尔FPGA产品,见下图。
结语
英特尔在发布会上宣告,Agilex™ FPGA将有F、I、M三个产品系列,见下图,并最早将于本年第三季度交付到客户手中进行前期评价。
小编信任,这款全副武装了英特尔各种黑科技的最高段位FPGA,必将对当时的FPGA商场带来一波最强的冲击。