林利集团(The Linley Group)高档剖析师Aakash Jani编撰
莱迪思半导体推出的第四款根据Nexus渠道的产品——CertusPro-NX为现有FPGA商场带来了严重改造。该系列FPGA选用28 nm FD-SOI工艺制作,具有低功耗和小尺度优势,首要针对低密度器材商场。与之前发布的Certus-NX比较,新产品的逻辑单元从17 K进步到了96 K。2020年,通用FPGA商场愈加多元化,商场规模添加约为10%;CertusPro-NX可用于完结各种功用,运用范畴包含5G蜂窝网、人工智能和物联网。这些商场不断产生着改变,而FPGA则能供给ASIC不具备的强壮灵敏性。
新产品系列有两种类型,CPNX-50K有52K逻辑单元;CPNX-100K有96K逻辑单元,也是首发工程样片。如图1所示,后一种类型有一个支撑LPDDR4 DRAM的可编程I/O(同类FPGA中尚属初次)。莱迪思还将内部存储器容量拓宽了3倍,让CertusPro-NX在进行存储密布运算时下降功耗。
图1:CertusPro-NX框图。全新FPGA包含7.3 Mb的片上存储器、156个18×18乘法器的DSP模块、可编程逻辑以及8个灵敏的10Gbps SERDES通道(可装备衔接DisplayPort或CoaXPress)。
在规划CertusPro-NX系列产品时,莱迪思选用了28 nmFD-SOI工艺。虽然之前人们对这个挑选存在质疑,但莱迪思完美达成了功耗和软过错率方面的标准,这对公司赢得客户的多个运用规划来说至关重要。除了可编程逻辑之外,CertusPro-NX还具有硬核模块,也能够下降功耗。它还包含一个10G以太网端口和一个四通道PCIe Gen3操控器。莱迪思还特别重视位流装备模块,因而其器材的发动速度十分之快,可在不到 30 毫秒内完结装备。
CertusPro-NX比较于前代产品进步巨大,能够让客户在他们根据FPGA的规划中完结高档功用。莱迪思将新产品的逻辑单元数量翻倍,拓宽了片上存储器容量,晋级了PCIe操控器以及可编程I/O接口。与英特尔的Cyclone V GT系列和赛灵思的ArTIx-7系列比较,新产品的功用到达了职业最佳。
机器视觉和网络边际AI
除了拓宽CertusPro-NX的可编程逻辑架构外,莱迪思还强化了该渠道的AI功用。新器材运用了7.3 Mb的内部存储器,客户能够加载轻量化的神经网络来辨认物体、监听要害词或检测反常行为。但是硬件仅仅规划的一方面。莱迪思的sensAI软件调集能与Caffe、TensorFlow、TensorFlow Lite和Keras等结构合作运用,且具有莱迪思AI编译器的支撑。这一经过验证的解决方案调集为很多莱迪思客户供给了功耗和资源功率充沛优化的人工智能运用。该软件渠道与公司的多款FPGA兼容(CertusPro-NX的兼容性方案于本年晚些时候推出)。
网络边际的机器视觉运用不只要求运用硬件来完结神经网络,还需求传感器兼容、传感器聚合和图画预处理等功用。在这方面,莱迪思经过可编程I/O和SERDES模块来为CertusPro-NX的客户供给满意的灵敏性。例如,许多高清图画传感器都选用SLVS-EC接口,这是许多网络边际AI加速器所短少的。
可编程SERDES还支撑各种将数据从网络边际传输到体系内部的标准,包含CoaXPress和10G Ethernet。
CertusPro-NX 的片上存储器巨细远超竞品。因为DRAM操作会添加功耗并下降吞吐量,所以假如一切权重都存储在芯片上,神经网络就能以最佳状况运转,且能够最大极限地削减DRAM拜访。因而,客户期望具有更大的片上存储器。莱迪思全新FPGA能够存储多达100万个8位权重——几乎是Cyclone V GT或ArTIx-7的两倍。因为芯片内部能够存储更多的权重,CertusPro-NX能够在不拜访DRAM的情况下运转更大的AI模型,然后下降功耗。
当莱迪思FPGA的确需求拜访DRAM时会运用可编程I/O模块,它支撑LPDDR4和速度达1066 Mbps的DDR3存储器。CertusPro-NX是同类产品中首个支撑LPDDR4的产品——比仅供给DDR3及更低标准的竞品抢先一代。但是,均匀而言,这种较新的技能会添加芯片和体系的功耗。但因为CertusPro-NX有着更大的片上存储器和优化的存储器操控器,它能够经过运用片上和外部存储器,下降能耗和存储器拜访时刻来到达新的能效高度。长时间的可用性也是包含嵌入式视觉在内的许多商场重视的问题,LPDDR4则解除了这种忧虑。
构建智能家居乃至是才智城市的一个要害因素是可见性。大多数终端用户更倾向于不显眼的物联网传感器规划,而小尺度的微处理器是此类规划的中心。CertusPro-NX的面积仅为81 mm2,在支撑SERDES的同类产品中具有最小的封装,比Cyclone V GT小33%,比ArTIx-7小84%。小尺度FPGA进一步添加了规划的可用空间,让OEM厂商得以添加更多功用或缩小规划尺度。
工业物联网
最新一代工业物联网的特色便是大规模自动化,这得益于互连和数据剖析方面的前进。为完结自动化分拣和包装等使命,智能工厂需求数千台物联网设备,它们每天共生成和处理的数据量达TB级。驱动这些设备的芯片有必要尺度小、功耗低且牢靠性高。为了让客户为工业4.0做好充沛准备,莱迪思在其最新一代FPGA中选用了以上准则。
与根据CMOS工艺的FPGA竞品比较,CertusPro-NX选用了FD-SOI来下降功耗。对这种功耗优势进行量化剖析的一种办法是检查各个供货商的功耗预算器。假定规划需求65 K逻辑单元、运用了75%的DSP和存储器、运转两个5Gbps的SERDES通道。关于在85℃结温文125MHz频率下运转的该规划而言,CertusPro-NX的总功耗(动态+静态)比ArTIx-7少75%,比Cyclone V GT少65%,如图 2 所示。
这些数据展现了FD-SOI工艺带来的强壮功耗优势。该制作技能在基板中运用绝缘层,与其他28 nm Bulk CMOS产品比较,漏电流最多可下降75%;而漏电流是产生静态功耗和待机功耗的首要因素。
跟着OEM厂商经过进步功耗来进步其产品功用,英特尔和赛灵思的FPGA将比莱迪思FPGA更快地超越其结温阈值。凭仗其抢先的功耗功率,CertusPro-NX具有更多功耗和散热空间,然后帮忙OEM厂商减缩体系尺度,下降散热办理本钱。此外在结温以下运转的体系不需求装置简单呈现机械毛病的电扇。
散热关于工业马达操控更为重要。马达往往是密封的,避免尘埃颗粒进入,缩短其运用寿命。但是,在运转期间,热量会在马达中积累并进步FPGA周围的环境温度。与竞品比较,莱迪思的低功耗解决方案能让FPGA操控更高扭矩的马达而不会过热。
图2:FPGA功耗比较。LC = 逻辑单元。与英特尔和赛灵思的同类FPGA比较,莱迪思FPGA的功耗下降65-75%。此处的功耗预算是5 Gbps双通道SERDES运用在125MHz以及85℃结温下,资源运用率为75%时计算得出的。(数据来历:莱迪思)
FD-SOI还具有消除单粒子翻转(SEU)过错的额定优势。当辐射粒子穿过器材并与存储器或寄存器单元相互作用时会产生这种过错,这会导致器材逻辑状况过错翻转,然后损坏存储器或数据途径。与Artix-7比较,CertusPro-NX可下降99%的软过错数量,无需运用软过错检测逻辑和纠错代码。这种办法既进步了体系牢靠性,又简化了客户规划。
CertusPro-NX的均匀毛病间隔时刻(MTBF)是Artix-7的110倍。这一特性可满意轿车和医疗体系对牢靠性的需求;因为不需求常常进行现场调整,因而还能够下降保护本钱,确保要害操作的正常继续运转。较高的MTBF还能够进步工业机器人的安全性,因为操控FPGA进入不知道状况或许会导致机器毛病,然后形成人身损伤或财产损失。
OEM厂商一般需求将FPGA与其他体系组件配对,这要求芯片间接口具有高带宽,避免数据流瓶颈。全新CertusPro-NX具有支撑此类衔接的四通道PCIe Gen3操控器。而其竞品一般只支撑PCIe Gen2,每个通道速度比PCIe Gen3慢了50%。更高的SERDES带宽结合更新的PCIe技能,让CertusPro-NX的客户打破芯片互连的瓶颈,而运用其他解决方案或许难以完结这样的作用。
5G运用
为了更好地服务于无线网络,基站OEM会将操控平面和用户平面分隔,让每个平面独立扩展——这是5G网络的一个要害特性,因为跟着3GPP不断发布新标准,这两个平面每年都会有所改变。操控平面是模块化的,因而无线网络供货商能够将其功用拆分到多个芯片中或将它们整合到单个芯片上。它处理各种使命,包含身份验证、客户端 (UE) 会话办理和一致数据办理。
虽然CPU能够履行一切这些功用,但它的功率不如FPGA。据职业估量,OEM厂商需求高效的硬件,因为每个5G基站的功耗比4G基站高70%。考虑到灵敏性和功耗约束,基站OEM一般需求FPGA来帮忙增强处理器或 ASIC。莱迪思新产品的功耗低于Artix-7和Cyclone V GT,简化了基站的散热办理。
5G小基站空间狭小,数据活动量大。CertusPro-NX在具有SERDES功用的同类芯片产品尺度最小,十分合适小尺度规划且数据速率不会受到约束。如图3所示,CertusPro-NX抢先的75 Gbps SERDES带宽比Artix-7高36%,是Cyclone V GT的2倍以上。关于数据包办理等高带宽功用,莱迪思FPGA凭仗其更大的SERDES带宽可供给更高的吞吐量,面积功率遥遥抢先。
图3:SERDES总带宽。CertusPro-NX超越竞品达2倍之多,在数据密布型操作(例如5G基站中的一致数据办理)方面有着明显优势。(数据来历:莱迪思)
定论
莱迪思推出CertusPro-NX首要是为了满意机器视觉、工业物联网、5G蜂窝网和其他不断添加的商场需求。该器材经优化的内部存储器和LPDDR4可最大极限地削减神经网络等存储密布型操作的功耗。FD-SOI技能下降了功耗和毛病率,让下一代器材更牢靠且运转本钱更低。新款FPGA的10Gbps SERDES和职业抢先的封装尺度使其十分合适辅佐数据处理的小型体系,例如5G蜂窝网络。除了在这些范畴中表现出色,OEM还能够将其运用于许多其他范畴,包含国防、轿车和帧抓取。
文中三款FPGA包含数量大致相同的逻辑单元,但莱迪思的产品因为支撑LPDDR4而具有明显优势。比较之下,其他器材仍选用DDR3存储器。CertusPro-NX 还供给更大的内部存储器和抢先的SERDES带宽。客户不只能够运用莱迪思FPGA处理和传输更多数据,并且还能够将功耗下降多达75%,电路板面积削减84%。
经过推出CertusPro-NX,莱迪思为多年来出资较少的这一重要范畴注入了新的生机。它的首要竞争对手在曩昔十年中没有发布任何一款新的低本钱架构产品,因而它有时机经过PCIe Gen3和LPDDR4等新技能来稳固其最新产品系列的商场位置。这一战略让莱迪思在低功耗FPGA的功耗和尺度方面始终保持抢先。CertusPro-NX在前一代产品立异技能的基础上,扩展了存储器、SERDES和逻辑功用,更好地服务于5G基站、工业物联网和机器视觉等新式商场。
Aakash Jani是 The Linley Group 的高档剖析师兼《微处理器陈述》的主编。Linley Group 为客户供给最全面的微处理器和 SoC 规划方面的剖析。咱们不只剖析事务战略,还 剖析技能层面。咱们的专题文章包含的主题包含嵌入式处理器、移动处理器、服务器处理 器、AI 加速器、IoT 处理器、处理器 IP 核和以太网芯片