您的位置 首页 硬件

神经网络协同处理器下降视觉处理功耗

神经网络协同处理器降低视觉处理功耗-嵌入式视觉(EV)系统的成长正推动对于更高性能与节能的视觉处理能力需求。包括AMD、CEVA、Imagination、英特尔(Intel)、Nvidia以及AR

  嵌入式视觉(EV)体系的生长正推进关于更高功用与节能的视觉处理才能需求。包含AMD、CEVA、Imagination、英特尔(Intel)、Nvidia以及ARM的授权客户等业界多家公司均活跃因应这一生长中的趋势,运用FPGA、FPGA/MPU组合、GPU与专用异质多中心等各种不同的硬体,为规划使命完成最佳化。

  新思科技(Synopsys Inc.)日前发布另一种解决计划——DesignWare EV处理器中心(IP)系列,专为整合于具有多颗CPU的SoC而规划,无论是选用来自ARM、英特尔、Imagination MIPS或PowerPC等其他CPU均可相容。

  该IP中心系列现在包含EV52与EV54两款可为视觉运算运用最佳化的产品,选用28nm制程制作。EV52搭载根据该公司ARC指令集的双中心 RISC处理器,以高达1GHz的频率作业;而EV54则选用四中心建置,供给较EV52更高的功用。两款产品均内建2-8个可编程装备的物件侦测引擎处理单元(PE)。

  

  Synopsys的视觉处理器结合根据ARC的RISC中心,以及卷积神经网路侦测引擎处理单元。

  EV52和EV54处理器运用‘卷积神经网路’(CNN)演算法——从人脑处理视觉资讯办法获得创意,为视觉运算运用完成最佳化。CNN运用前馈人工神经网路,其间,单个神经元以一种反响视野内堆叠区域的办法拼接摆放。这种堆叠是人眼得以追寻动作、辨识环境改动、差异不同物体以及反响脸部表情纤细改动的重要要害。

  Synopsys DesignWare ARC处理器资深产品行销司理Mike Thompson介绍:“该EV处理器系列是专为以1,000GOPS/W的功用履行CNN核算而规划的,它仅需运用约竞赛视觉计划一小部份的功耗,即可为一系列广泛的物件运用完成更敏捷与精确的侦测。”

  Thompson指出,“尽管有多种视觉辨识演算法竞相争宠,咱们一向以为CNN具有最重大进展,并且也是现在咱们看到在方针运用中最佳的物件辨识计划,可作为相机、可穿戴式设备、家庭自动化、DTV、虚拟实境、游戏、机器人、数位看板、医疗与车载资讯文娱体系等方针运用的抱负挑选。”

  Synopsys现在正与嵌入式视觉商场中的多家厂商协作,包含Nvidia、CEVA、微软(Microsoft)等。可是,尽管透过CNN可以获得逾越95%的精确成果,但问题仍取决于如安在商场可接受的功耗/功用规模内到达这样的精确度。

  Thompson表明,通用处理器(GPP)虽可用于视觉处理,但因为短少先进的数学运算资源而使其速度过于缓慢;绘图处理器(GPU)尽管有必要的数学运算资源,但却短少有用移动视觉材料的才能,使其视觉功用相对较低而功耗相对较高。

  “咱们提出的协同处理器战略将有助于使CNN本钱下降到可担负的规模,以及可运用在消费产品的功耗水平。”Thompson以一系列典型物件侦测与手势办识运用的比较为例表明,EV处理器履行视觉使命的功耗大约比其他视觉解决计划的功耗更低5倍。选用内建EV处理器的SoC以每秒30格的视讯处理速率履行一项脸部侦测使命时,大约仅需175mW的功耗。相形之下,假如选用GPU来履行相同使命的话,至少需求更高8-10倍的功耗。

  

  以每瓦数十亿次作业为衡量基准,EV处理器(最右)的履行功率逾越了其他视觉计划的物件侦测与剖析才能。

  嵌入式视觉导入CNN演算法

  为了将1或多个EV处理器整合于SoC,Synopsys运用与主处理器平行/同步作业的办法——透过杂乱和高效的消息传送设定以及中止机制,让不同卷积物件侦测引擎处理单元与其他处理器中心之间完成通讯(图3)。ARC EV处理器可经由编程完成自动化作业,或许,当运用有必要契合特定的功耗/功用约束时,开发人员也可以挑选尽量在EV处理器与主处理器之间完成最多的操控与功用同享。

  

  EV处理器的中心是物件侦测引擎,其间包含2-8颗专用的处理单元。

  Thompson说:“PE的数量是由用户在建构规划时所装备的,就像在PE之间的串流互连网路相同——在一切的PE之间装备灵敏的点对点互连。取决于物件侦测引擎上的CNN绘图履行情况,每个点或连线均可动态改动。”

  该架构的建置在于让EV处理器记忆体映射可完全由主处理器进行存取,这将可以让主处理器一方面继续进行操控,一起让一切的视觉处理使命卸载至EV单元,主处理器与EV处理器二者均可下降功耗,并加快要害的视觉使命进行。

  此外,Thompson着重,这种办法还可让各种不同的视觉处理单元都能与主处理器即时通讯。为了让EV之间以及与主处理器之间的通讯更有用率,每个EV 处理器都能存取贮存于SoC记忆体映射区的印象,或是在需求时透过内建的AMBA AXI规范体系介面存取晶片外接记忆体资源。

  为CNN开发供给软体套件

  Thompson指出,因为CNN存在必定的杂乱度,就算选用了EV硬体,为特定视觉处理运用推出合适的演算法组合仍然是一项困难的使命。为了帮忙开发商减轻一些职责,Synopsys供给了一套完好的东西库与参阅规划,让开发人员能更有用率地建构、除错、装备,以及运用业界规范且开放源码的嵌入式视觉东西链OpenCV和OpenVX,为其嵌入式视觉体系完成最佳化。

  该最佳化的东西套件内含ARC EV处理器,以及逾越2,500项OpenCV功用,可完成即时电脑视觉。此外,该东西套件还供给具有43种规范电脑视觉中心的OpenVX架构,可完成边际侦测、树立印象金字塔以及光流评价,这些功用均已为履行于EV处理器完成最佳化。

  Thompson还表明,因为EV处理器是可编程的,因此可加以练习用于援助任何物件检测图,以及导入新的OpenVX中心界说。一次OpenVX的运转时刻可将摆放的中心履行分配在EV处理器的多个履行单元上,然后简化了该处理器的编程。

  在用于规划EV中心时,可透过ARChitect东西宣布与装备ARC EV处理器。该东西合成了可整合于任何SoC规划的RTL,以援助任何主处理器,包含ARM、英特尔、Imagination MIPS与PowerPC等。为了进一步加快软体开发,虚拟原型机将可用于EV处理器,以及援助根据FPGA的原型规划,在制作晶片之前完成硬体和软体协同规划。

  “嵌入式视觉是一个快速改动的环境,”Thompson说,“现在,CNN看来是最佳的发展方向。可是,未来也可能发生改动。除了找到可以满意当今运用的本钱和功耗需求的解决计划以外,咱们期望为开发人员供给一种更有用的办法,在中期改动其规划使命,而无需回到起点从头规划。”

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/qianrushi/yingjian/173009.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部