作者:陈东华 飞思卡尔半导体
1 趋势
轿车电子业界现已开端选用智能图画处理来将多个摄像头收集来的数据进行同步,有用的给车辆供给了“看”和“辨认”周围环境的才干。很多的厂商也都在为创立更安全的驾驭环境这一一起的方针而尽力。飞思卡尔推出的带有APEX技能的图画辨认处理器(ICP)使得下一代的智能安全车辆更易完成。ICP能够在智能视觉体系中完成实时的嵌入式图画和视频剖析相关的使用,比方:带物体检测和图画校对的增强智能后视摄像头(EBC)、车道违背警示体系(LDW)、磕碰缓冲技能(CAS)、盲点检测(BSD)等。
图 1 高档驾驭辅佐体系
2 应战
根据图画辨认的高档驾驭辅佐体系规划的应战则在于,怎么规划一个渠道,能够继续的供给满意的处理功用,来满意核算密布类使用的需求,又能供给低功耗来防止散热的问题。在供给高性价比的低本钱的解决计划一起,能够让体系规划者能够规划出比较小尺度的封装。这样的智能的体系或许还需求集成图画传感器单元与智能摄像头互联(假如需求的话)。这样的集成了图画处理功用的图画传感器而建立出来的智能摄像头体系,能够被用在车内多个不同的场合,比方装置在后保险杠作为可进行物体检测的增强型的智能后视摄像头、装置在侧后镜来进行盲点检测、装置在后视镜后边来进行前向的防撞检测和车道违背检测、或许调配其他的摄像头模块来完成360o环视作用。别的,这种分布式的智能摄像头模块不会增加车辆中央控制台的担负,不需求额定的体系资源开支。
市场剖析陈述显现,高档驾驭员辅佐体系(ADAS)使用的增加将十分敏捷,若干年后不只是在高端车上,甚至在更多的一般低端的车辆上都会装置这样的使用。别的考虑到以上说到的每个使用都需求越来越多的核算功用,需求也十分的相似,现在也有趋势是越来越多的ADAS使用将会选用相同的硬件渠道。这就提出了一个问题–现在的DSP和FPGA的计划是否合适呢?
DSP算法履行的最大的瓶颈之一在于需求从外部的内存区载入数据,才干坚持对数据的读写拜访。传统的DSP仅供给了有限的并行处理机制,而且为了满意处理才干的需求,一般需求的主频也越来越高。当时钟频率提高得越来越高时,体系的功耗也会越来越大,相同导致散发出的热量也越来越多。FPGA供给了相关于DSP更多的并行度,可是一般编程也会变得越来越困难,而且常常需求选用一个RISC来对数据做后处理。FPGA功耗更大,封装尺度也更大,在体系的整体本钱上也相对更高。
3 图画辨认的未来: 多核并行处理
飞思卡尔根据多核并行处理机制的图画辨认处理器系列(ICP)刚好弥补了DSP和FPGA的缺陷。图画辨认处理器在单位面积仅毫瓦功耗的情况下供给了更多的功用,而且调集了低功耗、高功用、小尺度、完好软件开发渠道等很多特性,给开发者供给了十分有竞争力的低本钱计划。
飞思卡尔的图画辨认处理器的中心为APEX,如图2所示。这是一个多核的架构,由一个规范的RISC内核和一个矩阵处理引擎(APU)组成。RISC首要担任非并行的算法的处理而且办理算法的履行。APU则侧重于处理很多并行的单指令多数据(SIMD)的矩阵运算,一般是指图画处理和剖析算法中比较底层而且运算量大的并行运算。除了RISC和APU,APEX架构中装备了直接内存存取流(DMA流)以便于进行高效的数据搬移,别的还供给了一个序列器来主动高效的依照次序履行操作来完成功率的最大化。而使用层的程序则彻底运转在图画辨认处理器中的第二个RISC内核,该内核是独立运转于APEX之外的。
图 2 可编程的并行架构(APEX)
APEX灵敏可扩展,能够通过增加处理元素(带有专用内存的核算单元的组合)的数量而线性的增加APU并行处理的才干。这样做不只能够在较低的时钟频率下增强运转功用和并行操作度,而且还有利于下降功耗,削减热量的发生。处理元素是由核算单元(CU)组成的,每个CU都有自己本地专用的内存。一旦图画数据被从外部内存即体系内存取出并依照数据流的方法存入APU的内存中,则这些数据将一向存在本地内存中,一切的图画操作也将是根据这些本地的内存数据进行操作,直到一切的处理都完成后才会将这些数据依照数据流的方法存回到体系内存中去。通过这种将内存与APU的履行单元进行绑定的方法,咱们大大削减了图画处理中对外部内存的拜访次数,在不需求提高体系的时钟频率的情况下就能满意核算功用的要求,对下降功耗和提高功用也有十分大的协助。
别的,APEX模块与ICP的其他模块耦合较弱。也就是说APEX内核的运转频率和SOC的其他部分的运转频率是无关的,因而体系的其他的这些部分能够运转在更低的时钟频率下,以便更好的节约体系的功耗。芯片选用了堆叠技能将外部内存也封装在内部,因而整个芯片的封装尺度做得更小。得益于芯片的小封装和低功耗,整个板级规划尺度也能够做得很小。
图 3 图画辨认处理器软件架构
通过并行处理器内核,以及共同的软件可编程的数据流结构,飞思卡尔的ICP系列图画辨认处理器能够轻松调度杂乱的向量运算而且将数据搬移的搬移最小化。若在DSP履行相同的操作,则将占用更高的外部数据拜访带宽,导致更高的功耗,发生更多的热量。APEX灵敏可编程。飞思卡尔为使用开发供给了如图3 所示的软件结构。使用SIMD和软件结构,APEX能够到达FPAG相同的并行度,和DSP相同的编程的灵敏性 。通过调用软件结构中已通过优化的图画辨认库中现有算法的API接口,APEX能够更有用的充分使用算法自身所具有的主动流水线的特性来削减算法的杂乱度,而且多核体系的均衡以及多核的同步这些杂乱问题关于开发者来说也被躲藏起来了。APEX的可编程特性也使得用户能够增加自定制的算法到现有的算法库中。
飞思卡尔的%&&&&&%P图画辨认处理器的高并行度,且具有高带宽算术逻辑运算单元(ALU)的架构保证了这样的渠道能够供给满意的空间和功用,根据相同的硬件上能够完成多种不同的使用。灵敏的开发渠道和软件开发套件(SDK)使客户能够更便利的对APEX进行编程,来完成更具有竞争力和差异化的使用。这样的多核并行的架构渠道之所以成为开发者喜爱的挑选,不只是由于外表看得到的功用、功耗和尺度的优势,更是由于在将来的图画处理使用的开发中,现有的代码的复用将保证项目开发能够更快更快捷。
更多关于轿车电子的技能资讯,欢迎拜访 与非网轿车电子技能专区