(文章来历:风语辰)
自动驾驶域操控器,要具有多传感器交融、导航定位、途径规划、核算决议计划、V2X无线通讯、运动操控的才能。一般需求外接多个摄像头、毫米波雷达、激光雷达、V2X模块以及IMU等设备,完结包括图像识别、数据处理等功用。
跟着自动驾驶商业化趋势愈演愈烈,其所触及的环境感知、操控决议计划、运动操控体系,以及与车身其他域操控体系的交互、车联网V2X的通讯信息处理,都需求一个强壮的域操控器核算渠道支撑,而域操控器的处理才能取决于所选型的中心AI芯片的核算才能。现在能够供给自动驾驶AI芯片的公司不多,业界仅有NVIDIA、华为、瑞萨、NXP、TI、Mobileye、赛灵思、地平线等计划,且都未完结量产。
不同的自动驾驶公司,会因为不同的客户以及需求,挑选不同的计划。但中心也会有一些共性。当时阶段,AI 芯片的干流仍然是GPU + CPU,但跟着机器视觉、语音操控、深度学习的算法在 FPGA以及 ASIC芯片上的不断优化,此两者也将逐渐占有更多的市场份额,然后构成与GPU长期共存的局势,并逐渐完结反超。但从长远看,人工智能类脑神经芯片才是开展的终极方向。
AI 芯片是人工智能年代的技能中心之一,决议了自动驾驶核算渠道的软硬件根底架构和开展生态。AI 芯片按技能架构分类可分为GPU(Graphics Processing Unit,图形处理单元)、半定制化的 FPGA、全定制化 ASIC和神经拟态芯片等。
FPGA 是在 PAL、GAL、CPLD 等可编程器件根底上进一步开展的产品。用户能够经过烧入FPGA 的装备文件来界说这些门电路以及存储器之间的连线。这种烧入不是一次性的,比方用户能够把 FPGA 装备成一个微操控器 MCU,运用结束后能够修改装备文件把同一个FPGA 装备成一个音频编解码器。因而,它既处理了定制电路灵敏性的缺乏,又克服了原有可编程器材门电路数有限的缺陷。
FPGA 可一起进行数据并行和使命并行核算,在处理特定运用时有愈加显着的功率进步。关于某个特定运算,通用 CPU 或许需求多个时钟周期;而 FPGA 能够经过编程重组电路,直接生成专用运算电路,仅耗费少数乃至一次时钟周期就可完结运算。
因为FPGA的灵敏性,许多运用通用处理器或 ASIC难以完结的底层硬件操控操作技能,运用 FPGA 能够很方便地完结。这个特性为算法的功用完结和优化留出了更大空间和可修改性。一起 FPGA 一次性本钱(光刻掩膜制造本钱)远低于 ASIC,在芯片需求还未成规划、深度学习算法暂未安稳,需求不断迭代改善的情况下,运用 FPGA 芯片具有可重构的特性来完结半定制的人工智能芯片是最佳挑选之一。
功耗方面, FPGA 也具有天然生成的优势。CPU履行指令,都需求有指令存储器、译码器、各种指令的运算器及分支跳转处理逻辑参加运转,而FPGA每个逻辑单元的功用在重编程时就现已确认,不需求指令且无需同享内存,然后能够极大的下降单位履行的功耗,进步全体的能耗比。
因为 FPGA 具有灵敏快速的特色,因而在很多范畴都有代替 ASIC 的趋势。尤其是在需求更多的灵敏改动需求验证和支撑扩展运用方面,FPGA 在人工智能范畴的运用如图所示。
现在深度学习、视觉交融等人工智能核算需求,首要选用 CPU+GPU、FPGA 等已有的合适并行核算的芯片来完结。在自动驾驶运用没有大规划鼓起之前,运用这类已有的通用芯片能够防止专门研制定制芯片(ASIC)的高投入和高风险。可是,因为这类通用芯片规划初衷并非专门针对深度学习,因而天然存在功能、功耗等方面的局限性。
跟着人工智能算法和运用技能的日益开展,以及人工智能专用芯片ASIC工业环境的逐渐老练,全定制化人工智能ASIC也逐渐体现出自身的优势,从事此类芯片研制与运用的国内外比较有代表性的公司有华为、地平线、深鉴科技、寒武纪、中星微、英伟达、谷歌、高通、英特尔等。
首要,ASIC的功能进步十分显着。例如英伟达首款专门为深度学习从零开始规划的芯片 Tesla P100 数据处理速度是其 2014 年推出GPU 系列的 12 倍。谷歌为机器学习定制的芯片 TPU 将硬件功能进步至相当于当时芯片按摩尔定律开展 7 年后的水平。正如 CPU 改动了当年巨大的核算机相同,人工智能 ASIC 芯片也将大幅改动现在 AI 硬件设备的相貌。如大名鼎鼎的 AlphaGo 运用了约 170 个图形处理器(GPU)和 1200 个中央处理器(CPU),这些设备需求占用一个机房,还要装备大功率的空调,以及多名专家进行体系维护。
在ASIC芯片需求还未构成规划、深度学习算法暂未安稳,AI 芯片自身需求不断迭代改善的情况下,运用具有可重构特性的 FPGA 芯片来完结自动驾驶核算是成为挑选之一。但因为FPGA的技能门槛儿较高,处于创业类自动驾驶公司而言在短期内把握满足娴熟的FPGA编程技能并完结硬件可靠性规划的难度太大,因而运用通用型CPU+GPU来做自动驾驶核算渠道或域操控器的开发成为当时的干流,英伟达最近几年的炽热足以阐明全部,而且CPU+GPU组合,根据Linux内核和ROS体系的架构,现已有较为老练的生态,这样的挑选现在仍是最靠谱的,也是最简单落地的。
(责任修改:fqj)