在物联网、大数据和人工智能 (AI) 的推进下,从交通运输、医疗保健到零售和文娱等很多职业将走上转型之路,运用资料公司将其统称为 AI 核算年代。
在曾经的核算年代中,大型机/小型机、PC/服务器和智能手机/平板电脑均获益于摩尔定律的前进,伴跟着 2D 微缩,产品的功能、功耗和面积/本钱(也称为“PPAC”)得以同步进步。
尽管 AI 年代的各类运用正在繁荣开展,但摩尔定律却放缓了脚步;因而,职业需求在 2D 微缩以外获得打破,以全新办法推进 PPAC 的进步。详细而言,咱们需求新的核算架构、新资料、新结构(特别是节约面积的 3D 结构),以及用于芯片堆叠和异构规划的高档封装。
AI 年代的架构改变正在对逻辑和存储器发生影响。机器学习的算法很多地运用通用逻辑中极为杂乱的矩阵乘法运算,这推进了加速器及其存储器的改变。AI 核算包含两种显着不同的存储器使命:第一种是存储核算的中心成果;第二种是存储与练习模型相关的权重。
功能和功耗关于云核算和边际核算都十分重要,而存储器方面的立异可以为此供给助力。一种运用现有存储器技能的办法是“近存储器”,其间很多工作存储器被紧缩并放置在物理上与逻辑存储器严密相邻的方位,经过高速接口衔接。例如,3D 堆叠和硅通孔技能正益发遭到欢迎。作为这些运用中的“工作存储器”,SRAM 和 DRAM 的一个首要缺点在于它们是易失性存储器,需求继续供电来保存数据(如权重)。
为了下降云和边际的功耗,规划人员正在评价兼具高功能和非易失性的新式存储器,由于它们只要在自动读写时才需求运用电源。有三种计划引领着新式存储器, 它们分别是磁性RAM (MRAM)、相变式 RAM (PCRAM) 和电阻式 RAM (ReRAM) 。
不同于运用电荷,上述三款存储器运用新资料发生不同的电阻率状况 ,而凹凸电阻顺次表明 1 和 0。MRAM 运用磁场方向的改变来操控电阻率。PCRAM 运用了从非晶态到晶态的资料摆放结构改变。ReRAM 在资猜中发明了一条电流通路。PCRAM 和 ReRAM 均供给电阻率的中心阶段,这可在每个单元中存储多层的比特数据。
咱们来了解一下 AI 年代的核算运用,了解它们如安在未来蓝图中推进立异。
图 1. AI 年代推进半导体立异的复兴之路
物联网边际运用可被划分为低功能/低功耗运用,以及高功能/高功耗运用。
例如,选用 AI 算法的安全摄像头是一种低功能/低功耗运用,AI 算法十分合适面部和语音辨认等运用。规划方针是尽或许多地处理边际数据,并且仅将重要信息传输到云。由于采样频率较低,因而功能要求也很低。功耗(包含待机功耗)至关重要,关于电池供电设备尤为如此。
现在,业界在边际设备中运用 SRAM 存储器。SRAM 并非抱负挑选,由于每个存储单元需求多达六个晶体管,并且源走漏功率会很高。在存储权重方面,SRAM 的能效并不杰出,特别是在低频规划中运用时。作为代替计划,MRAM 可保证将晶体管密度进步数倍,然后完结更高的存储密度或更小的芯片尺寸。MRAM 的另一个要害特性在于,这种产品经专门规划,可以安装到嵌入式片上体系产品 (SOC) 的后端互连层中。MRAM 可用于存储 SOC 的操作体系和运用程序,无需运用嵌入式闪存芯片便可完结这一意图,然后减少了体系芯片的总数和本钱。
高功能“近边际”运用,如缺点检测和医学筛检,则需求更高的功能。MRAM 的一种变型称作自旋轨迹转矩 MRAM (SOT-MRAM),经证明,这种产品在速度和功耗方面或许优于自旋搬运力矩 MRAM (STT-MRAM)。
云核算需求尽或许高的核算功能,而练习时则需求将很多数据搬运到机器学习加速器邻近,相应地,需求为机器学习加速器供给较大的片上 SRAM 缓存并辅以大型片外 DRAM 阵列——这就要求运用继续的电源。用电量对云服务供给商十分重要,由于 AI 年代的数据会呈指数级增加,而电网功率有限且本钱昂扬。PCRAM 的功耗和本钱比 DRAM 更低,而功能则比固态硬盘和机械硬盘更高,因而成为云核算架构的首选计划。
除了上述“二进制”的边际运用、近边际运用和云运用方面具有宽广远景外,在存储内核算的研讨也在日益深化。可以幻想,在存储器阵列中为机器学习履行频频的矩阵乘法运算。规划人员正在探究伪交叉点架构,其间权重存储在各个存储器节点上。PCRAM、ReRAM 乃至铁电场效应晶体管 (FeFET) 都是优异的备选计划,由于它们都有每单元多层存储的潜力。现在而言,ReRAM 看起来是最合适此类运用的存储器。可以运用欧姆定律和基尔霍夫定律在阵列内完结矩阵乘法运算,而无需向芯片内移入和移出权重。多层单元架构可以完结全新等级的存储器密度,为规划和运用更大的模型供给支撑。需求对新资料进行全面的开发和工程规划,才能将这些新的模仿存储器付诸实际,现在运用资料公司正在积极探究部分极具代表性的计划。
当摩尔定律的指数级开展速度逐渐减缓,AI 年代将迎来数据上的指数级增加。这种压力已经在推进着架构、资料、3D 结构以及用于芯片堆叠和异构集成的先进封装不断立异。存储器与 AI 核算引擎的联系越来越严密,终究,存储器或许成为 AI 核算引擎自身。跟着这些立异锋芒毕露,咱们将见证功能、功耗和密度(面积/本钱)的明显进步——跟着新式存储器的逐渐优化,边际、近边际和云运用的需求终究会得到满意。咱们需求硬件上的全面复兴来开释 AI 年代的悉数潜力。