前语
在曩昔的几年里,咱们目击了数据的一系列巨大改变,包括数据怎么被生成、处理以及进一步运用以获取额定的价值和智能,而这些改变都受到以深度学习和神经网络运用为根底的新式核算形式所影响。这种深入的改变始于数据中心,其运用深度学习技能来供给对海量数据的洞悉,首要用于分类或辨认图画、支撑自然语言处理或语音处理,或许了解、生成或成功学习怎么玩杂乱的战略游戏。这种改变催生了一批专门针对这些类别的问题而规划的高成效核算设备(依据GP-GPU和FPGA),后来还产生了可彻底定制的ASIC,进一步加快并进步了依据深度学习的体系的核算才能。
大数据和快速数据
大数据运用选用专门的GP-GPU、FPGA和ASIC处理器透过深度学习技能来剖析大型数据集,并提醒趋势、形式和关联性,然后完成图画辨认、语音辨认等功用。因而,大数据是依据曩昔的信息或常驻在云端的停止数据。大数据剖析的一个常用的功用是履行特定使命“练习过的”神经网络,例如辨认和符号图画或视频序列中的一切面部,语音辨认也展现了神经网络的强壮功用。
这种使命最好由专门的引擎(或推理引擎)来履行,这种引擎直接驻留在边际设备上并由快速数据运用程序(图1)来引导。经过在边际设备上处理本地所捕获的数据,快速数据可以运用来自大数据的算法供给实时决议计划和成果。大数据供给了从“曩昔产生了什么”到“将来可能会产生什么”所演绎出的洞悉(猜测剖析),而快速数据则供给了可以改进事务决议计划、运营并削减低效景象的实时举动,所以这必定会影响终究成果。这些办法可以适用于各种边际和存储设备,例如照相机、智能手机和固态硬盘。
在数据上进行核算
新的作业负载依据两种场景:(1)针对特定作业负载(例如图画或语音辨认)练习大型神经网络;以及(2)在边际设备上运用经过练习的(或“合适的”)神经网络。两种作业负载都需求大规模并行的数据处理,其间包括大矩阵的乘法和卷积。这些核算功用的最佳施行办法需求在大矢量或数据阵列上运转的矢量指令。RISC-V便是一种十分合适于此类型运用的架构和生态体系,由于它供给了一套由开源软件支撑的标准化进程,使得开发人员可以彻底自由地选用、修正乃至增加专有矢量指令。图1中概述了一些清楚明了的RISC-V核算架构时机。
移动数据
快速数据和边际核算的呈现产生了一个实践的结果,即:与云端之间来回移动一切数据进行核算剖析并不是一件有用率的事。首要,在移动网络和以太网中进行远距离传输时,它涉及到相对较大的数据推迟传输,这关于有必要实时操作的图画辨认或语音辨认运用而言并不是抱负的。其次,在边际设备上进行核算需求更易于弹性的架构,其间,图画和语音处理或许在SSD上进行的内存核算操作都可用一种弹性的办法来进行。选用这种办法,每一台新增的边际设备都会带来所需求的增量核算才能,对数据移动办法和时刻进行优化是这种架构可弹性性的一项要害要素。
图1:大数据、快速数据和RISC-V时机
在图1a中,云数据中心服务器运用在大型大数据集上练习的深度学习神经网络来履行机器学习的功用。在图1b中,边际设备中的安全摄像机选用经过大数据练习的推理引擎来实时辨认图画(快速数据)。在图1c中,智能固态硬盘设备选用推理引擎进行数据辨认和分类,然后有用地运用了此设备的带宽。图1展现了RISC-V内核的潜在时机,它可以自由地增加专有的及未来标准化的矢量指令,这些指令关于处理深度学习和推理技能适当有用。
另一个相似且重要的趋势是大数据端和云端上数据的移动及拜访办法(图2)。传统的核算机体系结构(图2a)选用慢速外围总线,该总线连接到许多其他设备(例如,专用机器学习加快器、图形卡、高速固态硬盘、智能网络控制器,等等)。低速总线会影响设备的运用率,由于它约束了总线自身、主CPU以及首要的潜在耐久内存之间的通讯才能。这些新式核算设备也不行能在它们之间或与主CPU同享内存,然后导致在慢速总线上进行白费且受约束的数据移动。
关于怎么改进不同核算设备(例如CPU和核算机及网络加快器)之间的数据移动,以及怎么在内存或快速存储中拜访数据,呈现了几个重要的职业趋势。这些新趋势会集在敞开标准化作业上,可以供给更快、更低推迟的串行结构以及更智能的逻辑协议,然后完成对同享内存的共同拜访。
新一代以数据为中心的核算
未来的架构将需求布置敞开接口,以连接到耐久性内存以及接入核算加快器并支撑高速缓存共同性的快速总线(例如TileLink、RapidIO®、OpenCAPI™和Gen-Z),以期大幅度进步功用,并且使一切设备同享内存并削减不必要的数据移动。
图2:核算体系结构中的数据移动和拜访
在图2a中,传统的核算体系结构由于把一条慢速外设总线用于快速存储器及核算加快设备,其才能已达到其极限。在图2b中,未来的核算体系结构选用了敞开接口,可以为平台上一切的核算资源供给统一起支撑高速缓存共同性的拜访办法来拜访同享耐久内存,(这称为以数据为中心的体系结构)。在图2c中,所布置的设备可以运用相同的同享内存,然后削减了不必要的数据仿制。
CPU 外围中心及网络接口控制器的效果将成为支撑数据移动的要害要素。CPU外围中心组件有必要支撑密钥内存和永久内存接口(例如NVDIMM-P),也有必要支撑驻留在CPU邻近的内存。还需求施行面向核算加快器、智能网络和长途耐久内存的智能快速总线。这种总线上的任何设备(例如CPU、通用或专用核算加快器、网络适配器、存储器或内存)都可以包括其自己的核算资源并具有拜访同享内存的才能(图2b和图2c)。
RISC-V技能正是优化数据移动的要害推进要素,由于它可以在一切的核算加快器设备上针对新的机器学习作业负载来履行矢量指令。它完成了多种开源CPU技能,可以支撑敞开内存和智能总线接口;且完成了以数据为中心具有共同性同享内存的体系结构。
运用RISC-V处理应战
大数据和快速数据为未来的数据移动带来了应战,也为RISC-V指令集架构(ISA)铺平了路途。这种架构敞开的、模块化的办法十分合适用作以数据为中心的核算体系结构的根底。它供给了以下功用:
· 扩展边际核算设备的核算资源
· 增加新的指令,例如用于机器学习作业负载的矢量指令
· 寻觅十分接近于存储器和内存介质的小型核算内核
· 支撑新式核算范式以及模块化芯片规划办法
· 支撑新式以数据为中心的体系结构,其间一切的处理单元都可以透过共同的办法拜访同享的耐久内存,然后优化数据移动
RISC-V由超越100个安排机构的很多成员共同开发,这其间包括一个由软件和硬件立异者组成的协作性社区。这些立异者可以对ISA进行改编,使其习惯特定的意图或项目。任何参加该安排的人都可以依据一份“Berkeley Software Distribution”(BSD软件发布)许可证来规划、制作和/或出售RISC-V芯片和软件。
结语
为了完成其价值和可能性,数据需求捕获、保存、拜访并转化,以发挥其悉数潜力。含有大数据和快速数据运用的环境现已使通用核算体系结构的处理才能相形见绌。未来以数据为中心的极点运用将需求针对特定用处规划的处理才能,以便以敞开的办法支撑数据资源的独立扩展。
具有一套以在耐久内存中存储的数据为中心的通用敞开核算机体系结构,一起又可以让一切的设备发挥必定的核算效果,这是由新类型机器学习核算作业负载所推进的这些新式可扩展体系结构得以呈现的要害要素。跨过云端及边际设备各个部分的下一代运用都需求这种新式的低能耗处理办法,由于专门的核算加快处理器将可以专心于处理其手边的使命,然后可以削减来回移动数据所糟蹋的时刻,或许可以履行与数据无关的额定核算。经过发挥数据的力气、潜力和可能性,人类、社会以及咱们的星球都可以蓬勃发展。