在传统范畴鹤立鸡群的高端图形芯片现在也要开端进入并行核算范畴。图形芯片厂商nVidia在年头举行的“nVidia专业图形解决方案高端论坛”上,十分高调地表明将在更多新式范畴大显神通。
Andy Keane: FPGA仅在金融范畴与可编程GPU构成竞赛,其它并行核算范畴没有要挟。
“石油/天然气/地震材料处理、金融风险建模、医疗成像、有限元核算、生物序列匹配等新式运用范畴需求大规模并行核算才能,而咱们专业的可编程GPU具有128个处理器内核,十分合适于这些并行核算场合的需求,”nVidia专业解决方案事业部全球出售副总裁Walter Mundt-Blum说道。他以金融职业为例进行了解说,金融是并行核算的一个重要范畴,照实时期权隐含动摇引擎需求多个画面图形数据剖析,进行交换期权动摇核算,而GPU能进行单精度准确性核算,可在不到1秒钟的时间内评价一切美国的股票期权。
还有一个比如是医疗成像。在先进的医疗设备傍边,比如像CT机或者是核磁共振,往往传感器会给出很多数据需求一起进行处理,这对GPU来说十分适用。“别的像地质堪探,往往要处理十分很多的数据,乃至有时候会运用T字节级的数据进行剖析。这个范畴已有用户在运用咱们的GPU,与CPU比较GPU的速度可进步17~20倍左右,假定你用一个GPU的话,或许得运用20个CPU才行。”Mundt-Blum说道。
别的一个十分风趣的范畴便是可编程GPU能够使机器有一些认知才能,像狗的嗅觉相同,使机器能够闻出癌细胞。nVidia已在美国和一家公司协作,对嗅觉进行一些和模仿,运用GPU教电脑学会闻东西,估计几年之后咱们就会看到这类研讨和制造效果。
可是,大规模并行核算范畴也正是其它新式半导体器材如多核CPU、多核DSP以及FPGA等瞄准的新式运用,CPU和DSP向多核开展正是由于看好并行核算这个巨大的商场,而FPGA天然生成就在并行核算上具有优势。
众所周知,传统GPU是根据AS%&&&&&%结构,是不行编程的,现在nVidia大力推广其可编程GPU,也是由于看好并行核算这一重要的商场,但他们一定会面对其它技能的巨大压力。“咱们承认在某些范畴与一些器材有抵触,比如在金融范畴与FPGA有抵触,可是与其它器材抵触不会很大,GPU不与多核CPU抵触,而是与其互补。别的,多核DSP在并行核算范畴的运用刚开端,还不是竞赛对手。”该公司GPU核算事业务部总经理Andy Keane对本刊表明。Keane曾在赛灵思公司任职,在赛灵思前期进行的可重装备核算以及FPGA体系开发中发挥了重要作用。他解说道:“FPGA针对金融范畴的并行核算比较有优势,可是在其它范畴不构成竞赛。此外,其可编程性不如GPU,且FPGA的开发时间长,FPGA芯片也在不断改变。可修改GPU运用起来更便利,咱们选用了根据C++言语的开发环境CUDA。”
关于业界普遍以为可编程GPU将与多核CPU竞赛的观念他并不认同,由于两者完结的功用不同,多核CPU更合适于操作体系、数据库、产能、暂时紧缩、递归算法等的处理。CPU的专长是当从高速缓存获取数据时,尽或许快地履行一系列次序指令。CPU以很小的单位办理数据并次序地进行处理,信息的每个部分都必须等待着经过独自的履行单元,独自的履行单元十分灵敏,但不能并行地处理信息。而可编程GPU被规划用于进行一种彻底不同的处理方法。在GPU内部有128个处理器,每个处理器都能够一起选用并行方法核算一部分数据,此外GPU硬件规划能够办理数千个并行线程,这些线程悉数由GPU创建和办理,不需求开发人员进行任何编程和办理,规划便利可行。可编程GPU上还有快速存储体系——最大可至每秒76Gb。经过将并行核算放在GPU上而一起将串行核算放在CPU上,运用程序能够从这两种核算中充沛获益。“咱们不会代替多核CPU。”Keane再次着重道。
其实nVidia在2002年就引入了在GPU中进行核算的技能,推出了第一个可编程GPU,“那时咱们的编程单元只触及了GPU的很小一块——着色器,所以在2002年,咱们开端有了可编程的着色器。”Keane介绍道。经过将32位浮点技能搭载在GPU中,该公司等待开发人员将GPU超强的核算才能用于运用程序而不是图形。但前期的GPU是用相似OpenGL或Cg的图形API编程的,这些API很难而且大多数开发人员对这类API也不熟悉。
2003年,nVidia开端了一项旨在使GPU核算更简略的全新测验,并于2006年成功推出根据现在8系列GPU的CUDA技能。该公司开发了一个C程序,然后把CPU的代码和GPU的代码在源代码傍边共存,而CUDA则成为串行核算和并行核算的衔接。现在一切的8系列GPU,包含从笔记本电脑到高功能核算体系,都具有CUDA技能。为便利一致串行CPU编程以及选用GPU并行核算,nVidia还规划了CUDA环境。“将来,咱们以为CUDA环境还会用在GPU以外的处理器上,”Keane表明。“两种核算方法——串行处理和并行核算——在每个运用程序中都具有其可取之处,CUDA将是一致这两种处理和核算方法的核算方法。”
现在nVidia高功能GPU有三个渠道,即用于高功能核算的Tesla、用于专业工作站图形处理的Quadro以及用于文娱的GeForce。Tesla合适的运用包含地震、Monte Carlo服务器、分子动力学、天体物理学和信号处理;Quadro合适的运用包含图画、体视化、医学成像、专业视频和CAD等;GeForce合适的运用包含图画、音频、编码/解码、紧缩和安全性运用。GeForce渠道中现在仅有G8系列支撑CUDA。“首要的差异在于Quadro支撑OpenGL,功能是GeForce的五倍,尤其是它经过Shader Model 4.0、OpenGL和DX10进行了功能加快进步,更多重视笔直商场;Tesla集成内存控制器和内存,这对高功能核算十分重要。”Keane解说道。
nVidia的方针是将并行核算才能带入一切范畴。跟着在一切nVidia的8系列GPU上都参加CUDA技能,装备CUDA的GPU现现已超越5千万个。nVidia使得开发GPU并行程序更为简略。将来,任何开发人员都能轻松地取得一枚运用在笔记本电脑、低成本PC或高功能工作站中的可编程GPU。