为了提高核算基础设施的功能,并紧跟数据剖析与 AI 不断攀升的需求,很多企业将硬件加快视为首要的解决方案。在大多数状况下,先进的可编程硬件(首要是指 GPU 和 FPGA)是加快的首要办法。经过运用这种先进的硬件,企业正在赢得核算优势;但是,关于编程难度,他们依然存在合理的忧虑。
图 1:剖析/AI 流水线组件
硬件制造商正在将加快办法运用于核算存储,这是专门规划用于包含内嵌核算元素的存储。这种办法现已被证明可认为剖析和 AI 运用供给优异的功能(图 1)。运用或许不运用机器学习辅佐的剖析以及验证,都可以凭借核算存储器件进行加快。这些器材供给了一个要害的优势,使得本钱昂扬的核算被卸载到存储器材上,而不用在服务器 CPU 上完结。与规范的存储/CPU 办法比较,经过核算存储取得的优势包含:
1. 凭借运用专用编程定制可编程硬件,取得更高功能
2. 将核算使命从服务器卸载到存储器材,开释 CPU 资源
3. 数据与核算共址,下降数据传输需求
这种新颖的办法远景光亮。不过,您应依据具体用例评价这种办法,考量功能、本钱、功耗和易用性。性价比和单位功耗功能在挑选加快硬件评价时,占有首要比率。在本文中,咱们将研讨单位功耗功能(另一篇文章则专门研讨性价比)。
核算存储功耗比较
3种体系
在这个场景中,咱们将比较以 CSV 数据读取用例为主的三种东西:英伟达 GPUDirect 存储 和RAPIDS存储,以及依据赛灵思技能的三星 SmartSSD 存储。CSV 读取在核算密集型流水线中起着重要的效果(参见图 1)。
鄙人文中,咱们将功能界说成 CSV 的处理速率,或处理“带宽”。咱们先快速回忆一下三种体系的运转办法。
英伟达 GPUDirect 存储
·端到端满意剖析和 AI 需求
·将 GPU 用作核算单元,紧贴依据 NVMe 的存储器材布局 (GPUDirect)
·运用 CUDA 进行编程 (RAPIDS)
英伟达用其 CSV 数据读取技能衡量相关于规范 SSD 的功能提高。成果如图 1 所示。运用 1 到 8 个加快器时,对应的吞吐量是 4 到 23GB/s。
三星 SmartSSD 驱动器
·将赛灵思 FPGA 用作核算单元
·与存储逻辑内嵌驻留在同一个内部 PCIe 互联上
·经过编程在存储渠道上展开运算
赛灵思数据剖析解决方案协作伙伴 Bigstream 与三星协作,为 Apache Spark 规划加快器,包含用于 CSV 和 Parquet 处理的 IP。SmartSSD 的测验运用单机形式的 CSV 解析引擎,以便展开比较。成果如图 2 所示,运用 1 到 12 个加快器时,对应的吞吐量是 4 到 23GB/s,一起也给出英伟达的成果(运用 1 到 8 个加快器)。请注意,本评论中的一切成果都按 x 轴上的加快器数量进行参数化。
这些成果令人振奋,但在挑选您的解决方案时,请务必将功耗状况归入考虑。
图 2:SmartSSD 驱动器的 CSV 解析功能成果
单位功耗功能比较
图 3 显现了将功耗考虑在内后的剖析成果。它们代表单位功耗到达的功能水平,依据上述评论中引证的相关资料,给出了以下假定:
·Tesla V100 GPU:最大功耗 200 瓦
·SmartSSD 驱动器 FPGA:最大功耗 30 瓦
图 3:CSV 解析的每瓦功耗带宽比较
在这个场景下,核算标明,在悉数运用 8 个加快器的状况下,SmartSSD 的单位功耗功能比 GPUDirect Storage 高 25 倍。
FPGA 与 GPU 比照:有关单位功耗功能的终究考虑
核算存储的优势在于能增强数据剖析和 AI 运用的功能。但是,要让这种办法具有可实践布置的才能和实用性,就必须在评价时将功耗归入考虑。
针对用于 CSV 数据解析的两种不同的核算存储办法,咱们现已提出按功耗参数化的吞吐量功能曲线。成果显现,在运用类似数量的加快器进行比较时,SmartSSD 驱动器的单位功耗功能优于 GPUDirect存储办法。
GPUDirect 是英伟达经过 NVIDIA DGX-2 运用渠道供给的研讨体系。
三星 SmartSSD 驱动器是一种可布置的量产型 PCIe 可插拔渠道,现在现现已过赛灵思及分销商供货。
如需了解更多信息,请检查:
· 有关 Bigstream 与 SmartSSD 核算存储器材结合运用,加快大数据和数据剖析的电子书。
· Bigstream 硬件加快 Apache Spark解决方案。
· 有关运用三星 SmartSSD 驱动器给作业负载带来优势的 三星 SmartSSD 页面。