您的位置 首页 发布

Linux新技术目标存储文件体系

随着高性能计算由传统的主机方式向网络化集群演变,传统的基于主机的存储架构已逐渐向网络化存储发展,计算和存储分离的趋势越来越明显。针对 S

跟着高功用核算由传统的主机方法向网络化集群演化,传统的根据主机的存储架构已逐步向网络化存储展开,核算和存储别离的趋势越来越显着。针对 SAN 和 NAS 的缺乏,国际上已展开针对 Linux 集群的新式文件体系DD目标存储文件体系的研讨,本文要点论说了存储目标文件体系的架构、技能特色,并针对Lustre 目标存储文件体系进行了开端测验,结果表明目标存储文件体系在可扩展性、功用、易用性等方面都有明显进步,跟着网络化存储技能的不断老练,目标存储文件体系将成为重要的展开方向。

一、导言

高功用核算已由传统的主机方法逐步向集群方法演化,如TOP500中,1998年只要2台体系是集群方法,而到2003年已有208台为集群体系。跟着高功用核算体系结构的展开变化,传统的根据主机的存储架构已成为新的瓶颈,不能满意集群体系的需求。集群的存储体系有必要有用处理两个首要问题:(1)供给同享拜访数据,便于集群使用程序的编写和存储的负载均衡;(2)供给高功用的存储,在I/O级和数据吞吐率方面能满意成百上千台规划的Linux集群服务器聚合拜访的需求。现在,网络化存储已成为处理集群体系高功用存储的有用技能途径。

国际上首要有两类网络化存储架构,它们是经过指令集来区别的。第一类是SAN(Storage Area Network)结构,它选用SCSI 块I/O的指令集,经过在磁盘或FC(Fiber Channel)级的数据拜访供给高功用的随机I/O和数据吞吐率,它具有高带宽、低推迟的优势,在高功用核算中占有一席之地,如SGI的CXFS文件体系便是根据SAN完结高功用文件存储的,可是因为SAN体系的价格较高,且可扩展性较差,已不能满意不计其数个CPU规划的体系。第二类是NAS(Network Attached Storage)结构,它选用NFS或CIFS指令集拜访数据,以文件为传输协议,经过TCP/IP完结网络化存储,可扩展性好、价格便宜、用户易办理,如现在在集群核算中使用较多的NFS文件体系,但因为NAS的协议开支高、带宽低、推迟大,不利于在高功用集群中使用。

针对Linux集群对存储体系高功用和数据同享的需求,国外已开端研讨全新的存储架构和新式文件体系,希望能有用结合SAN和NAS体系的长处,支撑直接拜访磁盘以进步功用,经过同享的文件和元数据以简化办理,现在目标存储文件体系已成为Linux集群体系高功用文件体系的研讨热门,如Cluster File Systems公司的Lustre、Panasas公司的ActiveScale文件体系等。Lustre文件体系选用根据目标存储技能,它来源于卡耐基梅隆大学的Coda项目研讨作业,2003年12月发布了Lustre 1.0版,估计在2005年将发布2.0版。Lustre在美国能源部(U.S.Department of Energy:DOE)、Lawrence Livermore 国家实验室,Los Alamos国家实验室,Sandia 国家实验室,Pacific Northwest国家实验室的高功用核算体系中已得到了开端的使用,IBM正在研发的Blue Gene体系也将选用Lustre文件体系完结其高功用存储。ActiveScale文件体系技能来源于卡耐基梅隆大学的Dr. Garth Gibson,最早是由DARPA支撑的NASD(Network Attached Secure Disks)项目,现在已是业界比较有影响力的目标存储文件体系,荣获了ComputerWorld 2004年创新技能奖。

二、目标存储文件体系

2.1 目标存储文件体系架构

目标存储文件体系的中心是将数据通路(数据读或写)和操控通路(元数据)别离,而且根据目标存储设备(Object-based Storage Device,OSD)构建存储体系,每个目标存储设备具有必定的智能,能够主动办理其上的数据散布,目标存储文件体系一般有以下几部分组成。

1、目标

目标是体系中数据存储的根本单位,一个目标实际上便是文件的数据和一组特点的组合,这些特点能够界说根据文件的RAID参数、数据散布和服务质量等,而传统的存储体系顶用文件或块作为根本的存储单位,在块存储体系中还需要一直追寻体系中每个块的特点,目标经过与存储体系通讯保护自己的特点。在存储设备中,一切目标都有一个目标标识,经过目标标识OSD指令拜访该目标。一般有多种类型的目标,存储设备上的根目标标识存储设备和该设备的各种特点,组目标是存储设备上同享资源办理战略的目标调集等。

2、目标存储设备

目标存储设备具有必定的智能,它有自己的CPU、内存、网络和磁盘体系,现在国际上一般选用刀片式结构完结目标存储设备。OSD供给三个首要功用:

(1) 数据存储。OSD办理目标数据,并将它们放置在规范的磁盘体系上,OSD不供给块接口拜访方法,Client恳求数据时用目标ID、偏移进行数据读写。

(2) 智能散布。OSD用其本身的CPU和内存优化数据散布,并支撑数据的预取。因为OSD能够智能地支撑目标的预取,然后能够优化磁盘的功用。

(3) 每个目标元数据的办理。OSD办理存储在其上目标的元数据,该元数据与传统的inode元数据类似,一般包含目标的数据块和目标的长度。而在传统的NAS体系中,这些元数据是由文件服务器保护的,目标存储架构将体系中首要的元数据办理作业由OSD来完结,降低了Client的开支。

3、元数据服务器(Metadata Server,MDS)

MDS操控Client与OSD目标的交互,首要供给以下几个功用:

(1) 目标存储拜访。MDS结构、办理描绘每个文件散布的视图,答应Client直接拜访目标。MDS为Client供给拜访该文件所含目标的才能,OSD在接收到每个恳求时将先验证该才能,然后才能够拜访。

(2) 文件和目录拜访办理。MDS在存储体系上构建一个文件结构,包含限额操控、目录和文件的创建和删去、拜访操控等。

(3) Client Cache共同性。为了进步Client功用,在目标存储文件体系设计时一般支撑Client方的Cache。因为引进Client方的Cache,带来了Cache共同性问题,MDS支撑根据Client的文件Cache,当Cache的文件产生改动时,将告诉Client改写Cache,然后防止Cache不共同引发的问题。

4、目标存储文件体系的Client

为了有用支撑Client支撑拜访OSD上的目标,需要在核算结点完结目标存储文件体系的Client,一般供给POSIX文件体系接口,答应使用程序像履行规范的文件体系操作相同。

2.2 目标存储文件体系的关键技能

1、散布元数据传统的存储结构元数据服务器一般供给两个首要功用。(1)为核算结点供给一个存储数据的逻辑视图(Virtual File System,VFS层),文件名列表及目录结构。(2)安排物理存储介质的数据散布(inode层)。目标存储结构将存储数据的逻辑视图与物理视图分隔,并将负载散布,防止元数据服务器引起的瓶颈(如NAS体系)。元数据的VFS部分一般是元数据服务器的10%的负载,剩余的90%作业(inode部分)是在存储介质块的数据物理散布上完结的。在目标存储结构,inode作业散布到每个智能化的OSD,每个OSD担任办理数据散布和检索,这样90%的元数据办理作业散布到智能的存储设备,然后进步了体系元数据办理的功用。别的,散布的元数据办理,在添加更多的OSD到体系中时,能够一起添加元数据的功用和体系存储容量。

声明:本文内容来自网络转载或用户投稿,文章版权归原作者和原出处所有。文中观点,不代表本站立场。若有侵权请联系本站删除(kf@86ic.com)https://www.86ic.net/changshang/fabu/300749.html

为您推荐

联系我们

联系我们

在线咨询: QQ交谈

邮箱: kf@86ic.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

返回顶部