首页  ·  知识 ·  基础设施
磁盘阵列设备选型要点
李骏仁  E-Works   数据中心  编辑:德仔   图片来源:网络
在项目核心存储设备选型时,对当前市场主流的SAN、NAS、CAS存储设备进行了分析比对。对SAN+CAS、SAN+NAS、全SAN三种方案进行了技术分
在项目核心存储设备选型时,对当前市场主流的SAN、NAS、CAS存储设备进行了分析比对。对SAN+CAS、SAN+NAS、全SAN三种方案进行了技术分析和成本估算。前两种方案存在着管理复杂、对基础网络要求高、共享性低等特点;基于项目采用Windows 2008平台下SQL Server 2008数据库的FILESTREAM管理大数据量,经过认真调研,通过仔细对照,对行业企业级存储设备:包括SUNST6000系列、HP EVA8000系列、EMC CX4系列、NETAPP FAS3000系列、HDS AMS2000系列进行综合分析后,存储区域网(Storage Area Network,简称为SAN)成为项目的首选。

1 磁盘阵列

    市场主流磁盘阵列分为软件和硬件两种,软件磁盘阵列指的是用一块SCSI卡与磁盘连接,硬件磁盘阵列指的是阵列柜中具有背板的阵列。硬件磁盘阵列是一个完整的磁盘阵列系统与系统相接,内置CPU。与主机并行动作,所有的I/O都在磁盘阵列中完成,减轻主机的负担,增加系统整体性能,加速数据的存取与传输。

    SAN是一种通过光纤交换机等连接设备将磁盘阵列、磁带等存储设备与相关服务器连接起来的高速专用子网。

    旨在对主流的企业级磁盘阵列产品控制器冗余设计、断电保护技术、缓存大小、磁盘阵列的扩展性、前后端链路设计、存储带宽、IOPS大小、磁盘链路设计、存储的管理灵活性、磁盘阵列支持的协议、磁盘阵列的兼容性、远程磁盘阵列维护管理的支持、服务能力等进行综合分析。

2主要指标分析

    2.1控制器

    在采用光纤磁盘阵列,一般都采用带智能磁盘控制器的磁盘阵列。磁盘控制器是介于主机和磁盘之间的控制单元,配置有专门为I/O进行过优化的处理器以及一定数量的Cache。控制器上的CPU和Cache共同实现对来自主机系统I/O请求的操作和对磁盘阵列的RAID管理。控制器磁盘阵列释放了大量主机资源,来自主机的VO请求由控制器接受并处理,阵列上的Cache则作为I/O缓冲池,能够大大提高磁盘阵列的读写响应速度,显著改善磁盘阵列的性能。一般中高端光纤盘阵都采用双控制器,而高档阵列多采用多控制器。从而充分发挥光纤磁盘的高可用特性,可以配置成为Active/Active模式或者Active/Passive模式。

    Active/Passive意味着一个控制器为主动处理I/O请求,而另外一个处于空闲状态,以备用于在主控制器出现故障或者处于离线状态时接管其工作。而Active/Active存储系统包含一个由电池支持的镜像缓存,控制器中缓存中的内容被完整的镜像至另外一个控制器中,并能够保证其可用性。

    磁盘阵列体系结构,如图1所示,对比了单控制器、双控制器和多控制器磁盘阵列性能和成本投入之间的相对关系,企业应根据业务重要性和预算投资情况进行选择。

2.2通道数量和带宽

    磁盘阵列作为数据的存储设备,供前端应用系统使用,需要磁盘阵列提供接口,主要利用光线交换机与服务器主机或其他网络设备相连接。现在大多数外接主机通道均基于SAN连接具有FC接口,接口速率大小为2G、4G,部分可支持8G FC接口。磁盘阵列后端区别为FC、SAS链路,FC链路市场主流依然是4G或8G链路;而在中高端产品中使用3G的SAS链路,还受单条8m的长度制约,SAS2.x规范已在考虑超过20m的连接距离,并为扩展到12Gb/s的SAS-3做准备。

    磁盘阵列有单主机通道磁盘阵列和多主机通道磁盘阵列之分。单主机通道磁盘阵列只能接一台主机,多主机通道磁盘阵列可接多个主机系统,并同时使用,有很大的灵活扩充能力,可以群集(Cluster)的方式共用磁盘阵列。前端主机通道数越多表示可接主机数量越多,支持带宽越大;而后端通道数量越多,表示该阵列可扩展性就越高。

    2.3磁盘类型

    SATA(Serial Advanced Technology Attachment)一种基于行业标准的串行硬件驱动器接口,是由Intel、IBM、Dell、APT、Maxtor和Seagate公司共同提出的硬盘接口规范。在数据传输的过程中。数据线和信号线独立使用,并且传输的时钟频率保持独立。

    SAS(Serial Attached SCSZ)即串行连接SCSI,是新一代的SCSI技术,和现在流行的SATA硬盘相同,都是采用串行技术以获得更高的传输速度,并通过缩短连结线改善内部空间等。SAS的接口技术可以向下兼容SAlA。SAS可以和SATA以及部分SCSI设备无缝结合。中端磁盘阵列对扩展性和端对端数据完整性的要求更高,与SATA比较SAS 2.0的参数更为合适,而且,与4Gb/s FC相比,6Gb/sSAS在速度规格上更具优势,电气兼容性也更好。

    较之500G/750G/1TB硬盘,在单盘容量上,SSD还有很多研发工作要做;在可靠性上,SSD每个存储单元的连续擦写寿命也是厂家在新的技术、新的纠错能力上需要提高的;更重要的,还是价格,相对其他传统硬盘SSD的价格还不是一般应用所能接受。如表1所示比较了四类磁盘类型适用的应用场景,供读者参考。

表1 磁盘类型应用场景对比

 

 

 2.4最大可用容量

    中高端磁盘阵列产品中,可扩展磁盘数最大可达到960块,最小磁盘数也能达到300盘左右,而市场上主流单盘容量为FC 300G或450G 15Kr/min磁盘,最大存储容量是指磁盘阵列设备所能存储数据容量的极限,通俗的讲,就是磁盘阵列设备能够支持的最大硬盘数量乘以单个硬盘容量就是最大存储容量,即960×450/1024=422T,(1TB=1024GB)。实际上这个数值还取决于所使用RAID的级别和数据热备盘的比例。采用不同的RAID级别和热备盘数量。有效的存储容量也就有所差别,如果采用7D+1P的RAID5级别加上10%热备盘数量,可用容量最大可达316T,这完全满足对目前非数据中心的应用需要。

    如表2所示,从单盘容量、磁盘扩展能力测算磁盘阵列的最大存储容量和可供应有系统使用最大可用容量。

    表2 磁盘阵列最大可用容量测算对比

 
2.5 IOPS(每秒输入输出次数)

    在同等情况下,100%顺序读、100%顺序写、100%随机读、100%随机写这四种IOPS中。100%顺序读的IOPS最高。因此,很多厂商公布的那些非常高的IOPS数据实际上是将被测存储系统配置了尽量多的小容量、高转速磁盘且每个磁盘装载数据量不多、设置为RAID-10时测出的100%顺序读(Sequential Read)IOPS的最大值。

    决定IOPS的主要取决与阵列的算法,cache命中率,以及磁盘个数。阵列的算法根据不同的阵列而不同。cache的命中率取决于数据的分布、cachesize的大小、数据访问的规则以及csche的算法。如果一个阵列,读cache的命中率越高表示它可以支持更多的IOPs。

    每个物理硬盘能处理的IOPS是有限制的,如表3所示。

    表3 磁盘转速对应IOPS大小

 

如果一个阵列有150块15Kr/min的光纤盘,最大IOPS理论值为150 x 150=22500,如果超过这个值,硬盘的响应就会变的非常缓慢而不能正常提供业务。

    假定一个业务iops是10000,读cache命中率是30%,读iops为60%,写iops为40%,磁盘个数为150,那么在raid5与raidl0的情况下,单个磁盘的iops为:

 
可以看出,因为raidl0对于一个写操作,只发生2次io,所以,同样的压力,同样的磁盘,每个盘的iops只有81个,远远低于磁盘的极限iops。

    2.6存储带宽

    吞吐量主要取决于阵列的构架,光纤通道的大小以及硬盘的个数。阵列的构架与每个阵列不同而不同,他们也都存在内部带宽,不过一般情况下,内部带宽都设计的很充足,不是瓶颈的所在。

    光纤通道的影响还是比较大的,如数据仓库环境中,对数据的流量要求很大,而一块4Gb的光纤卡,所能支撑的最大流量应当是4Gb/8(小B)=500MB/s的实际流量,2块光纤卡才能达到1GB/s的实际流量。

    当光纤通道的瓶颈不存在的时候,就需要分析硬盘的个数,如表4,比较了不同的硬盘流量大小。

    表4 不同转速磁盘每秒最大流量对比

 
 那么,一个150块15Kr/min的光纤硬盘阵列,硬盘上最大的可以支撑的流量为150×13=1950MB/s,就需要4块4Gb的光纤卡。这对于主流的前端支持8条4Cb的光纤通道的中高档阵列来说,超过150块15Kr/min磁盘的应用,就需要支持8条以上前端通道的扩展能力。

    2.7其他

    对中高端磁盘阵列,主要用于大中型企业核心数据存储,存储的管理如卷的灵活配置、LUN的MAPPING等日常维护工作以及磁盘阵列的兼容性,比如,对主流操作系统的支持,对集群软件的支持;磁盘阵列远程可维护管理的支持、阵列可支持的快照、复制等功能以及容灾的支持级别等;作为在逻辑上SAN的核心,光纤通道交换机连接着主机和存储设备,其功能和稳定性决定整个SAN网络内数据安全以及设备厂商的服务能力都是在设备选型中必须要考虑。

3结束语

    SAN允许独立地增加它们的存储容量,也使得管理及集中控制更加简化。而且,光纤接口提供了10km的连接长度,这使得物理上分离的远距离存储变得更容易。通过SAN存储网络可以方便实现:大容量存储设备数据共享、高速计算机与高速存储设备的高速互联、灵活的存储设备配置要求、数据快速备份以及提高数据的可靠性和安全性。                  

本文作者:李骏仁 来源:E-Works
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的