首页  ·  知识 ·  基础设施
独立冗余磁盘阵列(RAID)技术及其应用
王曙光 吕国人  万方数据   数据中心  编辑:德仔   图片来源:网络
1 RAID概述 nbsp
 1 RAID概述

    RAID是“Redundant Array of IndependentDisk”的缩写,中文意思是独立冗余磁盘阵列。该技术诞生于1987年。由美国加州大学伯克利分校提出。

    RAID就是一种由多块廉价磁盘构成的冗余阵列,在操作系统下是作为一个独立的大型存储设备出现。RAID可以充分发挥出多块硬盘的优势,可以提升硬盘速度,增大容量,提供客错功能够确保数据安全性,易于管理的优点,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。

    2 RAID的几种常用的工作模式

    2.1 RAIDO:无差错控制的带区组

    即Data Stripping数据分条技术。RAID0可以把多块硬盘连成一个容量更大的硬盘群,可以提高磁盘的性能和吞吐量。RAID0没有冗余或错误修复能力,成本低,要求至少两个磁盘,一般只是在那些对数据安全性要求不高的情况下才被使用。

    2.2 RAID1:镜象结构

    RAID1是把一个磁盘的数据镜像到另一个磁盘上,在不影响性能情况下最大限度的保证系统的可靠性和可修复性,具有很高的数据冗余能力,这种硬盘模式的安全性是非常高的,RAIDl的数据安全性在所有的RAID级别上来说是最好的。但是其磁盘的利用率却只有50%,是所有RAID级别中最低的,故成本最高,多用在保存关键性的重要数据的场合。

    2.3 RAID2:带海明码校验

    从概念上讲,RAID2同RAID3类似,两者都是将数据条块化分布于不同的硬盘上,条块单位为位或字节。然而RAID2使用一定的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID2技术实施更复杂。因此,在商业环境中很少使用。电脑在写入数据时在一个磁盘卜保存数据的各个位,同时把一个数据不同的位运算得到的海明校验码保存另一组磁盘上,海明码可以往数据发生错误的情况下将错误校正,可保证输出的正确。但海明码使用数据冗余技术,所以使得输出数据的速率取决于驱动器组中速度最慢的磁盘。

    2.4 RAlD4:带奇偶校验码的独立磁盘结构

    RAID4和RAID3很象,它对数据的访问是按数据块进行的,也就是按磁盘进行的,每次是一个盘,不过在失败恢复时,它的难度可要比RAID3大得多了,控制器的设计难度也要大许多,而且访问数据的效率不够理想。

    2.5 RAID5:分布式奇偶校验的独立磁盘结构

    RAID5把校验块分散到所有的数据盘中。RAID5使用了一种特殊的算法,可以计算出任何一个带区校验块的存放位置。这样就可以确保任何对校验块进行的读写操作都会在所有的RAID磁盘中进行均衡,从而消除产生瓶颈的可能。RAID5的读出效率很高,写入效率一般,块式的集体访问效率不错。RAID5提高了系统可靠性,但对数据传输的并行性解决不好,而且控制器的设计也相当困难。

    2.6 RAID10:高可靠性与高效磁盘结构

    3 应用RAID技术

    要使用磁盘RAID主要有两种方式,第一种就是RAID适配卡,通过RAID适配卡插入PCI插槽再接上硬盘实现硬盘的RAID功能。第二种方式就是直接在主板上集成RAID控制芯片,让主板能直接实现磁盘RAID。这种方式成本比专用的RAID适配卡低很多。此外还可以用2000server or xpor linux系统做成软RAID。

    开始时RAID方案主要针对SCSI硬盘系统,系统成本比较昂贵。1993年,HighPoint公司推出了第一款IDE—RAID控制芯片,能够利用相对廉价的IDE硬盘来组建RAID系统,从而大大降低了RAID的“门槛”。从此,个人用户也开始关注这项技术,因为硬盘是现代个人计算机中发展最为“缓慢”和最缺少安全性的设备,而用户存储在其中的数据却常常远超计算机的本身价格。在花费相对较少的情况下,RAID技术可以使个人用户也享受到成倍的磁盘速度提升和更高的数据安全性。

    当前的PC机,整个系统的速度瓶颈主要是硬盘。在PC中磁盘速度慢一些并不是太严重的事,但在服务器中,这是不允许的。服务器必须能响应来自四面八方的服务请求,这些请求大多与磁盘上的数据有关,所以服务器的磁盘子系统必须要有很高的输入输出速度。为了数据的安全。还要有一定的容错功能。RAID提供了这些功能,所以RAID被广泛地应用在服务器体系中。RAID提供的容错功能是自动实现的由RAID硬件或RAID软件来做。它对应用程序是透明的,即无须应用程度为容错作半点工作。要得到最高的安全性和最快的恢复速度,可以使用RAID,要在容量,容错和性能上取拆衷使用RAIDS。

    在大多数数据库服务器中,操作系统和数据库系统所在的磁盘驱动器是RAID1,数据库的数据文件则是存放于RAID5的磁盘驱动器上。有时我们看某些名牌服务器的配置单。发现其CPU并不很快,内存也不算很大,显卡更不是最好。但价格却不便宜。服务器的配置与一般家用PC的着重点不一样,除去更高的稳定性外,冗余与容错是一大特点,如双电源,带电源备份的磁盘高速缓冲器、热插拔硬盘、热插拔PCI插槽等。另一个特点就是巨大的磁盘吞吐量,这主要归功于RAID。

    4 结语

    RAID技术是一项非常成熟的技术,所以应用十分普及。据统计,全世界80%以上的服务器系统目前配置RAID。由于服务器存储需求对数据安全性、扩展性等方面的要求越来越高,RAID技术的发展潜力巨大。可以预见,随着技术的进一步发展,价格的进一步降低,RAID技术终将被更多的人所了解和认识。

本文作者:王曙光 吕国人 来源:万方数据
CIO之家 www.ciozj.com 微信公众号:imciow
    >>频道首页  >>网站首页   纠错  >>投诉
版权声明:CIO之家尊重行业规范,每篇文章都注明有明确的作者和来源;CIO之家的原创文章,请转载时务必注明文章作者和来源;
延伸阅读
也许感兴趣的
我们推荐的
主题最新
看看其它的