一直以来,看到关于raid5与raid10的性能之争还是非常多的,甚至很多人那拿出了测试数据,但是,到底谁是谁非。这里,我就这两种raid的内部运行原理来分析一下,我们在什么情况下应当适合选哪一种raid方式。
为了方便对比,我这里拿同样多驱动器的磁盘来做对比,raid5选择3D+1P的raid方案,raid10选择2D+2D的Raid方案,分别如图:
1、安全性方面的比较
其实在安全性方面,勿须质疑,肯定是RAID10的安全性高于RAID5。我们也可以从简单的分析来得出。当盘1损坏时,对于RAID10,只有当盘1对应的镜象盘损坏,才导致RAID失效。但是对于RAID5,剩下的3块盘中,任何一块盘故障,都将导致RAID失效。
在恢复的时候,RAID10恢复的速度也快于RAID5。
2、空间利用率的比较
RAID10的利用率是50%,RAID5的利用率是75%。硬盘数量越多,RAID5的空间利用率越高。
3、读写性能方面的比较
那么,我们分析如下三个过程:读,连续写,随机写,但是,在介绍这三个过程之前,我需要介绍一个特别重要的概念:cache。
cache技术最近几年,在磁盘存储技术上,发展的非常迅速,作为高端存储,cache已经是整个存储的核心所在,就是中低端存储,也有很大的cache存在,包括最简单的raid卡,一般都包含有几十,甚至几百兆的raid cache。
cache的主要作用是什么呢?体现在读与写两个不同的方面,如果作为写,一般存储阵列只要求写到cache就算完成了写操作,所以,阵列的写是非常快速的,在写cache的数据积累到一定程度,阵列才把数据刷到磁盘,可以实现批量的写入,至于cache数据的保护,一般都依赖于镜相与电池(或者是UPS)。
cache的读一样不可忽视,因为如果读能在cache中命中的话,将减少磁盘的寻道,因为磁盘从寻道开始到找到数据,一般都在6ms以上,而这个时间,对于那些密集型io的应用可能不是太理想。但是,如果cache能命中,一般响应时间则可以在1ms以内。
不要迷信存储厂商的iops(每秒的io数)数据,他们可能全部在cache命中的基础上做到的,但是实际上,你的cache命中率可能只有10%。
介绍完cache,我们就可以解释raid5与raid10在不同的模式下,工作效率问题了,那么我们来分别分析以上三个问题。
3.1、读操作
因为raid5与raid10的磁盘都可以提供服务,所以,在读上面他们基本是没有差别的,除非是读的数据能影响cache命中率,导致命中率不一样。
3.2、连续写
连续写的过程,一般表示写入连续的大批量的数据,如媒体数据流,很大的文件等等,这个写操作过程,如果有写cache存在,并且算法没有问题的话,raid5比raid10甚至会更好一些(这里要假定存储有一定大小足够的写cache,而且计算校验的cpu不会出现瓶颈)。因为这个时候的校验是在cache中完成,如4块盘的raid5,可以先在内存中计算好校验,同时写入3个数据+1个校验。而raid10只能同时写入2个数据+2个镜相。
如,4块盘的raid5可以在同时间写入1、2、3到cache,并且在cache计算好校验之后,我这里假定是6(实际的校验计算并不是这样的,我这里仅仅是假设),同时把三个数据写到磁盘。而4块盘的raid10不管cache是否存在,写的时候,都是同时写2个数据与2个镜相。
但是,我前面也说过了,写cache是可以缓存写操作的,等到一定时期再写到磁盘,但是,写操作不比读操作,这个写是迟早也要发生的,也就是说,最后落到磁盘上的写还是避免不了的,不过,如果不是连续性的强连续写,只要不达到磁盘的写极限,差别都不是太大。
3.3、离散写
这里可能是最难理解,但是,也是最重要的部分,数据库,如oracle 数据库大部分操作就是离散写,如每次写一个数据块的数据,如8K;联机日志虽然看起来是连续写,但是因为每次写的量不多,不保证能添满raid5的一个条带(保证每张盘都能写入),所以很多时候也是离散写入。
我们再接上图,假定要把一个数字2变成数字4,那么对于raid5,实际发生了4次io,
先读出2与校验6,可能发生读命中
然后在cache中计算新的校验
写入新的数字4与新的校验8
对于raid10,我们可以看到,同样的单个操作,最终raid10只需要2个io,而raid5需要4个io。但是,这里我忽略了raid5在那两个读操作的时候,还可能会发生读命中操作,也就是说,如果需要读取的数据已经在cache中,可能是不需要4个io的,也证明了cache对raid5 的重要性,不仅仅是计算校验需要,而且对性能的提升由为重要。曾经测试过,在raid5的阵列中,如果关闭写cache,raid5的性能将差很多倍。
这里,并不是说cache对raid10就不重要了,因为写缓冲,读命中等,都是提高速度的关键所在,不过的是,raid10对cache的依赖性没有raid5那么明显而已。
到这里,大家应当也大致明白了raid5与raid10的原理与差别了,一般来说,象小io的数据库类型操作,建议采用raid10,而大型文件存储,数据仓库,则从空间利用的角度,可以采用raid5。
3.4、磁盘的IOPS对比
我们假定一个case,业务应用的IOPS是10000,读cache命中率是30%,读IOPS为60%,写IOPS为40%,磁盘个数为120,那么分别计算在RAID5与RAID10的情况下,每个磁盘的IOPS为多少。
RAID5:
1. 单块盘的IOPS = (10000*(1-0.3)*0.6 + 4 * (10000*0.4))/120
2. = (4200 + 16000)/120
3. = 168
这里的10000*(1-0.3)*0.6表示是读的IOPS,比例是0.6,除掉cache命中,实际只有4200个读IOPS。
而4 * (10000*0.4) 表示写的IOPS,因为每一个写,在RAID5中,实际发生了4个io,所以写的IOPS为16000个。
为了考虑RAID5在写操作的时候,那2个读操作也可能发生命中,所以更精确的计算应该为:
1. 单块盘的IOPS = (10000*(1-0.3)*0.6 + 2 * (10000*0.4)*(1-0.3) + 2 * (10000*0.4))/120
2. = (4200 + 5600 + 8000)/120
3. = 148
这样我们计算出来单个盘的IOPS为148个,基本达到磁盘IOPS极限,在这种情况下,磁盘的工作状态是非常不理想的。
RAID10对IOPS性能的影响
1. 单块盘的IOPS = (10000*(1-0.3)*0.6 + 2 * (10000*0.4))/120
2. = (4200 + 8000)/120
3. = 102
可以看到,因为RAID10对于一个写操作,只发生2次io,所以,同样的压力,同样的磁盘,每个盘的IOPS只有102个,还远远低于磁盘的极限IOPS。
这里回到我们先前讨论的case上来,在我们先前采用RAID5的时候,通过分析,每个磁盘的IOPS在高峰时期,快达到200了,导致响应速度巨慢无比。改造成RAID10,每个磁盘的IOPS降到100左右,很好的避免了这个性能问题。
3.5、小结
影响读数据的关键因素是cache命中率,在读数据的情况下,RAID5与RAID10性能本身没有太大差别。但是对于写数据的一些应用,尤其是小I/O频繁写入的一些应用,安全性要求很高,不计成本,小数据量频繁写入的系统。如企业ERP生产系统等等,RAID10相比RAID5可能产生较大的性能差异。而大型文件存储,数据仓库,如医疗PACS系统、视频编辑系统则从空间利用的角度,建议采用RAID5。
我们知道,在存储系统的采购过程中,厂商往往能够提供漂亮的性能参数,但实际运行中,该系统的实际性能表现并不能达到我们所期望的状态,那么在运行环境中存储系统的实际性能究竟受哪些环节和瓶颈的影响呢?
之所以要和大家来讨论这个问题,是因为在本人的工作中曾遇到一个实际的Case,在这个case中,一个恢复压力很大的standby(这里主要是写,而且是小io的写),采用了RAID5的方案,发现性能很差,后来改造成了RAID10,就很好的避免了性能的问题。
建议在阅读本文前,首先阅读本文上篇“ RAID5和RAID10,哪种RAID适合你 ”,因为性能瓶颈的出现,本身与RAID方式还是有很大关系,同时本文性能讨论的基础,本身建立在上文的一些结论之上。
阵列的瓶颈主要体现在2个方面,带宽与IOPS(单位时间传输的数据量,和单位时间完成的I/O数)。
影响带宽的主要因素
存储系统的带宽主要取决于阵列的构架,光纤通道的大小(我们今天讨论的阵列一般都是光纤阵列, SCSI这样的SSA阵列,暂时不在讨论范围之列)以及硬盘的个数。
所谓阵列构架影响存储系统带宽,指的是存储系统内部架构会存在一些内部带宽,类似于PC的系统总线,尽管阵列的构架因不同厂商不同型号的产品而各有不同,不过一般情况下,内部带宽都设计的很充足,不会是瓶颈的所在。
光纤通道对带宽的影响还是比较大的,例如数据仓库环境中,对数据的流量要求很大,而一块2Gb的光纤卡,所能支撑的最大流量应当是2GB/8=250Mb/s的实际流量,必须配备4块光纤卡才能达到1Gb/s的实际流量,所以对于数据仓库的环境来说,升级到光纤4Gb并非是厂商过于超前的产品更新,在大流量的数据环境下绝对有必要考虑更换4GB的光纤卡。
但是对于存储系统的带宽来说,硬盘接口的带宽限制是最重要的。当前面的瓶颈不再存在的时候,带宽就完全取决于硬盘的个数了,我下面列一下不同规格的硬盘所能支撑的流量大小,数据取自硬盘厂商的标准参数:
如果我们假定一个阵列有120块15K rpm转速的光纤硬盘,那么硬盘上最大的可以支撑的数据流量为120*13=1560Mb/s,当前端接口不成为瓶颈的时候,1560Mb/s就是理论上的最大数据流量。
而如果要实现上述的最大带宽,如果前端采用2GB的光纤卡,可能需要配置6块才能够,而4GB的光纤卡,配置3-4块就够了。因此我们可以知道,前端的光纤接口必须与后端磁盘个数相匹配。
但是否考虑到这些因素就足够了呢,存储系统的整体性能还受到多方面因素的影响,下面我们将分析存储系统的另外一个重要的性能指标:IOPS。
影响IOPS的主要因素
我们前面已经说过了,厂商所提供的IOPS值是在理想状态下测试出来的,对实际的运行性能的参考并不大,所以我们有必要通过以下几个方面来衡量该系统的实际IOPS的可能表现。
决定IOPS的主要因素取决于阵列的算法,cache命中率,以及磁盘个数。
阵列的算法也因为不同厂商不同型号的产品而不同,如我们最近遇到在HDS USP上面,可能因为ldev(lun)存在队列或者资源限制,而单个ldev的IOPS就上不去。所以,决定采购某型号的存储之前,有必要了解这个存储的一些算法规则与限制。
cache命中率对实际IOPS有决定性的影响,Cache命中率取决于数据的分布,cache size的大小,数据访问的规则,以及cache的算法,如果完整的讨论下来,这里将变得很复杂,可以有一天来慢慢讨论。
我们这里把这些内部原理都省略掉,只强调:对于一个存储阵列来说,读cache的命中率越高,一般就表示它可以支持更多的IOPS,为什么这么说呢?这个就与我们下面要讨论的硬盘IOPS有关系了。
每个物理硬盘能处理的IOPS是有限制的,如
同样,如果一个阵列有120块15K rpm转速的光纤硬盘,那么,它能支撑的最大IOPS为120*150=18000,这个为硬件限制的理论值,如果超过这个值,硬盘的响应可能会变的非常缓慢而不能正常提供业务。较高的读cache命中率,能降低硬盘的IOPS负荷,让硬盘在较小的压力下良好工作。
分享到:
相关推荐
RAID10 和 RAID5 的比较: * RAID10 和 RAID5 都是奇偶校验条带存储,但 RAID10 需要更多的磁盘空间,因为它需要两个独立的奇偶校验信息块,而 RAID5 只需要一个奇偶校验信息块。 * RAID10 的写性能较差,因为它...
RAID0_RAID1_RAID10_RAID5
### RAID5与RAID10在数据库部署中的性能对比分析 #### 概述 随着信息技术的发展,数据存储的安全性和性能成为关键因素。RAID(独立磁盘冗余阵列)技术通过将数据分布在多个物理磁盘上来提高存储系统的性能和可用性...
RAID10与RAID5的区别比较,利用率与安全的取舍 RAID10和RAID5都是常用的磁盘阵列技术,但它们在安全性、空间利用率、读写性能等方面存在明显的差异。 安全性方面的比较 在安全性方面,RAID10的安全性高于RAID5。...
与RAID5相比,RAID10在安全性上占优,因为RAID5的奇偶校验策略使得任何一个硬盘故障都可能导致整个阵列的崩溃。RAID10在硬盘故障时的恢复速度也更快。然而,RAID5在空间利用率上更高效,通常达到75%,而RAID10仅为50...
### RAID 10和RAID 5的比较 在存储技术领域中,RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种常见的数据存储方案,旨在通过将多个物理磁盘组合成一个逻辑单元来提供更高的性能、可靠性和/...
### Linux建立RAID10阵列的详细步骤 在Linux环境下构建RAID10阵列是一种常见的存储优化技术,能够显著提升数据冗余能力和读写性能。本文将详细介绍如何通过命令行工具在Linux系统中创建RAID10阵列。 #### 一、查看...
因为创建Raid0与Raid5的方式是一样的,所以就以创建Raid5为例。 1,启动时,Ctrl+R键,进入Raid配置界面,如图(请注意,在此屏幕有操作提示,如果不知道该按哪儿个键,可以看提示): 2,删除原来的Raid组:...
5. RAID 10(1+0):RAID 0和RAID 1的组合,提供了高性能和数据安全性。 在X3650 M5和X3850 X6服务器中,配置RAID通常需要遵循以下步骤: 1. **启动服务器**:连接所有硬盘,并确保服务器正常启动。 2. **进入...
5. **设置阵列大小**:由于RAID10需要两倍的硬盘空间用于镜像,8个1TB硬盘实际可用空间将是4TB。 6. **确认并创建**:确认所有设置无误后,开始创建RAID阵列。这个过程可能需要一段时间,取决于硬盘的速度和数量。 ...
AVAGO 3108MR RAID卡是一款高性能的RAID控制器,能够支持多种RAID级别,包括我们这里讨论的RAID 10。本文将详细介绍如何在AVAGO 3108MR RAID卡的Setup界面中配置一个RAID 10阵列,并将其平均划分为4个虚拟磁盘。 ...
DELL 服务器 RAID5 配置与全局热备设置指南 本文档旨在指导读者如何在 DELL 服务器上配置 RAID5 并设置全局热备,以提高数据存储的安全性和可靠性。 在开始配置之前,需要了解 RAID5 和热备的概念。RAID5 是一种...
常见的RAID级别有RAID 0、RAID 1、RAID 5、RAID 6、RAID 10等,每种级别在速度、安全性及成本方面各有优势。 在描述中提到,这些驱动适用于浪潮的双路服务器模型,这意味着服务器拥有两个处理器。双路服务器通常...
4. **RAID 6**:与RAID 5类似,但具有双重奇偶校验,能承受两块硬盘同时故障,适合大型、高要求的数据中心。 5. **RAID 10**:RAID 1和RAID 0的组合,既保证了性能,又提供了数据冗余,适合需要高性能和高可靠性的...
关于 RAID 5 与 热备份(Hot Spare) RAID(独立磁盘冗余阵列)是一种将多个磁盘组合成一个逻辑磁盘的技术,目的是提高数据存储的可靠性和性能。RAID 5 是一种常用的 RAID 级别,它提供了高效的数据存储和较强的...
RAID5(独立磁盘冗余阵列5)是一种存储虚拟化技术,它将数据分散...这是RAID5与其他一些RAID级别不同的地方,例如RAID1只需要镜像另一块硬盘的数据就可以恢复损坏硬盘的数据,而RAID5需要进行一定的计算来重建数据。
本演示将详细介绍RAID 0、1、5和10的工作原理。 **RAID 0** RAID 0是最基础的级别,也称为条带化(Striping)。在RAID 0中,数据被分割成多个块,并均匀分配到参与阵列的每个硬盘上。这种方式极大地提高了读写速度...
根据不同的数据分布和冗余策略,RAID可以分为多个级别,包括RAID 0、RAID 1、RAID 0+1(或RAID 10)以及RAID 5。 1. RAID 0:数据分条技术,将数据分割并并行写入多个磁盘,显著提升读写速度。然而,RAID 0不提供...
IBM X3650服务器是一款高性能的企业级服务器,支持多种RAID配置,其中RAID5是一种常见的冗余磁盘阵列方式,提供了数据保护和性能优化。以下将详细阐述在IBM X3650上创建RAID5的步骤: 1. **硬件准备**: 在进行...
RAID技术主要有多个级别,例如RAID 0、RAID 1、RAID 5、RAID 6以及RAID 10等。每个级别都有其独特的功能和优势。例如,RAID 0提供磁盘条带化,提高了读写速度;RAID 1则是镜像模式,保证了数据的冗余性,但牺牲了...