`

IO系统性能之二:缓存和RAID如何提高IO

    博客分类:
  • IO
 
阅读更多

http://storage.it168.com/a2011/0325/1170/000001170565_all.shtml

 

 

从上一篇文章:IO系统性能之一:衡量性能的几个指标的计算中我们可以看到一个15k转速的磁盘在随机读写访问的情况下IOPS竟然只有140左右,但在实际应用中我们却能看到很多标有5000IOPS甚至更高的存储系统,有这么大IOPS的存储系统怎么来的呢?这就要归结于各种存储技术的使用了,在这些存储技术中使用最广的就是高速缓存(Cache)和磁盘冗余阵列(RAID)了,本文就将探讨缓存和磁盘阵列提高存储IO性能的方法。

  高速缓存(Cache)

  在当下的各种存储产品中,按照速度从快到慢应该就是内存>闪存>磁盘>磁带了,然而速度越快也就意味着价格越高,闪存虽然说是发展势头很好,但目前来说却还是因为价格问题无法普及,因此现在还是一个磁盘作霸王的时代。与CPU内存速度相比,磁盘的速度无疑是计算机系统中最大的瓶颈了,所以在必须使用磁盘而又想提高性能的情况下,人们想出了在磁盘中嵌入一块高速的内存用来保存经常访问的数据从而提高读写效率的方法来折中的解决,这块嵌入的内存就被称为高速缓存。

  说到缓存,这东西应用现在已经是无处不在,从处于上层的应用,到操作系统层,再到磁盘控制器,还有CPU内部,单个磁盘的内部也都存在缓存,所有这些缓存存在的目的都是相同的,就是提高系统执行的效率。

  当然在这里我们只关心跟IO性能相关的缓存,与IO性能直接相关的几个缓存分别是文件系统缓存(File System Cache)、磁盘控制器缓存(Disk Controller Cache)和磁盘缓存(Disk Cache,也称为Disk Buffer),不过当在计算一个磁盘系统性能的时候文件系统缓存也是不会考虑在内的,因此我们重点考察的就是磁盘控制器缓存和磁盘缓存。

  不管是控制器缓存还是磁盘缓存,他们所起的作用主要是分为三部分:缓存数据、预读(Read-ahead)和回写(Write-back)。

 

  缓存数据

  首先是系统读取过的数据会被缓存在高速缓存中,这样下次再次需要读取相同的数据的时候就不用在访问磁盘,直接从缓存中取数据就可以了。当然使用过的数据也不可能在缓存中永久保留的,缓存的数据一般那是采取LRU算法来进行管理,目的是将长时间不用的数据清除出缓存,那些经常被访问的却能一直保留在缓存中,直到缓存被清空。

  预读

  预读是指采用预读算法在没有系统的IO请求的时候事先将数据从磁盘中读入到缓存中,然后在系统发出读IO请求的时候,就会实现去检查看看缓存里面是否存在要读取的数据,如果存在(即命中)的话就直接将结果返回,这时候的磁盘不再需要寻址、旋转等待、读取数据这一序列的操作了,这样是能节省很多时间的;如果没有命中则再发出真正的读取磁盘的命令去取所需要的数据。

  缓存的命中率跟缓存的大小有很大的关系,理论上是缓存越大的话,所能缓存的数据也就越多,这样命中率也自然越高,当然缓存不可能太大,毕竟成本在那儿呢。如果一个容量很大的存储系统配备了一个很小的读缓存的话,这时候问题会比较大的,因为小缓存缓存的数据量非常小,相比整个存储系统来说比例非常低,这样随机读取(数据库系统的大多数情况)的时候命中率也自然就很低,这样的缓存不但不能提高效率(因为绝大部分读IO都还要读取磁盘),反而会因为每次去匹配缓存而浪费时间。

  执行读IO操作是读取数据存在于缓存中的数量与全部要读取数据的比值称为缓存命中率(Read Cache Hit Radio),假设一个存储系统在不使用缓存的情况下随机小IO读取能达到150IOPS,而它的缓存能提供10%的缓存命中率的话,那么实际上它的IOPS可以达到150/(1-10%)=166。

  回写

  首先说一下,用于回写功能的那部分缓存被称为写缓存(Write Cache)。在一套写缓存打开的存储中,操作系统所发出的一系列写IO命令并不会被挨个的执行,这些写IO的命令会先写入缓存中,然后再一次性的将缓存中的修改推到磁盘中,这就相当于将那些相同的多个IO合并成一个,多个连续操作的小IO合并成一个大的IO,还有就是将多个随机的写IO变成一组连续的写IO,这样就能减少磁盘寻址等操作所消耗的时间,大大的提高磁盘写入的效率。

  读缓存虽然对效率提高是很明显的,但是它所带来的问题也比较严重,因为缓存和普通内存一样,掉点以后数据会全部丢失,当操作系统发出的写IO命令写入到缓存中后即被认为是写入成功,而实际上数据是没有被真正写入磁盘的,此时如果掉电,缓存中的数据就会永远的丢失了,这个对应用来说是灾难性的,目前解决这个问题最好的方法就是给缓存配备电池了,保证存储掉电之后缓存数据能如数保存下来。

  和读一样,写缓存也存在一个写缓存命中率(Write Cache Hit Radio),不过和读缓存命中情况不一样的是,尽管缓存命中,也不能将实际的IO操作免掉,只是被合并了而已。

  控制器缓存和磁盘缓存除了上面的作用之外还承当着其他的作用,比如磁盘缓存有保存IO命令队列的功能,单个的磁盘一次只能处理一个IO命令,但却能接收多个IO命令,这些进入到磁盘而未被处理的命令就保存在缓存中的IO队列中。

 

  RAID(Redundant Array Of Inexpensive Disks)

  如果你是一位数据库管理员或者经常接触服务器,那对RAID应该很熟悉了,作为最廉价的存储解决方案,RAID早已在服务器存储中得到了普及。在RAID的各个级别中,应当以RAID10和RAID5(不过RAID5已经基本走到头了,RAID6正在崛起中,看看这里了解下原因)应用最广了。下面将就RAID0,RAID1,RAID5,RAID6,RAID10这几种级别的RAID展开说一下磁盘阵列对于磁盘性能的影响,当然在阅读下面的内容之前你必须对各个级别的RAID的结构和工作原理要熟悉才行,这样才不至于满头雾水,推荐查看wikipedia上面的如下条目:RAID,Standard RAID levels,Nested RAID levels。

  RAID0

  RAID0将数据条带化(striping)将连续的数据分散在多个磁盘上进行存取,系统发出的IO命令(不管读IO和写IO都一样)就可以在磁盘上被并行的执行,每个磁盘单独执行自己的那一部分请求,这样的并行的IO操作能大大的增强整个存储系统的性能。假设一个RAID0阵列有n(n>=2)个磁盘组成,每个磁盘的随机读写的IO能力都达到140的话,那么整个磁盘阵列的IO能力将是140*n。同时如果在阵列总线的传输能力允许的话RAID0的吞吐率也将是单个磁盘的n倍。

  RAID1

  RAID1在容量上相当于是将两个磁盘合并成一个磁盘来使用了,互为镜像的两个磁盘里面保存的数据是完全一样的,因此在并行读取的时候速度将是n个磁盘速度的总和,但是写入就不一样了,每次写入都必须同时写入到两个磁盘中,因此写入速度只有n/2。

  RAID5

  我们那一个有n(n>=3)个磁盘的RAID5阵列来看,首先看看RAID5阵列的读IO,RAID5是支持并行IO的,而磁盘上的数据呈条带状的分布在所有的磁盘上,因此读IO的速度相当于所有磁盘速度的总和。不过这是在没有磁盘损坏的情况下,当有一个磁盘故障的时候读取速度也是会下降的,因为中间需要花时间来计算丢失磁盘上面的数据。

  读取数据的情况相对就要复杂的多了,先来看下RAID5奇偶校验数据写入的过程,我们把写入的数据称为D1,当磁盘拿到一个写IO的命令的时候,它首先会读取一次要入的地址的数据块中修改之前的数据D0,然后再读取到当前条带中的校验信息P0,接下来就根据D0,P0,D1这三组数据计算出数据写入之后的条带的奇偶校验信息P1,最后发出两个写IO的命令,一个写入D1,另一个写入奇偶校验信息P1。可以看出阵列在实际操作的时候需要读、读、写、写一共4个IO才能完成一次写IO操作,也就是实际上的写入速度只有所有磁盘速度总和的1/4。从这点可以看出RAID5是非常不适合用在要大批量写入数据的系统上的。

  RAID6

  RAID6和RAID5很类似,差别就在于RAID6多了一个用于校验的磁盘。就写IO速度上来说这两个是完全一样的,都是所有磁盘IO速度的总和。

  在写IO上也很是类似,不同的是RAID将一个命令分成了三次读、三次写一共6次IO命令才能完成,也就是RAID6实际写入磁盘的速度是全部磁盘速度之和的1/6。可以看出从写IO看RAID6比RAID5差别是很大的。

  RAID10

  RAID0读写速度都很好,却没有冗余保护;RAID5和RAID6都有同样的毛病就是写入的时候慢,读取的时候快。那么RAID1呢?嗯,这里要说的就是RAID1,其实不管是RAID10还是RAID01,其实都是组合大于2块磁盘时候的RAID1,当先镜像后条带时候就称为RAID10,先条带后镜像的时候称为RAID01。从性能上看RAID01和RAID10都是一样的,都是RAID1嘛,但是RAID10在重建故障磁盘的时候性能比RAID01要快。

  因为RAID10其实就是RAID1,所以它的性能与RAID1也就是一样的了,这里不需要再做过多的讨论。

 

  四个性能指标的变化

  IO响应时间(IO Response Time)

  在任何时候IO响应时间值得都是单个IO的响应时间,因此,不管磁盘是否组成了磁盘阵列,它的IO响应时间应该都是一样的。从前面的计算中我们可以看到,如果IO响应时间在10ms左右的话是很正常的,但是当IO响应时间比这个值超出太多的时候,你就要开始注意了,很可能就意味着此时你的磁盘系统已经成为了一个瓶颈。

  IOPS

  综合上面两个部分的讨论我们来估算一下阵列下的磁盘总体IOPS,在这里我们先假设组成阵列的单个磁盘的随机读写的IOPS为140,读写缓存命中率都为10%,组成阵列的磁盘个数为4。

  因为不管是那种阵列,磁盘的读取性能都是所有磁盘之和,所以可以得出下面的读取IOPS:

  read IOPS = disk_IOPS/(1-read_cache_hit_ratio)*disk_num = 140/(1-10%)*4 = 622

  而写入性能就完全不一样了,根据上面的讨论我们可以得出下面结论:

  RAID0: 1 IO request => need 1 actual IO on disk
  RAID1: 1 IO request => need 2 actual IO on disk
  RAID5: 1 IO request => need 4 actual IO on disk
  RAID6: 1 IO request => need 6 actual IO on disk

  由此我们也可以计算出写入IOPS估算公式:

  RAID0 write IOPS = disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num = 140/(1-10%)*4/1 = 622
  RAID1 write IOPS = disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num = 140/(1-10%)*4/2 = 311
  RAID5 write IOPS = disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num = 140/(1-10%)*4/4 = 155
  RAID6 write IOPS = disk_IOPS/(1-write_cache_hit_ratio)*disk_num/acture_IO_num = 140/(1-10%)*4/6 = 103

  实际上从通过上面的计算方法我们还可以估算当给定一个要求的IOPS的情况下,估计下使用各个阵列级别所需要的磁盘的数量。当然我们上面的计算方法只是一个估算,我们忽略很多其他的因素,得出的只是一个大概的数值,不过在实际的应用还是有一定的参考作用的。

  本篇最后附送一个计算磁盘系统IOPS的网站――wmarow’s disk & disk array calculator,这个网站提供的计算公式还考虑了诸如阵列条带大小以及主机方面的因素,很有参考价值,至于怎么选择合适的条带大小,以后还会撰文解释。

  传输速度(Transfer Rate)/吞吐率(Throughput)

  实际上估算除了随机读写的IOPS也就知道了随机读写的吞吐率。对于顺序读写的呢,还是跟前一篇所讲的一样,主要受限于磁盘的限制,不能再拿IOPS来衡量了。

  random_throughtput = random_IOPS * IO_chunk_size

分享到:
评论

相关推荐

    提高IO的缓存和RAID的方法

    总之,高速缓存和RAID是提升IO性能的有效手段,它们通过缓存策略、数据预读和写缓存优化,以及磁盘阵列的并行处理,使得存储系统能够在有限的成本下实现更高的性能。在设计和部署存储解决方案时,理解这些技术原理并...

    缓存和RAID如何提高IO

    从上一篇文章:IO系统性能之一:衡量性能的几个指标的计算中我们可以看到一个15k转速的磁盘在随机读写访问的情况下IOPS竟然只有140左右,但在实际应用中我们却能看到很多标有5000IOPS甚至更高的存储系统,有这么大IO

    SQL Server 2008内存及IO性能监控

    3. **IO子系统优化**:升级硬盘到更快的SSD,或者使用RAID配置提高磁盘读写速度。 4. **查询优化**:通过执行计划分析慢查询,优化查询语句,减少全表扫描和避免不必要排序。 5. **定期维护**:执行DBCC CHECKDB和...

    生产系统主机io性能分析指南

    生产系统主机IO性能分析是确保业务稳定运行的关键环节,尤其在面对高负载和大数据量时,磁盘IO性能成为衡量系统效能的重要指标。本文将深入探讨如何在Linux环境下监测和分析主机IO性能,涵盖dd命令的基本应用、...

    Iowait 的成因、对系统影响及对策

    **Iowait 成因** Iowait 是操作系统中一个关键指标,它反映了系统因为等待输入/输出(IO)操作完成而使CPU处于...总之,理解并监控iowait可以帮助识别系统瓶颈,从而采取相应的优化措施,提高系统的整体性能和效率。

    Oracle_IO_性能调优手册

    首先,手册会讲解Oracle数据库I/O基础,包括磁盘I/O体系结构、RAID技术、存储子系统以及Oracle的数据块和表空间管理。理解这些基础知识对于识别性能瓶颈和制定调优策略至关重要。 其次,书中将详细介绍Oracle的I/O...

    Oracle IO问题解析

    此外,使用RAID(冗余磁盘阵列)可以提高数据冗余性和IO性能,但不同的RAID级别会有不同的性能特点,需要根据实际需求选择。 Oracle的IO调优包括多个层面:表空间和数据文件的管理,控制文件的优化,以及redo log...

    Core IO优化企业IT基础架构(微软2008年1月24日讲座课件(一))

    在企业环境中,高效率的IO管理是确保业务连续性和性能的关键。以下是一些关于Core IO优化的关键知识点: 1. **I/O瓶颈识别**:理解系统中的I/O瓶颈是优化的第一步,这通常涉及到监控和分析系统的读写速度、响应时间...

    34 生产经验:Linux操作系统的存储系统软件层原理剖析以及IO调度优化原理.pdf

    Linux操作系统存储系统软件层原理剖析以及IO调度优化原理 Linux操作系统是现代计算机系统中广泛使用的开源操作...在实际工作中,系统管理员和数据库管理员应当综合考虑不同因素,采用恰当的策略来提高系统的整体性能。

    io性能测试工具iometer

    通过Iometer,用户可以对硬盘驱动器、RAID阵列、存储区域网络(SAN)、网络附加存储(NAS)设备等进行详尽的性能评估,确保在高负载下系统仍能保持高效运行。 **2. Iometer的主要特性** - **跨平台支持**:Iometer可在...

    行业分类-设备装置-一种RAID5的写IO优化处理方法.zip

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)是一种通过将数据分布在多个硬盘上实现容错和性能提升的技术。在RAID5中,它结合了奇偶校验功能,能够在单个硬盘故障时仍能保持数据的完整性。然而...

    行业-37 案例实战:RAID锂电池充放电导致的MySQL数据库性能抖动的优化.rar

    首先,RAID是一种通过将多个硬盘组合起来提供数据冗余和性能提升的技术。常见的RAID级别如RAID 0、RAID 1、RAID 5、RAID 6和RAID 10等,每种都有其特定的优势和应用场景。在RAID系统中,锂电池通常用于保存缓存数据...

    Linux系统性能优化经验.pdf

    - **磁盘IO**:RAID技术(如RAID0、1、5、01、10)用于提高磁盘性能。SSD磁盘在数据库服务器中提供更快的IO速度。 - **网络带宽**:选择合适的网卡和交换机,并通过双网卡绑定提升带宽,例如在hadoop平台和视频...

    RAID各级别的原理和适用场合.ppt

    * 性能方面:RAID 技术可以通过分块提高性能,将 IO 操作分散到各个不同的磁盘驱动器中,使主机 I/O 控制器能够处理更多的操作。 * 可用性方面:RAID 技术可以通过镜像冗余或校验冗余,提供了在个别磁盘失效的情况下...

    行业-34 生产经验:Linux操作系统的存储系统软件层原理剖析以及IO调度优化原理.rar

    在IT行业中,Linux操作系统...理解Linux存储系统软件层的工作原理并掌握IO调度优化技巧,对于提升系统性能和稳定性至关重要。在实际生产环境中,根据不同的业务场景灵活应用这些知识,能够显著改善系统整体的运行效率。

    磁盘IO占用测试工具

    6. **I/O优化策略**: 了解磁盘IO占用可以帮助我们优化系统设置,如调整文件系统参数、分配更大的缓存、使用SSD(固态硬盘)替换HDD(机械硬盘)或者采用RAID配置以提高I/O性能。 7. **日志分析**: 通过记录和分析...

    企业磁盘网络性能优化最佳实践.docx

    2. 网络IO:注意带宽、TCP连接数、丢包率和网络延迟,ntop、Wireshark等工具能提供详尽的网络性能数据。 五、性能定位与优化 1. 磁盘IO争用调优:可能的策略包括增加磁盘缓存、使用RAID技术、优化文件系统参数或...

    ssd缓存软件服务器设置缓存的最佳选择

    综上所述,正确设置和使用SSD缓存软件能显著提升服务器性能,但需谨慎选择软件、合理配置参数,并保持对系统状态的密切关注。通过这些方法,企业可以充分发挥SSD的潜力,为业务提供更高效、可靠的存储解决方案。

Global site tag (gtag.js) - Google Analytics