Lustre的主要组件有三个:先进的集群文件系统,基于对象的存储设备和可堆叠的对象驱动模型。
1.1 先进的集群文件系统
OBDFS是一个基于对象的文件系统,目前能很好的运行于单一的安装了对象存储设备的系统上。OBDFS能很好地扩展成集群文件系统,从而多个节点共享一个对象存储设备。传统的群集文件系统共享块存储设备。
Lustre文件系统具有很好的特性。允许扩展到10000个客户端,并支持巨大的并行IO池(1000's)的对象存储控制器。
1.2 基于对象的存储设备
Lustre采用对象存储设备。具有很大的优越性。
l 对象存储系统简介:
主要包含OSD和MDS。OSD是智能的对象存储设备,具有自身的CPU,内存和存储介质,提供以对象为单位的访问,不提供对块的访问;MDS管理整个文件系统的命名空间,包括文件系统的目录层次结构,和数据的分布。因为OSD是智能型的,所以MDS上的很多数据分布的工作交给OSD完成,从而降低了MDS的负载。Client端可以并发地从多个OSD上读写,达到线性叠加的高带宽。如ActiveScale对象存储文件系统的带宽可以达到10GB/s
l Nutch分布式文件系统的对比:
Nutch的分布式文件系统,就没有去解决这个问题,它是提供对块的访问,NameNode负责管理全局的文件命名空间以及每以及个块在DataNode上的分布。因此NameNode容易成为瓶颈。
l 一般的分布式文件系统:
一般包括服务端和客户端,服务器又分为SCM(Service Control Machine)和
Non-SCM,SCM负责与其它服务器的同步。当客户端和服务器端建立连接后,会在本地生成一个文件系统的映射,并和服务器端保持同步。客户端根据这个本地的映射的文件系统可以透明地访问在别的机器上共享的文件数据。
1.3 可堆叠的对象驱动模型
除了直接的控制存储的驱动之外,还可以在这一层上面实现不同的驱动,像逻辑的对象存储驱动和客户端的对象驱动等。
比如,可以很容易地实现逻辑的RAID磁盘阵列,只需要一个对象驱动能同时和多个直接的存储驱动交互即可。
-
文章出处:DIY部落(http://www.diybl.com/course/6_system/linux/Linuxjs/20090308/159666.html)
分享到:
相关推荐
Lustre 文件系统是一个集群存储体系结构的核心组件,能够提供符合 POSIX 标准的 UNIX 文件系统接口。该文件系统可在 Linux 操作系统上运行,并具有按需扩展容量和性能的能力。 Lustre 文件系统的特点 1. 可扩展...
Lustre文件系统可以有效地管理和存储海量的空间数据,支持地理信息数据的数字化生产管理,并可与云计算技术结合,建立分布式地理信息系统体系结构。 6. Lustre的开源特性与协议 Lustre是开源的,遵循GNU的GPL协议...
相比之下,像GoogleFS或Lustre这类基于磁盘块和inode的存储系统,则必须依赖元数据服务,虽然它们在处理大量数据时具有高性能优势,但也面临着系统复杂性和并发处理的挑战。 - **客户端与服务器的RDMA通信**:...
文章首先介绍了Lustre多级混合存储体系结构的基本概念,包括: 1. **持久客户端缓存(Persistent Client Cache, PCC)**:这是一种在同一命名空间内提供缓存功能的方法,可以显著提高数据访问速度。但是,它对I/O...
例如,Ceph是一个开源的、融合进Openstack体系的分布式文件系统,它支持块、文件和对象的存储,并且提供动态子树分割、快照支持等特性。GlusterFS则没有元数据,利用哈希定位,支持多种数据布局和异构存储。HDFS和...
在《机群系统的介绍.doc》文档中,可能详细阐述了群机体系结构的构建步骤、常用软件工具以及实际案例分析。建议读者深入阅读此文档,以获取更具体的操作指导和实践经验。 总的来说,理解和掌握计算机的并行结构对于...
#### 四、MooseFS体系结构 MooseFS主要由以下三个组件构成: 1. **元数据服务器(Master)**: - 控制所有数据存储服务器。 - 提供客户端访问接口。 - 支持多种Linux/Unix操作系统。 - 目前只有一个master,...
其研制过程中面临了功耗、稳定性等一系列问题,但通过异构协同并行体系结构,软硬一体的低功耗控制,监控系统自反馈冷却调节以及一体化能耗管理框架等技术难点,成功研制出峰值性能达到千万亿次的计算机系统。...
云计算技术体系结构分为四层:物理资源层、资源池层、管理中间件层和SOA构建层。物理资源层包括计算机、存储器、网络设施、数据库和软件。资源池层是将大量一样类型的资源构成同构或接近同构的资源池,如计算资源池...
集群系统是基于MPP(大规模并行处理)和SMP(对称多处理)体系结构的一种,以InfiniBand高速网络作为计算节点之间的通信基础,同时采用千兆或万兆网络进行管理和监控。曙光集群的优势在于其易实施、易维护和高性价比...
##### 1.6 系统体系结构优化 - **研究体系结构**:深入研究并行计算机体系结构,了解硬件特性及其限制,为并行程序优化提供指导。 - **设计新体系结构**:针对现有并行计算机体系结构的不足之处,设计和实现新的...
文档中的大数据应用场景和体系结构描述了如何将这些技术和组件组合起来构建解决方案,以满足不同行业和应用场景的需求。 最后,文档通过互联网大数据案例解析,进一步阐释了大数据技术如何在实际商业环境和日常生活...
综上所述,超级计算机是一个集硬件、软件、网络和应用于一体的复杂系统,它的设计和使用涉及到计算机体系结构、并行计算、操作系统、编程模型、高效存储、能源效率等多个领域的专业知识。随着技术的不断发展,超级...
虽然GFS本身并未开源,但类似的分布式文件系统如Red Hat的GFS、IBM的GPFS和Sun的Lustre等,都受到了GFS概念的影响,成为高性能计算和大型数据中心的常用工具。Google云计算的成功在于将技术创新与实际应用紧密结合,...
- Lustre作为并行文件系统,适用于高性能计算场景,但结构复杂,扩展性有限。 针对分布式存储系统的性能优化和调优,系统架构设计尤为重要。本文提出了一套基于Ceph的企业分布式存储解决方案,并对软硬件组件进行了...
这一领域的知识涵盖了计算机体系结构、并行算法、网络通信、数据管理和优化策略等多个方面。 首先,书中可能详细阐述了高性能计算的基础理论,包括并行计算的概念。并行计算是指同时使用多个处理器或计算节点执行...
这些算法在很大程度上决定了InfiniBand网络的拓扑结构,特别是在高性能计算和大规模集群系统中,网络之间的拓扑结构和上下行链路的阻塞情况对于整体网络性能至关重要。 #### 四、FatTree拓扑结构 - **定义与特点**...