一、分布式文件系统
分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。一个典型的网络可能包括多个供多用户访问的服务器。另外,允许一些系统扮演客户机和服务器的双重角色。例如,用户可以“发表”一个允许其他客户机访问的目录,一旦被访问,这个目录对客户机来说就象使用本地驱动器一样。二、主流分布式文件系统介绍及特性比较
MooseFS(MFS) |
MooseFS是一款网络分布式文件系统。它把数据分散在多台服务器上,但对于用户来讲,看到的只是一个源。MFS也像其他类unix文件系统一样,包含了层级结构(目录树),存储着文件属性(权限,最后访问和修改时间),可以创建特殊的文件(块设备,字符设备,管道,套接字),符号链接,硬链接。 MFS文件系统个人理解: 将分布在各个范围的计算机,将他们的分区统一进行管理使用的一种文件系统。 简单来讲,就是将分布在各个范围的计算机,将他们的分区统一进行管理使用的一种文件系统。 |
Ceph |
Ceph是加州大学Santa Cruz分校的Sage Weil(DreamHost的联合创始人)专为博士论文设计的新一代自由软件分布式文件系统。自2007年毕业之后,Sage开始全职投入到Ceph开发之中,使其能适用于生产环境。Ceph的主要目标是设计成基于POSIX的没有单点故障的分布式文件系统,使数据能容错和无缝的复制,2010年3 月,Linus Torvalds将Ceph client合并到内核2.6.34中,目前还不适用于生产环境。 |
GlusterFS |
Glusterfs 是一个具有可以扩展到几个 PB 数量级的分布式集群文件系统。它可以把多个不同类型的存储块通过 Infiniband RDMA 或者 TCP/IP 汇聚成一个大的并行网络文件系统。 |
Lustre |
lustre是一个大规模的、安全可靠的,具备高可用性的集群文件系统,它是由SUN公司开发和维护。该项目主要的目的就是开发下一代的集群文件系统,可以支持超过10000个节点,数以PB的数量存储系统 |
特性比较如下:
|
MooseFS(MFS) |
Ceph |
GlusterFS |
Lustre |
Metadata server |
单个MDS。存在单点故障和瓶颈。 |
多个MDS,不存在单点故障和瓶颈。MDS可以扩展,不存在瓶颈。 |
无,不存在单点故障。靠运行在各个节点上的动态算法来代替MDS,不需同步元数据,无硬盘I/O瓶颈。 |
双MDS(互相备份)。MDS不可以扩展,存在瓶颈。 |
文件分布/数据分布 |
文件被分片,数据块保存在不同的存储服务器上。 |
文件被分片,每个数据块是一个对象。对象保存在不同的存储服务器上。 |
Cluster Translators(GlusterFS集群存储的核心)包括AFR、DHT(和Stripe三种类型。 AFR相当于RAID1,每个文件都被复制到多个存储节点上。Stripe相当于RAID0,文件被分片,数据被条带化到各个存储节点上。 Translators可以组合,即AFR和stripe可以组成RAID10,实现高性能和高可用。 |
可以把大文件分片并分散存储在多个存储节点上。 |
冗余保护/副本 |
多副本 |
多副本 |
镜像 |
无 |
数据可靠性 |
由数据的多副本提供可靠性。 |
由数据的多副本提供可靠性。 |
由镜像提供可靠性。 |
由存储节点上的RAID1或RAID5/6提供可靠性。假如存储节点失效,则数据不可用。 |
故障恢复 |
手动恢复 |
当节点失效时,自动迁移数据、重新复制副本。 |
当节点、硬件、磁盘、网络发生故障时,系统会自动处理这些故障,管理员不需介入。 |
无 |
扩展性 |
增加存储服务器,可以提高容量和文件操作性能。但是由于不能增加MDS,因此元数据操作性能不能提高,是整个系统的瓶颈。 |
可以增加元数据服务器和存储节点。容量可扩展。文件操作性能可扩展。元数据操作性能可扩展。 |
容量可扩展。 |
可增加存储节点,提高容量可文件操作性能,但是由于不能增加MDS,因此元数据操作性能不能提高,是整个系统的瓶颈。 |
安装/部署 |
简单 |
简单 |
简单 |
复杂。而且Lustre严重依赖内核,需要重新编译内核。 |
开发语言 |
C |
C++ |
C |
C |
适合场景 |
大量小文件读写 |
小文件 |
对于小文件,无元数据服务设计解决了元数据的问题。但GlusterFS并没有在I/O方面作优化,在存储服务器底层文件系统上仍然是大量小文件,本地文件系统元数据访问是瓶颈,数据分布和并行性也无法充分发挥作用。因此,GlusterFS的小文件性能还存在很大优化空间。 |
大文件读写 |
产品级别 |
小型 |
中型 |
中型 |
大型 |
应用 |
国内较多 |
无 |
较多用户使用 |
HPC领域。 |
优缺点 |
实施简单 易用、稳定、对小文件很高效 但是存在单点故障。 |
不稳定,目前还在实验阶段,不适合于生产环境。 |
无元数据服务器,堆栈式架构(基本功能模块可以进行堆栈式组合,实现强大功能)。具有线性横向扩展能力。
由于没有元数据服务器,因此增加了客户端的负载,占用相当的CPU和内存。 但遍历文件目录时,则实现较为复杂和低效,需要搜索所有的存储节点。因此不建议使用较深的路径。 |
复杂、高效、很成熟、适合大型集群。 |
三、MooseFS系统的组成
角色 |
角色作用 |
管理服务器(mfs master) |
负责各个数据存储服务器的管理,文件读写调度,文件空间回收以及恢复.多节点拷贝。 |
元数据日志服务器 Metalogger server(Metalogger) |
负责备份master 服务器的变化日志文件,文件类型为changelog_ml.*.mfs ,以便于在master server 出问题的时候接替其进行工作。 |
数据存储服务器(chunkservers) |
负责连接管理服务器,听从管理服务器调度,提供存储空间,并为客户提供数据传输。 |
MooseFS Client |
通过fuse 内核接口挂接远程管理服务器上所管理的数据存储服务器,.看起来共享的文件系统和本地unix 文件系统使用一样的效果。 |
四、MooseFs的工作原理
在客户端上对挂载在 MooseFS 上的文件操作与的文件系统完全一样,操作系统内核将文件操作传输至 FUSE 模块,进而与 mfsmount 进程进行交互。 Mfsmount 进程通过网络与管理服 务器及数据服务器交互。整个过程对用户来说是完全透明的。Mfsmount 每次与管理服务器交互,以下的操作文件元是必须的:
- 创建文件
- 删除文件
- 读取文件目录
- 读取及改变属性
- 改变文件大小
- 开始读取或写入数据
- 访问MFSMETA 上的任何特殊文件
mfsmount 直接连接到数据服务器,用于存储相关片段的文件。当写入一个文件时,写入过程完成后,管理服务器会接收从 mfsmount 发送回来的信息,用于更新文件的长度及最后的修改时间。此外,数据服务器间能够相互复制数据,以达到将数据文件存储在不同机器上的目的,以下用图来简单介绍mooseFs的读写过程:
读文件流程如上图所示, 分4个步骤
- Client向Master请求Chunk Server地址和Chunk版本;
- Master返回按照拓扑位置排序Chunk Server地址列表,以及Chunk版本;
- Client从第一个Chunk Server读取数据;
- 若版本匹配, Chunk Server返回Chunk数据;
写流程如上图所示分为一下几个步骤:
- Client向Master请求Chunk Server地址和Chunk版本;
- Master返回Chunk Server地址和版本
- 若Chunk不存在, Master通知Chunk Server创建Chunk
- 若Chunk存在, Master通知Chunk Server增加Chunk版本
- 若多个文件引用chunk,Master通知Chunk Server复制一份Chunk
- 若Chunk上没有Lease,Master设置Lease,Lease超时时间为120s
- Master返回Chunk版本,和按照拓扑排序之后的Chunk Server地址
- Client与第一个ChunkServer建立连接, 发送写请求CLTOCS_WRITE,CLTOCS_WRITE 包含Chunk Server链信息,Chunk Server转发该消息到后续Chunk Server,建立一条Chunk Server pipeline
- Client发送多个CLTOCS_WRITE_DATA消息到Chunk Server pipeline(管道),CLTOCS_WRITE_DATA包含要写入的数据,偏移和长度等信息。
- Chunk Server收到消息后, 写请求到下一个Chunk Server, 同时调用写本地Chunk文件,写Chunk文件过程如下:
- 检查请求版本和Chunk版本是否一致、检查请求的CRC校验是否正确(Chunk分为64KB block,每个block对应32位CRC校验),检查其他参数
- 修改Chunk文件(写到操作系统缓存)
- 重新计算block checksum
- 如果写Chunk文件成功,且后续Chunk Server也返回成功,则返回成功到前一个Chunk Server或者Client
- Client收到Chunk Server响应消息之后, 通知Master写操作完成, Master记录必要的日志,并释放Chunk Lease
五、MooseFs的系统结构说明
服务器名 |
系统 |
IP |
备注 |
master |
Centos5.8 |
192.168.108.108 |
vm |
chunkserver1 |
Centos5.8 |
192.168.108.161 |
vm |
Chunkserver2 |
Centos5.8 |
192.168.108.162 |
vm |
Chunkserver3 |
Centos5.8 |
192.168.108.163 |
vm |
Chunkserver4 |
Centos5.8 |
192.168.108.164 |
vm |
client |
Centos5.8 |
192.168.108.109 |
vm |
六、MooseFs备份、故障恢复机制说明
1、MooseFs元数据的备份
通常元数据有两部分的数据
相关推荐
《mfs:轻量级文件系统与mfs-1.6.27-5.tar.gz详解》 在信息技术领域,文件系统(File System)扮演着至关重要的角色,它负责管理和组织计算机上的数据存储,使用户能够高效地访问和管理文件。mfs(Memory File ...
#### 三、安装步骤详解 1. **管理服务器安装配置** - 下载MFS源码包`mfs-1.6.15.tar.gz`。 - 创建用户`mfs`,所属组为`mfs`。 - 解压、编译、安装MFS:使用`tar-zxvf mfs-1.6.15.tar.gz`解压源码包,进入解压后的...
**MFS部署脚本及MFS部署包详解** MFS,全称为 Modular File System,是一种模块化的文件系统,常用于分布式存储环境中。它允许用户在不同的硬件和软件平台上灵活地组织和管理数据。MFS部署脚本和MFS部署包是实现MFS...
#### MFS系统组件详解 MFS主要由四个关键组件构成:元数据服务器(Master)、日志记录器(MetaLogger)、数据块服务器(ChunkServer)以及客户端(Client)。 1. **元数据服务器(Master)**:作为整个MFS的核心,...
### FreeBSD下建立MFS分布式文件系统详解 #### 一、MFS文件系统简介 Moose File System (MFS) 是一种分布式文件系统,其主要特点在于能够实现数据在网络中的多个服务器上分布存储,并且具备良好的容错机制。通过...
### Linux 下 MFS (MooseFS) 安装与使用详解 #### MFS 文件系统概述 MooseFS(简称 MFS)是一种分布式文件系统,它能够提供高性能、高可用性和可扩展性的数据存储解决方案。MFS 适用于需要处理大量数据的应用场景,...
《MFSAnalyzer20可执行文件详解》 MFSAnalyzer20是一款专为CMMB(中国移动多媒体广播)系统设计的文件分析工具,它主要用于解析和理解MFS( Multimedia File System,多媒体文件系统)格式的数据。这个软件的核心...
《Microsoft Logging Framework详解》 在IT领域,日志记录(Logging)是软件开发中的重要环节,它能够帮助开发者追踪程序运行状态,定位错误,优化性能。Microsoft Logging Framework是微软为.NET开发者提供的一种...
**MFS Tools 开源软件详解** MFS Tools 是一套专为TiVo用户设计的开源工具集,旨在帮助用户充分利用他们的TiVo设备。这套工具的主要功能是进行TiVo硬盘的备份和扩展存储空间,以满足更多视频存储的需求。不仅如此,...
MooseFS集群部署详解 MooseFS是一款高性能的分布式文件系统,能够提供高可用性和高扩展性的存储解决方案。以下是MooseFS集群部署的详细手册。 一、安装部署Master角色服务器 1. 安装相关依赖包:yum -y install ...
《分布式存储系统MooseFS详解:从3.0.101版本说起》 MooseFS,简称MFS,是一款高性能、可扩展的分布式文件系统,适用于大规模数据存储和处理场景。在3.0.101-1这个版本中,MFS进一步优化了其在云原生环境下的表现,...
### MooseFS 安装与配置详解 #### 一、MooseFS概述 MooseFS (MFS) 是一种分布式文件系统,它能够提供大规模的数据存储能力,并具备良好的容错性和可扩展性。MooseFS 适用于多种场景,包括但不限于海量数据存储、云...
**mfs3功能详解** 1. **波束设计与优化**:mfs3支持创建和调整不同形状的卫星波束,如圆形、椭圆形或可变形状,以适应特定地区的覆盖需求。用户可以设置波束宽度、增益和旁瓣水平,优化信号覆盖和干扰抑制。 2. **...
【MooseFS与Ansible自动化部署详解】 MooseFS(简称MFS)是一款高可用、高性能、可扩展的分布式文件系统。它通过将数据分散存储在多台服务器上,提供了强大的容错能力和高可用性,适合大数据处理和云计算环境。而...
### MooseFS 安装与使用详解 MooseFS(MFS),作为一种分布式文件存储解决方案,旨在为用户提供高效、可靠且可扩展的存储环境。本文将深入解析MFS的安装过程、配置要点及基本操作,帮助读者更好地理解和运用这一...
"aliases": ["mfs"], "factory": "./my-first-schema", "description": "my first schematic.", "schema": "./my-first-schema/schema.json" } } } ``` `$schema`指定了JSON架构的URL,`schematics`对象定义...
### MATLAB引擎(engine)在VC中的应用详解 #### 标题:MATLAB引擎(engine)的用法 #### 描述概述:本文档提供了通过VC调用MATLAB引擎(engine)的方法汇总,适用于需要了解如何在C++环境中集成MATLAB功能的开发者。 #...
**Python-gcForest官方克隆详解** gcForest是一种深度集成学习框架,由Zhou和Tang等人在2017年提出,主要用于解决复杂多模态数据的分类问题。gcForest的核心思想是通过一系列随机森林构成的级联结构,逐步提取和...