本文对目前数种分布式文件系统进行简单的介绍。当前比较流行的分布式文件系统包括:Lustre、Hadoop、MogileFS、FreeNAS、FastDFS、NFS、OpenAFS、MooseFS、pNFS、以及GoogleFS。
Lustre(
www.lustre.org
)
lustre是一个大规模的、安全可靠的,具备高可用性的集群文件系统,它是由SUN公司开发和维护。该项目主要的目的就是开发下一代的集群文件系统,可以支持超过10000个节点,数以PB的数量存储系统。
lustre是开放源代码的集群文件系统,采取GPL许可协议,目前在集群计算机里,计算机与磁盘间数据交换的提升无法跟上微处理器和内存增长的速度,
从而也拖累了应用程序的性能,一种新兴的集群文件系统软件提高了I/O速度,可能降低企业购买存储设备的成本并改变企业购买存储的方式,集群文件系统已经
在大学、实验室和超级计算机研究中心里使用,而且即将进入通用商业计算市场。新的集群文件系统采用了开源的lustre技术,由美国能源部
(Department Of
Energy)开发,惠普公司(HP)提供商业支持。它显著提高了输入输出(I/O)速度,目前已经在高校、国家实验室和超级计算研究中心产生了一定影
响,未来几年中,它很有可能进入普通的商业计算机领域。
运行在linux下,开发语言c/c++
Hadoop(hadoop.apache.com)
hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的框架。
如下图是hadoop的体系结构:
授权协议apache,开发语言java,资源耗费有点大。
MogileFs(www.danga.com)
Mogile Fs是一个开源的分布式文件系统,主要特征包括
1、应用层的组件
2、无单点故障
3、自动文件复制
4、具有比RAID更好的可靠性
5、无需RAID nigukefs支持 ,运行在linux下。
FreeNAS(
www.openqrm.org
)
FreeNAS是网络附加存储(NAS)服务专用操作系统(FreeBSD的简化版
)。基于m0n0wall防火墙,该系统通过提供磁盘管理及RAID软件,可让用户home将PC转换为NAS服务器,支持FTP/NFS/RSYNC
/CIFS/AFP/UNISON/SSH sourceforge.net/pro协议,旨在让人们重新使用旧硬件.
FastDFS(code.google.com/p/fastdfs)
FastDFS是一
个开源的分布式文件系统,它对文件进行管理,功能包括:文件存储、文件同步、文件访问(文件上传、文件下载)等,解决了大容量存储和负载均衡的问题。特别
适合以文件为载体的在线服务,
如相册网站,视频网站等等。FastDFS服务端有两个角色:跟踪器(tracker)和存储节点(storage)。跟踪器主要做调度的工作,在访问上
起负载均衡的作用。存储节点存储文件,完成文件管理的所有功能:
存储、同步、和提供存取接口,FastDFS同时对文件的meta
data进行管理。所谓文件的meta data就是文件的相关属性,以键值对(key value
pair)方式表示,如:width=1024,其中的key为width,value为1024。文件meta
data是文件属性列表,可以包含多个键值树。
开发语言c/c++,运行在linux系统下。
NFS(www.tldp.org/HOWTO/NFS-HOWTO/index.html)
网络文件系统是FreeBSD支持的文件系统中的一种,也被称为NFS。
NFS允许一个系统在网络上与它人共享目录和文件。通过使用NFS, 用户和程序可以象访问本地文件一样访问远端系统上的文件。它的好处是:
1、本地工作站使用更少的磁盘空间,因为通常的数据可以存放在一台机器上而且可以通过网络访问到。
2、用户不必在每个网络上机器里面都有一个home目录。home目录可以被放在NFS服务器上并且在网络上处处可用。
3、诸如软驱、CDROM、和ZIP之类的存储设备可以在网络上面被别的机器使用。可以减少整个网络上的可移动介质设备的数量。
开发语言c/c++,可跨平台运行。
OpenAFS(
www.openafs.org
)
OpenAFS是一套开放源代码的分布式文件系统,允许系统之间通过局域网和广域网来分享档案和资源。OpenAFS是围绕一组叫做cell的文件服务
器组织的,每个服务器的标识通常是隐藏在文件系统中,从AFS客户机登陆的用户将分辨不出他们在那个服务器上运行,因为从用户的角度上看,他们想在有识别
的Unix文件系统语义的单个系统上运行。
文件系统内容通常都是跨cell复制,一便一个硬盘的失效不会损害OpenAFS客户机上的
运行。OpenAFS需要高达1GB的大容量客户机缓存,以允许访问经常使用的文件。它是一个十分安全的基于kerbero的系统,它使用访问控制列表
(ACL)以便可以进行细粒度的访问,这不是基于通常的Linux和Unix安全模型。开发协议IBM Public,运行在linux下。
MooseFs(derf.homelinux.org)
Moose File System是一个具备容错功能的网路分布式文件统,它将数据分布在网络中的不同服务器上,MooseFs通过FUSE使之看起来就 是一个Unix的文件系统。但有一点问题,它还是不能解决单点故障的问题。开发语言perl,可跨平台操作。
pNFS(
www.pnfs.com
)
网络文件系统(Network
FileSystem,NFS)是大多数局域网(LAN)的重要的组成部分。但NFS不适用于高性能计算中苛刻的输入书橱密集型程序,至少以前是这样。
NFS标准的罪行修改纳入了Parallel NFS(pNFS),它是文件共享的并行实现,将传输速率提高了几个数量级。
开发语言c/c++,运行在linu下。
googleFs
据说是一个比较不错的一个可扩展分布式文件系统,用于大型的,分布式的,对大量数据进行访问的应用。它运行于廉价的普通硬件上,但可以提供容错功能,它可以给大量的用户提供性能较高的服务。google自己开发的。
分享到:
相关推荐
在这篇文章中,作者秦东霞和周航详细探讨了基于分布式系统的海量数据存储技术,深入分析了当下流行的存储算法,并对海量数据存储技术的未来趋势进行了展望。 首先,文章解释了海量数据存储的定义,即那些以TB(太...
云计算作为当下最为流行的技术之一,为网站提供了强大的后台支持,能够处理大规模的数据和流量。 7. **网络舆情分析与社会计算**:网络舆情分析涉及对网民行为和意见的研究,社会计算模型在这里被提及,以帮助更...
乐兔淘购物分享系统它综合当下热门流行的Pinterest类购物分享模式开发的一款非常易用的购物分享社区系统。 乐兔淘购物分享系统可用于建设淘宝客网站、社会化电子商务网站、商品展示网站、淘宝店铺推广网站、...
乐兔淘购物分享系统它综合当下热门流行的Pinterest类购物分享模式开发的一款非常易用的购物分享社区系统。乐兔淘购物分享系统可用于建设淘宝客网站、社会化电子商务网站、商品展示网站、淘宝店铺推广网站、兴趣类或...
这是一个 B2C 商城,用户可以登录注册浏览商品下单购买等,使用当下最流行的 SpringBoot+SpringCloud 组合基于微服务的架构模式,各微服务之间通信使用 RestFul 接口进行访问,使用 MybatisPlus 来组合传统 Mybatis ...
文件是一种简单的数据存储方式,用户可以通过文件系统来存储和读取数据,但这种方式存在着很多限制,例如数据检索困难、数据冗余、数据不一致等问题。数据库则是一种复杂的数据存储方式,提供了数据库表、行和列的...
GitHub和GitLab作为当下流行的代码托管平台,广泛应用于开源项目的管理和团队协作中。Git作为一款开源的分布式版本控制系统,可以高效地处理项目开发中的版本迭代问题。掌握GitHub/GitLab的基本配置以及Git的常用...
虽然分布式系统在当下非常流行,但嵌入式网络编程仍然广泛应用于各种领域,如物联网设备、汽车电子系统、医疗设备等。通过深入学习这些知识点,开发者可以构建出高效、可靠的嵌入式网络应用。"C嵌入式系统编程"这个...
- **知识点说明**:在Hadoop生态系统中,HDFS (Hadoop Distributed File System) 是分布式文件系统的核心组件之一,主要用于存储大量数据。HDFS中的数据存储工作由DataNode来负责。因此,正确答案应指向DataNode。 ...
- 微服务架构:当下流行的服务架构模式,可能会涉及到Spring Cloud、Dubbo等微服务解决方案。 - 容器化和虚拟化技术:如Docker和Kubernetes在Java应用部署中的应用。 - 版本控制系统:如Git的使用,以及与之相关的...
Apache Pulsar是当下流行的分布式消息中间件,它提供低延迟、高吞吐量的消息传递服务,广泛应用于大数据处理和实时应用中。本压缩包"pulsar2.8.1.zip"包含了Apache Pulsar的2.8.1版本,这是一个方便用户在本地进行...
Git是当下最流行的版本控制系统之一,它是一个开源的分布式版本控制系统,能够有效、高速地处理从很小到非常大的项目版本管理。本速查表主要涵盖了Git操作中的一些基本命令以及相关的操作流程,帮助开发者能够快速...
标题《最新大数据学习资料分享》表明此文件是关于大数据领域的学习资源汇编。在当今信息技术迅速发展的时代,大数据已成为IT领域的重要分支,越来越多的从业者和学习者渴望深入了解和掌握大数据技术。资料分享意味着...
首先,Elasticsearch是当下非常流行的一款开源全文搜索引擎,它基于Lucene构建,提供分布式、RESTful风格的搜索和数据分析功能。在没有可视化界面的情况下,管理和操作Elasticsearch主要依赖命令行,这对于许多...