分布式存储
分布式存储是一种采用分布式架构的存储海量数据的存储系统。
传统存储系统
磁盘存储系统
这些都是些硬件存储介质,包括硬盘,软盘,磁带。硬盘是我们重要的存储介质,我们的计算机(包括我们的电脑)中的各种数据,文件都是存在硬盘中的。后面我们会单独讲讲硬盘。话说现在的硬盘,除了传统的机械硬盘,还有种固态硬盘开始用的比较多了。
文件系统
文件系统是操作系统中一个很重要的子系统。
数据库
其他存储系统
如redis,mongodb,elasticsearch,casscadra等。
其他分布式存储
HDFS,fastdfs,TFS等。
数据存储结构
文件
对象
key-value结构
块
文件读写存储是以块为基本单位的。块是文件系统的一个逻辑概念,块大小一般为4k,当然也有1k,2k,8k的,在格式化磁盘的时候可以指定。
假设一个文件大小为3k,如果一个块大小为1k,那要存下3k的这个文件,得用3个块才能存下,实际为了存储这个文件,不止文件自身的3k大小,需要比3k大一点的存储空间去存。假如是一个100byte或2148byte(约2.1k),那么924byte的存储空间给浪费了。如果是一百亿张这样的文件,大约要浪费8605G的存储空间!
文件存储的一些场景:
海量小文件存储(小于一个block大小,这里的block指的是文件系统中的数据块)
大文件超大文件存储
不会对文件进行更新操作(如追加,插入,删除)
存在对文件的更新操作
读文件操作频繁
写文件操作频繁
顺序读&随机读
Linux文件系统
参考另一篇文章:https://lobin.iteye.com/blog/609813
相关推荐
分布式存储系统主要经历了四个阶段:第一代分布式存储系统(1980 到 1990),第二代分布式存储系统(1990 到 1995),第三代分布式存储系统(1995 到 2000),第四代分布式存储系统(2000 至今)。 第一代分布式...
本报告对分布式存储市场进行了深入的调研,涉及到了分布式存储的定义与分类、分布式存储与其他相关技术的关系、分布式存储市场状况、分布式存储行业典型应用场景等多个方面,为读者提供了一个系统的了解分布式存储的...
### 分布式存储技术及应用 随着互联网技术的飞速发展和数据量的爆炸性增长,如何高效地存储和管理海量数据成为了一个重要的课题。分布式存储技术作为一种有效的解决方案,在近年来得到了广泛的应用和发展。本文将...
《大规模分布式存储系统:原理解析与架构实战》是一本深度探讨Java中间件设计的珍贵资料,特别适合那些致力于研究和开发分布式存储和分布式系统的技术人员。这本书详细阐述了在处理海量数据时,如何构建高效、可靠且...
《大规模分布式存储系统:原理解析与架构实战》是分布式系统领域的一部经典著作,作者杨传辉依托于深厚的理论知识和实践经验,为读者详尽地解析了分布式存储系统的核心技术和基本原理,并针对全球顶尖互联网公司的...
理论方面,不仅讲解了大规模分布式存储系统的核心技术和基本原理,而且对谷歌、亚马逊、微软和阿里巴巴等国际型大互联网公司的大规模分布式存储系统进行了分析;实战方面,首先通过对阿里巴巴的分布式数据库Ocean...
在云计算环境下的分布式存储关键技术是当前信息化发展的重要研究方向之一。随着信息技术的不断进步,云计算已成为多个行业信息化建设的关键应用领域。在云环境中,数据的存储、处理和安全已成为技术研究的核心问题。...
本书《Ceph分布式存储实战》是一本详细讲解Ceph分布式存储系统原理与应用的实战书籍,适合对云计算与虚拟化技术感兴趣的读者阅读。Ceph是一个开源的分布式存储系统,其设计目标是提供优秀的性能、可靠性和可扩展性。...
"基于区块链的分布式存储技术研究" 基于区块链的分布式存储技术是近年来兴起的一种崭新的技术解决方式,可以大幅度地降低数据存储与运输的资金投入,并且对数据存储的安全性有一个很大的提高。本研究主要探讨了基于...
分布式存储是一种先进的数据存储技术,它将数据分散存储在多个独立的节点上,形成一个统一的存储系统。H3C(华三通信)是全球知名的网络与IT解决方案提供商,其H3C认证分布式存储(H3CS-DS)是针对企业级数据中心...
分布式存储技术是现代大数据处理和云计算服务中的关键组件。元数据设计在分布式存储系统中扮演了至关重要的角色,它主要负责描述和管理数据在系统中的存储位置、访问权限、数据完整性等多种信息。元数据设计的优劣...
《大规模分布式存储系统:原理解析与架构实战》是分布式系统领域的经典著作,由阿里巴巴高级技术专家“阿里日照”(OceanBase核心开发人员)撰写,阳振坤、章文嵩、杨卫华、汪源、余锋(褚霸)、赖春波等来自阿里、...
Ceph分布式存储系统是一种开源的、基于软件的分布式文件系统,它设计用于高可扩展性、高性能以及高可靠性,其设计目标是处理PB级别的数据并可自动修复、自我管理。本文将深入探讨Ceph的关键特性和其搭建过程。 ### ...
ZStack Ceph 企业版分布式存储系统软件安装手册v3.1.9是上海云轴信息科技有限公司提供的一份详尽指南,旨在帮助用户成功安装和配置Ceph分布式存储系统。Ceph是一个开源的、高性能的分布式存储解决方案,广泛应用于...
分布式存储系统是现代信息技术中的重要组成部分,特别是在大数据和云计算时代,其重要性不言而喻。本书《大规模分布式存储系统:原理解析与架构实战》由杨传辉编著,旨在深入浅出地讲解分布式存储的基本概念、核心...
华为分布式存储技术与应用实践 华为分布式存储技术是指将存储资源分布在多个节点上,通过网络连接和协调工作,以实现高性能、高可靠性和高可扩展性的存储系统。华为分布式存储技术的主要特点包括水平扩展、超大容量...
Java分布式存储是一个重要的技术领域,尤其在大数据处理和云计算中占据着核心地位。在这个实例中,我们看到一个基于Java实现的分布式存储系统,这可能是基于某个特定的框架或设计模式,比如Hadoop HDFS(Hadoop...
《大规模分布式存储系统:原理解析与架构实战》与《分布式服务框架原理与实践》这两本书深入探讨了现代IT行业中至关重要的两个主题:分布式存储系统和分布式服务框架。这两者都是构建可扩展、高可用性及高性能应用的...