`

大数据学习笔记18:hdfs--解决大数据存储

 
阅读更多

hdfs--解决大数据存储

 

1、hdfs 之前解决大数据存储 可以使用 NFS

 

     

 

 

 

            1.1   Network File System  网络文件系统

   

             1.2  NFS问题1  :大文件集中存储,并发访问单节点 压力大

 

             1.3 NFS问题2   : 有单点故障问题 ,需要别的方式提供高可用处理

 

 

 

 2、HDFS 的方案

 

 

   2.1   文件划分为block  分散存储到多个节点上--  读大文件时可以从分散的多个节点上读取 减轻单节点压力

 

  2.2   一个block存储多个备份---提高文件高可用性  即使某个节点挂掉只要还有一个节点上有可用的 备份

          整个文件扔可用。

 

  2.3   namenode: 就像一个总目录 记录各个文件的详细的分布情况。

 

  2.4   datanode :  数据节点 实际存放文件数据的地方 。

  • 大小: 116.9 KB
  • 大小: 258.6 KB
分享到:
评论

相关推荐

    大数据学习笔记

    大数据学习笔记 本资源摘要信息涵盖了大数据领域中的多个方面,包括Hadoop、HBase、Sqoop、Spark和Hive等技术栈。下面将对这些技术栈进行详细的解释和分析。 一、HDFS架构详尽分析 HDFS(Hadoop Distributed File...

    大数据学习笔记.docx

    本笔记将深入探讨大数据的基本概念,包括Hadoop、Hive、离线计算、实时计算、数据库、数据仓库、维度建模以及大规模并行处理MPP,还将介绍阿里云的一些大数据产品,如MaxCompute、DataWorks、数据集成、机器学习PAI...

    大数据学习笔记.zip

    大数据学习笔记.zip是一个压缩包,其中包含了关于大数据技术的学习资料,特别是聚焦于Hadoop、HBase、Kafka和Flume这四个重要组件。这些技术都是大数据处理和分析领域中的核心工具,广泛应用于海量数据的存储、实时...

    HCIA-Big Data考试题库.zip

    5. **大数据存储**:包括关系型数据库如MySQL、非关系型数据库如MongoDB、列式存储如HBase,以及数据湖(Data Lake)的概念。 6. **大数据处理**:MapReduce模型和Spark的RDD(弹性分布式数据集)模型是大数据处理...

    大数据学习笔记,学习路线,技术案例整理。.zip

    本资料包“大数据学习笔记,学习路线,技术案例整理”是一个全面的大数据学习资源,旨在帮助初学者和进阶者系统地掌握大数据的核心技术和应用实践。 首先,我们来了解一下大数据的关键概念和技术栈。大数据通常有四...

    大数据学习笔记汇总指南

    这份“大数据学习笔记汇总指南”涵盖了大数据技术栈中的关键组件,包括Hadoop、Hive、Spark、Storm、Flink以及HBase。让我们逐一深入探讨这些技术及其在大数据生态系统中的作用。 一、Hadoop Hadoop是Apache基金会...

    大数据学习笔记.pdf

    4.5 UN-Persist存储 ........................................................................................................ 18 第5章 Spark调度与高级编程 ..................................................

    大数据学习笔记文档.rar

    《大数据学习笔记文档》 大数据领域是信息技术的热门方向,涵盖了多个关键技术,如Linux、Kafka、Python、Hadoop和Scala等。以下是对这些技术的详细介绍: **Linux**:作为大数据处理的基础平台,Linux因其开源、...

    大数据技术原理学习笔记.docx

    大数据技术原理的学习是理解现代信息技术的关键部分,它涵盖了数据的收集、存储、处理和分析等多个环节。本笔记基于林子雨老师在MOOC上的《大数据技术原理》课程,旨在为IT从业者和大学生提供一个全面了解大数据的...

    Talend学习笔记2——mysql文件导入到HDFS

    ### Talend学习笔记2——mysql文件导入到HDFS #### 关键知识点概览 - **Talend Data Integration** - **MySQL 数据库** - **Hadoop 和 HDFS(Hadoop Distributed File System)** #### 详细知识点说明 ##### 1. ...

    大数据创建相关笔记,能够很好的了解和学习大数据相关知识

    大数据是21世纪信息技术发展的重要领域,它涵盖了从数据采集、存储、处理到分析的一系列技术,为企业和个人提供了前所未有的洞察力。这份“大数据创建相关笔记”无疑是你深入理解和掌握大数据概念、技术和应用的宝贵...

    大数据学习资料.zip

    在这个“大数据学习资料.zip”压缩包中,我们可以找到一系列与大数据相关的学习资源,特别适合初学者快速入门。 首先,让我们关注“大数据”这一概念。大数据不仅仅是数据量的增加,更关键的是数据的多样性、高速...

    YDB编程指南最新版笔记版

    - HDFS:作为Apache Hadoop的一部分,HDFS是分布式文件系统的代表,为大数据存储提供高可用性和容错性。 4. **YDB编程** - 尽管具体内容未详细提及YDB的编程细节,但可以推测YDB可能是一种支持大数据处理的编程...

    大数据学习文档.docx

    【大数据学习文档】这篇文档是关于大数据学习的笔记,主要关注了Hadoop和Storm这两个重要的分布式计算框架。本文将详细解析Hadoop集群的安装、配置和启动过程。 首先,我们来了解一下Hadoop。Hadoop是一个开源的...

    大数据技术学习笔记1

    大数据技术学习笔记1 大数据技术学习笔记1 是一份关于大数据技术的学习笔记,涵盖了大数据技术的基本概念、Hadoop 生态系统、MapReduce 算法、Spark 框架、分布式计算平台等多个方面。 Hadoop 生态系统 Hadoop 是...

    henrrywan.github.io:大数据学习笔记

    标题 "henrrywan.github.io:大数据学习笔记" 暗示这可能是一个关于大数据学习的个人博客或项目,发布在GitHub平台上。描述中的链接指向了GitHub和Gitee(中国的GitHub镜像)上的个人页面,表明作者Henry Wan分享了他...

    linux 和ajango学习笔记

    Linux 和 Django 学习笔记 Linux 是一个开源的操作系统,它的核心组件是 Linux 内核。Linux 内核是 Linux 操作系统的核心部分,它负责管理计算机的硬件资源,提供了一个平台 для运行应用程序。 Linux 内核的开发...

Global site tag (gtag.js) - Google Analytics