`
D大调卡农
  • 浏览: 2632 次
最近访客 更多访客>>
社区版块
存档分类
最新评论

Hadoop组件

阅读更多

      上一篇文章写到了配置文件,于是有些朋友就问我,这些配置文件是什么意思呢?这里我也引用一个地址,大家可以去看看(对于现有资源要好好利用,别浪费了),URL:http://blog.chinaunix.net/uid-22477743-id-388307.html

 

      回归主题,这次要讲的是我们Hadoop的一些组件(如果你上篇文章看了,可是还没部署,赶紧部署吧,看是没用的!) ,在写之前,还是给大家普及一些概念,你们就继续默念我唠叨吧。。。

 

       hadoop包括:NameNode(名称节点),DataNode(数据节点),Secondary NameNode(次名称节点),JobTracker(作业跟踪节点),TaskTracker(任务跟踪节点)【我不是吕不韦,不能做到一字千金来悬赏大家,不过欢迎大家来勘误,我表示衷心的感谢】

 

       NameNode:名称节点是Hadoop守护进程中最重要的一个,NameNode位于HDFS(Hadoop文件系统)的主端(Master端),他指导Slave端的DataNode执行I/O任务,他跟踪文件如何分割成文件块,然后被什么节点存储,以及分布式文件系统的运行状态是否正常。

 

      DataNode:每个Slave节点都会有个DataNode守护进程来执行文件系统的工作---将HDFS数据块读取或者写入本地系统的实际文件中。当客户端要读取系统的数据时,NameNode会告诉客户端每个数据块分别存储在什么DataNode上,然后客户端直接与DataNode通信,来处理与数据块相应的本地文件。

 

      Secondary NameNode: 这个相当于是一个备份系统,备份NameNode的数据,因为NameNode是单一故障点,有了 Secondary NameNode,当NameNode出现故障后,我们需要手工配置将 Secondary NameNode 配置为主NameNode即可, Secondary NameNode 在正常情况下只会跟NameNode通讯,获取HDFS元数据的快照。

 

      JobTracker:  JobTracker是应用程序与hadoop之间的纽带。当有代码提交到集群时, JobTracker会确定执行计划,包括处理什么文件,为不同任务分配节点,以及监控所有的任务。如果任务失败就自动重启任务,但是分配节点可能不同,一个集群只有一个 JobTracker,一般也在主节点上。从之前的配置文件上看,是这么回事。

 

      TaskTracker: JobTracker是监测系统MapReduce的整个执行过程,那么 TaskTracker就是监控各个任务在自己的节点的执行情况。我想这个还是比较好理解的。 TaskTracker会不断跟JobTracker联系,如果联系超时或者Down了,那么JobTracker会分配任务到其他节点。

hadoop

 

 

 

分享到:
评论

相关推荐

    hadoop 组件详细安装步骤

    大数据组件 详细安装步骤(linux配置 hadoop集群搭建 hive flume kafka spark zk 搭建安装)

    hadoop组件程序包.zip

    《Hadoop组件程序包详解:助力初学者轻松入门》 Hadoop,作为大数据处理领域的重要框架,因其分布式、可扩展的特性,深受广大开发者和企业的青睐。本文将针对标题为“hadoop组件程序包.zip”的资源,深入解析其中...

    hadoop组件tar.gz安装包

    这个“hadoop组件tar.gz安装包”集合了多个关键的组件,为搭建一个完整的大数据处理环境提供了便利。让我们详细了解一下这些组件以及它们各自的功能。 首先,Hadoop本身是由Apache软件基金会开发的分布式计算系统,...

    Hadoop组件简介共5页.pdf.zip

    【标题】:Hadoop组件简介 Hadoop是一个开源框架,主要设计用于处理和存储大量数据。这个框架允许在分布式计算环境中高效地运行应用程序。Hadoop的核心由两个主要部分组成:Hadoop Distributed File System (HDFS) ...

    Hadoop大数据开发与性能调优实战培训课程-Hadoop组件详解.rar

    本课程“Hadoop大数据开发与性能调优实战培训课程-Hadoop组件详解”旨在深入探讨Hadoop的主要组件及其优化策略,帮助开发者和数据工程师提升在大数据环境中的实践能力。 首先,我们要了解Hadoop的基础架构,它主要...

    在安装配置好的Hadoop环境中,实现Hadoop组件的启动停止、各节点进程监视,通过Web界面监视和控制Application

    本实验旨在在一个已经安装和配置好的Hadoop环境中,实现对Hadoop组件的启动与停止操作,监控各个节点的进程,并通过Web界面来监视和控制应用程序。Docker的引入则为Hadoop环境的部署提供了轻量级的容器化解决方案。 ...

    基于hadoop监控的grafana模板

    为了实现这些功能,你需要配置Grafana的数据源(可能是Prometheus或JMX Exporter等),将Hadoop组件的日志和指标数据暴露出来。然后,导入提供的模板文件,调整配置以匹配你的环境。一旦设置完成,Grafana将成为你...

    Hadoop核心组件安装及配置

    ### Hadoop核心组件安装及配置知识点详解 #### Hadoop简介 Hadoop是一个开源软件框架,主要用于分布式存储和处理大规模数据集。它通过提供一个高效、可靠且可扩展的平台,支持大量的并发用户对数据进行访问。Hadoop...

    prometheus grafana 基于开源监控apache Hadoop模板大全

    首先,JMX(Java Management Extensions)是Java平台提供的一种标准管理框架,它允许我们对Java应用程序,包括Hadoop组件进行监控和管理。Prometheus通过jmx_exporter这样的插件可以与JMX接口交互,收集Hadoop组件的...

    grafana关于hadoop大数据组件的Dashboard

    用户可以将此文件导入到他们的Grafana实例中,以便立即开始监控Hadoop组件。 在实际操作中,使用Grafana监控Hadoop大数据组件时,我们需要注意以下几点: 1. **数据源配置**:根据Hadoop集群的实际情况,选择合适...

    Hadoop大数据开发与性能调优实战培训课程-Hadoop组件详解.ppt

    共59页,主要内容: 1、理解HDFS原理 2、掌握mapreduce原理和开发 3、应用举例讲解

    hadoop搭建基础组件

    5. **同步策略到Hadoop组件**:将Ranger的策略应用到Hadoop集群,确保权限控制生效。 6. **启用审计**:配置Ranger的日志审计功能,便于跟踪和分析用户的访问行为。 7. **测试安全性**:验证Ranger策略是否按预期...

    基于ansible的Hadoop相关组件快速安装.zip

    在实际操作中,使用Ansible进行Hadoop组件的安装通常会涉及以下步骤: 1. **主机清单**:定义所有参与Hadoop集群的节点,包括名称、IP地址和角色(如NameNode、DataNode、ResourceManager等)。 2. **安装依赖**:...

    hadoop组件 仅实验使用

    标题中的“hadoop组件 仅实验使用”表明这是一个关于Hadoop生态系统的实验环境,其中包含了一些关键组件。这些组件主要用于处理大数据,实现分布式计算。现在,让我们深入了解一下这些组件及其在大数据处理中的作用...

    基于Kubernetes平台部署Hadoop实践.docx

    我们还提供了镜像的启动脚本,用于启动不同的Hadoop组件。通过本文,你可以了解如何将Hadoop部署到Kubernetes平台上,并解决Hadoop在Kubernetes上的部署问题。 关键点: * Hadoop在Kubernetes上的部署需要深入了解...

    hadoop-3.1.1 bin目录文件-含hadoop.dll、winutils

    “hadoop-common-3.1.1-bin”包是Hadoop的通用模块,包含了所有Hadoop组件共享的类库和工具。这个包里的winutils.exe和hadoop.dll对于在Windows上搭建和调试Hadoop环境是必不可少的。 总结来说,Hadoop-3.1.1的bin...

    Hadoop集群与安全

    资源名称:Hadoop集群与安全内容简介:Hadoop自动化安装和配置的问题在于隐藏了许多Hadoop组件协同工作的重要细节,本书介绍如何手动安装和配置主要的Hadoop组件,以便高效使用Hadoop平台。通过设置一个完全可运行的...

    hadoop-2.6.0-cdh5.7.0版本.zip

    这里的“hadoop-2.6.0-cdh5.7.0版本”指的是Cloudera的Hadoop发行版,CDH(Cloudera Distribution Including Apache Hadoop)5.7.0中的Hadoop组件为2.6.0版本。这个版本包含了Hadoop生态系统中的多个关键组件,如...

    大数据安全-kerberos技术-hadoop安装包,hadoop版本:hadoop-3.3.4.tar.gz

    首先,需要设置Kerberos的KDC服务器,并为每个Hadoop组件创建相应的服务主体名(SPN)。接着,为所有参与节点生成Kerberos密钥材料,包括principal和keytabs。这些keytabs将用于启动Hadoop守护进程,验证其身份。 ...

Global site tag (gtag.js) - Google Analytics