上一篇文章写到了配置文件,于是有些朋友就问我,这些配置文件是什么意思呢?这里我也引用一个地址,大家可以去看看(对于现有资源要好好利用,别浪费了),URL:http://blog.chinaunix.net/uid-22477743-id-388307.html
回归主题,这次要讲的是我们Hadoop的一些组件(如果你上篇文章看了,可是还没部署,赶紧部署吧,看是没用的!) ,在写之前,还是给大家普及一些概念,你们就继续默念我唠叨吧。。。
hadoop包括:NameNode(名称节点),DataNode(数据节点),Secondary NameNode(次名称节点),JobTracker(作业跟踪节点),TaskTracker(任务跟踪节点)【我不是吕不韦,不能做到一字千金来悬赏大家,不过欢迎大家来勘误,我表示衷心的感谢】
NameNode:名称节点是Hadoop守护进程中最重要的一个,NameNode位于HDFS(Hadoop文件系统)的主端(Master端),他指导Slave端的DataNode执行I/O任务,他跟踪文件如何分割成文件块,然后被什么节点存储,以及分布式文件系统的运行状态是否正常。
DataNode:每个Slave节点都会有个DataNode守护进程来执行文件系统的工作---将HDFS数据块读取或者写入本地系统的实际文件中。当客户端要读取系统的数据时,NameNode会告诉客户端每个数据块分别存储在什么DataNode上,然后客户端直接与DataNode通信,来处理与数据块相应的本地文件。
Secondary NameNode: 这个相当于是一个备份系统,备份NameNode的数据,因为NameNode是单一故障点,有了 Secondary NameNode,当NameNode出现故障后,我们需要手工配置将
Secondary NameNode
配置为主NameNode即可,
Secondary NameNode
在正常情况下只会跟NameNode通讯,获取HDFS元数据的快照。
JobTracker:
JobTracker是应用程序与hadoop之间的纽带。当有代码提交到集群时,
JobTracker会确定执行计划,包括处理什么文件,为不同任务分配节点,以及监控所有的任务。如果任务失败就自动重启任务,但是分配节点可能不同,一个集群只有一个 JobTracker,一般也在主节点上。从之前的配置文件上看,是这么回事。
TaskTracker:
JobTracker是监测系统MapReduce的整个执行过程,那么
TaskTracker就是监控各个任务在自己的节点的执行情况。我想这个还是比较好理解的。
TaskTracker会不断跟JobTracker联系,如果联系超时或者Down了,那么JobTracker会分配任务到其他节点。
分享到:
相关推荐
大数据组件 详细安装步骤(linux配置 hadoop集群搭建 hive flume kafka spark zk 搭建安装)
《Hadoop组件程序包详解:助力初学者轻松入门》 Hadoop,作为大数据处理领域的重要框架,因其分布式、可扩展的特性,深受广大开发者和企业的青睐。本文将针对标题为“hadoop组件程序包.zip”的资源,深入解析其中...
这个“hadoop组件tar.gz安装包”集合了多个关键的组件,为搭建一个完整的大数据处理环境提供了便利。让我们详细了解一下这些组件以及它们各自的功能。 首先,Hadoop本身是由Apache软件基金会开发的分布式计算系统,...
【标题】:Hadoop组件简介 Hadoop是一个开源框架,主要设计用于处理和存储大量数据。这个框架允许在分布式计算环境中高效地运行应用程序。Hadoop的核心由两个主要部分组成:Hadoop Distributed File System (HDFS) ...
本课程“Hadoop大数据开发与性能调优实战培训课程-Hadoop组件详解”旨在深入探讨Hadoop的主要组件及其优化策略,帮助开发者和数据工程师提升在大数据环境中的实践能力。 首先,我们要了解Hadoop的基础架构,它主要...
本实验旨在在一个已经安装和配置好的Hadoop环境中,实现对Hadoop组件的启动与停止操作,监控各个节点的进程,并通过Web界面来监视和控制应用程序。Docker的引入则为Hadoop环境的部署提供了轻量级的容器化解决方案。 ...
为了实现这些功能,你需要配置Grafana的数据源(可能是Prometheus或JMX Exporter等),将Hadoop组件的日志和指标数据暴露出来。然后,导入提供的模板文件,调整配置以匹配你的环境。一旦设置完成,Grafana将成为你...
Hadoop生态系统组件介绍 Hadoop是一个大数据处理的开源框架,由于其强大的数据处理能力和高扩展性,已经成为大数据处理的标准解决方案。Hadoop生态系统中有多种组件,每个组件都有其特点和功能,本文将对Hadoop生态...
### Hadoop核心组件安装及配置知识点详解 #### Hadoop简介 Hadoop是一个开源软件框架,主要用于分布式存储和处理大规模数据集。它通过提供一个高效、可靠且可扩展的平台,支持大量的并发用户对数据进行访问。Hadoop...
首先,JMX(Java Management Extensions)是Java平台提供的一种标准管理框架,它允许我们对Java应用程序,包括Hadoop组件进行监控和管理。Prometheus通过jmx_exporter这样的插件可以与JMX接口交互,收集Hadoop组件的...
用户可以将此文件导入到他们的Grafana实例中,以便立即开始监控Hadoop组件。 在实际操作中,使用Grafana监控Hadoop大数据组件时,我们需要注意以下几点: 1. **数据源配置**:根据Hadoop集群的实际情况,选择合适...
共59页,主要内容: 1、理解HDFS原理 2、掌握mapreduce原理和开发 3、应用举例讲解
5. **同步策略到Hadoop组件**:将Ranger的策略应用到Hadoop集群,确保权限控制生效。 6. **启用审计**:配置Ranger的日志审计功能,便于跟踪和分析用户的访问行为。 7. **测试安全性**:验证Ranger策略是否按预期...
在实际操作中,使用Ansible进行Hadoop组件的安装通常会涉及以下步骤: 1. **主机清单**:定义所有参与Hadoop集群的节点,包括名称、IP地址和角色(如NameNode、DataNode、ResourceManager等)。 2. **安装依赖**:...
标题中的“hadoop组件 仅实验使用”表明这是一个关于Hadoop生态系统的实验环境,其中包含了一些关键组件。这些组件主要用于处理大数据,实现分布式计算。现在,让我们深入了解一下这些组件及其在大数据处理中的作用...
我们还提供了镜像的启动脚本,用于启动不同的Hadoop组件。通过本文,你可以了解如何将Hadoop部署到Kubernetes平台上,并解决Hadoop在Kubernetes上的部署问题。 关键点: * Hadoop在Kubernetes上的部署需要深入了解...
首先,需要设置Kerberos的KDC服务器,并为每个Hadoop组件创建相应的服务主体名(SPN)。接着,为所有参与节点生成Kerberos密钥材料,包括principal和keytabs。这些keytabs将用于启动Hadoop守护进程,验证其身份。 ...
“hadoop-common-3.1.1-bin”包是Hadoop的通用模块,包含了所有Hadoop组件共享的类库和工具。这个包里的winutils.exe和hadoop.dll对于在Windows上搭建和调试Hadoop环境是必不可少的。 总结来说,Hadoop-3.1.1的bin...
资源名称:Hadoop集群与安全内容简介:Hadoop自动化安装和配置的问题在于隐藏了许多Hadoop组件协同工作的重要细节,本书介绍如何手动安装和配置主要的Hadoop组件,以便高效使用Hadoop平台。通过设置一个完全可运行的...