`
01jiangwei01
  • 浏览: 542886 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop 伪分布模式

 
阅读更多

hadoop 各个组件均利用XML文件进行配置。core-site.xml文件用于配置Common组件的属性,hdfs-site.xml文件用于配置HDFS属性,而mapred-site.xml文件则用于配置MapReduce属性。这些配置文件都放在conf子目录中。

hadoop的运行模式有三种:

1)独立模式:在本机模式下测试和调试,适宜用在开发阶段。

2)伪分布模式:hadoop守护进程运行在本机上,模拟一个小规模的集群。

3)全分布模式:守护进程运行在一个集群上,生产模式。

 

下面主讲一下伪分布模式:

core-site.xml

<?xml version="1.0"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
	<property>
		<name>fs.default.name</name>
		<value>hdfs://localhost/</value>
	</property>
</configuration>

 hdfs-site.xml

<?xml version="1.0"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
	<property>
		 <name>dfs.replication</name>
		 <value>1</value>
	</property>
</configuration>

 mapred-site.xml

<?xml version="1.0"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
	<property>
		<name>mapred.job.tracker</name>
		<value>localhost:8021</value>
	</property>
</configuration>

 格式化HDFS文件系统

格式化HDFS文件系统非常方便,只需要一个命令:

hadoop namenode -format

 启动和终止守护进程

为启动HDF和MapReduce守护进程,键入如下命令:

start-dfs.sh
start-mapred.sh
或执行:
start-all.sh

 本地将启动三个守护进程:一个namenode、一个辅助namenode和一个datanode。可以浏览logs目录中的日志文件来检查守护进程是否成功启动,或通过web界面:http://localhost:500030查看jobtracker或在http://localhost:50070查看namenode。此外java的jps命令也能查看守护进程是否正在运行。

终止守护进程:

stop-dfs.sh
stop-mapred.sh

 

 

分享到:
评论

相关推荐

    大数据之hadoop伪分布模式启动.docx

    大数据之Hadoop伪分布模式启动 Hadoop伪分布模式是一种特殊的Hadoop集群模式,在这种模式下,所有Hadoop服务都运行在同一个节点上,模拟一个完整的Hadoop集群环境。这种模式非常适合开发、测试和学习Hadoop。 格式...

    Hadoop伪分布模式环境搭建[超详细]

    Hadoop伪分布模式环境搭建 Hadoop伪分布模式环境搭建是指在单个节点上搭建Hadoop集群环境,主要用于开发调试MapReduce应用逻辑。以下是搭建伪分布模式环境的步骤: 一、SSH协议介绍 SSH(Secure Shell)是一种...

    大数据之hadoop伪分布模式启动.pdf

    【大数据之Hadoop伪分布模式启动】 在大数据处理领域,Hadoop是一个开源的分布式计算框架,它能够处理和存储海量数据。在学习和测试Hadoop时,为了方便,通常会采用伪分布模式(Pseudo-Distributed Mode),这种...

    hadoop伪分布模式搭建(详细步骤)_hadoop伪分布式搭建全过程-CSDN博客.mhtml

    hadoop伪分布模式搭建(详细步骤)_hadoop伪分布式搭建全过程-CSDN博客.mhtml

    hadoop伪分布配置

    Hadoop伪分布模式是一种在单台机器上模拟分布式环境的方式,通常用于开发测试阶段。这种方式既能够体验到Hadoop的分布式特性,又不需要复杂的多节点集群配置。本文将详细介绍如何在Ubuntu系统上搭建Hadoop伪分布环境...

    hadoop的独立模式、伪分布模式、完全分布式、HA配置文件

    在Hadoop生态系统中,了解和配置不同的运行模式是至关重要的,这些模式包括独立模式、伪分布模式、完全分布式模式以及高可用性(HA)配置。接下来,我们将详细探讨这些模式及其相关的配置文件。 1. **独立模式**: ...

    Hadoop单机模式和伪分布模式.ppt

    **二、Hadoop伪分布模式** 伪分布模式是介于单机模式和完全分布式模式之间的一种模式,它在一个单一节点上模拟整个Hadoop集群。每个Hadoop守护进程(如NameNode、DataNode等)都在独立的进程中运行,但仍然在本地...

    JDK的安装和Hadoop伪分布的配置

    ### JDK的安装与Hadoop伪分布模式配置详解 #### 一、JDK的安装 Java Development Kit(简称JDK)是Sun Microsystems针对Java语言开发的一个软件开发工具包,同时也是运行Hadoop集群的基础环境之一。Hadoop是用Java...

    9-Hadoop伪分布模式HDFS+YARN1

    2.1. 2.2. 2.3. 3.1. 3.2. 3.3. 3.4. 3.5. 3.6. 3.7. 4.1. 4.2. 4.3. 4.4. 6.1. 6.2.

    hadoop伪分布搭建步骤

    ### Hadoop伪分布模式搭建详解 #### 一、概述 Hadoop是一款开源的大数据处理框架,主要用于处理海量数据。在实际应用中,Hadoop通常运行在由多台计算机组成的集群环境中,但在学习或测试阶段,我们往往会在一台...

    Linux下部署Hadoop伪分布模式

     第一步:配置ssh本地登录证书(虽然为伪分布模式,Hadoop依然会使用SSH进行通信)   [hadoop@promote ~]$ which ssh /usr/bin/ssh [hadoop@promote ~]$ which ssh-keygen /usr/bin/...

    Hadoop单机伪分布完全分布实验文档

    单机伪分布模式是Hadoop初学者入门的常见方式,它模拟了分布式环境,但所有进程都在同一台机器上运行。这种模式下,Hadoop的各个组件如NameNode、DataNode、JobTracker和TaskTracker等都在一个Java进程中运行,方便...

    基于单机的Hadoop伪分布式运行模拟实现即其分析过程(完整版)

    ### 基于单机的Hadoop伪分布式运行模拟实现及其分析 #### 一、引言 随着大数据技术的发展,Hadoop已经成为处理大规模数据集的重要工具之一。为了更好地理解和掌握Hadoop的工作原理,通过在单机上模拟实现Hadoop伪...

    linux下伪分布安装hadoop环境及问题处理

    ### Hadoop伪分布模式在Linux CentOS下的安装与配置详解 #### 一、概览 本文旨在详细介绍如何在Linux CentOS 5.0系统下搭建Hadoop伪分布模式的测试环境,包括必要的步骤、注意事项以及可能遇到的问题及其解决方案...

    Hadoop伪分布环境部署

    - **配置HDFS副本数**:在`hdfs-site.xml`文件中设置`dfs.replication`为1,表示HDFS数据块的副本数为1,这是伪分布模式的典型配置。 - **配置MapReduce作业追踪器**:编辑`mapred-site.xml`文件,设置`mapred.job...

    shell脚本配置Hadoop伪分布式.zip

    在这个"shell脚本配置Hadoop伪分布式.zip"压缩包中,包含了配置Hadoop伪分布式环境所需的所有资源和指南。伪分布式模式是在单个节点上模拟分布式环境,这对于学习和测试Hadoop功能非常有用,无需复杂的多节点集群...

    Hadoop伪分布式安装

    **Hadoop伪分布模式安装步骤**: 1. **创建新用户**:为了安全起见,可以创建一个新的Linux用户,例如`zhangyu`,并为其分配sudo权限,以便执行需要管理员权限的命令。 2. **配置SSH免密码登录**:通过`ssh-keygen...

    Hadoop平台搭建(单节点,伪分布,分布式文件系统及其上MapReduce程序测试)

    在本文中,我们将深入探讨如何搭建Hadoop平台,包括单节点模式、伪分布式模式以及分布式文件系统,并在这些环境中运行MapReduce程序进行测试。Hadoop是Apache软件基金会的一个开源项目,它提供了一个分布式文件系统...

Global site tag (gtag.js) - Google Analytics