`

hadoop 2.x伪分布式环境搭建

 
阅读更多

1.linux环境准备

(1).设置静态IP

(2).设置主机名

操作:

hostname www.hyman.com

vi /etc/sysconfig/network

验证:

hostname

(3).绑定主机名

操作:

vi /etc/hosts

验证:

ping www.hyman.com

(4).关闭防火墙

操作:

service iptables stop

验证:

service iptables status

(5).关闭防火墙自启动

操作:

chkconfig iptables off

验证:

chkconfig --list | grep iptables

(6).设置ssh免密码登陆

操作:

ssh-keygen -t rsa

cp id_rsa.pub authorized_keys

验证:

ssh localhost

(7).安装jdk

操作:

cd /usr/local

tar -zxvf jdk-7u67-linux-x64.tar.gz

mv jdk1.7.0_67 jdk

vi /etc/profile

增加>

export JAVA_HOME=/usr/local/jdk

export PATH=$PATH:$JAVA_HOME/bin:.

验证:

java -version

 

2.hadoop2为分布式安装

 

(1).解压hadoop

操作:

cp /usr/local

tar -zxvf hadoop-2.5.2.tar.gz

mv hadoop-2.5.2 hadoop

验证:

 

(2).修改配置文件

操作:

cd $HADOOP_HOME/etc/hadoop

1>、hadoop-env.sh

export JAVA_HOME=/opt/modules/jdk1.6.0_45

 

2>、yarn-env.sh

export JAVA_HOME=/opt/modules/jdk1.6.0_45

 

3>、mapred-env.sh

export JAVA_HOME=/opt/modules/jdk1.6.0_45

 

4>、core-site.xml

<property> 

<name>fs.default.name</name>

<value>hdfs://hadoop-yarn.dragon.org:8020</value>

</property>

 

<property>

<name>hadoop.tmp.dir</name>

<value>/opt/modules/hadoop-2.2.0/data/tmp</value>

</property>

 

5>、hdfs-site.xml

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

 

6>、yarn-site.xml

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

 

7>、mapred-site.xml

<property>        

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

验证:

 

(3).namenode format

操作:

bin/hdfs namenode -format

验证:

 

(4).启动

操作:

sbin/start-dfs.sh

sbin/start-yarn.sh

验证:

jps

 

NameNode http服务地址:http://hostname:50070

ResourceManager http服务地址:http://hostname:8088

分享到:
评论

相关推荐

    大数据+Hadoop3.X伪分布式集群搭建笔记+练习搭建Hadoop平台

    练习搭建伪分布Hadoop3.X集群,只用于刚刚开始学习搭建hadoo伪分布式集群的人群,帮助大家快速搭建Hadoop3.X伪分布式集群,快速入门大数据为日后的学习打下坚实的基础

    Hadoop 2.x伪分布式环境搭建详细步骤

    在本教程中,我们将深入探讨如何在本地计算机上搭建Hadoop 2.x的伪分布式环境。伪分布式环境意味着所有Hadoop服务都在同一台机器上运行,但模拟的是一个分布式的集群环境,这对于学习和测试Hadoop功能非常有用。 ...

    Hadoop3.x系统文档

    比如,在伪分布式模式下,原2.x版本通常使用的9000端口,在Hadoop 3.0中更改为了9820端口。这一改变是重要的,因为它会影响客户端和集群中各个服务的通信。文档中提到了端口变化的详细说明链接,指引用户访问以获取...

    hadoop-2.x的环境搭建

    本文将详细阐述如何搭建Hadoop 2.x的环境,这包括单节点模式、伪分布式模式以及完全分布式模式的安装与配置,同时也涵盖了Hadoop生态系统中其他重要组件的安装。 一、Hadoop简介 Hadoop是基于Java开发的,它由...

    hadoop伪分布式集群搭建

    在实际应用中,Hadoop通常运行在由多台服务器组成的集群环境中,但为了方便学习和测试,可以搭建一个伪分布式集群(Pseudo Distributed Cluster)。伪分布式集群是指所有Hadoop守护进程都在同一台机器上运行,每个...

    shell脚本配置Hadoop伪分布式.zip

    7. 最后,通过`help文档.txt`中的指示进行验证,确保Hadoop伪分布式环境已成功搭建并运行。 理解并掌握这些步骤和配置文件的用途,是成为Hadoop管理员或数据工程师的关键技能之一。在实际应用中,你可能需要根据...

    Hadoop单节点伪分布式搭建中文版

    【Hadoop 单节点伪分布式搭建】是一种适合学习和测试Hadoop环境的简易方式,无需配置复杂的多节点集群。在单节点伪分布式模式下,所有Hadoop服务都在同一个节点上以独立Java进程的方式运行,模拟分布式环境的行为,...

    hadoop伪分布式配置教程.doc

    2. **安装SSH**:Hadoop的伪分布式环境需要SSH服务,用于在本地不同进程中通信。Ubuntu系统通常预装了SSH客户端,我们需要安装SSH服务器。执行: ```bash sudo apt install openssh-server ``` 安装完成后,...

    Hadoop伪分布式搭建配置文件

    以上就是Hadoop伪分布式搭建的基本流程,过程中涉及的配置文件和参数设置都是关键知识点。在实际应用中,还需要根据硬件资源和具体需求进行调整。如果你遇到问题,可以参考提供的配置文件,或者查阅相关文档和社区...

    Ubuntu上搭建Hadoop2.x详细文档

    本文档将详细介绍如何在Ubuntu系统上搭建Hadoop2.x环境,包括伪分布式的配置过程。 #### 安装准备 1. **虚拟机安装**: - 首先需要在主机上安装虚拟机软件,如VMware Workstation。 - 在虚拟机中安装Ubuntu操作...

    hadoop2.4.1伪分布式搭建

    ### Hadoop 2.4.1 伪分布式环境搭建详细步骤 #### 一、环境准备:Linux系统配置 在开始之前,确保您的开发环境中已经安装并配置好了虚拟机(如VMware),并且能够正常运行Linux操作系统。以下是具体的配置步骤: ...

    Hadoop伪分布式.rar

    总的来说,"Hadoop伪分布式.rar" 提供了搭建本地Hadoop环境的基础,结合JDK,使得开发者可以在自己的机器上实践和理解Hadoop的工作原理,从而更好地掌握大数据处理的核心技术。无论是为了学习、实验还是开发,这都是...

    大数据 Hadoop 伪分布式搭建

    本教程将指导你如何在Ubuntu 16.04系统上搭建Hadoop 2.6.0的伪分布式环境,这个环境模拟了一个完整的Hadoop集群,但所有服务都在同一台机器上运行。 首先,我们需要创建一个新的用户和用户组,这有助于管理和隔离...

    VM+CentOS+hadoop2.7搭建hadoop完全分布式集群

    ### 基于VM+CentOS+hadoop2.7搭建Hadoop完全分布式集群的知识点解析 #### 一、概述 本文旨在详细介绍如何使用VMware Workstation(简称VM)结合CentOS 6.5操作系统来搭建Hadoop 2.7的完全分布式集群。此文档是根据...

    hadoop伪分布式搭建.docx

    ### Hadoop伪分布式环境搭建详解 #### 一、VirtualBox 安装与配置 ##### 1. VirtualBox 安装步骤 - **选择版本**:根据文档提供的信息,选择 VirtualBox 的版本为 6.0.8 版本。 - **安装程序启动**:双击安装包...

    linux虚拟机搭建hadoop伪分布式集群

    在搭建Hadoop伪分布式集群的过程中,首先需要在Linux环境下配置VMware的NAT网络,确保虚拟机能够稳定地运行和通信。NAT网络允许虚拟机通过宿主机与外部网络进行通信,同时保持IP地址的固定性。具体操作包括取消DHCP...

Global site tag (gtag.js) - Google Analytics