1.linux环境准备
(1).设置静态IP
(2).设置主机名
操作:
hostname www.hyman.com
vi /etc/sysconfig/network
验证:
hostname
(3).绑定主机名
操作:
vi /etc/hosts
验证:
ping www.hyman.com
(4).关闭防火墙
操作:
service iptables stop
验证:
service iptables status
(5).关闭防火墙自启动
操作:
chkconfig iptables off
验证:
chkconfig --list | grep iptables
(6).设置ssh免密码登陆
操作:
ssh-keygen -t rsa
cp id_rsa.pub authorized_keys
验证:
ssh localhost
(7).安装jdk
操作:
cd /usr/local
tar -zxvf jdk-7u67-linux-x64.tar.gz
mv jdk1.7.0_67 jdk
vi /etc/profile
增加>
export JAVA_HOME=/usr/local/jdk
export PATH=$PATH:$JAVA_HOME/bin:.
验证:
java -version
2.hadoop2为分布式安装
(1).解压hadoop
操作:
cp /usr/local
tar -zxvf hadoop-2.5.2.tar.gz
mv hadoop-2.5.2 hadoop
验证:
(2).修改配置文件
操作:
cd $HADOOP_HOME/etc/hadoop
1>、hadoop-env.sh
export JAVA_HOME=/opt/modules/jdk1.6.0_45
2>、yarn-env.sh
export JAVA_HOME=/opt/modules/jdk1.6.0_45
3>、mapred-env.sh
export JAVA_HOME=/opt/modules/jdk1.6.0_45
4>、core-site.xml
<property>
<name>fs.default.name</name>
<value>hdfs://hadoop-yarn.dragon.org:8020</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/opt/modules/hadoop-2.2.0/data/tmp</value>
</property>
5>、hdfs-site.xml
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
6>、yarn-site.xml
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
7>、mapred-site.xml
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
验证:
(3).namenode format
操作:
bin/hdfs namenode -format
验证:
(4).启动
操作:
sbin/start-dfs.sh
sbin/start-yarn.sh
验证:
jps
NameNode http服务地址:http://hostname:50070
ResourceManager http服务地址:http://hostname:8088
相关推荐
练习搭建伪分布Hadoop3.X集群,只用于刚刚开始学习搭建hadoo伪分布式集群的人群,帮助大家快速搭建Hadoop3.X伪分布式集群,快速入门大数据为日后的学习打下坚实的基础
在本教程中,我们将深入探讨如何在本地计算机上搭建Hadoop 2.x的伪分布式环境。伪分布式环境意味着所有Hadoop服务都在同一台机器上运行,但模拟的是一个分布式的集群环境,这对于学习和测试Hadoop功能非常有用。 ...
比如,在伪分布式模式下,原2.x版本通常使用的9000端口,在Hadoop 3.0中更改为了9820端口。这一改变是重要的,因为它会影响客户端和集群中各个服务的通信。文档中提到了端口变化的详细说明链接,指引用户访问以获取...
本文将详细阐述如何搭建Hadoop 2.x的环境,这包括单节点模式、伪分布式模式以及完全分布式模式的安装与配置,同时也涵盖了Hadoop生态系统中其他重要组件的安装。 一、Hadoop简介 Hadoop是基于Java开发的,它由...
在实际应用中,Hadoop通常运行在由多台服务器组成的集群环境中,但为了方便学习和测试,可以搭建一个伪分布式集群(Pseudo Distributed Cluster)。伪分布式集群是指所有Hadoop守护进程都在同一台机器上运行,每个...
7. 最后,通过`help文档.txt`中的指示进行验证,确保Hadoop伪分布式环境已成功搭建并运行。 理解并掌握这些步骤和配置文件的用途,是成为Hadoop管理员或数据工程师的关键技能之一。在实际应用中,你可能需要根据...
【Hadoop 单节点伪分布式搭建】是一种适合学习和测试Hadoop环境的简易方式,无需配置复杂的多节点集群。在单节点伪分布式模式下,所有Hadoop服务都在同一个节点上以独立Java进程的方式运行,模拟分布式环境的行为,...
2. **安装SSH**:Hadoop的伪分布式环境需要SSH服务,用于在本地不同进程中通信。Ubuntu系统通常预装了SSH客户端,我们需要安装SSH服务器。执行: ```bash sudo apt install openssh-server ``` 安装完成后,...
以上就是Hadoop伪分布式搭建的基本流程,过程中涉及的配置文件和参数设置都是关键知识点。在实际应用中,还需要根据硬件资源和具体需求进行调整。如果你遇到问题,可以参考提供的配置文件,或者查阅相关文档和社区...
本文档将详细介绍如何在Ubuntu系统上搭建Hadoop2.x环境,包括伪分布式的配置过程。 #### 安装准备 1. **虚拟机安装**: - 首先需要在主机上安装虚拟机软件,如VMware Workstation。 - 在虚拟机中安装Ubuntu操作...
### Hadoop 2.4.1 伪分布式环境搭建详细步骤 #### 一、环境准备:Linux系统配置 在开始之前,确保您的开发环境中已经安装并配置好了虚拟机(如VMware),并且能够正常运行Linux操作系统。以下是具体的配置步骤: ...
总的来说,"Hadoop伪分布式.rar" 提供了搭建本地Hadoop环境的基础,结合JDK,使得开发者可以在自己的机器上实践和理解Hadoop的工作原理,从而更好地掌握大数据处理的核心技术。无论是为了学习、实验还是开发,这都是...
本教程将指导你如何在Ubuntu 16.04系统上搭建Hadoop 2.6.0的伪分布式环境,这个环境模拟了一个完整的Hadoop集群,但所有服务都在同一台机器上运行。 首先,我们需要创建一个新的用户和用户组,这有助于管理和隔离...
### 基于VM+CentOS+hadoop2.7搭建Hadoop完全分布式集群的知识点解析 #### 一、概述 本文旨在详细介绍如何使用VMware Workstation(简称VM)结合CentOS 6.5操作系统来搭建Hadoop 2.7的完全分布式集群。此文档是根据...
### Hadoop伪分布式环境搭建详解 #### 一、VirtualBox 安装与配置 ##### 1. VirtualBox 安装步骤 - **选择版本**:根据文档提供的信息,选择 VirtualBox 的版本为 6.0.8 版本。 - **安装程序启动**:双击安装包...
在搭建Hadoop伪分布式集群的过程中,首先需要在Linux环境下配置VMware的NAT网络,确保虚拟机能够稳定地运行和通信。NAT网络允许虚拟机通过宿主机与外部网络进行通信,同时保持IP地址的固定性。具体操作包括取消DHCP...