`

hadoop2.2伪分布搭建

阅读更多

1.准备Linux环境

1.0点击VMware快捷方式,右键打开文件所在位置 -> 双击vmnetcfg.exe -> VMnet1 host-only ->修改subnet ip 设置网段:192.168.1.0 子网掩码:255.255.255.0 -> 

apply -> ok

回到windows --> 打开网络和共享中心 -> 更改适配器设置 -> 右键VMnet1 -> 属性 -> 双击IPv4 -> 设置windows的IP:192.168.1.110 子网掩码:255.255.255.0 -> 

点击确定

在虚拟软件上 --My Computer -> 选中虚拟机 -> 右键 -> settings -> network adapter -> host only -> ok

1.1修改主机名

vim /etc/sysconfig/network

 

NETWORKING=yes

HOSTNAME=lina01  

 

1.2修改IP

两种方式:

第一种:通过Linux图形界面进行修改(强烈推荐)此乃高富帅和白富美使用

进入Linux图形界面 -> 右键点击右上方的两个小电脑 -> 点击Edit connections -> 选中当前网络System eth0 -> 点击edit按钮 -> 选择IPv4 -> method选择为manual -> 点击add按钮 -> 添加IP:192.168.1.9 子网掩码:255.255.255.0 网关:192.168.1.1 -> apply

 

第二种:修改配置文件方式(屌丝程序猿专用)

vim /etc/sysconfig/network-scripts/ifcfg-eth0

 

DEVICE="eth0"

BOOTPROTO="static"          

HWADDR="00:0C:29:3C:BF:E7"

IPV6INIT="yes"

NM_CONTROLLED="yes"

ONBOOT="yes"

TYPE="Ethernet"

UUID="ce22eeca-ecde-4536-8cc2-ef0dc36d4a8c"

IPADDR="192.168.1.9"       

NETMASK="255.255.255.0"      

GATEWAY="192.168.1.1"        

 

1.3修改主机名和IP的映射关系

vim /etc/hosts

 

192.168.1.44lina01  

 

1.4关闭防火墙

#查看防火墙状态

service iptables status

#关闭防火墙

service iptables stop

#查看防火墙开机启动状态

chkconfig iptables --list

#关闭防火墙开机启动

chkconfig iptables off

 

1.5重启Linux

reboot

 

2.安装JDK

2.1上传

 

2.2解压jdk

#创建文件夹

mkdir /usr/java

#解压

tar -zxvf jdk-7u55-linux-i586.tar.gz -C /usr/java/

 

2.3将java添加到环境变量中

vim /etc/profile

#在文件最后添加

export JAVA_HOME=/usr/java/jdk1.7.0_60

export PATH=$PATH:$JAVA_HOME/bin

 

#刷新配置

source /etc/profile

3.安装Hadoop

3.1上传hadoop安装包

 

3.2解压hadoop安装包

mkdir /cloud

#解压到/cloud/目录下

tar -zxvf hadoop-2.2.0.tar.gz -C /cloud/

 

3.3修改配置文件(5个)

第一个:hadoop-env.sh

#在27行修改

export JAVA_HOME=/usr/java/jdk1.7.0_60

 

第二个:core-site.xml

<configuration>

<!-- 指定HDFS老大(namenode)的通信地址 -->

<property>

<name>fs.defaultFS</name>

<value>hdfs://lina01:9000</value>

</property>

<!-- 指定hadoop运行时产生文件的存储路径 -->

<property>

<name>hadoop.tmp.dir</name>

<value>/cloud/hadoop-2.2.0/tmp</value>

</property>

</configuration>

 

第三个:hdfs-site.xml

<configuration>

<!-- 设置hdfs副本数量 -->

<property>

<name>dfs.replication</name>

<value>1</value>

</property>

</configuration>

 

第四个:mapred-site.xml.template 需要重命名: mv mapred-site.xml.template mapred-site.xml

<configuration>

<!-- 通知框架MR使用YARN -->

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

 

第五个:yarn-site.xml

<configuration>

<!-- reducer取数据的方式是mapreduce_shuffle -->

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

 

3.4将hadoop添加到环境变量

vim /etc/profile

 

export JAVA_HOME=/usr/java/jdk1.7.0_60

export HADOOP_HOME=/cloud/hadoop-2.2.0

export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

 

source /etc/profile

3.5格式化HDFS(namenode)第一次使用时要格式化

hadoop namenode -format

 

3.6启动hadoop

先启动HDFS

sbin/start-dfs.sh

 

再启动YARN

sbin/start-yarn.sh

 

3.7验证是否启动成功

使用jps命令验证

27408 NameNode

28218 Jps

27643 SecondaryNameNode

28066 NodeManager

27803 ResourceManager

27512 DataNode

 

http://192.168.1.9:50070  (HDFS管理界面)

在这个文件中添加linux主机名和IP的映射关系

C:\Windows\System32\drivers\etc\hosts

192.168.1.9lina01

 

http://192.168.1.44:8088 (MR管理界面)

 

4.配置ssh免登陆

生成ssh免登陆密钥

cd ~,进入到我的home目录

cd .ssh/

 

ssh-keygen -t rsa (四个回车)

执行完这个命令后,会生成两个文件id_rsa(私钥)、id_rsa.pub(公钥)

将公钥拷贝到要免登陆的机器上

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

ssh-copy-id -i localhost 

 

 

以上蓝色部分是要添加及修改的部分   验证部分也很重要 不要有丢失的 如果有丢失就代表你配置的没有成功

 

 

 

 

 

分享到:
评论

相关推荐

    hadoop2.2伪分布式集群搭建

    hadoop2.2伪分布式集群搭建 #查看防火墙状态 service iptables status #关闭防火墙 service iptables stop #查看防火墙开机启动状态 chkconfig iptables --list #关闭防火墙开机启动 chkconfig iptables off

    hadoop2.2+spark集群搭建手记之hadoop集群遇到的各种问题

    hadoop2.2集群搭建遇到的各种问题。

    hadoop2.2搭建

    ### Hadoop 2.2 伪分布环境搭建详解 #### 一、环境准备与配置 在搭建 Hadoop 2.2 的伪分布环境之前,首先需要进行一系列的基础环境准备及配置工作,确保 Linux 虚拟机能够正常运行并具备相应的网络设置。 ##### ...

    Hadoop2.2部署文档

    《Hadoop2.2部署指南》 在当前的数字化时代,大数据处理已成为企业的重要需求,而Hadoop作为开源的大数据处理框架,因其高效、可扩展的特性,深受业界青睐。本指南将详细介绍如何在Red Hat Enterprise Linux Server...

    hadoop2.2.0伪分布式搭建

    此伪分布式搭建文件绝对正确,LZ亲自试验过。另,本文件为传智播客中使用文件,请勿用于商业用途,否则后果自负。

    hadoop2.4.1伪分布式搭建.txt

    ### Hadoop 2.4.1 伪分布式搭建详解 #### 一、环境准备与配置 在进行Hadoop 2.4.1伪分布式的搭建之前,首先需要确保Linux环境的正确配置。以下将详细介绍所需的步骤。 ##### 1.1 VMware网络配置 - **开启VMware...

    hadoop2.4.1伪分布式搭建

    ### Hadoop 2.4.1 伪分布式环境搭建详细步骤 #### 一、环境准备:Linux系统配置 在开始之前,确保您的开发环境中已经安装并配置好了虚拟机(如VMware),并且能够正常运行Linux操作系统。以下是具体的配置步骤: ...

    JDK的安装和Hadoop伪分布的配置

    通过上述步骤,我们可以成功地在本地计算机上搭建起Hadoop伪分布模式。这对于初学者来说是一个非常好的学习平台,不仅能够帮助理解Hadoop的基本工作原理,还能掌握Hadoop集群的搭建过程。同时,通过实际操作,也能更...

    伪分布hadoop搭建.docx

    为了在本地环境中学习和测试Hadoop的功能,我们通常会搭建一个伪分布式环境。本文档将详细指导你如何在Linux系统上进行伪分布式Hadoop的搭建。 首先,我们需要准备一个运行Linux的环境。在第1章中,我们讲解了如何...

    Hadoop伪分布式及生态圈组件搭建新手指导文档

    以上是 Hadoop 伪分布式环境以及 Hbase 的搭建过程,这个过程对初学者来说至关重要,因为它提供了 Hadoop 生态圈的基本运行环境。Hadoop 是一个开源的大数据处理框架,主要由 HDFS(Hadoop Distributed File System...

    centos7安装和基础环境配置:Hadoop分布式搭建前期准备工作.docx

    完成 Hadoop 环境配置后,需要搭建伪式分布式系统,包括配置 NodeManager、ResourceManager 等组件。 4.1 配置 NodeManager 配置 NodeManager,包括设置 NodeManager 的执行参数、输入输出文件等。 4.2 配置 ...

    云服务器上搭建大数据伪分布式环境

    #### 一、云服务器上搭建Hadoop伪分布式环境 ##### 1、软硬件环境 - **操作系统**: CentOS 7.2 64位 - **Java版本**: OpenJDK-1.8.0 - **Hadoop版本**: Hadoop-2.7 ##### 2、安装SSH客户端 为了能够在本地或其他...

    在本机搭建hadoop3.1.2开发环境详解

    ### 在本机搭建Hadoop 3.1.2开发环境详解 #### 一、环境准备与虚拟机搭建 ...至此,Hadoop 3.1.2的伪分布式环境就已经搭建完成了。接下来可以根据项目需求进一步开发和测试相关的Hadoop应用程序。

    在ubuntu下搭建hadoop环境搭建__说明文档

    ### 在Ubuntu下搭建Hadoop环境的关键步骤 ...通过以上步骤,您可以在Ubuntu系统下成功搭建起Hadoop环境,并且能够在单节点伪分布模式下运行Hadoop集群。这对于学习和测试Hadoop的基本功能非常有用。

    hadoop&spark环境配置.pdf

    #### 四、Hadoop 伪分布模式搭建 - **步骤**: - 在单台机器上安装和配置Hadoop。 - 设置SSH无密码登录。 - 编辑配置文件以适应伪分布模式。 #### 五、Hadoop 完全分布式搭建 - **步骤**: - 在集群中安装和...

Global site tag (gtag.js) - Google Analytics