`

hadoop 2.2.0 伪分布安装

 
阅读更多

 

Linux配置

1、配置ip地址:192.168.56.100/24

2、修改主机名:/etc/sysconfig/network

3、修改主机名和IP地址的映射:/etc/hosts

4、关闭防火墙:    service iptables stop、chkconfig iptables off

reboot

解压命令:tar -zxvf

 

 

安装jdk

解压jdk后,在/etc/profile文件中配置环境变量

export JAVA_HOME=/usr/java/jdk1.7.0_79
export PATH=$PATH:$JAVA_HOME/bin

 然后source该文件,然后查看jdk的版本,看是否配置成功

[root@centos1 bin]# java -version
java version "1.7.0_79"
Java(TM) SE Runtime Environment (build 1.7.0_79-b15)
Java HotSpot(TM) Client VM (build 24.79-b02, mixed mode)

安装hadoop2.2.0

到该地址去下载,找stable或current目录,该目录为稳定版

http://archive.apache.org/dist/
http://archive.apache.org/dist/hadoop/core/stable/ 

 解压文件,后开始配置hadoop,这里一共需要配置五个文件

文件一:hadoop-env.sh

位置:

hadoop-2.2.0/etc/hadoop

 配置:

export JAVA_HOME=/usr/java/jdk1.7.0_79

文件二:core-site.xml

位置:

hadoop-2.2.0/etc/hadoop

配置:

<configuration>
		<!-- 制定HDFS的老大(NameNode)的地址 -->
		<property>
			<name>fs.defaultFS</name>
			<value>hdfs://centos1:9000</value>
		</property>
		<!-- 指定hadoop运行时产生文件的存储目录 -->
		<property>
			<name>hadoop.tmp.dir</name>
			<value>/usr/hadoop/hadoop-2.2.0/tmp</value>
     		</property>
</configuration>

 文件三:hdfs-site.xml

位置:

hadoop-2.2.0/etc/hadoop

配置:

<configuration>
		<!-- 指定HDFS副本的数量 -->
		<property>
			<name>dfs.replication</name>
			<value>1</value>
	        </property>
</configuration>

 文件四:mapred-site.xml

该文件并不存在,但是有一个mapred-site.xml.template存在,修改该文件的名称

mv mapred-site.xml.template mapred-site.xml

位置:

hadoop-2.2.0/etc/hadoop

配置:

<configuration>
		<!-- 指定mr运行在yarn上 -->
		<property>
			<name>mapreduce.framework.name</name>
			<value>yarn</value>
       		</property>
</configuration>

 文件五:yarn-site.xml

位置:

hadoop-2.2.0/etc/hadoop

配置:

<configuration>
	<!-- 指定YARN的老大(ResourceManager)的地址 -->
		<property>
			<name>yarn.resourcemanager.hostname</name>
			<value>centos1</value>
        </property>
		<!-- reducer获取数据的方式 -->
        <property>
			<name>yarn.nodemanager.aux-services</name>
			<value>mapreduce_shuffle</value>
        </property>

</configuration>

在/etc/profile 中添加hadoop环境变量

export HADOOP_HOME=/usr/hadoop/hadoop-2.2.0
export PATH=.:$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

 格式化hdfs,hadoop  namenode -format 这个命令在hadoop2中已经过时了,格式化后会在hadoop-2.2.0/tmp目中生成一些文件

 hdfs namenode -format

 启动hadoop使用,这是需要属于秘密,每启动一个进程都需要输入一次密码

sbin/start-dfs.sh
sbin/start-yarn.sh

 启动后查看进程

[root@centos1 sbin]# jps
5129 SecondaryNameNode
5522 NodeManager
5552 Jps
5251 ResourceManager
4890 NameNode
4972 DataNode

 

192.168.56.100:50070 查看Namenode,访问Browse the filesystem时通过主机名,需要配置hosts文件

192.168.56.100:8088 查看yarn

 

 配饰ssh免密码

#目录
/root/.ssh
#生成rsa密钥和公钥
ssh-keygen -t rsa
#生成的文件
-rw-------. 1 root root 1675 Sep 19 10:21 id_rsa
-rw-r--r--. 1 root root  394 Sep 19 10:21 id_rsa.pub
#copy公钥到认证文件中,文件名必须为 authorized_keys
cp id_rsa.pub authorized_keys
#
-rw-r--r--. 1 root root  394 Sep 19 10:24 authorized_keys
-rw-------. 1 root root 1675 Sep 19 10:21 id_rsa
-rw-r--r--. 1 root root  394 Sep 19 10:21 id_rsa.pub
#把本机的公钥copy给对方主机
ssh-copy-id 对方主机地址

 

 

 

 

 

 

 

 

 

 

 

分享到:
评论

相关推荐

    hadoop2.2.0的64位安装包

    总结来说,安装64位的Hadoop 2.2.0涉及下载源代码、配置编译环境、编译源代码、安装和配置Hadoop以及启动服务。这个过程对于理解和掌握Hadoop的工作原理非常有帮助,同时也能确保在64位Linux系统上顺利运行大数据...

    hadoop2.2.0伪分布式搭建

    此伪分布式搭建文件绝对正确,LZ亲自试验过。另,本文件为传智播客中使用文件,请勿用于商业用途,否则后果自负。

    hadoop2.2.0部署

    ### Hadoop 2.2.0 部署详尽指南 #### 一、安装Linux **1. 安装wmware11** - **待补充:** 这部分需要更详细的说明来指导用户如何顺利安装wmware11,包括系统的最低配置要求、安装过程中需要注意的关键步骤等。 **...

    Hadoop2.2.0单机伪分布环境快速搭建手册

    hadoop2 - 虚拟机VMWare - Linux(ubuntu) ,单节点伪分布环境搭建快速手册,同之前上传的doc文档配套。

    Hadoop2.2.0Hbase0.98.1Hive0.13完全安装手册

    ### Hadoop2.2.0 + HBase0.98.1 + Sqoop1.4.4 + Hive0.13 完全安装手册 #### 前言 随着大数据技术的发展,Hadoop已经成为处理海量数据的核心框架之一。本文旨在为读者提供一套最新的Hadoop2.2.0、HBase0.98.1、...

    Hadoop2.2.0集群搭建手册

    Hadoop2.2.0版本 - 虚拟机VMWare - Linux(ubuntu) ,多节点伪分布环境搭建详细操作手册,可以直接用于完全分布。每一步都有自己详细操作记录和相关说明,几夜风雨的辛劳搭建和测试。 此操作手册搭建的集群详细说明: ...

    hadoop伪分布式搭建(超级详细)

    我们将基于提供的hadoop-2.2.0版本进行操作,并参考名为“hadoop2.2.0伪分布式搭建.txt”的指南文件。 首先,我们需要安装Java开发工具包(JDK),因为Hadoop是用Java编写的,依赖于JDK运行。确保你的系统已经安装...

    Hadoop2.2部署文档

    3. Hadoop 伪分布安装配置 在单机上模拟分布式环境,便于学习和测试: 3.1 配置SSH免密钥登陆:实现节点间的无密码登录,简化操作。 3.2 Hadoop伪分布式配置: - 配置hadoop-env.sh:设置Hadoop相关环境变量,如...

    传智黑马赵星老师hadoop七天课程资料笔记-第一天(全)

    6. "hadoop2.2.0伪分布式搭建.txt" - 这可能是一个文本指南,指导如何在单机环境下设置Hadoop的伪分布式模式,这是学习Hadoop的常见起点。 7. "分布式文件系统.txt" - 可能详细阐述了Hadoop分布式文件系统(HDFS)...

    单机版hadoop配置文件

    本话题主要聚焦于在单机环境中设置Hadoop的伪分布式模式,使用的版本为2.2.0。这种配置方式允许你在一台计算机上模拟多节点集群的行为,以便学习、测试或开发Hadoop相关应用。 首先,我们需要理解Hadoop的两个核心...

    Hadoop汇总整理.doc

    Hadoop 有三种模式:独立模式、伪分布模式、完全分布模式。Hadoop 主要由 NameNode(核心)、SecondNameNode、DataNode 组成。 Hadoop 在 Windows 上安装步骤: 1. 下载 JDK 1.8,并配置环境变量 JAVA_HOME=jdk ...

    hadoop实现购物商城推荐系统

    3,hadoop2.2.0:这里用于练习的是伪分布模式。4,完成内容:喜欢该商品的人还喜欢,相同购物喜好的好友推荐。1,通过sqoop从mysql中将“用户收藏商品”(这里用的是用户收藏商品信息表作为推荐系统业务上的依据,...

    hadoop2.2搭建

    ### Hadoop 2.2 伪分布环境搭建详解 #### 一、环境准备与配置 在搭建 Hadoop 2.2 的伪分布环境之前,首先需要进行一系列的基础环境准备及配置工作,确保 Linux 虚拟机能够正常运行并具备相应的网络设置。 ##### ...

    hadoop配置参数

    在这个场景中,我们将关注Hadoop 2.2.0版本的伪分布式配置,这是一种在单台机器上模拟分布式环境的方式,便于测试和学习。 在Hadoop的配置文件中,有几个核心的参数需要我们重点关注: 1. **core-site.xml**:这是...

    Hadoop汇总整理.docx

    在 Windows 上安装 Hadoop 主要用于个人测试和学习,通常采用伪分布模式。安装步骤包括: 1. 安装 Java Development Kit (JDK) 并配置 `JAVA_HOME` 环境变量。 2. 将 Hadoop 添加到系统路径中,包括 `HADOOP_...

    Spark伪分布式.rar

    1. **Spark**:这里提供的是`spark-2.2.0-bin-hadoop2.7.tgz`,这是Spark 2.2.0版本的二进制包,内含了对Hadoop 2.7的兼容支持。Spark提供了编程接口,包括Scala、Java、Python和R,其中Scala是其原生语言,提供了最...

Global site tag (gtag.js) - Google Analytics