`

linux hadoop安装配置

 
阅读更多

1,环境说明

机器是三台,都是linux RHEL6系统,三台机器的IP是192.168.1.99、192.168.1.98、192.168.1.97。

各自设置主机名

192.168.1.99 namenode

192.168.1.98 datanode1

192.168.1.97 datanode2

设置主机名的方法:

http://stranger2008.iteye.com/blog/1825953

每台机器都已经安装好了java,安装目录在/usr/local/java,安装方法:

http://stranger2008.iteye.com/blog/1820548

在每台机器上的/etc/hosts内加入以下代码:

192.168.1.99 namenode
192.168.1.98 datanode1
192.168.1.97 datanode2

 

2,设置SSH无密码登录

hadoop运行集群需要各机器支持ssh无密码登录,我这里直接用root登录。

进入root主目录,执行生成密钥代码

 

#cd ~
#ssh-keygen -t rsa

执行以上代码,一直回车即可,在root的主目录下会生成.ssh文件夹,文件夹内包括两个文件id_rsa.pub和id_rsa。

以上这步操作每台机器都相同的做一遍。

 

生成id_rsa.pub和id_rsa这两个文件后,在本地创建一个文件authorized_keys,再把三台服务器上的id_rsa.pub下载下来,并把里面的内容都加到authorized_keys文件里,然后在把authorized_keys上传到各个服务器的/root/.ssh/目录下。

 

然后试着连接即可,本机也可以连自己,第一次连接需要输入密码,后面就不需要了。

 

ssh namenode
ssh datanode1
ssh datanode2

 

3,安装hadoop

下载地址:

http://labs.xiaonei.com/apache-mirror/hadoop/core/hadoop-0.20.1/hadoop-0.20.2.tar.gz

a,创建安装目录

mkdir /usr/local/hadoop/

b,解压安装文件hadoop-0.21.0.tar放入到安装目录

tar -zxvf hadoop-0.21.0.tar

c,设置环境变量

/etc/profile增加如下内容

#config hadoop
export HADOOP_HOME=/usr/local/hadoop/
export PATH=$HADOOP_HOME/bin:$PATH
#hadoop logs file path
export HADOOP_LOG_DIR=${HADOOP_HOME}/logs

让设置生效: source /etc/profile

d,设置主从配置

/usr/local/hadoop/conf/masters的配置如下:

namenode

/usr/local/hadoop/conf/slaves的配置如下:

datanode1
datanode2

 e,修改配置文件

/usr/local/hadoop/conf/hadoop-env.sh

把JAVA_HOME该为安装jdk的路径

# The java implementation to use.  Required.
export JAVA_HOME=/usr/local/java/

  

core-site.xml

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://Namenode:9000/</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop/tmp/</value>
</property>
</configuration>

  hdfs-site.xml

<configuration>
<property>
<name>dfs.replication</name>
#set bak file number
<value>1</value>
</property>
</configuration>

 

mapred-site.xml

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>Namenode:9001</value>
</property>
</configuration>

f,初始化Hadoop

#cd /usr/local/hadoop/
#./bin/hadoop namenode -format

以上a-f的步骤三台机器一模一样做一遍。

 

4,在namenode机器上启动hadoop

#cd /usr/local/hadoop/
#./bin/start-all.sh

 

启动后用命令JPS查看结果如下:

 

[root@namenode hadoop]# jps
1806 Jps
1368 NameNode
1694 JobTracker
1587 SecondaryNameNode
然后到Datanode1/2上去查看,执行JPS,结果如下:
[root@datanode2 hadoop]# jps
1440 Jps
1382 TaskTracker
1303 DataNode
[root@datanode2 hadoop]# jps
1382 TaskTracker
1303 DataNode
1452 Jps
说明你成功集群安装了Hadoop

 

 5,查看状态

 

查看集群状态:$ hadoop dfsadmin -report
Hadoop 的web 方式查看:http://192.168.1.99:50070

http://192.168.1.99:50030 可以查看运行的job和结果

分享到:
评论

相关推荐

    linuxhadoop配置[归纳].pdf

    linuxhadoop配置[归纳].pdf

    Linuxhadoop集群安装

    4. **配置Hadoop配置文件**:编辑`core-site.xml`,`hdfs-site.xml`,`mapred-site.xml`,和`yarn-site.xml`等配置文件,指定HDFS的NameNode,DataNode,MapReduce的JobHistoryServer,以及YARN的ResourceManager和...

    Linux下Hadoop配置

    Linux基本常用命令,ssh无密钥登录,Linux安装hadoop,hadoop集群搭建

    Linux下Hadoop伪分布式配置及操作命令

    Hadoop是用Java编写的,因此安装JDK(Java Development Kit)是安装Hadoop之前必须进行的步骤。这涉及到下载JDK安装包并进行安装,然后配置Java环境变量,包括JAVA_HOME(指向JDK安装目录)、JRE_HOME(指向JDK中的...

    linux下的hadoop安装及配置详解

    ### Linux 下 Hadoop 安装及配置详解 #### 前言 随着大数据技术的不断发展,Hadoop 成为了处理大规模数据集的一种重要工具。本文旨在详细介绍如何在 Linux 环境下安装和配置 Hadoop,确保能够顺利地进行大数据处理...

    windows+inux安装+hadoop安装配置

    windows+linux双系统的安装,hadoop集群的安装配置,单机环境和多机环境的配置安装

    hadoop安装配置文档.pdf

    Hadoop安装配置知识点: 一、Hadoop简介 Hadoop是云计算的基础,它是一个分布式系统的基础架构,被广泛应用于云计算的分布式存储和计算中。Hadoop设计用来从单一服务器扩展到数千台机器,每台机器提供本地计算和...

    linuxhadoop搭建手册以及三种集群模式配置

    资源名称:linux hadoop搭建手册以及三种集群模式配置内容简介: linux hadoop搭建手册以及三种集群模式配置前半部分主要讲述了环境配置 环境配置环境配置;后半部分主要讲述Hadoop集群有三种运行模式,分别为单机...

    Linux下Hadoop配置和使用

    Linux下的Hadoop配置和使用是大数据处理领域的重要环节,它基于Apache基金会开发的分布式系统基础架构,旨在简化在分布式环境中开发和运行程序的过程。Hadoop的核心组件包括分布式文件系统(Hadoop Distributed File...

    Hadoop安装与配置详细教程(Linux)

    【Hadoop安装与配置详细教程(Linux)】 Hadoop是一个开源的分布式计算框架,广泛应用于大数据处理。在Linux环境下安装和配置Hadoop是一项基础但重要的任务,尤其对于那些需要处理大规模数据的组织。本文将详细介绍...

    linux下载,安装,JDK配置,hadoop安装

    ### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...

    Linux下Hadoop集群安装指南

    Linux 下 Hadoop 集群安装指南 一、Linux 下 Hadoop 集群安装前的准备工作 在开始安装 Hadoop 集群之前,我们需要安装 VMware 和 Ubuntu Linux 作为操作系统。这一步骤非常重要,因为 Hadoop 集群需要在 Linux ...

    Linux环境下Hadoop搭建与Eclipse配置

    1. **Hadoop安装**: - 下载Hadoop的最新稳定版本,并将其解压到Linux服务器的适当目录,例如 `/usr/local/hadoop`。 - 配置环境变量,在`~/.bashrc`或`~/.bash_profile`中添加HADOOP_HOME,并将Hadoop的bin目录...

    Linux下Hadoop单机配置文档

    #### 三、Hadoop安装与配置 1. **Hadoop下载**: - 下载`hadoop-0.20.1.tar.gz`,并解压至指定位置,例如`/usr/hadoop`。 2. **配置`hadoop-env.sh`文件**: - 修改`/usr/hadoop/hadoop-0.20.1/conf/hadoop-env....

    Linux 系统下 Hadoop 安装配置教程.md

    ### Linux系统下Hadoop安装配置的关键知识点 #### 环境准备 - **确保Linux系统已安装Java**:Hadoop的运行依赖于Java环境。在安装Hadoop之前,需先确保Linux系统上已经安装了Java,并且版本符合Hadoop的要求。可以...

    Hadoop集群安装与配置详细步骤

    通过安装 Linux 系统的虚拟机、配置虚拟机网络、安装 Hadoop、配置 HDFS、配置 YUM 源和安装必要软件,可以实现高效的数据处理和存储。本节提供了详细的安装和配置步骤,帮助读者快速安装和配置 Hadoop 集群。 知识...

    Linux和Win下配置eclipse开发hadoop

    2. **安装Hadoop**: 解压Hadoop到合适位置,如`C:\hadoop`,配置`conf`目录下的配置文件。 3. **配置环境变量**: 在系统环境变量中添加Hadoop相关的变量,如`HADOOP_HOME`、`JAVA_HOME`以及`Path`。 4. **模拟...

    非root权限下配置linux hadoop集群自动SSH记录

    本文将详细介绍如何在非root权限下配置Linux Hadoop集群的自动SSH。 首先,理解SSH的基本概念是必要的。SSH是一种网络协议,用于加密网络连接,提供远程登录和其他网络服务,确保数据传输的安全性。在Hadoop集群中...

Global site tag (gtag.js) - Google Analytics