1,环境说明
机器是三台,都是linux RHEL6系统,三台机器的IP是192.168.1.99、192.168.1.98、192.168.1.97。
各自设置主机名
192.168.1.99 namenode
192.168.1.98 datanode1
192.168.1.97 datanode2
设置主机名的方法:
http://stranger2008.iteye.com/blog/1825953
每台机器都已经安装好了java,安装目录在/usr/local/java,安装方法:
http://stranger2008.iteye.com/blog/1820548
在每台机器上的/etc/hosts内加入以下代码:
192.168.1.99 namenode 192.168.1.98 datanode1 192.168.1.97 datanode2
2,设置SSH无密码登录
hadoop运行集群需要各机器支持ssh无密码登录,我这里直接用root登录。
进入root主目录,执行生成密钥代码
#cd ~ #ssh-keygen -t rsa
执行以上代码,一直回车即可,在root的主目录下会生成.ssh文件夹,文件夹内包括两个文件id_rsa.pub和id_rsa。
以上这步操作每台机器都相同的做一遍。
生成id_rsa.pub和id_rsa这两个文件后,在本地创建一个文件authorized_keys,再把三台服务器上的id_rsa.pub下载下来,并把里面的内容都加到authorized_keys文件里,然后在把authorized_keys上传到各个服务器的/root/.ssh/目录下。
然后试着连接即可,本机也可以连自己,第一次连接需要输入密码,后面就不需要了。
ssh namenode ssh datanode1 ssh datanode2
3,安装hadoop
下载地址:
http://labs.xiaonei.com/apache-mirror/hadoop/core/hadoop-0.20.1/hadoop-0.20.2.tar.gz
a,创建安装目录
mkdir /usr/local/hadoop/
b,解压安装文件hadoop-0.21.0.tar放入到安装目录
tar -zxvf hadoop-0.21.0.tar
c,设置环境变量
/etc/profile增加如下内容
#config hadoop export HADOOP_HOME=/usr/local/hadoop/ export PATH=$HADOOP_HOME/bin:$PATH #hadoop logs file path export HADOOP_LOG_DIR=${HADOOP_HOME}/logs
让设置生效: source /etc/profile
d,设置主从配置
/usr/local/hadoop/conf/masters的配置如下:
namenode
/usr/local/hadoop/conf/slaves的配置如下:
datanode1 datanode2
e,修改配置文件
/usr/local/hadoop/conf/hadoop-env.sh
把JAVA_HOME该为安装jdk的路径
# The java implementation to use. Required. export JAVA_HOME=/usr/local/java/
core-site.xml
<configuration> <property> <name>fs.default.name</name> <value>hdfs://Namenode:9000/</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/usr/local/hadoop/tmp/</value> </property> </configuration>
hdfs-site.xml
<configuration> <property> <name>dfs.replication</name> #set bak file number <value>1</value> </property> </configuration>
mapred-site.xml
<configuration> <property> <name>mapred.job.tracker</name> <value>Namenode:9001</value> </property> </configuration>
f,初始化Hadoop
#cd /usr/local/hadoop/ #./bin/hadoop namenode -format
以上a-f的步骤三台机器一模一样做一遍。
4,在namenode机器上启动hadoop
#cd /usr/local/hadoop/ #./bin/start-all.sh
启动后用命令JPS查看结果如下:
[root@namenode hadoop]# jps
1806 Jps
1368 NameNode
1694 JobTracker
1587 SecondaryNameNode
然后到Datanode1/2上去查看,执行JPS,结果如下:
[root@datanode2 hadoop]# jps
1440 Jps
1382 TaskTracker
1303 DataNode
[root@datanode2 hadoop]# jps
1382 TaskTracker
1303 DataNode
1452 Jps
说明你成功集群安装了Hadoop
5,查看状态
查看集群状态:$ hadoop dfsadmin -report
Hadoop 的web 方式查看:http://192.168.1.99:50070
http://192.168.1.99:50030 可以查看运行的job和结果
相关推荐
linuxhadoop配置[归纳].pdf
4. **配置Hadoop配置文件**:编辑`core-site.xml`,`hdfs-site.xml`,`mapred-site.xml`,和`yarn-site.xml`等配置文件,指定HDFS的NameNode,DataNode,MapReduce的JobHistoryServer,以及YARN的ResourceManager和...
Linux基本常用命令,ssh无密钥登录,Linux安装hadoop,hadoop集群搭建
Hadoop是用Java编写的,因此安装JDK(Java Development Kit)是安装Hadoop之前必须进行的步骤。这涉及到下载JDK安装包并进行安装,然后配置Java环境变量,包括JAVA_HOME(指向JDK安装目录)、JRE_HOME(指向JDK中的...
### Linux 下 Hadoop 安装及配置详解 #### 前言 随着大数据技术的不断发展,Hadoop 成为了处理大规模数据集的一种重要工具。本文旨在详细介绍如何在 Linux 环境下安装和配置 Hadoop,确保能够顺利地进行大数据处理...
windows+linux双系统的安装,hadoop集群的安装配置,单机环境和多机环境的配置安装
Hadoop安装配置知识点: 一、Hadoop简介 Hadoop是云计算的基础,它是一个分布式系统的基础架构,被广泛应用于云计算的分布式存储和计算中。Hadoop设计用来从单一服务器扩展到数千台机器,每台机器提供本地计算和...
资源名称:linux hadoop搭建手册以及三种集群模式配置内容简介: linux hadoop搭建手册以及三种集群模式配置前半部分主要讲述了环境配置 环境配置环境配置;后半部分主要讲述Hadoop集群有三种运行模式,分别为单机...
Linux下的Hadoop配置和使用是大数据处理领域的重要环节,它基于Apache基金会开发的分布式系统基础架构,旨在简化在分布式环境中开发和运行程序的过程。Hadoop的核心组件包括分布式文件系统(Hadoop Distributed File...
【Hadoop安装与配置详细教程(Linux)】 Hadoop是一个开源的分布式计算框架,广泛应用于大数据处理。在Linux环境下安装和配置Hadoop是一项基础但重要的任务,尤其对于那些需要处理大规模数据的组织。本文将详细介绍...
### Linux下载、安装、JDK配置、Hadoop安装相关知识点 #### 一、Linux环境准备与安装 **1.1 Linux版本选择** - **CentOS 6.5**:适用于本教程,是一款稳定且广受支持的企业级操作系统。 **1.2 下载Linux** - **...
Linux 下 Hadoop 集群安装指南 一、Linux 下 Hadoop 集群安装前的准备工作 在开始安装 Hadoop 集群之前,我们需要安装 VMware 和 Ubuntu Linux 作为操作系统。这一步骤非常重要,因为 Hadoop 集群需要在 Linux ...
1. **Hadoop安装**: - 下载Hadoop的最新稳定版本,并将其解压到Linux服务器的适当目录,例如 `/usr/local/hadoop`。 - 配置环境变量,在`~/.bashrc`或`~/.bash_profile`中添加HADOOP_HOME,并将Hadoop的bin目录...
#### 三、Hadoop安装与配置 1. **Hadoop下载**: - 下载`hadoop-0.20.1.tar.gz`,并解压至指定位置,例如`/usr/hadoop`。 2. **配置`hadoop-env.sh`文件**: - 修改`/usr/hadoop/hadoop-0.20.1/conf/hadoop-env....
### Linux系统下Hadoop安装配置的关键知识点 #### 环境准备 - **确保Linux系统已安装Java**:Hadoop的运行依赖于Java环境。在安装Hadoop之前,需先确保Linux系统上已经安装了Java,并且版本符合Hadoop的要求。可以...
通过安装 Linux 系统的虚拟机、配置虚拟机网络、安装 Hadoop、配置 HDFS、配置 YUM 源和安装必要软件,可以实现高效的数据处理和存储。本节提供了详细的安装和配置步骤,帮助读者快速安装和配置 Hadoop 集群。 知识...
2. **安装Hadoop**: 解压Hadoop到合适位置,如`C:\hadoop`,配置`conf`目录下的配置文件。 3. **配置环境变量**: 在系统环境变量中添加Hadoop相关的变量,如`HADOOP_HOME`、`JAVA_HOME`以及`Path`。 4. **模拟...
本文将详细介绍如何在非root权限下配置Linux Hadoop集群的自动SSH。 首先,理解SSH的基本概念是必要的。SSH是一种网络协议,用于加密网络连接,提供远程登录和其他网络服务,确保数据传输的安全性。在Hadoop集群中...