`

hadoop 2.3.0 配置 Single Node Cluster

    博客分类:
  • java
阅读更多
下载

文档地址http://hadoop.apache.org/docs/current/hadoop-project-dist/hadoop-common/SingleCluster.html

http://www.diaryfolio.com/hadoop-install-steps/


前期准备

解压到指定目录
tar -zxvf hadoop-2.3.0.tar.gz -C /data/javadev


添加hadoop用户和用户组
useradd hadoop
usermod -g hadoop hadoop


查看hadoop用户
id hadoop


将解压的hadoop文件目录所属用户改为hadoop
chown -R hadoop:hadoop hadoop-2.3.0/


将hadoop添加到sudo中
visudo

在末尾添加一行
hadoop          ALL=(ALL)               ALL

保存

切换到hadoop用户
su - hadoop



环境变量和SSH配置

以下操作都使用hadoop用户

修改环境变量

vi .bashrc



export JAVA_HOME=/usr/java/jdk1.6.0_31/

#hadoop var
HADOOP_COMMON_HOME=/data01/javaapp/hadoop-2.3.0
HADOOP_HDFS_HOME=/data01/javaapp/hadoop-2.3.0
HADOOP_MAPRED_HOME=/data01/javaapp/hadoop-2.3.0
HADOOP_YARN_HOME=/data01/javaapp/hadoop-2.3.0
HADOOP_CONF_DIR=/data01/javaapp/hadoop-2.3.0/etc/hadoop
YARN_CONF_DIR=/data01/javaapp/hadoop-2.3.0/etc/hadoop

export HADOOP_COMMON_HOME HADOOP_HDFS_HOME HADOOP_MAPRED_HOME HADOOP_YARN_HOME HADOOP_CONF_DIR  YARN_CONF_DIR

export PATH=$PATH:$HADOOP_COMMON_HOME/bin


保存

使环境变量立即生效

source .bashrc


设置SSH
ssh-keygen -t rsa -P ""   

cat id_dsa.pub >> ~/.ssh/authorized_keys 


chmod 644 authorized_keys
cd ~
chmod 700 .ssh



hadoop配置文件


connect to host localhost port 22: Connection refused

SSH端口不是默认的22端口,修改环境配置文件
 hadoop-2.3.0/etc/hadoop/hadoop-env.sh

追加一行
export HADOOP_SSH_OPTS="-p <num>"



The authenticity of host 'localhost (127.0.0.1)' can't be established.

SSH认证文件权限不正确
切换到su hadoop 到/home/hadoop目录
执行
chmod 644 authorized_keys
cd ~
chmod 700 .ssh




创建 hadoop-2.3.0/tmp目录
mkdir tmp


修改hadoop-2.3.0/etc/hadoop/mapred-site.xml


修改四个配置文件
#hadoop-2.3.0/etc/hadoop/core-site.xml
 
 <configuration>
 <property>
 <name>hadoop.tmp.dir</name>
 <value>/data01/javaapp/hadoop-2.3.0/tmp</value>
 <description>A base for other temporary directories.</description>
 </property>
 <property>
 <name>fs.default.name</name>
 <value>hdfs://localhost:54310</value>
 </property>
</configuration>




#vi etc/hadoop/mapred-site.xml

<configuration>
<property>
 <name>mapred.job.tracker</name>
 <value>localhost:54311</value>
 </property>
 <property>
 <name> mapreduce.framework.name</name>
 <value>yarn</value>
 </property>
</configuration>


#vi etc/hadoop/hdfs-site.xml

<configuration>
 <property>
 <name>dfs.replication</name>
 <value>1</value>
 </property>
 <property>
 <name>dfs.permissions</name>
 <value>false</value>
 </property>
</configuration>

#vi etc/hadoop/yarn-site.xml

<configuration>
<property>
 <name>yarn.nodemanager.aux-services</name>
 <value>mapreduce_shuffle</value>
 </property>
 <property>
 <name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name>
 <value>org.apache.hadoop.mapred.ShuffleHandler</value>
 </property>
</configuration>



hadoop启动和停止

格式化HDFS文件系统

$HADOOP_HOME/bin/hadoop namenode -format  


启动系统
$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode

$HADOOP_HOME/sbin/yarn-daemon.sh start resourcemanager
$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver


查看运行日志:
引用
less logs/hadoop-hadoop-datanode-UAT.log



停止系统
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh stop historyserver
$HADOOP_HOME/sbin/yarn-daemon.sh stop nodemanager
$HADOOP_HOME/sbin/yarn-daemon.sh stop resourcemanager

$HADOOP_HOME/sbin/hadoop-daemon.sh stop secondarynamenode
$HADOOP_HOME/sbin/hadoop-daemon.sh stop datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh stop namenode



查看Java虚拟机里运行的hadoop进程
# Java Virtual Machine Process Status Tool (jps) acts like a ps command and 
# shows various java process running. Hence running would show all hadoop processes.
hduser@diaryfoliovm:/opt/hadoop$ jps
2243 TaskTracker
2314 JobTracker
1923 DataNode
2895 SecondaryNameNode
1234 Jps
1788 NameNode





运行wordcount实例

创建空文件
vi hadoop-2.3.0/tmp/input 

复制以下内容进去
Read: Father of Santa Barbara Victim Sobs and Rails Against Son's Death
That "last chance" turned bleak – a night that reflected his ambitions,
 fury and warped perspectives. It became a flashpoint leading up to last 
 Friday's attacks that left six others dead and 13 injured.
WATCH: Massive Crowd Comes to Mourn Santa Barbara Shooting Victims
Rodger bought a bottle of vodka that night, taking a few shots for 
courage, maybe downing one too many. Other students were partying – 
"good looking popular kids," as he identified them. Without the buzz, 
he would have been too intimidated to mingle.



启动hadoop,

$HADOOP_HOME/sbin/hadoop-daemon.sh start namenode
$HADOOP_HOME/sbin/hadoop-daemon.sh start datanode
$HADOOP_HOME/sbin/hadoop-daemon.sh start secondarynamenode

$HADOOP_HOME/sbin/yarn-daemon.sh start resourcemanager
$HADOOP_HOME/sbin/yarn-daemon.sh start nodemanager
$HADOOP_HOME/sbin/mr-jobhistory-daemon.sh start historyserver


执行wordcount命令
 bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.3.0.jar wordcount file:///data01/javaapp/hadoop-2.3.0/tmp/input output2


查看生成的文件
 bin/hadoop fs  -ls -R output2

 14/05/28 14:06:39 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
-rw-r--r--   1 hadoop supergroup          0 2014-05-28 13:58 output2/_SUCCESS
-rw-r--r--   1 hadoop supergroup       4574 2014-05-28 13:58 output2/part-r-00000


查看统计结果
bin/hadoop fs -cat output2/part-r-00000


删除已生成的结果文件
bin/hadoop fs -rmr output*


运行状态:
 bin/hadoop dfsadmin -report


webl界面
http://192.168.1.22:50075/dataNodeHome.jsp

hfs文件管理
http://192.168.1.22:50070/dfshealth.html

http://192.168.1.22:50090/status.jsp

节点管理
http://192.168.1.22:8042/node

应用管理
http://192.168.1.22/node:8088

hadoop缺省端口
http://hsrong.iteye.com/blog/1374734

hadoop2.3集群
分享到:
评论

相关推荐

    Hadoop Single Node Cluster的安装.txt

    Hadoop Single Node Cluster的详细安装,master主机与data1、data2、data3三台节点连接。

    官网荡下的源码,自己亲手编译的hadoop2.3.0 64位,给大家分享下

    官网荡下的源码,自己亲手编译的hadoop2.x 64位,给大家分享下 文件太大放的是百度网盘链接,目前有hadoop2.3.0,后面的版本我会陆续更新。

    hadoop 2.3.0

    5. **Hadoop配置**:在2.3.0版本中,配置参数有所调整,例如`mapred-site.xml`和`core-site.xml`,这些配置文件控制Hadoop集群的行为。开发者需要了解和调整这些配置来优化集群性能。 6. **安全性增强**:Hadoop ...

    hadoop2.3.0-64位编译完成包(3)

    这个“hadoop2.3.0-64位编译完成包”包含的`hadoop-2.3.0`文件可能是完整的源码、编译后的二进制文件或者是配置文件等,用户在下载并自行解压后,可以按照官方文档或相关教程进行安装和配置,以便在64位系统上运行和...

    hadoop2.3.0详细部署

    本文详细描述了Hadoop2.3.0安装步骤。其中有转载于其他部分的内容。

    Hadoop 2.3.0分布式集群搭建图文.doc

    ### Hadoop 2.3.0 分布式集群搭建知识点详解 #### 一、集群环境配置 - **物理机配置**:本案例采用的操作系统为Windows 7 64位。 - **虚拟机软件**:使用的是VirtualBox 4.3.10版本。 - **操作系统**:Linux发行版...

    hadoop2.3.0-eclipse-plugin

    hadoop2.3.0-eclipse-plugin htrace-core-3.0.4.jar有这个jar包。

    Hadoop Multi Node Cluster 安装步骤.pdf

    Hadoop Multi Node Cluster 安装步骤.pdf

    hadoop single node setup

    根据给定的文件信息,以下是对“hadoop single node setup”相关知识点的详细说明: 1. Hadoop单节点安装的目的 Hadoop单节点安装的主要目的是为了让用户能够在单机上快速地进行简单的Hadoop MapReduce和Hadoop...

    hadoop2.3.0-64位编译完成包

    资源如题,自己想办法编译的,亲测可用,因为等级低,所以分了三部分上传。(我不会分卷压缩tar.gz,所以压缩成了.zip,见谅哈)

    hadoop-2.3.0 的64位 native库

    在Hadoop 2.3.0版本中,为了在64位操作系统上运行,需要使用对应的64位native库,因为默认从Apache官网下载的版本可能只包含了32位的库。 在64位操作系统上使用32位的Hadoop native库会导致兼容性问题,例如性能...

    Hadoop-Single-Node-Cluster

    【Hadoop-Single-Node-Cluster】是针对初学者或者开发者进行本地测试和学习Hadoop环境搭建的一个项目。在这个单节点集群中,所有的Hadoop组件都安装在一个单一的计算机上,便于理解和掌握Hadoop的基本原理和操作。这...

    Hadoop 2.2.0 配置文件

    在这个配置文件中,我们将会探讨Hadoop 2.2.0 在4台CentOS 6.4系统上运行所需的配置细节。 首先,Hadoop的核心组件包括HDFS(Hadoop Distributed File System)和MapReduce,它们都需要通过一系列的配置文件来定制...

    hadoop安装配置文档.pdf

    Hadoop安装配置知识点: 一、Hadoop简介 Hadoop是云计算的基础,它是一个分布式系统的基础架构,被广泛应用于云计算的分布式存储和计算中。Hadoop设计用来从单一服务器扩展到数千台机器,每台机器提供本地计算和...

    Hadoop3.1.3 配置文件

    首先,Hadoop的配置文件是整个系统运行的基础,它们定义了Hadoop集群的运行参数、节点间的通信方式以及数据存储策略等关键设置。主要的配置文件包括`core-site.xml`、`hdfs-site.xml`、`mapred-site.xml`和`yarn-...

    Hadoop深入浅出之Cluster介绍.pptx

    Hadoop深入浅出之Cluster介绍.pptx

    完全分布式Hadoop2.3安装与配置

    完全分布式 Hadoop 2.3 安装与配置 Hadoop 介绍 Hadoop 是一个开源的分布式计算框架,它具有高可靠性、高扩展性、高效性、高容错性和低成本等特点。Hadoop 的核心组件包括 HDFS(Hadoop Distributed File System)...

    Hadoop cluster配置

    本文将深入探讨“Hadoop集群配置”这一主题,结合提供的WordCount代码实例,来阐述Hadoop集群搭建和运行的基本流程。 首先,Hadoop集群的核心组件包括HDFS(Hadoop Distributed File System)和MapReduce。HDFS是...

    hadoop单机配置方法

    ### Hadoop单机配置详解 在大数据处理领域,Apache Hadoop是一个开源软件框架,用于分布式存储和处理大型数据集。本文将详细介绍如何在单机环境下配置Hadoop,使其能够运行基本的大数据处理任务。 #### 一、配置...

Global site tag (gtag.js) - Google Analytics