Hadoop 安装手册

marsorp

浏览: 220157 次
性别:
来自: 北京

最近访客更多访客>>

llbb2000go

如系如系

itgege

itoyotokyo

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

hadoop

Hadoop 安装手册

软件准备
1. a) CentOS6.2 b4bit ,需要安装 DEV 包,分区采用基本分区方式、关闭防
  
  火墙、关闭 SELinux
2. b) Oracle Javase 1.6.37 64bit(JDK)
3. c) Hadoop1.0.4,从 http://hadoop.apache.org 下载
硬件规划
1. a) NameNode 采用高可靠性 X86 64 服务器,内存建议 64G 以上,CPU
  
  4core 以上,支持 HT,采用冗余电源,磁盘做 Raid1
2. b) DataNode 采用终端硬件,内存建议在 32G 以上,CPU 4Core 以上,支
  
  持 HT,使用 SATA 硬盘即可
规划角色

主机名	角色
master	NameNode、Jobtracker
secondmaster	Secondary NameNode
slave01	Datanode、Tasktracker
slave02	Datanode、Tasktracker
slave03	Datanode、Tasktracker
slave04	Datanode、Tasktracker
slave05	Datanode、Tasktracker

规划目录
创建帐号
# useradd hadoop # passwd hadoop
配置环境变量 # su – hadoop

$ vi ~/.bash_profile

文件尾增加如下内容

export JAVA_HOME=/opt/jdk
export JAVA_BIN=$JAVA_HOME/bin
export CLASSPATH=.:$JAVA_HOME/jre/lib/rt.jar:$JAVA_HOME/lib/tools.jar export HADOOP_HOME=~/hadoop
export HADOOP_BIN=$HADOOP_HOME/bin
export PATH=.:$JAVA_BIN:$HADOOP_BIN:$PATH
$source ~/.bash_profile

目录	说明
/home/hadoop/data/nn	Namenode 元数据
/home/hadoop/data/snn	Secondary Namenode 元数据
/home/hadoop/data/dn	Datanode 数据
/opt/jdk	Oracle Java

7. 配置主机名及IP映射
# vi /etc/sysconfig/network

例,Namenode 角色节点变更如下

HOSTNAME=master

  其它节点根据角色,根据上面第三点进行设置主机名称

# reboot

# vi /etc/hosts
master 节点中文件内容形如,IP 地址仅是样例,需要根据实际情况规划 IP 地址
127.0.0.1
192.168.0.10
192.168.0.11
192.168.0.12
192.168.0.13
192.168.0.14
192.168.0.15
192.168.0.16
配置好后,将此文件分发到其它几点上
# scp /etc/hosts secondmaster:/etc/hosts
# scp /etc/hosts slave01:/etc/hosts
...

SSH 互信配置
例在 master 节点上执行

$ ssh-keygen (说明:一路回车)
$ cat ~/.ssh/id_rsa.pub > ~/.ssh/authorized_keys $ scp –r ~/.ssh secondmaster:.
$ scp –r ~/.ssh slave01:.
...
配置Hadoop
前提把 hadoop-1.0.4.tar.gz 分发到所有节点上的/home/hadoop 目录下 $ tar –zxvf ~/hadoop-1.0.4.tar.gz
$ ln –s hadoop-1.0.4 hadoop
所有节点均执行此操作

hadoop 配置文件均在$HADOOP_HOME/conf 目录下

配置 core-site.xml <configuration>

<property> <name>fs.default.name</name> <value>hdfs://master:9000</value>

localhost

master secondmaster

slave01 slave02 slave03 slave04 slave05

<description>NN listening port</description> </property>

<property>
<name>fs.checkpoint.dir</name> <value>/home/hadoop/data/snn</value> <description>2nd NN metadata folder</description>

</property> </configuration>

配置 hdfs-site.xml <configuration>

<property>
<name>dfs.name.dir</name> <value>/home/hadoop/data/nn</value> <description>NN metadata folder</description>

</property> <property>

<name>dfs.data.dir</name> <value>/home/hadoop/data/dn</value> <description>DN file data folder</description>

</property> <property>

<name>dfs.replication</name>
<value>3</value>
<description>data replica copy number</description>

</property> </configuration>

配置 mapred-site.xml <configuration>

<property>
<name>mapred.job.tracker</name> <value>master:9001</value> <description>JobTracker listening port</description>

</property> </configuration>

配置 masters secondmaster

配置 slaves slave01 slave02 slave03

slave04 slave05

所有节点的配置文件均相同 10. 配置 NTP 服务

在 master 上配置服务端
# vi /etc/ntp.conf
内容形如:
restrict default nomodify notrap noquery
restrict 127.0.0.1 restrict 192.168.0.0 mask 255.255.255.0 nomodify notrap server 0.asia.pool.ntp.org

server 1.asia.pool.ntp.org server 2.asia.pool.ntp.org server 3.asia.pool.ntp.org server 127.127.1.0

fudge 127.127.1.0 stratum 10

# /etc/init.d/ntpd restart

在其它节点执行

# crontab –e
*/15 * * * * ntpdate master

11. 格式化 HDFS
$ hadoop namenode –format

12. Hadoop 服务启动、停止启动服务

$ start-all.sh

停止服务

$ stop-all.sh

13. Hadoop WEB UI http://master:50070 HDFS UI http://master:50030 MapReduce UI

14. 测试 Hadoop 集群

$hadoop jar tsinput
$ hadoop jar tsoutput

teragen 100 $HADOOP_HOME/hadoop-examples-*.jar terasort tsinput

$HADOOP_HOME/hadoop-examples-*.jar

$ hadoop fs -ls tsoutput
$ hadoop fs -cat tsoutput/part-00000

正常执行完成,即说明 Hadoop 集群运行正常 15. 备注

提示符“#”代表以 root 帐号执行

提示符“$”代表以 hadoop 帐号执行

分享到：

利用大数据创业 | vnc sever 不工作，原因是字体库缺失

2013-04-08 15:47
浏览 1204
评论(0)
分类:企业架构
查看更多

发表评论

您还没有登录,请您登录后再发表评论

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论