Ubuntu下搭建单节点Hadoop环境及WordCount示例的运行

aaron-han

浏览: 27370 次
性别:
来自: 北京

最近访客更多访客>>

ne独孤之心ne

luyuncheng

860548048

651630320

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

Hadoop

hadoop ubuntu wordcount

基于前两篇的基础，在ubuntu下搭建hadoop环境及运行wordcount示例的过程比较顺利，现做一下简单记录。
环境：ubuntu10.04 hadoop0.20.2 jdk1.6.0_29
步骤如下：
1.安装JDK并配置环境变量
一些文章里说用sudo apt-get install sun-java6-jdk之类的命令，我对ubuntu比较小白，半天也没折腾出来，然后就直接去oralce的官网下了linux版本的jdk。

配置环境变量：

  sudo gedit /etc/profile

在最后边追加：

  #set java environment
  export JAVA_HOME=/usr/java/jdk1.6.0_29
  export PATH=$JAVA_HOME/bin:$PATH
  export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:$CLASSPATH

别忘了用echo和java -version验证以下。

2.添加用户组和用户，都取名hadoop，新用户hadoop不能执行sudo命令。

  sudo addgroup hadoop
  sudo adduser --ingroup hadoop hadoop

3.配置ssh

  sudo apt-get install openssh-server //安装openssh-server
  su - hadoop                         //切换到hadoop用户
  ssh-keygen -t rsa -P ""             //生成ssh key
  cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys  //设置允许ssh访问

设置完成后通过ssh localhost测试一下。

4.关掉ipv6
修改hadoop根目录下conf/hadoop-env.sh文件(还没下载hadoop的下载解压先～)

  export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true

5.将hadoop目录所有者更改为用户hadoop

  sudo chown -R hadoop:hadoop /usr/hadoop-0.20.2

6.安装hadoop
过程同windows下基本一致，详见之前的文章。还是要注意两点：a.设置core-site.xml中hadoop.tmp.dir的值，我设为/home/hadoop/tmp。b.把hadoop-env.sh中JAVA_HOME前边的#去掉。

7.格式化namenode

  ./hadoop namenode -format

8.启动hadoop

  ./start-all.sh

9.启动成功后，用jps查看下。

10.运行WordCount吧！少年！
wordcount示例运行详见前边的文章，但是并没有出现在windows下出现的那两个问题。

参考博客：
http://www.cnblogs.com/end/archive/2011/04/19/2021536.html
http://www.hadoopor.com/thread-2674-1-1.html