基于前两篇的基础,在ubuntu下搭建hadoop环境及运行wordcount示例的过程比较顺利,现做一下简单记录。
环境:ubuntu10.04 hadoop0.20.2 jdk1.6.0_29
步骤如下:
1.安装JDK并配置环境变量
一些文章里说用sudo apt-get install sun-java6-jdk之类的命令,我对ubuntu比较小白,半天也没折腾出来,然后就直接去oralce的官网下了linux版本的jdk。
配置环境变量:
sudo gedit /etc/profile
在最后边追加:
#set java environment
export JAVA_HOME=/usr/java/jdk1.6.0_29
export PATH=$JAVA_HOME/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/tools.jar:$JAVA_HOME/lib/dt.jar:$CLASSPATH
别忘了用echo和java -version验证以下。
2.添加用户组和用户,都取名hadoop,新用户hadoop不能执行sudo命令。
sudo addgroup hadoop
sudo adduser --ingroup hadoop hadoop
3.配置ssh
sudo apt-get install openssh-server //安装openssh-server
su - hadoop //切换到hadoop用户
ssh-keygen -t rsa -P "" //生成ssh key
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys //设置允许ssh访问
设置完成后通过ssh localhost测试一下。
4.关掉ipv6
修改hadoop根目录下conf/hadoop-env.sh文件(还没下载hadoop的下载解压先~)
export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true
5.将hadoop目录所有者更改为用户hadoop
sudo chown -R hadoop:hadoop /usr/hadoop-0.20.2
6.安装hadoop
过程同windows下基本一致,详见之前的文章。还是要
注意两点:a.设置core-site.xml中hadoop.tmp.dir的值,我设为/home/hadoop/tmp。b.把hadoop-env.sh中JAVA_HOME前边的#去掉。
7.格式化namenode
./hadoop namenode -format
8.启动hadoop
./start-all.sh
9.启动成功后,用jps查看下。
10.运行WordCount吧!少年!
wordcount示例运行详见前边的文章,但是并没有出现在windows下出现的那两个问题。
参考博客:
http://www.cnblogs.com/end/archive/2011/04/19/2021536.html
http://www.hadoopor.com/thread-2674-1-1.html
- 大小: 23 KB
分享到:
相关推荐
本文旨在详细介绍如何在虚拟机环境下,利用Ubuntu系统搭建Hadoop平台的单机模式。通过本教程,您可以掌握从安装虚拟机到配置Hadoop环境的全过程。本文不仅涵盖了安装步骤,还提供了可能遇到的问题及其解决方案。 ##...
### Ubuntu安装Hadoop实现MapReduce里的WordCount ...通过以上步骤,可以在Ubuntu环境下成功安装Hadoop,并实现MapReduce WordCount示例。这些步骤不仅适用于初学者的学习过程记录,也为Hadoop的部署提供了详细的指南。
以上就是Ubuntu环境下搭建Hadoop的基本步骤。在实际操作中,可能还需要考虑网络配置、安全性设置、高可用性部署等问题,这些都需要根据具体需求和环境来调整。对于大型集群,还需要关注监控、日志管理和资源调度策略...
本文将详细阐述如何搭建Hadoop 2.x的环境,这包括单节点模式、伪分布式模式以及完全分布式模式的安装与配置,同时也涵盖了Hadoop生态系统中其他重要组件的安装。 一、Hadoop简介 Hadoop是基于Java开发的,它由...
现在,Hadoop单机环境已经准备就绪,可以进行简单的测试,例如运行WordCount示例程序。 Hadoop的集群搭建涉及到更多的配置,包括设置 slaves 文件、配置YARN、MapReduce等。此外,Hadoop的发展也一直在进行,其创始...
本文档将详细介绍如何搭建一个Hadoop集群,并演示如何在Windows环境下利用Eclipse开发MapReduce程序,以WordCount为例。 **Hadoop安装前准备** 在开始搭建Hadoop集群之前,需要确保你的环境满足以下条件: 1. **...
为了测试Hadoop平台,可以运行自带的WordCount示例。WordCount程序统计文本文件中单词出现的次数,这展示了Hadoop处理大数据的基本流程。首先,创建一个简单的输入文件,如`hello.txt`,并将其放入Hadoop的输入目录...
这个过程详细介绍了在Ubuntu系统中创建hadoop用户组和用户,安装Java环境,配置Hadoop环境变量,以及执行WordCount示例来验证安装的完整流程。遵循这些步骤,您可以顺利地在Ubuntu上建立一个基础的Hadoop环境。
在Linux环境下搭建Hadoop集群是一项复杂但至关重要的任务,它为大数据处理提供了强大的分布式平台。以下将详细介绍如何在一台虚拟机上安装多台Linux服务节点,并构建Hadoop集群环境。 首先,我们需要准备一个基础...
本文档详细介绍了如何在Ubuntu11.10操作系统上搭建Hadoop1.0.2双机集群的过程,并通过WordCount示例验证了集群的正确性和可用性。该文档对于希望在类Ubuntu环境中部署Hadoop集群的用户具有较高的参考价值。 #### 二...
7. **运行WordCount示例**:这是Hadoop的典型示例,它统计文本文件中的单词出现次数。首先将数据复制到HDFS,然后编写并编译WordCount程序,最后运行MapReduce作业。 8. **停止Hadoop**:当不再使用Hadoop时,可以...
- 将WordCount示例程序编译成jar包,然后使用Hadoop的`hadoop jar`命令提交到集群执行。 6. **监控和调试**: - 使用Hadoop提供的Web界面监控NameNode和JobTracker的状态。 - 查看日志文件进行故障排查。 通过...
### Ubuntu16.04搭建...接下来的部分将继续介绍Hadoop的具体配置步骤、运行测试示例(如WordCount词频统计)以及如何比较MapReduce与Spark在执行效率上的异同点。这些内容将进一步加深我们对Hadoop及其生态的理解。
在本文中,我们将深入探讨如何在Ubuntu 12.04 64位服务器上安装和配置Hadoop 2.2.0单节点环境。这个过程由雨水在2013年10月24日记录并发布在CSDN博客上。以下是详细的步骤: 首先,确保你的环境准备就绪。这包括在...