`

hadoop0.20.2配置 in linux(ubuntu)

 
阅读更多

配置ssh

创建密钥,这里p后面是空密码,不推荐使用空密码

ssh-keygen -t rsa -P ''

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

配置完后,执行一下 ssh localhost, 确认你的机器可以用 SSH 连接,并且连接时不需要手工输入密码

下载hadoop

wgethttp://mirror.bjtu.edu.cn/apache/hadoop/common/hadoop-0.20.2/hadoop-0.20.2.tar.gz

tar -xvf hadoop-0.20.2.tar.gz

增加环境变量

在/etc/environment

HADOOP_HOME=目录路径

JAVA_HOME=jdk路径

在/etc/profile中增加

exportHADOOP_HOME=目录路径

export JAVA_HOME=jdk路径

修改hadoop配置文件

修改$HADOOP_HOME/conf/hadoop-env.sh

#export JAVA_HOME=

改为export JAVA_HOME=jdk路径

设置HDFS目录

mkdir /$HOME/tmp

chmod -R 777 /$HOME/tmp

修改/conf/core-site.xml文件

增加

<property>
<name>hadoop.tmp.dir</name>
<value>/home/du/tmp</value>
<description>A base for other temporary directories.</description>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:54310</value>
</property>

修改conf/mapred-site.xml

<property>
<name>mapred.job.tracker</name>
<value>localhost:54311</value>
<description>The host and port that the MapReduce job tracker runs
at. If "local", then jobs are run in-process as a single map
and reduce task.
</description>
</property>

修改conf/hdfs-site.xml

增加

<property>
<name>dfs.replication</name>
<value>1</value>
<description>Default block replication.
The actual number of replications can be specified when the file is created.
The default is used if replication is not specified in create time.
</description>
</property>

格式化文件系统

hadoop namenode -format

启动伪分布式

$HADOOP_HOME/bin/start-all.sh

检查是否启动成功

jps

18160 SecondaryNameNode
17777 NameNode
17970 DataNode
18477 Jps
18409 TaskTracker
18231 JobTracker


停止

$HADOOP_HOME/bin/stop-all.sh

hadoop web访问接口

http://localhost:50030/job tracker访问

http://localhost:50060/ task tracker访问

http://localhost:50070/name node访问


分享到:
评论

相关推荐

    Ubuntu Hadoop 0.20.2 安装配置说明

    ### Hadoop 0.20.2 在 Ubuntu 上的安装配置详解 #### 一、概述 本文档旨在为初学者提供一份详细的指南,用于在 Ubuntu Server 12.04 x64 系统上安装并配置 Hadoop 0.20.2。通过本文档的学习,读者可以掌握如何搭建...

    ubuntu环境下hadoop环境搭建(伪分布模式)

    - 解压缩Hadoop:同样使用`sudo tar xzvf hadoop0.20.2.tar.gz`解压Hadoop,解压后Hadoop安装完成。 - 安装SSH:使用`sudo apt-get install ssh`来安装SSH服务,用于节点间通信。 - 安装rsync:通过`sudo apt-get...

    hadoop安装配置指南

    在开始Hadoop的安装和配置之前,需要确保有一台安装了Linux操作系统的服务器,这里推荐使用Ubuntu Linux 10.04 LTS。本指南将详细解释如何在单节点上以伪分布式模式安装和配置Hadoop 0.20.2。 首先,安装Java环境。...

    使用VMware安装Hadoop全过程

    3. **Hadoop服务启动失败**: 如果启动Hadoop服务时遇到错误,应仔细查看日志文件(通常位于`/usr/hadoop-0.20.2/logs`),以便找出具体原因。 #### 九、总结 通过以上步骤,我们已经成功地在VMware中搭建了一个...

    云计算应用实验报告 武汉理工大学云计算应用 hadoop单机模式和伪分布式

    3. **安装Hadoop 0.20.2**:解压Hadoop压缩包,配置环境变量,包括JAVA_HOME、HADOOP_HOME和PATH。 4. **配置SSH**:安装SSH服务,生成密钥对,实现SSH免密登录,便于Hadoop集群间通信。 5. **单机模式操作**:创建...

    ubuntu10.04_JDK1.6_hadoop_hbase安装白皮书.txt

    本文详细介绍了如何在 Ubuntu 10.04 系统上安装和配置 JDK 1.6、Hadoop 和 HBase。通过这些步骤,用户可以搭建起一个简单的 Hadoop 和 HBase 集群环境,用于进行大数据处理和存储。需要注意的是,为了确保系统的稳定...

    Hadoop的安装.pdf

    二、Hadoop 分布式模式安装(Ubuntu Linux) 在Linux环境中,Hadoop的分布式安装通常在多台机器组成的集群上进行。这里以Ubuntu为例,假设集群有3台机器,分别作为1个Namenode和2个Datanodes。首先,确保所有机器间...

    虚拟机与Linu系统安装以及云计算平台的搭建及安装.pdf

    本文主要涉及了三个关键领域:虚拟机的使用、Linux系统的安装与配置、以及云计算平台(尤其是Hadoop)的搭建。我们将逐一详细阐述这些知识点。 1. 虚拟机的建立与Linux系统安装: 虚拟机是一种在物理计算机上模拟...

    Hadoop学习全程记录-在Eclipse中运行第一个MapReduce程序.docx

    在这个例子中,操作系统是通过Wubi在Windows上安装的Ubuntu 10.10,Hadoop版本为hadoop-0.20.2,Eclipse版本为eclipse-jee-helios-SR1-linux-gtk。为了简化学习过程,我们将在“伪分布式模式”下运行Hadoop,这意味...

    云计算应用实验报告

    - **Hadoop版本**: hadoop-0.20.2 - **Java环境**: JDK 1.7.0 - **虚拟化平台**: VMware 10 - **辅助工具**: VMware tools ##### (一)安装VMware tools 1. **安装准备**: 首先确保虚拟机已安装完毕。接着通过...

    云基准数据管理的理解与实践

    - Linux Ubuntu 9.04 Server。 - **系统软件**: - Hadoop 0.20.2 - Hive 0.6.0 - HBase 0.20 通过对这些系统进行基准测试,可以更好地了解它们在实际应用场景中的性能表现,并为后续优化提供参考依据。 总之...

Global site tag (gtag.js) - Google Analytics