参考《hadoop开发者》第一期中的内容配置了hadoop集群。
软件环境:
ubuntu-10.04.1-server-i386
jdk-7u3-linux-i586.tar.gz
hadoop-1.0.0.tar.gz
linux的版本选型比较麻烦,需要考虑版权和稳定性,经过查找资料和多方面的比较最后选择ubuntu server版本。
jdk在ubuntu中安装还是使用tar文件方便,直接解压后配置环境变量即可使用。相关环境环境变量配置请参考附录文章:
安装前注意:
1、 ssh 必须安装;
2、 NTP:集群的时钟要保证基本的一致。如果你查询的时候或者是遇到奇怪的故障,可以检查一下系统时间是否正确!
设置集群各个节点时钟:date -s “2012-02-13 14:00:00”
安装时注意:
按照提示步骤走,但要模拟真实环境,我用虚拟机搭建了4个linux环境,一个namenode剩余3个都是datanode。
配置完后执行hadoop相关命令都提示如下错误
Warning: $HADOOP_HOME is deprecated.
12/02/28 01:31:01 INFO ipc.Client: Retrying connect to server: namenode/192.168.0.200:9000. Already tried 0 time(s).
最后将hdfs-site.xml中的内容用如下部分替换。
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>
重新执行hadoop namenode -format
然后hadoop就可以执行文件操作了。需要注意的是/etc/hosts中添加了配置
192.168.0.200 namenode
这些都需要进一步去验证。
PS:可以使用jps命令查看结果确认服务是否成功
正常情况下NameNode端显示如下结果:
3489 NameNode
3237 JobTracker
3158 SecondaryNameNode
3752 Jps
DataNode端显示如下结果:
1457 Jps
1418 TaskTracker
1334 DataNode
如果少其中一个服务则表示服务没有正常启动,需要检查或者重启。
如果DataNode端没有正常启动请配置/etc/hosts文件进行名称解析,对集群里的每个服务器都进行配置。配置参考如下:
127.0.0.1 localhost
192.168.0.200 namenode
192.168.0.203 datanode1
192.168.0.204 datanode2
192.168.0.205 datanode3
《Hadoop技术论坛》
《Ubuntu FTP服务配置》、《Ubuntu 安装jdk》、《Ubuntu 设置IP》
官方文档《Hadoop集群搭建》
注:src/core/core-default.xml可以用来替换 hdfs-site.xml中的内容作为默认内容。
分享到:
相关推荐
本文将深入探讨“Hadoop集群配置文件备份”的重要性、步骤和最佳实践。 **1. Hadoop配置文件概述** Hadoop的配置文件主要包括`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`、`mapred-site.xml`等,这些XML...
《Hadoop集群配置及MapReduce开发手册》是针对大数据处理领域的重要参考资料,主要涵盖了Hadoop分布式计算框架的安装、配置以及MapReduce编程模型的详细解析。Hadoop作为Apache基金会的一个开源项目,因其分布式存储...
hadoop集群配置范例及问题总结 Hadoop集群配置是大数据处理的关键步骤,本文将详细介绍Hadoop集群配置的步骤和注意事项。 一、硬件环境配置 Hadoop集群需要多台机器组成,通常使用虚拟机来模拟多台机器。 VMware ...
hadoop集群配置文档
Hadoop集群配置范例及问题总结 Hadoop集群配置是一个复杂的过程,需要详细的规划和实施。以下是Hadoop集群配置的相关知识点: 1. 硬件环境:Hadoop集群需要至少两台机器,安装ubuntu11操作系统,并采用桥接模式,...
Hadoop 集群配置是一个复杂的过程,涉及到多台服务器之间的通信和数据存储。在这个详解中,我们将深入理解如何在Fedora和Ubuntu系统上搭建一个Hadoop集群。 首先,为了确保集群中的节点能够相互识别,我们需要配置...
在Hadoop集群配置过程中,安装和配置Hive是一个重要环节。这个过程中需要保证Hadoop集群本身已经搭建好并且运行正常。在安装Hive之前,一般需要先安装和配置好MySQL数据库,因为Hive会使用MySQL来存储其元数据。元...
hadoop配置详细教程,涵盖了Hadoop集群配置从头到尾的所有细节部署,其中注意点已用红色标记,此文档曾用于企业Hadoop集群搭建教程,涵盖了 准备篇---配置篇----启动测试篇---问题篇,解决网络上Hadoop集群配置教程...
### Hadoop集群配置及MapReduce开发手册知识点梳理 #### 一、Hadoop集群配置说明 ##### 1.1 环境说明 本手册适用于基于CentOS 5系统的Hadoop集群配置,具体环境配置如下: - **操作系统**:CentOS 5 - **JDK版本...
Hadoop 集群配置详解 Hadoop_Hadoop集群(第1期)_CentOS安装配置 Hadoop_Hadoop集群(第2期)_机器信息分布表 Hadoop_Hadoop集群(第4期)_SecureCRT使用 Hadoop_Hadoop集群(第5期)_Hadoop安装配置 Hadoop_Hadoop...
【基于CentOS 7的Hadoop集群配置的研究与实现】 Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。本论文详细探讨了在CentOS 7操作系统上配置和实施Hadoop集群的过程,这对于理解和掌握大数据处理...
### Eclipse链接Hadoop集群配置详解 #### 一、前言 在大数据处理领域,Hadoop因其卓越的分布式处理能力而备受青睐。为了更好地利用Hadoop的强大功能,开发人员经常需要在本地开发环境中与Hadoop集群进行交互。本文...
hadoop集群配置 很实用的入门参考书