`
peigang
  • 浏览: 170630 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

hadoop集群配置

 
阅读更多

参考《hadoop开发者》第一期中的内容配置了hadoop集群。

软件环境:

ubuntu-10.04.1-server-i386

 jdk-7u3-linux-i586.tar.gz

hadoop-1.0.0.tar.gz

linux的版本选型比较麻烦,需要考虑版权和稳定性,经过查找资料和多方面的比较最后选择ubuntu server版本。

jdk在ubuntu中安装还是使用tar文件方便,直接解压后配置环境变量即可使用。相关环境环境变量配置请参考附录文章:

 

安装前注意:

1、 ssh 必须安装;

2、 NTP:集群的时钟要保证基本的一致。如果你查询的时候或者是遇到奇怪的故障,可以检查一下系统时间是否正确!
设置集群各个节点时钟:date -s “2012-02-13 14:00:00”

 

安装时注意:

按照提示步骤走,但要模拟真实环境,我用虚拟机搭建了4个linux环境,一个namenode剩余3个都是datanode。

 

配置完后执行hadoop相关命令都提示如下错误

Warning: $HADOOP_HOME is deprecated.

12/02/28 01:31:01 INFO ipc.Client: Retrying connect to server: namenode/192.168.0.200:9000. Already tried 0 time(s).

最后将hdfs-site.xml中的内容用如下部分替换。

 

<configuration>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
</configuration>

  重新执行hadoop namenode -format

然后hadoop就可以执行文件操作了。需要注意的是/etc/hosts中添加了配置

192.168.0.200  namenode

这些都需要进一步去验证。

 

PS:可以使用jps命令查看结果确认服务是否成功

正常情况下NameNode端显示如下结果:

 3489 NameNode
3237 JobTracker
3158 SecondaryNameNode
3752 Jps

DataNode端显示如下结果:

1457 Jps
1418 TaskTracker
1334 DataNode

如果少其中一个服务则表示服务没有正常启动,需要检查或者重启。

 

如果DataNode端没有正常启动请配置/etc/hosts文件进行名称解析,对集群里的每个服务器都进行配置。配置参考如下:

 127.0.0.1 localhost

192.168.0.200 namenode
192.168.0.203 datanode1
192.168.0.204 datanode2
192.168.0.205 datanode3

 

 《Hadoop技术论坛

 

《Ubuntu FTP服务配置》、《Ubuntu 安装jdk》、《Ubuntu 设置IP》

 

官方文档《Hadoop集群搭建

 

注:src/core/core-default.xml可以用来替换 hdfs-site.xml中的内容作为默认内容。

分享到:
评论

相关推荐

    Hadoop集群配置文件备份

    本文将深入探讨“Hadoop集群配置文件备份”的重要性、步骤和最佳实践。 **1. Hadoop配置文件概述** Hadoop的配置文件主要包括`core-site.xml`、`hdfs-site.xml`、`yarn-site.xml`、`mapred-site.xml`等,这些XML...

    Hadoop集群配置及MapReduce开发手册

    《Hadoop集群配置及MapReduce开发手册》是针对大数据处理领域的重要参考资料,主要涵盖了Hadoop分布式计算框架的安装、配置以及MapReduce编程模型的详细解析。Hadoop作为Apache基金会的一个开源项目,因其分布式存储...

    hadoop集群配置范例及问题总结.pdf

    hadoop集群配置范例及问题总结 Hadoop集群配置是大数据处理的关键步骤,本文将详细介绍Hadoop集群配置的步骤和注意事项。 一、硬件环境配置 Hadoop集群需要多台机器组成,通常使用虚拟机来模拟多台机器。 VMware ...

    hadoop集群配置文档

    hadoop集群配置文档

    hadoop集群配置范例及问题总结.docx

    Hadoop集群配置范例及问题总结 Hadoop集群配置是一个复杂的过程,需要详细的规划和实施。以下是Hadoop集群配置的相关知识点: 1. 硬件环境:Hadoop集群需要至少两台机器,安装ubuntu11操作系统,并采用桥接模式,...

    hadoop集群配置详解

    Hadoop 集群配置是一个复杂的过程,涉及到多台服务器之间的通信和数据存储。在这个详解中,我们将深入理解如何在Fedora和Ubuntu系统上搭建一个Hadoop集群。 首先,为了确保集群中的节点能够相互识别,我们需要配置...

    hadoop集群配置之———hive安装与配置(超详细)

    在Hadoop集群配置过程中,安装和配置Hive是一个重要环节。这个过程中需要保证Hadoop集群本身已经搭建好并且运行正常。在安装Hive之前,一般需要先安装和配置好MySQL数据库,因为Hive会使用MySQL来存储其元数据。元...

    Hadoop集群配置详细教程

    hadoop配置详细教程,涵盖了Hadoop集群配置从头到尾的所有细节部署,其中注意点已用红色标记,此文档曾用于企业Hadoop集群搭建教程,涵盖了 准备篇---配置篇----启动测试篇---问题篇,解决网络上Hadoop集群配置教程...

    hadoop集群配置及mapreduce开发手册

    ### Hadoop集群配置及MapReduce开发手册知识点梳理 #### 一、Hadoop集群配置说明 ##### 1.1 环境说明 本手册适用于基于CentOS 5系统的Hadoop集群配置,具体环境配置如下: - **操作系统**:CentOS 5 - **JDK版本...

    Hadoop集群pdf文档

    Hadoop 集群配置详解 Hadoop_Hadoop集群(第1期)_CentOS安装配置 Hadoop_Hadoop集群(第2期)_机器信息分布表 Hadoop_Hadoop集群(第4期)_SecureCRT使用 Hadoop_Hadoop集群(第5期)_Hadoop安装配置 Hadoop_Hadoop...

    基于CentOS 7的Hadoop集群配置的研究与实现.docx

    【基于CentOS 7的Hadoop集群配置的研究与实现】 Hadoop是一个开源的分布式计算框架,主要用于处理和存储大规模数据。本论文详细探讨了在CentOS 7操作系统上配置和实施Hadoop集群的过程,这对于理解和掌握大数据处理...

    Eclipse链接Hadoop集群配置.docx

    ### Eclipse链接Hadoop集群配置详解 #### 一、前言 在大数据处理领域,Hadoop因其卓越的分布式处理能力而备受青睐。为了更好地利用Hadoop的强大功能,开发人员经常需要在本地开发环境中与Hadoop集群进行交互。本文...

    hadoop集群配置.pdf

    hadoop集群配置 很实用的入门参考书

Global site tag (gtag.js) - Google Analytics