`

Hadoop0.20.2集群环境搭建

阅读更多

本文转自我的ChinaUnix博客:http://blog.chinaunix.net/u3/107162/showart_2201271.html

2010-03-24 

     

 

      几天在单机环境下搭好了Hadoop,这两天开始着手搭建集群环境。使用设备是我自己在实验室的一台PC机和实验室的两台服务器,PC作为Namenode节点,同时运行一个Namenode和一个Datanode,两台服务器作为slave,各自作为一个Datanode,这样就一共有3个Datanode节点。IP地址分配为:

     master:192.168.5.236,Ubuntu9.10,运行Namenode,SecondaryNamenode,Datanode,JobTracker,TaskTracker
     slave1:192.168.5.201,Debian4.0,运行Datanode,TaskTracker
     slave2:192.168.5.202,Debian4.0,运行Datanode,TaskTracker

    1.首先是配置java环境,这个略去~~~~
   
    2.把PC上已有的hadoop程序文件夹拷贝到两个datanode的相同目录下,注意一定是相同目录,而且登录这3台机器的用户名必须相同。

    3.修改三台机器的/etc/hosts,
           # /etc/hosts (for master AND slave)
           192.168.5.236    master
           192.168.5.201    slave1
           192.168.5.202    slave2          
   
    4.设置namenode以ssh免密码方式连接datanode
    a)先在PC上设置ssh免密码登录: 
 

hadoop@ubuntu:~$ ssh-keygen -t rsa -P ""
 Generating public/private rsa key pair.
 Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):
 Created directory '/home/hadoop/.ssh'.
 Your identification has been saved in /home/hadoop/.ssh/id_rsa.
 Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.
 The key fingerprint is:
 9d:47:ab:d7:22:54:f0:f9:b9:3b:64:93:12:75:81:27 hadoop@ubuntu
 hadoop@ubuntu:~$

 

    b)然后,再把master的$HOME/.ssh/id_rsa.pub文件拷贝到slave1和slave2的$HOME/.ssh/下。

    5.修改master节点的配置文件
    a)修改 <HADOOP_INSTALL>/conf/masters如下:

                                         master

     b)修改 <HADOOP_INSTALL>/conf/slaves如下:

                                   master
                                   slave1
                                   slave2

    6.在所有节点上修改配置文件
    a)修改conf/hadoop-env.sh,添加java_home的路径
            export JAVA_HOME=/usr/lib/.........
    b)修改conf/core-site.xml,加入
            <property>
                 <name>fs.default.name</name>
                 <value>hdfs://master:54310</value>
            </property>
            <property>
                 <name>hadoop.tmp.dir</name>
                 <value>这里写想存放HDFS文件系统的位置</value>
            </property>
    c)修改conf/mapred-site.xml,加入
            <property>
                 <name>mapred.job.tracker</name>
                 <value>master:54311</value>
            </property>
            <property>
                 <name>mapred.local.dir</name>
                 <value>这里写想存放临时文件的位置</value>
            </property>
     d)修改conf/hdfs-site.xml,加入
              <property>
                 <name>dfs.replication</name>
                 <value>3</value>      注:这里有3个datanode,所以有三个副本
            </property>
   
     7.配置完成,在master上格式化Namenode,
                     
                          $ bin/hadoop namenode -format
   
     8.然后通过bin/start-all.sh启动各节点即可。

 2010-03-24

分享到:
评论

相关推荐

    hadoop集群环境的搭建

    "hadoop集群环境的搭建" Hadoop 是一个开源的大数据处理框架,由Apache基金会开发和维护。它可以实现大规模数据的存储和处理,具有高可扩展性、可靠性和高性能等特点。搭建 Hadoop 集群环境是实现大数据处理的重要...

    hadoop0.20.2

    在学习Hadoop 0.20.2 时,可以通过搭建本地或伪分布式环境来实践配置和使用HDFS及MapReduce。同时,理解Hadoop生态中的其他工具,如Pig、Hive和HBase,可以帮助更全面地掌握大数据处理的流程。 压缩包中的`hadoop-...

    在Ubunt-11.04上布署hadoop-0.20.2集群云平台

    ### 在Ubuntu 11.04上部署Hadoop-0.20.2集群云平台的知识点 #### 一、前言与环境准备 - **背景介绍**:本实验指导旨在帮助用户在Ubuntu 11.04操作系统上成功部署Hadoop-0.20.2集群云平台。该文档由厦门大学软件...

    Ubuntu Hadoop 0.20.2 安装配置说明

    通过本文档的学习,读者可以掌握如何搭建一个基本的 Hadoop 集群,执行简单的 HDFS 操作以及利用 MapReduce 进行分布式计算。本教程基于五台虚拟机进行演示,这些虚拟机均运行 Ubuntu Server 12.04 x64,并配备了 ...

    fedora 安装hadoop0.20.2

    ### Fedora 下安装 Hadoop 0.20.2 的详细步骤及原理 #### 一、安装背景与概述...通过以上步骤,您已经成功在 Fedora 操作系统上搭建了 Hadoop 0.20.2 的伪分布式环境。这对于学习和实践 Hadoop 分布式计算非常有帮助。

    Ubuntu10.04下Hadoop-0.20.2集群配置手册.doc

    这篇文档主要介绍了如何在Ubuntu 10.04操作系统环境下配置Hadoop-0.20.2集群,包括集群的硬件环境准备、软件环境的搭建、SSH无密码验证以及Hadoop的配置步骤。 首先,硬件环境是一个典型的分布式计算集群配置,由两...

    Linux-Hadoop集群搭建详细简明教程

    Linux 操作系统安装环境下Hadoop集群搭建详细简明教程

    基于windows的hadoop集群搭建图文教程 自己写的亲测可以安装

    ### 基于Windows的Hadoop集群搭建图文教程 #### 一、引言与背景介绍 随着大数据技术的发展,Hadoop作为一个重要的分布式处理框架,在数据分析领域占据着举足轻重的地位。然而,对于初学者而言,尤其是在Windows...

    hadoop+hbase集群搭建 详细手册

    Hadoop+HBase集群搭建详细手册 本文将详细介绍如何搭建Hadoop+HBase集群,包括前提准备、机器集群结构分布、硬件环境、软件准备、操作步骤等。 一、前提准备 在搭建Hadoop+HBase集群之前,需要准备以下几个组件:...

    hadoop-0.20.2安装手册

    通过上述步骤,您已经成功搭建了一个基于Hadoop-0.20.2版本的简单集群环境。此版本虽然不是最新的,但对于学习Hadoop的基本原理和技术栈仍然非常有用。后续可以根据实际需求进一步扩展集群规模或进行更深入的技术...

    hadoop-0.20.2.tar

    Hadoop的核心设计理念是“大规模、低成本、高容错性”,它允许用户在廉价硬件上搭建大规模的数据处理集群,实现了数据的分布式存储和并行计算。 在Hadoop 0.20.2版本中,我们主要关注以下几个核心组件: 1. **HDFS...

    hadoop集群搭建

    hadoop集群搭建 Hadoop集群搭建是大数据处理和存储的关键步骤,本文档将指导您如何从头开始搭建一个Hadoop集群,包括安装虚拟机、Ubuntu系统、JDK、Hadoop等步骤。 一、虚拟机安装 首先,在Windows系统上安装...

    单节点hadoop-0.20.2

    总之,"单节点hadoop-0.20.2"是一个便捷的工具,帮助IT从业者快速搭建Hadoop环境,理解其核心组件和工作流程。无论是为了学习还是实验目的,这个压缩包都提供了必要的资源和简化后的配置,使得用户可以专注于大数据...

    Hadoop虚拟机集群安装

    这里我们使用hadoop-0.20.2和jdk-6u30-linux-i586.bin。Hadoop依赖于Java环境,因此需要安装JDK。 JDK安装和配置 ------------- 在每台机器上,需要安装JDK。可以使用以下命令安装JDK: ``` ./jdk-6u30-linux-i...

    hadoop-0.20.2-cdh3u4

    Hadoop是Apache软件基金会开发的一个开源分布式计算框架,它的核心设计是解决大数据处理的问题。"hadoop-0.20.2-cdh3u4"是Cloudera公司...用户可以通过这个发行版来搭建和管理自己的Hadoop集群,处理和挖掘海量数据。

    Hadoop分布式集群容错验证.pdf

    - Hadoop的版本:hadoop-0.20.2。 - 机器角色分配:其中一台作为NameNode(命名节点)和JobTracker(任务跟踪器),其余作为DataNode(数据节点)和TaskTracker(任务跟踪器)。 - 集群搭建步骤:包括配置hosts...

Global site tag (gtag.js) - Google Analytics