`
xjtom78
  • 浏览: 77291 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Hadoop0.20.2版本在Ubuntu10下安装和配置

    博客分类:
  • java
阅读更多

1、安装JDK
  (1)下载安装JDK:确保计算机联网之后命令行输入下面命令安装JDK
       sudo apt-get install sun-java6-jdk
  (2)配置计算机Java环境:打开/etc/profile,在文件最后输入下面内容
       export JAVA_HOME = (Java安装目录)
       export CLASSPATH = ".:$JAVA_HOME/lib:$CLASSPATH"
       export PATH = "$JAVA_HOME/:PATH"
  (3)验证Java是否安装成功
  输入 java -version ,输出Java版本信息即为安装成功。

2、安装配置SSH

  (1)下载安装SSH:同样在命令行输入下面命令安装SSH
      sudo apt-get install ssh
  (2)配置无密码登录本机:在命令行输入下面两条命令
     $ ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa
         直接回车,完成后会在~/.ssh/生成两个文件:id_rsa和id_rsa.pub;这两个成对出现,类似钥匙和锁。
        
         再把id_rsa.pub追加到授权key里面(当前并没有authorized_keys文件)
         $ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
    

  (3)验证SSH是否安装成功
       输入 ssh localhost 。如果显示本机登录成功就表明安装成功。

3、关闭防火墙
   $sudo ufw disable
   注意:这步非常重要,如果不关闭,会出现找不到datanode的问题
  
4、安装运行Hadoop(以0.20.2版本为例)

  (1)下载Hadoop:在http://www.apache.org/dyn/closer.cgi/hadoop/core/页面上下载Hadoop。
  (2)安装配置Hadoop

   单节点配置:
   安装单节点的Hadoop无需配置,在这种方式下,Hadoop被认作为一个单独的Java进程。

   伪分布配置:
   伪分布的Hadoop是只有一个节点的集群。在这个集群中,计算机既是master也是slave,
     即使 namenode也是datanode,既是jobtracker也是tasktracker。

  配置的过程如下:

  a、进入conf文件夹修改下面的文件。
  Hadoop-env.sh中加入下面内容:
  export JAVA_HOME = (JAVA安装目录)

  core-site.xml文件内容修改为下面内容:
  <configuration>

     <!-- global properties -->
     <property>
    <name>hadoop.tmp.dir</name>
    <value>/home/zhongping/tmp</value>
   </property>

    <!-- file system properties -->
   <property>
    <name>fs.default.name</name>
    <value>hdfs://localhost:9000</value>
   </property>
  </configuration>

  hdfs-site.xml文件内容修改为下面内容:(replication默认为3,如果不修改,datanode少于三台就会报错)
  <configuration>
   <property>
    <name>fs.replication</name>
    <value>1</value>
   </property>
  </configuration>

  mapred-site.xml文件内容修改为下面内容:
  <configuration>
   <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
   </property>
  </configuration>

  b、格式化Hadoop文件系统,在命令行输入命令:
  bin/hadoop namenode -format

  c、启动Hadoop,在命令行输入命令:
  bin/start-all.sh

  d、验证Hadoop是否安装成功,在浏览器中输入下面网址,如果正常打开说明安装成功。
  http://localhost:50030 (mapreduce的web页面)
  http://localhost:50070 (hdfs的web页面)

5、运行实例
   (1)先在本地磁盘建立两个输入文件 file01和file02
   $echo "Hello World Bye World" > file01
   $echo "Hello Hadoop Goodbye Hadoop" > file02
  
   (2)在hdfs中建立一个input目录:$hadoop fs -mkdir inputy
   (3)将file01和file02拷贝到hdfs中:
      $hadoop fs -copyFromLocal /home/zhongping/file0* input
   (4)执行wordcount:
      $hadoop jar hadoop-0.20.2-examples.jar wordcount input output
   (5)完成之后,查看结果
      $hadoop fs -cat output/part-r-00000

 

分享到:
评论
2 楼 han_yu_han 2011-09-13  
you are a good boy! very good!
1 楼 whuqin 2011-07-21  
very good

相关推荐

    Ubuntu Hadoop 0.20.2 安装配置说明

    ### Hadoop 0.20.2 在 Ubuntu 上的安装配置详解 #### 一、概述 本文档旨在为初学者提供一份详细的指南,用于在 Ubuntu Server 12.04 x64 系统上安装并配置 Hadoop 0.20.2。通过本文档的学习,读者可以掌握如何搭建...

    Ubuntu11.10下安装Hadoop0.20.2(单机伪分布式)

    ### Ubuntu11.10下安装Hadoop0.20.2(单机伪分布式) #### 一、安装虚拟机VMware Workstation v7.1.4 在开始Hadoop的安装之前,首先需要在宿主机上安装虚拟机软件VMware Workstation v7.1.4。这一步主要是为了搭建...

    Ubuntu部署Hadoop0.20.2简要指南.pdf

    【Ubuntu部署Hadoop 0.20.2简要指南】是针对在Ubuntu 10.10系统上安装和配置Hadoop 0.20.204.0版本的详细步骤。以下是对该指南内容的详细解释: 1. **Java安装与环境配置**: 在部署Hadoop之前,需要先确保系统中...

    在Ubuntu10.04上分布式部署Hadoop0.20.2.doc

    在Ubuntu10.04上分布式部署Hadoop0.20.2

    hadoop-0.20.2安装手册

    本文将详细介绍如何安装并配置Hadoop-0.20.2版本,包括必要的准备工作、集群配置步骤等。 #### 二、环境准备 1. **硬件准备**: - 如果没有足够的物理服务器资源,可以利用虚拟化技术(如VMware 7.1)创建多台...

    Ubuntu10.04下Hadoop-0.20.2集群配置手册.doc

    这篇文档主要介绍了如何在Ubuntu 10.04操作系统环境下配置Hadoop-0.20.2集群,包括集群的硬件环境准备、软件环境的搭建、SSH无密码验证以及Hadoop的配置步骤。 首先,硬件环境是一个典型的分布式计算集群配置,由两...

    ubuntu环境下hadoop环境搭建(伪分布模式)

    在Ubuntu环境下搭建Hadoop伪分布式模式,主要是为了模拟多节点Hadoop集群的环境,以便于学习和测试Hadoop的功能。这个过程涉及到多个步骤,包括必要的资源下载、软件安装、环境配置以及Hadoop服务的启动与验证。以下...

    在Ubunt-11.04上布署hadoop-0.20.2集群云平台

    ### 在Ubuntu 11.04上部署Hadoop-0.20.2集群云平台的知识点 #### 一、前言与环境准备 - **背景介绍**:本实验指导旨在帮助用户在Ubuntu 11.04操作系统上成功部署Hadoop-0.20.2集群云平台。该文档由厦门大学软件...

    用虚拟机在ubuntu上搭建hadoop平台的单机模式

    本文旨在详细介绍如何在虚拟机环境下,利用Ubuntu系统搭建Hadoop平台的单机模式。通过本教程,您可以掌握从安装虚拟机到配置Hadoop环境的全过程。本文不仅涵盖了安装步骤,还提供了可能遇到的问题及其解决方案。 ##...

    ubuntu运行hadoop的wordcount

    在Ubuntu系统上部署并运行Hadoop WordCount实例,首先需要确保已经安装了Hadoop环境,并且版本为hadoop-0.20.2。此版本较旧,主要用于教学或测试目的,在生产环境中建议使用更稳定的新版本。 1. **下载与解压Hadoop...

    hadoop单机配置方法

    通过以上步骤,您可以在单机环境下完成Hadoop的基本配置,为后续的Hadoop学习和开发打下基础。请注意,这些步骤适用于特定版本的Hadoop和Ubuntu,对于其他版本或操作系统,可能需要适当调整配置过程。

    hadoop安装文档

    在本篇文档中,我们将详细探讨如何在Ubuntu环境下安装Hadoop 0.20.2版本。 首先,安装的前提是需要一个Java开发环境(JDK)。请确保已经正确安装了JDK,并设置了相应的环境变量,以便Hadoop能够找到Java运行时环境...

    hadoop安装配置指南

    在开始Hadoop的安装和配置之前,需要确保有一台安装了Linux操作系统的服务器,这里推荐使用Ubuntu Linux 10.04 LTS。本指南将详细解释如何在单节点上以伪分布式模式安装和配置Hadoop 0.20.2。 首先,安装Java环境。...

    hadoop搭建与eclipse开发环境设置.pdf

    作者使用的是Hadoop 0.20.2版本,需要先下载并安装JDK 1.6,然后下载Hadoop安装包并解压缩到/opt/hadoop目录下。接着,需要修改系统环境配置文件/etc/profile,加入JDK和Hadoop的环境变量。最后,需要修改Hadoop的...

    在 Ubuntu 上安装Hadoop-0.20.2 教程.docx

    。。。

    在 Ubuntu 上安装Hadoop-0.20.2 教程.pdf

    。。。

    Hadoop实验环境搭建.docx

    本文将指导如何在单机上通过虚拟机搭建Hadoop环境,包括安装虚拟机、安装Ubuntu操作系统、配置网络、安装依赖项、安装和配置Hadoop等步骤。 一、安装虚拟机 为了搭建Hadoop环境,我们需要首先安装虚拟机软件VMware...

    使用VMware安装Hadoop全过程

    1. **安装JDK**: 在Ubuntu中安装Java环境是使用Hadoop的前提条件。可以使用命令`sudo apt-get install default-jdk`快速安装默认版本的JDK,也可以手动下载特定版本进行安装。例如,下载JDK 1.6.0_26的二进制文件`...

Global site tag (gtag.js) - Google Analytics