`

在Ubuntu上装Hadoop

阅读更多

在装Hadoop之前首先需要:

1.java1.6.x 最好是sun的,1.5.x也可以

2.ssh

安装ssh

 

$ sudo apt-get install ssh
$ sudo apt-get install rsync

 

 

下载Hadoop

http://hadoop.apache.org/core/releases.html 下载最近发布的版本

 

最好为hadoop创建一个用户:

比如创建一个group为hadoop user为hadoop的用户以及组

 

$ sudo addgroup hadoop
$ sudo adduser --ingroup hadoop hadoop

 

解压下载的hadoop文件,放到/home/hadoop目录下 名字为hadoop 

配置JAVA_HOME:

 

gedit ~/hadoop/conf/hadoop-env.sh

 

 

 # The java implementation to use.  Required.
 # export JAVA_HOME=/usr/lib/j2sdk1.5-sun

 

 修改成java的安装目录:(我的是:/usr/lib/jvm/java-6-sun-1.6.0.15)

 

# The java implementation to use. Required.
export JAVA_HOME=/usr/lib/jvm/java-6-sun-1.6.0.15
 

 

现在可以使用单节点的方式运行:

 

$ cd hadoop
$ mkdir input
$ cp conf/*.xml input
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
$ cat output/*

 

Pseudo-distributed方式跑:

 

配置ssh

 

$ su - hadoop
$ ssh-keygen -t rsa -P ""
Generating public/private rsa key pair.
Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):
Created directory '/home/hadoop/.ssh'.
Your identification has been saved in /home/hadoop/.ssh/id_rsa.
Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.
The key fingerprint is:
9d:47:ab:d7:22:54:f0:f9:b9:3b:64:93:12:75:81:27 hadoop@ubuntu

 

 让其不输入密码就能登录:

 

hadoop@ubuntu:~$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

 

  使用:

 

$ ssh localhost

 

 看看是不是直接ok了。

 

 

hadoop配置文件:

conf/core-site.xml

 

<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>

<!-- Put site-specific property overrides in this file. -->

<configuration>
   <property>
	<name>hadoop.tmp.dir</name>
        <value>/home/hadoop/hadoop-datastore/hadoop-${user.name}</value>
   </property>
   <property>
	<name>fs.default.name</name>
	<value>hdfs://localhost:9000</value>
   </property>
</configuration>

 

 hadoop.tmp.dir配置为你想要的路径,${user.name}会自动扩展为运行hadoop的用户名

 

conf/hdfs-site.xml

 

<configuration>
  <property>
    <name>dfs.replication</name>
    <value>1</value>
  </property>
</configuration>

 

 dfs.replication为默认block复制数量

conf/mapred-site.xml

 

<configuration>
  <property>
    <name>mapred.job.tracker</name>
    <value>localhost:9001</value>
  </property>
</configuration>

 

 执行

 

格式化分布式文件系统:

 

$ bin/hadoop namenode -format

 

 启动hadoop:

 

$ bin/start-all.sh

 

 可以从

 

NameNode - http://localhost:50070/
JobTracker - http://localhost:50030/

 

 查看NameNode和JobTracker

 

运行例子:

 

 

$ bin/hadoop fs -put conf input
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'

 

look at the run result:

$ bin/hadoop fs -get output output
$ cat output/*
 

 

参考: 1、http://hadoop.apache.org/common/docs/current/quickstart.html
2、http://www.michael-noll.com/wiki/Running_Hadoop_On_Ubuntu_Linux_%28Single-Node_Cluster%29
3
0
分享到:
评论
2 楼 chenwq 2011-10-19  
xuedi_manbu 写道
请问Ubuntu选择哪个版本?比如Ubuntu 10.4,也有很多版本,应该选择哪个?

都可以,最近的一次我在3台11.04上配置了。
但是最近又有新版本的Ubuntu出来啦~
1 楼 xuedi_manbu 2011-08-31  
请问Ubuntu选择哪个版本?比如Ubuntu 10.4,也有很多版本,应该选择哪个?

相关推荐

    基于Ubuntu的Hadoop简易集群安装与配置

    ### 基于Ubuntu的Hadoop简易集群安装与配置知识点详解 #### 一、绪论 ##### 1.1 研究背景及意义 在当前信息化社会中,随着科技的发展与进步,尤其是互联网技术的普及,我们正处在一个数据爆炸的时代。各行各业都在...

    ubuntu搭建hadoop单节点.docx

    本文将指导读者在 Ubuntu 操作系统上搭建 Hadoop 单节点,实现简单的本地服务。整个搭建过程可以分为三步:环境准备、软件安装和配置过程。 环境准备包括安装 VMware Workstation11 和软件准备,包括 SSH、Hadoop-...

    ubuntu运行hadoop的wordcount

    在Ubuntu系统上部署并运行Hadoop WordCount实例,首先需要确保已经安装了Hadoop环境,并且版本为hadoop-0.20.2。此版本较旧,主要用于教学或测试目的,在生产环境中建议使用更稳定的新版本。 1. **下载与解压Hadoop...

    基于Ubuntu的hadoop集群安装与配置

    "基于Ubuntu的hadoop集群安装与配置" 本文将详细介绍基于Ubuntu环境下的Hadoop集群安装与配置,涵盖Hadoop的基本概念、HDFS(分布式文件系统)、MapReduce(分布式计算模型)、集群架构、NameNode和DataNode的角色...

    Ubuntu20.04配置Hadoop.txt

    本教程是根据个人在UBUNTU虚拟机上安装配置Hadoop2.7.3的实际操作步骤一步步记录下来的,大部分指令操作的目的都加了注释以方便理解。(本教程很详细,如果还是遇到问题可以直接咨询楼主,不会让你的积分百花的)

    Ubuntu14.04 Hadoop完全分布式安装手册

    Hadoop安装

    ubuntu搭建hadoop

    在Ubuntu系统上搭建Hadoop集群是一项基础且重要的任务,它涉及到分布式存储和计算的基础架构。本文将详细解析这个过程,包括环境准备、安装Java、配置Hadoop、启动集群以及进行基本的测试。 首先,环境准备是搭建...

    Ubuntu下Hadoop的配置与搭建

    在Ubuntu下利用Hadoop配置与搭建分布式系统。 全部是自己搜网上资料, 自己摸索写的。 内容详细!

    ubuntu上hadoop的安装及配置

    在本文中,我们将详细探讨如何在Ubuntu 10.10 (Maverick Meerkat)上通过VMware虚拟机安装并配置Hadoop集群。这个过程涵盖了从搭建虚拟环境到安装必要的软件,以及最终配置Hadoop分布式文件系统(HDFS)和MapReduce服务...

    在Ubuntu上配置Hadoop集群

    ### 在Ubuntu上配置Hadoop集群的关键知识点 #### 一、任务概述 本文档旨在指导用户如何在Ubuntu系统上搭建一个分布式的Hadoop集群。通过详细的操作步骤和注意事项,确保读者能够顺利地完成集群的配置。 #### 二、...

    Ubuntu下hadoop-2.5.2编译好的64bit的native库

    在Ubuntu操作系统中,Hadoop是Apache软件基金会开发的一个开源分布式计算框架,用于处理和存储大量数据。Hadoop的运行效率和性能与它的本机库(Native Libraries)紧密相关,这些库提供了与操作系统的直接交互,比如...

    ubuntu下安装hadoop集群

    ubuntu下安装hadoop集群,设置ssh对其他node无密码访问

    在ubuntu上搭建hadoop总结

    在Ubuntu上搭建Hadoop是一个常见的任务,特别是在学习和实验分布式计算环境时。本文将详细讲解在Ubuntu 12.04上安装Hadoop伪分布式模式的过程,这将帮助你理解Hadoop的基础设置,并为日后扩展到完全分布式环境打下...

    Ubuntu下的Hadoop安装教程

    ### Hadoop 在 Ubuntu 下的安装教程 #### 一、安装 Linux 操作系统 在搭建 Hadoop 开发环境之前,首先需要确保系统环境已准备好。本文档假设你正在使用 Ubuntu 12.04 操作系统。 如果你还没有安装 Linux 操作系统...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结: 1. 安装前的准备工作:创建 hadoop 用户,设置密码,增加...

    Ubuntu上搭建Hadoop2.x详细文档

    本文档详细介绍了如何在Ubuntu系统上搭建Hadoop2.x环境,包括创建用户、安装Java环境、配置SSH无密码登录、安装Hadoop并配置相关核心文件的过程。通过这些步骤,用户可以顺利地在自己的Ubuntu环境中运行Hadoop集群,...

    用虚拟机在ubuntu上搭建hadoop平台的单机模式

    ### 使用虚拟机在Ubuntu上搭建Hadoop平台单机模式 #### 概述 本文旨在详细介绍如何在虚拟机环境下,利用Ubuntu系统搭建Hadoop平台的单机模式。通过本教程,您可以掌握从安装虚拟机到配置Hadoop环境的全过程。本文...

Global site tag (gtag.js) - Google Analytics