`
jimmee
  • 浏览: 549478 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

Ubuntu上“单节点”方式运行Hadoop (Running Hadoop 1.5.3 on Ubuntu in Single-node cluster)

    博客分类:
  • J2SE
阅读更多

对于程序员,在开发中以single-node cluster的方式建立Hadoop环境是很好的选择,只需在在一台PC上就能模拟Hadoop的集群环境,何乐而不为?本文Step-by-Step 讲述了Single-node cluster hadoop环境的配置,参考了http://www.michael-noll.com/wiki /Running_Hadoop_On_Ubuntu_Linux_%28Single-Node_Cluster%29一文。

JAVA 6

首先,请确保您的java-1.6(1.5 以上)已经安装成功,JAVA_HOME也已经设置。

添加一个专门的Hadoop用户

推荐使用专门的系统用户使用Hadoop,因为这样可以隔离开其他的应用软件的安装以及本机上的其他的用户(考虑到: 安全, 权限设置, 备份, 等等).

建立名为hadoop的用户

$ sudo addgroup hadoop

$ sudo adduser --ingroup hadoop hadoop

配置SSH

这一步是必须的,Hadoop使用SSH的方式管理其节点,即使在single-node方式中也需要对其进行配置。否则会出现“connection refused on port 22”错误.

在此之前,请确保您已经安装了SSH,如果没有,可以使用

$ sudo apt-get install openssh-server

下载并安装。

而后,我们为hadoop用户产生一个SSH密钥

  young@ubuntu:~$ su - hadoop

  hadoop@ubuntu:~$ ssh-keygen -t rsa -P ""

  Generating public/private rsa key pair.

  Enter file in which to save the key (/home/hadoop/.ssh/id_rsa):

  Created directory '/home/hadoop/.ssh'.


  Your identification has been saved in /home/hadoop/.ssh/id_rsa.


  Your public key has been saved in /home/hadoop/.ssh/id_rsa.pub.


  The key fingerprint is:


  9d:47:ab:d7:22:54:f0:f9:b9:3b:64:93:12:75:81:27 hadoop@ubuntu


  hadoop@ubuntu:~$




第二行命令会创建一个 RSA 密钥对,此时密码为空. 一般而言, 不推荐使用空密码, 但是你总不想每次Hadoop和它的节点交互时,都要经历密码的检验的吧,所以这里设置为空


然后,你需要使用新创建的密钥可以SSH访问你的本地机器。 


hadoop@ubuntu:~$ cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys


最后,测试SSH通过Hadoop user连接本地机器


  hadoop@ubuntu:~$ ssh localhost


  The authenticity of host 'localhost (127.0.0.1)' can't be established.


  RSA key fingerprint is 76:d7:61:86:ea:86:8f:31:89:9f:68:b0:75:88:52:72.


  Are you sure you want to continue connecting (yes/no)? yes


  Warning: Permanently added 'localhost' (RSA) to the list of known hosts.


  Ubuntu 7.04


  ...


  hadoop@ubuntu:~$


如果出现错误,如 ssh connect to host localhost port 22: connection refused,一般是openssh-server未安装造成的。


如果其他错误,你可以使用  ssh -vvv localhost  来查看错误的细节,然后google吧……

安装Hadoop

解压缩

你须下hadoop 0.15.3.tar.gz 并且解压缩Hadoop包到你喜欢的路径下。我选择/usr/local/hadoop .确保修改所有的文件的所有属性为Hadoop用户和组,如下:

$ cd /usr/local

$ sudo tar xzf hadoop-0.14.2.tar.gz

$ sudo mv hadoop-0.14.2 hadoop

$ sudo chown -R hadoop:hadoop hadoop


配置hadoop-env.sh

打开<Hadoop_install>/conf/hadoop-env.sh

export JAVA_HOME=/usr/lib/jvm/java-1.6-sun(正确的JAVA_HOME路径)

配置hadoop-site.sh

打开<Hadoop_install>/conf/hadoop-site.sh

加入

 <property>
  <name>fs.default.name</name>
  <value>hdfs://localhost:9000</value>
</property>

<property>
  <name>mapred.job.tracker</name>
  <value>localhost:9001</value>
</property>

<property>
  <name>dfs.replication</name>
  <value>1</value>
</property>

格式化 namenode

$ cd hadoop - 0.15.3

$ bin/hadoop namenode -format

启动单机节点群

$ <HADOOP_INSTALL>/bin/start-all.sh

成功后,使用jps查看,如果成功,则显示


  hadoop@sea:/usr/local/hadoop/$ jps


  19811 TaskTracker


  19674 SecondaryNameNode


  19735 JobTracker


  19497 NameNode


  20879 TaskTracker$Child


  21810 Jps





NOTICE: 现在Hadoop的版本已经更新到0.2,配置文件有了变化,如hadoop-site.xml就不再使用了,好像被hadoop-core.xml替代了,但是文档还没有更新……ummm……不过配置也是差不多的,先不多说了

分享到:
评论
3 楼 jimmee 2010-09-24  
在Windows下部署hadoop前,都需要安装cygwin软件,那么我们先来看一下,如何安装和配置cygwin

一、cygwin的安装与配置

  1、什么是cygwin
 cygwin是一个在windows平台上运行的unix模拟环境,是cygnus solutions公司开发的自由软件(该公司开发了很多好东西,著名的还有eCos,不过现已被Redhat收购)。它对于学习unix/linux操作环境,或者从unix到windows的应用程序移植,或者进行某些特殊的开发工作,尤其是使用gnu工具集在windows上进行嵌入式系统开发,非常有用。随着嵌入式系统开发在国内日渐流行,越来越多的开发者对cygwin产生了兴趣。
2、cygwin的安装
  (1)下载安装程序,下载地址为: http://www.cygwin.com/setup.exe
   (2)选择必须安装的包,根据实践有如下包必须选择安 装,否则很可能cygwin安装失败!
   Net Category下的OpenSSL,OpenSSH;
   Base Category下的sed;
   Editors Category下的vim,Emacs;
   Devel Category下的subversion,binutils,gcc,gcc-mingw,gdb

(3)点击下一步。一直到完成
   说明:虽然cygwin提供在线安装,个人建议先  完全下载到本地,再进行安装,因为在线安装会出现许多莫名奇妙的问题。

2、cygwin的配置
(1)配置环境变量
CLASSPATH= .;C:\Java\jdk1.6.0_11\lib\dt.jar;C:\Java\jdk1.6.0_11\lib\tools.jar
  CYGWIN=ntsec;
JAVA_HOME=C:\Java\JDK1.6.0_11;C:\Java\jre6;
在PATH环境变量中加入如下路径C:\cygwin\bin;C:\cygwin\usr\i686-pc-cygwin\bin;C:\Java\jdk1.6.0_11\bin;

(2)安装sshd服务
    启动cygwin输入命令:ssh-host-config;
    根据提示进行相应的操作直至安装完成,安装成功后立即启动名称为“CYGWIN sshd”的服务。

(3)配置ssh登录
      执行ssh-keygen命令,然后根据提示按三次回车键,最后输入如下命令:
   cd ~/.ssh/;
   cp id_rsa.pub authorized_keys

至此,cygwin的安装与配置成功,你可以享受cygwin带来的乐趣。
2 楼 jimmee 2010-09-24  
2.异常
hadoop@hadoop-desktop:~/hadoop-0.19.0$ hadoop fs -copyFromLocal /home/jme/output.log hdfs://localhost/user/tom/quangle.txt
10/09/24 14:31:52 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8020. Already tried 0 time(s).
10/09/24 14:31:53 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:8020. Already tried 1 time(s).
copyFromLocal: Call to localhost/127.0.0.1:8020 failed on local exception: Connection refused

修改conf/hadoop-site.xml中9000为8020
<name>fs.default.name</name>
  <value>hdfs://localhost:8020</value>

1 楼 jimmee 2010-09-24  
1. 异常
hadoop@hadoop-desktop:~/hadoop-0.19.0$ hadoop fs -copyFromLocal /home/jme/output.log hdfs://localhost/user/tom/quangle.txt
10/09/24 14:20:47 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000. Already tried 0 time(s).
10/09/24 14:20:48 INFO ipc.Client: Retrying connect to server: localhost/127.0.0.1:9000. Already tried 1 time(s).

Bad connection to FS. command aborted.

把你DataNode上的DFS数据全删了,再重新格式化NameNode即可。

相关推荐

    ubuntu搭建hadoop单节点.docx

    ubuntu 搭建 Hadoop 单节点 Hadoop 是一个由 Apache 基金会所开发的分布式系统根底架构,用户可以在不了解分布式底层细节的情况下,开发分布式程序。Hadoop 实现了一个分布式文件系统(HDFS),简称 HDFS。HDFS 有...

    hadoop-cluster-docker, 在 Docker 容器中运行 Hadoop.zip

    hadoop-cluster-docker, 在 Docker 容器中运行 Hadoop 在 Docker 容器内运行Hadoop集群博客:在 Docker 更新中运行Hadoop集群。博客:基于Docker搭建Hadoop集群之升级版 3节点Hadoop集群 1.拉 Docker 图像sudo do

    Hadoop Single Node Cluster的安装.txt

    Hadoop Single Node Cluster的详细安装,master主机与data1、data2、data3三台节点连接。

    hadoop单节点配置

    Hadoop 单节点配置详解 Hadoop 是一个开源的大数据处理框架,由Apache基金会维护。它可以在单节点模式下运行,以便于开发、测试和学习。单节点模式下,Hadoop 可以在一台机器上模拟分布式环境,方便用户快速上手和...

    hadoop-cluster-build

    【标题】"hadoop-cluster-build"涉及的知识点主要围绕着Hadoop集群的构建,这是一个大数据处理的核心技术。Hadoop是一个开源框架,它允许在廉价硬件上进行大规模数据处理,具有高度可扩展性和容错性。 【描述】...

    Hadoop-Single-Node-Cluster

    【Hadoop-Single-Node-Cluster】是针对初学者或者开发者进行本地测试和学习Hadoop环境搭建的一个项目。在这个单节点集群中,所有的Hadoop组件都安装在一个单一的计算机上,便于理解和掌握Hadoop的基本原理和操作。这...

    ubuntu运行hadoop的wordcount

    ### Ubuntu上运行Hadoop WordCount实例详解 #### 一、环境搭建与配置 在Ubuntu系统上部署并运行Hadoop WordCount实例,首先需要确保已经安装了Hadoop环境,并且版本为hadoop-0.20.2。此版本较旧,主要用于教学或...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    3. 伪分布式模式安装:Hadoop 可以在单节点上以伪分布式的方式运行,Hadoop 进程以分离的 Java 进程来运行,节点既作为 NameNode 也作为 DataNode,同时,读取的是 HDFS 中的文件。 4. 分布式模式安装:使用多个...

    apache-carbondata-1.4.0-bin-spark2.1.0-hadoop2.6.0-cdh5.11.1.jar

    carbondata-1.4,spark-2.1,hadoop-2.6.0-cdh5.11.1源码编译

    hadoop single node setup

    根据给定的文件信息,以下是对“hadoop single node setup”相关知识点的详细说明: 1. Hadoop单节点安装的目的 Hadoop单节点安装的主要目的是为了让用户能够在单机上快速地进行简单的Hadoop MapReduce和Hadoop...

    hadoop插件apache-hadoop-3.1.0-winutils-master.zip

    标题中的"apache-hadoop-3.1.0-winutils-master.zip"是一个针对Windows用户的Hadoop工具包,它包含了运行Hadoop所需的特定于Windows的工具和配置。`winutils.exe`是这个工具包的关键组件,它是Hadoop在Windows上的一...

    单节点Hadoop安装手册

    本手册旨在指导如何在一台计算机上搭建单节点伪分布式Hadoop环境,使用户能够在实际环境中熟悉Hadoop的配置、启动和数据处理流程。 #### 二、准备工作 - **操作系统**:推荐使用RHEL 6.0(Red Hat Enterprise ...

    Hadoop Multi Node Cluster 安装步骤.pdf

    Hadoop Multi Node Cluster 安装步骤.pdf

    single-node-cluster:一个hadoop单节点伪集群

    在Hadoop生态系统中,"单节点集群"(Single Node Cluster)是一种常见的开发和测试环境配置,它模拟了一个完整的多节点集群,但所有组件都运行在同一台机器上。这对于初学者和开发者来说非常方便,因为它降低了硬件...

    hadoop最新版本3.1.1全量jar包

    hadoop-annotations-3.1.1.jar hadoop-common-3.1.1.jar hadoop-mapreduce-client-core-3.1.1.jar hadoop-yarn-api-3.1.1.jar hadoop-auth-3.1.1.jar hadoop-hdfs-3.1.1.jar hadoop-mapreduce-client-hs-3.1.1.jar ...

    hadoop-3.3.1 windows + apache-hadoop-3.1.0-winutils-master.zip

    1. **下载并解压**:首先,你需要下载hadoop-3.3.1的Windows版本和winutils工具包,并将它们解压到合适的目录,例如`C:\Hadoop`。 2. **配置环境变量**:打开系统环境变量设置,添加新的系统变量`HADOOP_HOME`,...

    Config and Run Hadoop Single Node mode in Ubuntu linux

    ### Hadoop 单节点模式在 Ubuntu Linux 上的配置与运行 #### 一、环境准备与用户组设置 在 Ubuntu Linux 上部署 Hadoop 单节点模式之前,首先需要进行一定的环境准备,包括创建 Hadoop 用户组及用户,并设置必要的...

    hadoop-common-2.6.0-bin-master.zip

    `hadoop-common-2.6.0-bin-master.zip` 是一个针对Hadoop 2.6.0版本的压缩包,特别适用于在Windows环境下进行本地开发和测试。这个版本的Hadoop包含了对Windows系统的优化,比如提供了`winutils.exe`,这是在Windows...

    docker-hadoop, 在Ubuntu上,用于运行Hadoop的Dockerfile.zip

    docker-hadoop, 在Ubuntu上,用于运行Hadoop的Dockerfile Hadoop的 Docker 映像 支持的标签和相应的Dockerfile 链接2.6.0/Dockerfile2.5.2/Dockerfile2.5.1/Dockerfile2.5.0/Dockerfile2.4.

    ubuntu上安装hadoop

    ubuntu上安装hadoop集群,三个节点

Global site tag (gtag.js) - Google Analytics