`
qiemengdao
  • 浏览: 276117 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论

Fedora13伪分布式模式安装Hadoop

阅读更多
1安装Linux系统,在这里安装的是Fedora13

创建用户的用户名为:ssj

2安装openssh-server:

yum install openssh-server

如果已经安装则跳过。

3建立ssh无密码登录:

(1)在namenode上面实现无密码登录:

       ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa

      直接回车,完成后会在 ~/.ssh/ 生成两个文件: id_dsa 和 id_dsa.pub 。这两个是成对
现,类似钥匙和锁。

      再把 id_dsa.pub 追加到授权 key 里面 ( 当前并没有 authorized_keys文件 ) :

      cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys 。

       完成后可以实现无密码录本机: $ ssh localhost 。

若此时连接不上,检查sshd服务是否打开。可以用命令:service sshd start开启服务

(2)实现 NameNode 无密码登录其他 DataNode :(注:在这里我是单机安装,本机既是namenode,又是datanode。所以这步跳过。)
NameNode 上的 id_dsa.pub 文件追加到 dataNode 的 authorized_keys 内 ( 以
8.0.3 节点为例 ) :
拷贝 NameNode 的 id_dsa.pub 文件:
scp id_dsa.pub hexianghui@192.168.0.3:/home/ssj/
登录 192.168.0.3 ,执行 $ cat id_dsa.pub >> .ssh/authorized_keys
他的 dataNode 执行同样的操作。
意: 如果配置完毕,如果 namenode 依然不能访问 datanode ,可以修改 datanode 的
ized_keys : $ chmod 600 authorized_keys 。



4.关闭防火墙:

在终端中输入:service iptables stop(最好把selinux也关掉)

5.安装jdk1.6:

这里是安装目录是:/home/ssj/cloud/ jdk1.6.0_21,安装完成后,在/etc/profile中加入:

export JAVA_HOME=/home/ssj/jdk1.6.0_21

export JRE_HOME=/home/ssj/jdk1.6.0_21/jre

export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH

export PATH=$JAVA_HOME/bin:$JRE_HOME/bin:$PATH

6.安装hadoop:

下载hadoop-0.20.2.tar.gz,解压:tar -zvxf hadoop-0.20.2.tar.gz

在这里,解压目录为:/home/ssj/cloud/hadoop-0.20.2,然后在/etc/profile里面加入:

export HADOOP_HOME=/home/ssj/hadoop-0.20.2

export PATH=$HADOOP_HOME/bin:$PATH

7.配置hadoop:

hadoop 的主要配置都在 hadoop-0.20.2 /conf 下。
(1) 在 conf/hadoop-env.sh 中配置 Java 环境 (namenode 与 datanode 的配置相同 ) :
$ gedit hadoop-env.sh
$ export JAVA_HOME=/home/ssj/jdk1.6.0_21
(2) 配置 conf/masters 和 conf/slaves 文件 只在 namenode 上配置 )
masters: localhost

slaves:localhost

注意:因为这是在单机上,则都配置成localhost,若有多台节点机,则masters配置用作masters的机器ip,而slaves则配置多个slaves的ip。

(3) 配置 conf/core-site.xml, conf/hdfs-site.xml 及 conf/mapred-site.xml( 简单 配
置, datanode 的配置相同,在这里只配置localhost,因为只有一台机子)
core-site.xml:
<configuration>
<!--- global properties -->
<property>
<name> hadoop.tmp.dir </name>
<value> /home/hexianghui/tmp </value>
<description>A base for other temporary directories.</description>
</property>
<!-- file system properties -->
<property>
<name> fs.default.name </name>
<value> hdfs://localhost:9000 </value>
</property>
</configuration>

hdfs-site.xml replication 默认为 3 ,如果不修改, datanode 少于三台就会报错 )
<configuration>
<property>
<name> dfs.replication </name>
<value> 1 </value>
</property>
</configuration>

mapred-site.xml:
<configuration>
<property>
<name>mapred.job.tracker</name>
<value> localhost:9001 </value>
</property>
</configuration>

8.运行hadoop

进入 hadoop-0.20.1 /bin ,首先格式化文件系统: $ hadoop namenode – format
启动 Hadoop : $start-all.sh

用jps命令查看进程:

[root@localhost cloud]# jps
2733 TaskTracker
2672 JobTracker
2610 SecondaryNameNode
3927 Jps
2486 NameNode
2547 DataNode

查看集群状态: $ hadoop dfsadmin -report
Hadoop 的 web 方式查看: http://localhost:50070

至此,安装完成。




分享到:
评论

相关推荐

    Windows7下eclipse调试Fedora虚拟机的hadoop+hbase伪分布式

    在Fedora服务器上安装Hadoop,首先需要配置SSH本地登录证书,这一步在伪分布式模式下可以跳过。然后,解压Hadoop的tar.gz文件到合适目录,配置Hadoop的相关环境变量(如HADOOP_HOME、PATH等),并根据需求修改Hadoop...

    fedora 安装hadoop0.20.2

    本篇文章将详细介绍如何在 Fedora 操作系统上安装 Hadoop 0.20.2 版本,并设置伪分布式环境。我们将采用 Sun 的 JDK 而非 OpenJDK,这是因为早期版本的 Hadoop 可能与 OpenJDK 存在兼容性问题。 #### 二、准备工作 ...

    Hadoop分布式集群容错验证.pdf

    Hadoop是一种开源分布式系统架构,它的出现与云计算的发展密切相关。云计算的出现使得海量数据的存储与处理成为了可能,Hadoop作为一个广泛应用于多种平台上的开源分布式系统架构,为应用程序提供了一组稳定可靠的...

    hadoop集群部署

    Hadoop 是一种基于分布式计算的开源框架,主要用于处理大规模数据。为了成功部署 Hadoop 集群,需要准备好 Linux 操作系统、虚拟机环境、Hadoop 软件包、hosts 文件、namenode、datanode 等组件。 虚拟机环境配置 ...

    Apress - Pro Hadoop

    目前Hadoop受到Yahoo的支持,有Yahoo员工长期工作在项目上,而且Yahoo内部也准备使用Hadoop代替原来的的分布式系统。  Hadoop实现了HDFS文件系统和MapRecue。用户只要继承MapReduceBase,提供分别实现Map和Reduce...

    hadoop 部署

    以上步骤是一个基本的Hadoop伪分布式集群的搭建流程。在这个过程中,新手需要注意各个细节,确保每一步都正确无误。Hadoop的配置与部署是一个复杂但非常重要的过程,正确的部署对于后续数据分析工作的顺利进行至关...

    hadoop-0.22.0.tar.gz

    在Fedora 8下配置Hadoop 0.22.0,首先需要安装必要的依赖,如Java开发工具包(JDK)和开放SSH服务。接着,解压`hadoop-0.22.0.tar.gz`到一个适当的目录,并根据官方文档或网络上的教程进行配置。这通常涉及修改`conf...

    hadoop集群安装-鲁德性能测试.docx

    【Hadoop集群安装详解】 Hadoop是一个开源的分布式计算框架,广泛应用于大数据处理领域。要深入学习Hadoop集群数据分析技术,首先要搭建一个Hadoop集群环境。这个环境可以通过在多个物理机器或虚拟机上安装和运行...

    Hadoop运行原理分析

    Hadoop运行原理分析主要涉及MapReduce编程模式、HDFS的架构以及Hadoop分布式计算的基本流程。以下是对该文件内容的详细解析。 1. Hadoop概述 Hadoop是一个能够处理海量数据的分布式计算框架,它基于Google开发的...

    hadoop集群安装_鲁德性能测试.doc

    Hadoop是一个开源的分布式计算框架,由Apache软件基金会开发,主要用于处理和存储海量数据。它基于谷歌的MapReduce编程模型,提供高容错性和高可扩展性,使得在廉价硬件上构建大规模数据处理系统成为可能。 在安装...

    Hadoop环境搭建与WordCount实例浅析.pdf

    Hadoop是一个分布式计算框架,广泛应用于大数据处理。要搭建Hadoop环境并实现WordCount实例,你需要遵循以下步骤: 1. **环境准备**: - 首先,你需要一个Linux操作系统环境。对于初学者,建议使用虚拟机,如...

    Hadoop开发环境配置

    在Fedora8系统的Hadoop集群机器(192.168.1.211,即namenode和jobtracker)和两台VMWare虚拟机(192.168.1.58和192.168.1.59)上,进行SSH无密码登录的配置。这涉及到生成SSH密钥对(ssh-keygen -t rsa),并将公钥...

    Hadoop的配置及运行WordCount.docx

    Hadoop是一个开源的分布式计算框架,广泛应用于大数据处理,它允许数据在集群中的多台机器上并行处理,提高了处理效率。 一、环境: 在开始配置Hadoop之前,我们需要确保有一台或多台Linux服务器,这里以Fedora为例...

    基于Eclipse的Hadoop应用开发环境配置.pdf

    首先,描述中提到了一个开发环境,包括Fedora 14操作系统,一个NameNode和两个DataNode,以及Hadoop版本为0.20.205.0,Eclipse版本为3.7.1。NameNode是Hadoop分布式文件系统(HDFS)的主要节点,负责管理文件系统的...

    基于Eclipse的Hadoop应用开发环境配置.docx

    在配置Eclipse的Hadoop开发环境时,首先需要确保Hadoop守护进程(如Namenode和Datanode)已经在操作系统(例如Fedora 14)上正确启动。然后,我们需要在Eclipse中安装Hadoop插件,这可以通过将`hadoop-eclipse-...

Global site tag (gtag.js) - Google Analytics