`
cyw
  • 浏览: 33126 次
  • 来自: 广州
社区版块
存档分类
最新评论

Hadoop-2.7.1安装与配置

 
阅读更多

Hadoop-2.7.1安装与配置

     前面我们说了,旧版hadoop-1.2.1的安装配置,这也是好几年前的版本了吧。而现在最新版本是hadoop-2.7.1 。虽然,大体上hadoop的安装步骤基本一致,但是最新版本与hadoop-1.2.1不管是目录结构,亦或是脚本什么的都有了个很大的改变。所以,我便有写了一篇关于hadoop-2.7.1的安装配置博客。当然,最好的教程还是在官网,所以本文仅供参考,真正可行的还是在官网: http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html

一、准备

jdk-7u17-linux-x64.tar.gz

hadoop-2.7.1.tar.gz

二、jdk、ssh安装

      可以参考前面的安装步骤:

http://cyw.iteye.com/blog/2251727

三、安装hadoop-2.7.1

1、将hadoop-2.7.1.tar.gz放在桌面,打开终端,cp到喜欢的目录之下。比如我安装在/home/hadoop/目录下

cp hadoop-2.7.1.tar.gz /home/hadoop/ 

 

 

2、解压安装hadoop-2.7.1

sudo tar -zxvf hadoop-2.7.1.tar.gz 

 

3、进入hadoop-2.7.1文件夹,配置环境变量,打开etc/hadoop/hadoop-env.sh。

sudo gedit etc/hadoop/hadoop-env.sh

 

 在文件里编辑如下JAVA_HOME变量,改为自己的java安装目录:

export JAVA_HOME=/usr/lib/java/jdk1.7.0_17 

 

4、进入hadoop文件夹

bin/hadoop

 

      输出如下:



 

5、如果是单机模式的话,这是便可以使用了:



 

6、如果是伪分布式的话,则还需要配置一些。打开etc/hadoop/core-site.xml

      sudo gedit etc/hadoop/core-site.xml

 

 编辑内容如下:

<configuration>
     <property>
             <name>fs.defaultFS</name>
             <value>hdfs://localhost:9000</value>
      </property>
 </configuration>

 

 

7、打开etc/hadoop/hdfs-site.xml

sudo gedit etc/hadoop/hdfs-site.xml

 

 编辑内容如下:

<configuration>
    <property>
        <name>dfs.replication</name>
         <value>1</value>
     </property>
</configuration>

 

 

8、此时,hdfs的配置已经完成。可以开启namenode 、secondarynomenode、datanode了。此时,hadoop-2.7.1建议我们使用hdfs而不是hadoop脚本,而且部分hdfs的操作放在sbin目录的脚本里面。所以:

 #格式化namenode
 bin/hdfs namenode -format
 #开启hdfs的相关节点
 sbin/start-dfs.sh
 #关闭hdfs节点
 sbin/stop-dfs.sh

 

可以使用浏览器url:localhost:50070进行web查看管理。

 

9、配置yarn计算框架(算是Map/Reduce的升级版)

 打开etc/hadoop/mapred-queues.xml.template

sudo gedit etc/hadoop/mapred-queues.xml.template

 

 编辑内容如下:

<configuration>
    <property>
            <name>mapreduce.framework.name</name>
             <value>yarn</value>
     </property>
 </configuration>

 

 

10、打开etc/hadoop/yarn.site.xml

sudo gedit etc/hadoop/yarn-site.xml

 

 编辑如下:

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
</configuration>

 

 

11、此时,关于yarn计算框架也配置完成了,可以开始使用了。

  #启动yarn
  sbin/start-yarn.sh
  #关闭yarn
  sbin/stop-yarn.sh

 

 

    12、已经配置完成,全部开启之后,输入命令:

 jps

 


出现以上输出,即是说明安装配置完成了。

注意:如果在开启的时候,出现无法创建、打开目录文件的情况时,即是说明,当前用户没有此文件操作权限,所以需要修改权限:

 sudo chmod 777 *

     尤其是修改hadoop-2.7.1目录、logs目录及其中文件、etc目录及其中的hadoop目录及其其中的文件,这些的权限。

      以上,便安装配置完成了。以下链接是所需要的安装包:

http://pan.baidu.com/s/14uFy2

      以及hadoop-1.2.1的安装配置文章: 

http://cyw.iteye.com/blog/2251727

  • 大小: 106.3 KB
  • 大小: 22.2 KB
  • 大小: 23 KB
1
3
分享到:
评论

相关推荐

    hadoop.dll & winutils.exe For hadoop-2.7.1

    本文将详细探讨与"Hadoop.dll"和"winutils.exe"相关的知识点,以及它们在Hadoop-2.7.1版本中的作用。 Hadoop.dll是Hadoop在Windows操作系统上的一个关键组件,它是Apache Hadoop对Windows平台的适配部分。由于...

    hadoop-2.7.1.tar.gz.zip

    在安装和配置Hadoop时,你需要修改conf目录下的配置文件,如core-site.xml(定义HDFS的基本属性)、hdfs-site.xml(设置HDFS的参数)、mapred-site.xml(设置MapReduce参数)和yarn-site.xml(配置YARN)。...

    Hadoop-2.7.1已编译64位

    根据提供的文件信息,我们可以深入探讨Hadoop-2.7.1的相关知识点,包括其特性、安装配置步骤以及可能的应用场景等。 ### Hadoop-2.7.1版本概述 Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它...

    hadoop-2.7.1.tar.gz

    压缩包子文件的文件名称列表中只有一个条目:"hadoop-2.7.1",这可能是解压后的Hadoop安装目录,包含了一系列的配置文件、可执行文件和其他相关组件。用户在Windows上解压这个文件后,可能需要按照提供的说明或者...

    hadoop-common-2.7.1-bin-master.zip

    《Hadoop Common 2.7.1:基础工具包详解》 Hadoop作为一个开源的分布式计算框架,其组件众多,而“hadoop-common-2.7.1-bin-master.zip”正是其中的重要组成部分——Hadoop Common的工具包。这个压缩包包含了运行...

    hadoop-eclipse-plugin-2.7.1.jar

    Hadoop Eclipse Plugin 2.7.1 是一个强大的工具,它将流行的开源大数据处理框架Hadoop与Java开发环境Eclipse紧密集成,极大地简化了Hadoop应用的开发和调试过程。这个插件允许开发者在Eclipse中直接创建、编辑、构建...

    hadoop-2.7.1

    10. **安装与部署**:安装Hadoop 2.7.1通常涉及解压`hadoop-2.7.1.tar.gz`,配置环境变量,格式化HDFS,启动守护进程等步骤。集群部署还需要考虑节点间的通信和数据同步。 综上所述,Hadoop 2.7.1是一个强大的大...

    hadoop-2.7.1 windows版本,bin目录包括hadoop.dll winutils.exe hadoop-2.6.0\bin

    1. **配置环境变量**:将Hadoop的安装路径添加到系统PATH环境变量中,以便在任何目录下都能执行Hadoop命令。 2. **配置Hadoop配置文件**:修改`core-site.xml`和`hdfs-site.xml`,设定HDFS的命名节点和数据节点,...

    winutils.exe_hadoop-2.7.1

    《Hadoop Winutils.exe在2.7.1版本中的应用与配置详解》 Hadoop作为一个分布式计算框架,广泛应用于大数据处理领域。在Windows环境中,Winutils.exe和hadoop.dll是Hadoop的重要组成部分,它们为Hadoop在Windows上的...

    hadoop-2.7.1-src.rar

    2. HA(High Availability):Hadoop 2.7.1支持NameNode和ResourceManager的高可用性,这意味着可以配置多个NameNode或ResourceManager,以防止单点故障。 3. Erasure Coding:这是一种新的数据冗余策略,可以替代...

    hadoop-common-2.7.1-bin-maste

    《深入理解Hadoop Common 2.7.1:构建大数据处理基石》 Hadoop Common是Apache Hadoop项目的核心组件之一,它提供了Hadoop生态系统中所有其他模块所必需的基础设施和服务。在本文中,我们将深入探讨Hadoop Common ...

    hadoop-common-2.7.1-bin-master-master.zip

    《Hadoop Common 2.7.1:深入理解与应用》 Hadoop作为一个开源的分布式计算框架,其组件众多,而Hadoop Common是其中的基础模块,包含了许多Hadoop系统运行所必需的工具和服务。本篇将围绕"Hadoop-common-2.7.1-bin...

    hadoop-common-2.7.1-bin-master.zip+hbase-2.0.0-bin.tar.gz Hbase与Hadoop版本对应

    本文将深入探讨Hadoop Common 2.7.1与HBase 2.0.0之间的关系,以及在Windows环境下如何正确安装和配置这两个组件。 Hadoop是Apache软件基金会开发的一个开源框架,主要用于处理和存储大规模数据集。Hadoop Common是...

    hadoop-eclipse2.7.1、hadoop-eclipse2.7.2、hadoop-eclipse2.7.3

    1. **Hadoop-Eclipse插件安装与配置**:要使用Hadoop-Eclipse插件,首先需要在Eclipse中安装该插件。这可以通过Eclipse的“Help”菜单 -&gt; "Install New Software" -&gt; "Add" 来完成,然后提供下载的插件JAR文件路径...

    Hadoop-2.7.1分布式安装手册

    《Hadoop-2.7.1分布式安装手册》是一份详尽的指南,旨在帮助用户在不同的模式下安装和配置Apache Hadoop 2.7.1。Hadoop是开源的大数据处理框架,它允许在廉价硬件上进行大规模数据处理,具有高容错性和可扩展性。这...

    hadoop-eclipse-plugin-2.7.1

    1. **项目创建与管理**:通过Eclipse的菜单,开发人员可以直接创建新的Hadoop MapReduce项目,设置项目属性,包括指定Hadoop配置文件路径,以及选择运行的Hadoop版本。 2. **资源管理**:可以直观地查看和管理HDFS...

    hadoop-2.7.1.zip

    安装Hadoop-2.7.1时,你需要将`bin`目录添加到系统路径中,这样你就可以在命令行中直接运行`hadoop`和`winutils`命令。此外,还需要配置Hadoop的配置文件,如`core-site.xml`和`hdfs-site.xml`,这些文件定义了...

    hadoop-2.7.1-bin.zip

    在CentOS上部署Hadoop通常涉及到安装Java环境、配置SSH无密码登录、格式化HDFS、启动Hadoop服务等一系列步骤。 总的来说,Hadoop-2.7.1是一个强大且广泛使用的分布式计算平台,其在数据处理和分析方面发挥着重要...

Global site tag (gtag.js) - Google Analytics