Hadoop-2.7.1安装与配置
前面我们说了,旧版hadoop-1.2.1的安装配置,这也是好几年前的版本了吧。而现在最新版本是hadoop-2.7.1 。虽然,大体上hadoop的安装步骤基本一致,但是最新版本与hadoop-1.2.1不管是目录结构,亦或是脚本什么的都有了个很大的改变。所以,我便有写了一篇关于hadoop-2.7.1的安装配置博客。当然,最好的教程还是在官网,所以本文仅供参考,真正可行的还是在官网: http://hadoop.apache.org/docs/r2.7.1/hadoop-project-dist/hadoop-common/SingleCluster.html
一、准备
jdk-7u17-linux-x64.tar.gz
hadoop-2.7.1.tar.gz
二、jdk、ssh安装
可以参考前面的安装步骤:
http://cyw.iteye.com/blog/2251727
三、安装hadoop-2.7.1
1、将hadoop-2.7.1.tar.gz放在桌面,打开终端,cp到喜欢的目录之下。比如我安装在/home/hadoop/目录下
cp hadoop-2.7.1.tar.gz /home/hadoop/
2、解压安装hadoop-2.7.1
sudo tar -zxvf hadoop-2.7.1.tar.gz
3、进入hadoop-2.7.1文件夹,配置环境变量,打开etc/hadoop/hadoop-env.sh。
sudo gedit etc/hadoop/hadoop-env.sh
在文件里编辑如下JAVA_HOME变量,改为自己的java安装目录:
export JAVA_HOME=/usr/lib/java/jdk1.7.0_17
4、进入hadoop文件夹
bin/hadoop
输出如下:
5、如果是单机模式的话,这是便可以使用了:
6、如果是伪分布式的话,则还需要配置一些。打开etc/hadoop/core-site.xml
sudo gedit etc/hadoop/core-site.xml
编辑内容如下:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://localhost:9000</value> </property> </configuration>
7、打开etc/hadoop/hdfs-site.xml
sudo gedit etc/hadoop/hdfs-site.xml
编辑内容如下:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> </configuration>
8、此时,hdfs的配置已经完成。可以开启namenode 、secondarynomenode、datanode了。此时,hadoop-2.7.1建议我们使用hdfs而不是hadoop脚本,而且部分hdfs的操作放在sbin目录的脚本里面。所以:
#格式化namenode bin/hdfs namenode -format #开启hdfs的相关节点 sbin/start-dfs.sh #关闭hdfs节点 sbin/stop-dfs.sh
可以使用浏览器url:localhost:50070进行web查看管理。
9、配置yarn计算框架(算是Map/Reduce的升级版)
打开etc/hadoop/mapred-queues.xml.template
sudo gedit etc/hadoop/mapred-queues.xml.template
编辑内容如下:
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
10、打开etc/hadoop/yarn.site.xml
sudo gedit etc/hadoop/yarn-site.xml
编辑如下:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> </configuration>
11、此时,关于yarn计算框架也配置完成了,可以开始使用了。
#启动yarn sbin/start-yarn.sh #关闭yarn sbin/stop-yarn.sh
12、已经配置完成,全部开启之后,输入命令:
jps
出现以上输出,即是说明安装配置完成了。
注意:如果在开启的时候,出现无法创建、打开目录文件的情况时,即是说明,当前用户没有此文件操作权限,所以需要修改权限:
sudo chmod 777 *
尤其是修改hadoop-2.7.1目录、logs目录及其中文件、etc目录及其中的hadoop目录及其其中的文件,这些的权限。
以上,便安装配置完成了。以下链接是所需要的安装包:
以及hadoop-1.2.1的安装配置文章:
相关推荐
本文将详细探讨与"Hadoop.dll"和"winutils.exe"相关的知识点,以及它们在Hadoop-2.7.1版本中的作用。 Hadoop.dll是Hadoop在Windows操作系统上的一个关键组件,它是Apache Hadoop对Windows平台的适配部分。由于...
在安装和配置Hadoop时,你需要修改conf目录下的配置文件,如core-site.xml(定义HDFS的基本属性)、hdfs-site.xml(设置HDFS的参数)、mapred-site.xml(设置MapReduce参数)和yarn-site.xml(配置YARN)。...
根据提供的文件信息,我们可以深入探讨Hadoop-2.7.1的相关知识点,包括其特性、安装配置步骤以及可能的应用场景等。 ### Hadoop-2.7.1版本概述 Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它...
压缩包子文件的文件名称列表中只有一个条目:"hadoop-2.7.1",这可能是解压后的Hadoop安装目录,包含了一系列的配置文件、可执行文件和其他相关组件。用户在Windows上解压这个文件后,可能需要按照提供的说明或者...
《Hadoop Common 2.7.1:基础工具包详解》 Hadoop作为一个开源的分布式计算框架,其组件众多,而“hadoop-common-2.7.1-bin-master.zip”正是其中的重要组成部分——Hadoop Common的工具包。这个压缩包包含了运行...
Hadoop Eclipse Plugin 2.7.1 是一个强大的工具,它将流行的开源大数据处理框架Hadoop与Java开发环境Eclipse紧密集成,极大地简化了Hadoop应用的开发和调试过程。这个插件允许开发者在Eclipse中直接创建、编辑、构建...
10. **安装与部署**:安装Hadoop 2.7.1通常涉及解压`hadoop-2.7.1.tar.gz`,配置环境变量,格式化HDFS,启动守护进程等步骤。集群部署还需要考虑节点间的通信和数据同步。 综上所述,Hadoop 2.7.1是一个强大的大...
1. **配置环境变量**:将Hadoop的安装路径添加到系统PATH环境变量中,以便在任何目录下都能执行Hadoop命令。 2. **配置Hadoop配置文件**:修改`core-site.xml`和`hdfs-site.xml`,设定HDFS的命名节点和数据节点,...
《Hadoop Winutils.exe在2.7.1版本中的应用与配置详解》 Hadoop作为一个分布式计算框架,广泛应用于大数据处理领域。在Windows环境中,Winutils.exe和hadoop.dll是Hadoop的重要组成部分,它们为Hadoop在Windows上的...
2. HA(High Availability):Hadoop 2.7.1支持NameNode和ResourceManager的高可用性,这意味着可以配置多个NameNode或ResourceManager,以防止单点故障。 3. Erasure Coding:这是一种新的数据冗余策略,可以替代...
《深入理解Hadoop Common 2.7.1:构建大数据处理基石》 Hadoop Common是Apache Hadoop项目的核心组件之一,它提供了Hadoop生态系统中所有其他模块所必需的基础设施和服务。在本文中,我们将深入探讨Hadoop Common ...
《Hadoop Common 2.7.1:深入理解与应用》 Hadoop作为一个开源的分布式计算框架,其组件众多,而Hadoop Common是其中的基础模块,包含了许多Hadoop系统运行所必需的工具和服务。本篇将围绕"Hadoop-common-2.7.1-bin...
本文将深入探讨Hadoop Common 2.7.1与HBase 2.0.0之间的关系,以及在Windows环境下如何正确安装和配置这两个组件。 Hadoop是Apache软件基金会开发的一个开源框架,主要用于处理和存储大规模数据集。Hadoop Common是...
1. **Hadoop-Eclipse插件安装与配置**:要使用Hadoop-Eclipse插件,首先需要在Eclipse中安装该插件。这可以通过Eclipse的“Help”菜单 -> "Install New Software" -> "Add" 来完成,然后提供下载的插件JAR文件路径...
《Hadoop-2.7.1分布式安装手册》是一份详尽的指南,旨在帮助用户在不同的模式下安装和配置Apache Hadoop 2.7.1。Hadoop是开源的大数据处理框架,它允许在廉价硬件上进行大规模数据处理,具有高容错性和可扩展性。这...
1. **项目创建与管理**:通过Eclipse的菜单,开发人员可以直接创建新的Hadoop MapReduce项目,设置项目属性,包括指定Hadoop配置文件路径,以及选择运行的Hadoop版本。 2. **资源管理**:可以直观地查看和管理HDFS...
安装Hadoop-2.7.1时,你需要将`bin`目录添加到系统路径中,这样你就可以在命令行中直接运行`hadoop`和`winutils`命令。此外,还需要配置Hadoop的配置文件,如`core-site.xml`和`hdfs-site.xml`,这些文件定义了...
在CentOS上部署Hadoop通常涉及到安装Java环境、配置SSH无密码登录、格式化HDFS、启动Hadoop服务等一系列步骤。 总的来说,Hadoop-2.7.1是一个强大且广泛使用的分布式计算平台,其在数据处理和分析方面发挥着重要...