单机安装主要用于程序逻辑调试。安装步骤基本通分布式安装,包括环境变量,主要Hadoop配置文件,SSH配置等。主要的区别在于配置文件:slaves配置需要修改,另外如果分布式安装中dfs.replication大于1,需要修改为1,因为只有1个datanode.
分布式安装请参考:
单机安装中,使用一台机器,即做namenode和JobTracker也是datanode和TaskTracker,当然也是SecondaryNameNode。
主要配置文件core-site.xml,hdfs-site.xml,mapred-site.xml,masters完全同分布树安装配置,如果分布式安装配置方案中hdfs-site.xml的副本数量定义大于1,则修改为1.
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
主要不同在于slaves的配置,分布式安装中是多个其他机器作为datanode,单机模式本机是datanode,所以修改slaves配置文件为本机的域名。如:本机机器名为hadoop11,则:
[hadoop@hadoop11 ~]$ cat hadoop/conf/slaves
hadoop11
完成配置后,启动:
$ start-all.sh
$ jps
15556 Jps
15111 JobTracker
15258 TaskTracker
15014 SecondaryNameNode
14861 DataNode
14712 NameNode
运行DEMO
$ echo word1 word2 word2 word3 word3 word3 > words
$ cat words
word1 word2 word2 word3 word3 word3
$ hadoop dfsadmin -safemode leave
$ hadoop fs -copyFromLocal words /single/input/words
$ hadoop fs -cat /single/input/words
12/02/17 19:47:44 INFO security.Groups: Group mapping impl=org.apache.hadoop.security.ShellBasedUnixGroupsMapping; cacheTimeout=300000
word1 word2 word2 word3 word3 word3
$ hadoop jar hadoop-0.21.0/hadoop-mapred-examples-0.21.0.jar wordcount /single/input /single/output
......
$ hadoop fs -ls /single/output
......
-rw-r--r-- 1 hadoop supergroup 0 2012-02-17 19:50 /single/output/_SUCCESS
-rw-r--r-- 1 hadoop supergroup 24 2012-02-17 19:50 /single/output/part-r-00000
$ hadoop fs -cat /single/output/part-r-00000
......
word1 1
word2 2
word3 3
分享到:
相关推荐
2. **配置环境变量**:打开系统环境变量设置,添加新的系统变量`HADOOP_HOME`,指向你的Hadoop安装目录(如`C:\Hadoop\hadoop-3.3.1`)。同时,将`PATH`变量中添加`%HADOOP_HOME%\bin`和`%HADOOP_HOME%\sbin`,以便...
- **本地模式**:开发者可以在单机上运行Hadoop,进行快速测试和调试,无需真实分布式环境。 - **日志与调试工具**:如Hadoop的日志框架Log4j和JMX监控,帮助开发者诊断问题。 5. **Hadoop生态与扩展** - **...
3. **配置Hadoop**:修改`etc/hadoop`目录下的配置文件,如`hadoop-env.sh`、`core-site.xml`、`hdfs-site.xml`和`mapred-site.xml`,设置Hadoop的相关参数,如HDFS的命名节点、数据节点路径等。 4. **格式化...
3. **配置环境变量**: 在系统环境变量中添加`HADOOP_HOME`,值设为你的Hadoop安装目录。同时,将`%HADOOP_HOME%\bin`添加到`PATH`环境变量中,使得命令行可以直接执行Hadoop命令。 **二、配置Hadoop** 1. **修改...
6. **hadoop-minicluster-1.2.1.jar**:这个库提供了在单机上运行小型Hadoop集群的能力,对于开发和测试环境非常有用。它允许开发者在本地环境中快速启动一个包含所有Hadoop服务的小型集群,无需复杂的分布式环境...
在Windows中配置Hadoop,首先需要安装Java Development Kit (JDK),因为Hadoop是用Java编写的,依赖JRE环境。接着,下载并解压"Hadoop-2.7.3"压缩包,配置环境变量,包括HADOOP_HOME、JAVA_HOME以及PATH,确保系统...
接下来,我们将介绍如何在Hadoop单机版上安装HBase,一个基于列族的分布式数据库。 1. **下载HBase**:获取HBase的相应版本,与你的Hadoop版本兼容。 2. **配置HBase**:类似Hadoop,设置HBASE_HOME和HADOOP_CONF_...
### Hadoop-2.8.5全面资料知识点详解 #### 一、Hadoop概述与版本说明 Hadoop是一个能够对大量数据进行分布式处理的软件框架,由Apache基金会开发。...希望本文对您理解Hadoop-2.8.5及其安装配置有所帮助。
在Ubuntu 14.04操作系统上配置Hadoop,无论是单机模式还是伪分布式模式,都是Hadoop初学者的重要步骤。Hadoop是一个开源的分布式计算框架,它允许在大量廉价硬件上处理大规模数据。这篇文章将详细介绍如何在Ubuntu...
### Hadoop与HBase集群及单机安装配置详解 #### 一、背景介绍 随着大数据技术的发展,Hadoop和HBase成为了处理大规模数据集的重要工具。Hadoop是一种能够存储和处理大量数据的分布式计算框架,而HBase则是在Hadoop...
本文将详细讲解如何配置Hadoop 2.6.0的单机模式,以便于初学者理解和实践。 一、Hadoop简介 Hadoop是由Apache基金会开发的分布式计算框架,基于Google的GFS(Google File System)和MapReduce模型。它的核心包括两...
standalone模式是Hadoop的一种运行模式,适合开发者进行本地测试和学习,因为它不需要集群环境,可以在单机上模拟Hadoop的运行情况。 在standalone模式下,Hadoop的所有组件(如HDFS和MapReduce)都在同一个JVM进程...
6. **Hadoop单机模式与伪分布式模式**: 在Windows上,你可以选择启动Hadoop的本地模式(适合快速测试)或伪分布式模式(模拟多节点集群)。本地模式下,所有服务都在一个Java进程中运行,而伪分布式模式则模拟多节点...
接下来,我们将详细探讨如何在单机环境下配置Hadoop和Spark的伪分布式模式。 首先,我们需要理解Hadoop的伪分布式配置。这涉及到以下几个步骤: 1. **下载Hadoop**: 获取Hadoop的源码或者二进制发行版,确保版本与...
《Hadoop-2.7.1分布式安装手册》是一份详尽的指南,旨在帮助用户在不同的模式下安装和配置Apache Hadoop 2.7.1。Hadoop是开源的大数据处理框架,它允许在廉价硬件上进行大规模数据处理,具有高容错性和可扩展性。这...
本教程将详细介绍"Hadoop-2.7.4 单机伪分布配置文件"的相关知识点,帮助你快速搭建本地单机模拟Hadoop集群环境。 首先,我们要理解什么是Hadoop的伪分布式模式。在伪分布式模式下,所有的Hadoop服务都在一台机器上...
Hadoop的出现,使得处理海量数据变得更加高效和便捷,尤其适合那些无法在单机上处理的大规模数据分析任务。 Eclipse和MyEclipse是广泛使用的Java IDE,它们提供了强大的代码编辑、调试和项目管理功能。然而,由于...
"单机Hadoop配置安装教程" 单机Hadoop配置安装是Hadoop beginners的不二之选,本篇文章将详细指导您如何在Windows平台上安装和配置Hadoop-2.5.2。通过亲自实验和实践,本教程将带您掌握单机Hadoop配置安装的所有...