1. 安装Hadoop到/home/xsj/hadoop:
$ tar -zxvf hadoop-0.20.2.tar.gz
2. 创建目录:
$ mkdir /home/xsj/hadoop/hadoop-0.20.2/hadooptmp
$ mkdir /home/xsj/hadoop/hadoop-0.20.2/hdfs/data
$ mkdir /home/xsj/hadoop/hadoop-0.20.2/hdfs/name
$ mkdir /home/xsj/hadoop/hadoop-0.20.2/mapred/local
$ mkdir /home/xsj/hadoop/hadoop-0.20.2/mapred/system
3. 修改~/hadoop/hadoop-0.20.2/conf/下的配置文件:
(1)hadoop-env.sh:
export JAVA_HOME=/usr/local/java/jdk1.6.0_32
(2)core-site.xml
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/xsj/hadoop/hadoop-0.20.2/hadooptmp</value>
</property>
</configuration>
(3)hdfs-site.xml
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
<property>
<name>dfs.name.dir</name>
<value>/home/xsj/hadoop/hadoop-0.20.2/hdfs/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/xsj/hadoop/hadoop-0.20.2/hdfs/data</value>
</property>
</configuration>
(4)mapred-site.xml
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
<property>
<name>mapred.local.dir</name>
<value>/home/xsj/hadoop/hadoop-0.20.2/mapred/local</value>
</property>
<property>
<name>mapred.system.dir</name>
<value>/home/xsj/hadoop/hadoop-0.20.2/mapred/system</value>
</property>
</configuration>
(5)masters
localhost
(6)slaves
localhost
4. 格式化HDFS文件系统:
$ ./bin/hadoop namenode -format
5. 启动Hadoop:
$ ./bin/start-all.sh
6. 验证Hadoop是否安装成功:
打开浏览器,分别输入网址:
http://localhost:50030 (MapReduce的Web页面)
http://localhost:50070 (HDFS的Web页面)
7. 关闭Hadoop:
$ ./bin/stop-all.sh
8. 特别注意:
(1)不要以root身份运行Hadoop,否则会涉及到Java虚拟机的-jvm选项问题,导致Hadoop启动失败。
(2)每次重启Hadoop之前,务必先删除hadooptmp文件夹,防止因hadoop的错误退出导致的启动namenode和jobtracker失败。
(3)单机伪分布式部署启动失败可以尝试格式化HDFS文件系统。
(4)有用的命令:$ jps
相关推荐
在深入探讨伪分布式Hadoop配置之前,我们先来了解下何为伪分布式模式。伪分布式模式是指Hadoop集群的所有守护进程运行在同一台机器上,但它们仍然通过网络(通常是在不同的端口上)进行通信。这种模式非常适合测试和...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
### CentOS 下安装伪分布式 Hadoop-1.2.1 的详细步骤 ...至此,已经完成了在 CentOS 下伪分布式模式的 Hadoop-1.2.1 的安装与基本配置。这为后续进行 Hadoop 相关的大数据处理任务提供了坚实的基础。
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
### Hadoop3.1.3安装与单机/伪分布式配置知识点详解 #### 一、实验目的和要求 - **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 ...
"Hadoop 伪分布式环境配置" Hadoop 伪分布式环境配置是指在单机上模拟 Hadoop 分布式环境的配置过程。这种配置方式可以模拟分布式环境,方便开发者测试和调试 Hadoop 程序。下面是 Hadoop 伪分布式环境配置的详细...
### Hadoop伪分布式模式配置与安装详解 #### 一、前言 在深入探讨Hadoop伪分布式模式的配置与安装之前,我们先简单回顾一下Hadoop的基本概念以及它为何重要。Hadoop是一个开源框架,用于分布式存储和处理大规模...
### Hadoop伪分布式安装知识点详解 #### 一、Hadoop伪分布式概述 Hadoop是一种能够处理海量数据的大规模分布式计算框架。它通过将任务分解到多个计算机节点上并行处理来提高数据处理效率。Hadoop支持多种运行模式,...
Hadoop伪分布式安装及配置参考步骤 Hadoop是一种分布式系统基础架构,由Apache基金会开发,能够对大量数据进行分布式处理和存储。用户可以轻松地在Hadoop集群上开发和运行处理海量数据的应用程序。Hadoop具有高可靠...
Hadoop安装教程_单机/伪分布式配置_Hadoop2.6.0/Ubuntu14.04
网上找的,适合于原生Hadoop2,包括Hadoop 2.6.0, Hadoop 2.7.1 等版本,主要参考了官方安装教程,步骤详细,辅以适当说明,相信按照步骤来,都能顺利安装并运行Hadoop。
下面我们将详细探讨如何配置单机伪分布式Hadoop。 1. **环境准备**:首先确保你的系统安装了Java Development Kit (JDK),因为Hadoop是用Java编写的,运行时需要JRE。你可以通过`java -version`命令检查是否已安装...
在本教程中,我们将深入探讨如何在VMware虚拟机中安装CentOS7.0操作系统,并配置Hadoop3.1的伪分布式环境。这个过程对于学习Hadoop基础、大数据处理和分布式计算至关重要。以下是对整个搭建过程的详细步骤和知识点的...
【标题】: "Hadoop伪分布式模式的配置与安装指南" 【内容】: Hadoop是一个开源的分布式计算框架,主要用于处理和存储大量数据。在学习和测试Hadoop时,我们通常会采用伪分布式模式,它在单个节点上模拟整个Hadoop...
2、大数据环境-安装Hadoop2.5.2伪分布式傻瓜教程 原创