1、新建用户和组
addgroup hadoop
adduser --ingroup hadoop hadoop
注销root以hadoop用户登录
2、配置SSH
ssh-keygen -t rsa(密码为空,路径默认)
cp .ssh/id_rsa.pub .ssh/authorized_keys
3、准备HADOOP运行环境
wget http://archive.apache.org/dist/hadoop/common/hadoop-1.1.2/hadoop-1.1.2.tar.gz
tar -xzvf hadoop-1.1.2.tar.gz
在/home/hadoop/.bashrc 中追加:
export PATH=/home/hadoop/hadoop-1.1.2/bin:$PATH
重新登录就生效
ssh localhost
which hadoop
4、配置HADOOP运行参数
vi conf/core-site.xml
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoop/tmp</value>
</property>
vi conf/hdfs-site.xml
<property>
<name>dfs.name.dir</name>
<value>/home/hadoop/dfs/filesystem/name</value>
</property>
<property>
<name>dfs.data.dir</name>
<value>/home/hadoop/dfs/filesystem/data</value>
</property>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
vi conf/mapred-site.xml
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
<property>
<name>mapred.tasktracker.map.tasks.maximum</name>
<value>4</value>
</property>
<property>
<name>mapred.tasktracker.reduce.tasks.maximum</name>
<value>4</value>
</property>
<property>
<name>mapred.system.dir</name>
<value>/home/hadoop/mapreduce/system</value>
</property>
<property>
<name>mapred.local.dir</name>
<value>/home/hadoop/mapreduce/local</value>
</property>
5、格式化名称节点并启动集群
hadoop namenode -format
6、启动集群并查看WEB管理界面
start-all.sh
访问http://localhost:50030可以查看 JobTracker 的运行状态
访问http://localhost:50060可以查看 TaskTracker 的运行状态
访问http://localhost:50070可以查看 NameNode 以及整个分布式文件系统的状态,浏览分布式文件系统中的文件以及 log 等
7、停止集群
stop-all.sh停止集群
相关推荐
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
伪分布式模式将守护进程部署在单个机器上,但是每个守护进程都运行在不同的JVM进程中,模拟集群的运行环境。 从给定文件内容来看,我们首先需要准备的有以下基本软件: 1. VMware虚拟机软件:作为虚拟化平台,用于...
注意,这只是一个基础的Hadoop单机伪分布式环境,如果你想要模拟更接近真实生产环境的分布式集群,还需要设置多个节点,配置网络和NameNode高可用等。但在学习和测试阶段,单机伪分布式环境足够使用。
### Hadoop伪分布式安装知识点详解 #### 一、Hadoop伪分布式概述 Hadoop是一种能够处理海量数据的大规模分布式计算框架。它通过将任务分解到多个计算机节点上并行处理来提高数据处理效率。Hadoop支持多种运行模式,...
本篇将详细介绍如何在本地计算机上搭建Hadoop的伪分布式集群环境,这非常适合初学者进行学习和测试。 首先,我们需要了解Hadoop的组成部分。Hadoop主要由两个核心组件构成:HDFS(Hadoop Distributed File System)...
本教程将指导你如何在不同的模式下安装和配置 Hadoop,包括单机模式、伪分布式模式和分布式集群模式。 首先,我们从**SSH免密登录**开始。SSH (Secure Shell) 是用于远程访问Linux主机的安全协议。在Hadoop环境中,...
单机模式仅在本地启动一个Hadoop进程,而伪分布式模式则模拟多节点集群环境,每个节点在本地运行。 **实验步骤:** 1. **安装Ubuntu 20.04.3**:在虚拟机中安装操作系统,确保系统更新至最新版本。 2. **安装JDK8*...
在本文中,我们将详细介绍如何在Ubuntu 12.04上安装Hadoop 1.0.4的伪分布式模式。首先,我们来看看安装环境和基本概念。...遵循上述步骤,你可以在本地环境中成功搭建起一个运行中的Hadoop伪分布式集群。
本教程将详细介绍如何在Ubuntu 12.10操作系统上安装Hadoop的单机版和集群版。首先,确保你已经在VMware虚拟机上安装了Ubuntu 12.10系统,并准备安装Hadoop稳定版1.0.4。 **单机版安装步骤:** 1. **下载与解压...
本教程将详细介绍如何在本地机器上搭建 Hadoop 2.7.3 的伪分布式环境,为初学者提供一个实践和学习 Hadoop 的基础平台。 **总体环境** 在搭建 Hadoop 伪分布式环境之前,我们需要一个适合运行 Hadoop 的基础环境。...
用户可以轻松地在Hadoop集群上开发和运行处理海量数据的应用程序。Hadoop具有高可靠、 高扩展、高效性、高容错等优点。 Hadoop框架最核心的设计是HDFS(Hadoop Distributed File System)和MapReduce。HDFS为海量的...
对于想学习 Spark 的人而言,如何构建 Spark 集群是其最大的难点之一, 为了解决大家构建 Spark 集群的一切困难,Spark 集群的构建分为了五个步骤,从 零起步,不需要任何前置知识,涵盖操作的每一个细节,构建完整...
根据提供的文件信息,本文将详细解析如何在Ubuntu 16.04虚拟机环境下搭建Hadoop完全分布式集群。本文档适合已经具备基本Linux操作技能并对Hadoop有一定了解的读者。 ### 一、所需文件及软件 为了搭建Hadoop完全...
2. 安装JDK:这可能通过apt-get或yum命令在Ubuntu/CentOS等系统上进行,或者通过解压预下载的JDK包并设置环境变量。 3. 配置环境变量:设置JAVA_HOME指向JDK的安装路径,确保系统能找到Java运行时环境。 4. 解压...
【Hadoop 单节点伪分布式搭建】是一种适合学习和测试Hadoop环境的简易方式,无需配置复杂的多节点集群。在单节点伪分布式模式下,所有Hadoop服务都在同一个节点上以独立Java进程的方式运行,模拟分布式环境的行为,...
标题“Ubuntu 14.04.1 + Hadoop 2.4 完全分布式搭建要点”涉及到的是在Ubuntu 14.04.1操作系统上安装和配置Hadoop 2.4版本的过程,这是一个大数据处理框架,常用于分布式存储和计算任务。Hadoop的核心组件包括HDFS...
伪分布式模式是指所有的Hadoop守护进程在一台机器上运行,并且对外表现得就像是一个分布式的集群环境。这种模式对于学习、开发和测试非常有用。 ### 2. 操作系统环境准备 Hadoop通常在Linux环境下安装,尤其是...
在Linux虚拟机上安装Hadoop的伪分布式模式,是学习和测试Hadoop功能的理想方式,因为它可以在一台机器上模拟多节点集群的行为。下面将详细介绍在Ubuntu Linux系统上进行Hadoop伪分布式安装的步骤。 首先,确保你...
在Ubuntu环境下搭建Hadoop伪分布式模式,主要是为了模拟多节点Hadoop集群的环境,以便于学习和测试Hadoop的功能。这个过程涉及到多个步骤,包括必要的资源下载、软件安装、环境配置以及Hadoop服务的启动与验证。以下...