安装linux
详细步骤参考文章:http://hermosa-young.iteye.com/admin/blogs/1776184
安装java
详细步骤参考文章:http://hermosa-young.iteye.com/admin/blogs/1798026
在官网上下载Hadoop
地址:http://labs.mop.com/apache-mirror/hadoop/common/hadoop-1.1.1/
将下载好的安装文件,拷贝到共享文件夹:E:\share1下,如下图所示。
在CentOS系统中,查看该安装文件,如下图所示。
在该文件拷贝到/usr下,并查看该文件,如下图所示。
解压到/usr目录下,如下图所示。
会在usr下生成hadoop-1.1.1目录,将目录名称改为hadoop,如下图所示。
修改配置文件,如下图所示。
将下图中标注行开头的“#”去掉,并修改路径信息,保存退出。
Hadoop配置
修改三个配置文件分别是core-site.xml,hdfs-site.xml和mapred-site.xml。
修改core-site.xml,如下图所示。
修改hdfs-site.xml,如下图所示。
修改mapred-site.xml,如下图所示。
此时执行ssh localhost,会看到需要输入密码,如下图所示。
现在进行免密码SSH配置,输入如下命令,之后一直按<Enter>键,就会按照默认的选项将生成的密钥对保存在.ssh/id_rsa文件中,如下图所示。
再进入到.ssh目录,执行如下命令,之后再执行ssh localhost命令,就可以实现用SSH连接并且不需要输入密码,如下图所示。
现在要运行Hadoop
首先格式化分布式文件系统,如下图所示。
启动Hadoop守护进程。输入命令,如下图所示。
成功执行后,将在本机上启动NameNode,DataNode,JobTracker,TaskTracker和Secondary NameNode
通过http://localhost:50070查看NameNode运行情况,如下图所示。
通过http://localhost:50030查看Jobtracker运行情况,如下图所示。
关闭系统,如下图所示。
相关推荐
在搭建Hadoop伪分布式环境的过程中,常常会遇到与文件系统权限相关的错误,特别是在CentOS这样的Linux发行版上。本文将详细解析标题和描述中提到的两个常见问题,并提供解决方案。 问题1:启动集群时出错:`mkdir: ...
本教程详细指导如何在Ubuntu 14.04 64位系统上配置Hadoop的伪分布式环境。虽然教程是基于Ubuntu 14.04,但同样适用于Ubuntu 12.04、16.04以及32位系统,同时也适用于CentOS/RedHat系统的类似配置。教程经过验证,...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
以上知识点详细地阐述了在CentOS系统上配置Hadoop伪分布式环境的全过程,包括了环境准备、JDK安装、环境变量配置、Hadoop配置文件修改、SSH无密码登录配置、集群的启动和使用,以及常用命令的介绍。对于初学者来说,...
在本教程中,我们将深入探讨如何在VMware虚拟机中安装CentOS7.0操作系统,并配置Hadoop3.1的伪分布式环境。这个过程对于学习Hadoop基础、大数据处理和分布式计算至关重要。以下是对整个搭建过程的详细步骤和知识点的...
centos6.2下hadoop全分布式集群配置
本文将详细介绍如何在 CentOS 6.5 环境中部署 Hadoop 2.6 伪分布式环境,包括环境准备、Hadoop 安装、配置和测试等步骤。 环境准备 在开始部署 Hadoop 之前,需要准备好 Linux 环境。这里选择 CentOS 6.5 作为操作...
Hadoop的安装分为单机方式、伪分布式方式和完全分布式方式。 这里主要讲解在CentOS6.5环境中Hadoop的伪分布式安装配置。
本教程针对的是在CentOS 6.4操作系统上安装Hadoop 2.6.0的伪分布式配置,这种配置方式适合初学者和开发者进行本地测试和学习,它在一个单一节点上模拟分布式环境。 **环境准备** 在开始安装前,确保你的系统是...
需要注意的是,Hadoop伪分布式集群虽然只在一台机器上模拟了多个节点,但它能帮助开发者理解Hadoop的架构和基本工作原理,是单机学习和测试Hadoop的常用方式。然而,在生产环境中,通常会部署完全分布式集群,以实现...
- **定义**:Hadoop可以在单个节点上以伪分布式模式运行,这意味着虽然只有一个物理节点,但是不同的Hadoop组件(如NameNode和DataNode)会分别运行在不同的Java进程中。 - **特点**: - 模拟了分布式环境。 - 有...
Hadoop是大数据处理的基石,而伪分布式安装是Hadoop的基本配置之一。在本资源中,我们将详细介绍Hadoop伪分布式安装的步骤,包括宿主机和客户机的网络连接、Hadoop的伪分布安装步骤、JDK的安装、Hadoop的安装等。 1...
本篇将详细介绍如何在本地计算机上搭建Hadoop的伪分布式集群环境,这非常适合初学者进行学习和测试。 首先,我们需要了解Hadoop的组成部分。Hadoop主要由两个核心组件构成:HDFS(Hadoop Distributed File System)...
### CentOS 下安装伪分布式 Hadoop-1.2.1 的详细步骤 ...至此,已经完成了在 CentOS 下伪分布式模式的 Hadoop-1.2.1 的安装与基本配置。这为后续进行 Hadoop 相关的大数据处理任务提供了坚实的基础。
### 基于VM+CentOS+hadoop2.7搭建Hadoop完全分布式集群的知识点解析 #### 一、概述 本文旨在详细介绍如何使用VMware Workstation(简称VM)结合CentOS 6.5操作系统来搭建Hadoop 2.7的完全分布式集群。此文档是根据...
hadoop2.7分布式完全安装配置手册,含hbase1.2安装配置,图文并茂,一看就会。
伪分布式模式是指所有的Hadoop守护进程在一台机器上运行,并且对外表现得就像是一个分布式的集群环境。这种模式对于学习、开发和测试非常有用。 ### 2. 操作系统环境准备 Hadoop通常在Linux环境下安装,尤其是...
在Centos7.0中搭建Haoop伪分布式环境,并用Java接口上传文件进行测试。