login as root
#cd ~
#wget http://apache.freelamp.com/hadoop/core/stable/hadoop-0.20.2.tar.gz
#mkdir /opt/hadoop
#cd /opt/hadoop
#mv /root/hadoop-0.20.2.tar.gz .
#tar xzvf hadoop-0.20.2.tar.gz
#cd hadoop-0.20.2
#vi conf/hadoop-env.sh
加入 export JAVA_HOME=/usr/java/jdk1.6.0_14
1、单机模式的操作方法
# mkdir input
# cp conf/*.xml input
# bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
# cat output/*
2、伪分布式模式的操作方法
1)conf/Core-site.xml代码
<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>
2)conf/hdfs-site.xml代码
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
3)conf/mapred-site.xml代码
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>
4)确认能否不输入口令就用ssh登录localhost:
#ssh localhost
如果不输入口令就无法用ssh登陆localhost,执行下面的命令:
#ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa
#cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys
5)格式化一个新的分布式文件系统:
#bin/hadoop namenode -format
6)启动Hadoop守护进程:
#bin/start-all.sh
7)将输入文件拷贝到分布式文件系统:
#bin/hadoop fs -put conf input
8)运行发行版提供的示例程序:
#bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+'
9)查看输出文件:
将输出文件从分布式文件系统拷贝到本地文件系统查看:
#bin/hadoop fs -get output output
#cat output/*
或者
在分布式文件系统上查看输出文件:
#bin/hadoop fs -cat output/*
10)完成全部操作后,停止守护进程:
#bin/stop-all.sh
参考文档 > http://hadoop.apache.org/common/docs/r0.18.2/cn/quickstart.html#Local
分享到:
相关推荐
实验主题:武汉理工大学云计算应用 - Hadoop单机模式与伪分布式 **实验目的与意义:** 本次实验旨在让学生理解并掌握Hadoop的两种基础运行模式:单机模式和伪分布式模式。Hadoop是云计算领域的重要组件,主要用于大...
本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式和伪分布式模式。无论您是初学者还是有一定经验的技术人员,本教程都将帮助您顺利完成Hadoop的安装和配置。 #### 二、环境准备 1....
虚拟机Ubuntu下hadoop2.6.0的安装与配置 (单机模式,伪分布式,完全分布式)非常详细的安装配置指南
5. 配置Hadoop单机模式:修改Hadoop配置文件,让Hadoop运行在单机模式。 6. 测试Wordcount示例:运行Hadoop自带的Wordcount示例,验证环境搭建是否成功。 搭建伪分布式开发环境的步骤大致与单机模式相似,但是需要...
本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结: 1. 安装前的准备工作:创建 hadoop 用户,设置密码,增加...
在Hadoop生态系统中,了解和配置不同的运行模式是至关重要的,这些模式包括独立模式、伪分布模式、完全分布式模式以及高可用性(HA)配置。接下来,我们将详细探讨这些模式及其相关的配置文件。 1. **独立模式**: ...
- **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 - **熟悉Hadoop的常用操作**:如文件上传、数据处理等。 #### 二、实验原理 ##...
本教程将指导你如何在不同的模式下安装和配置 Hadoop,包括单机模式、伪分布式模式和分布式集群模式。 首先,我们从**SSH免密登录**开始。SSH (Secure Shell) 是用于远程访问Linux主机的安全协议。在Hadoop环境中,...
配置Hadoop单机模式相对简单,只需在hadoop-env.sh文件中设置JAVA_HOME,然后编辑配置文件core-site.xml、hdfs-site.xml、mapred-site.xml和yarn-site.xml,设置必要的参数以指定NameNode和DataNode的存储路径,以及...
### Ubuntu11.10下安装Hadoop0.20.2(单机伪分布式) #### 一、安装虚拟机VMware Workstation v7.1.4 在开始Hadoop的安装之前,首先需要在宿主机上安装虚拟机软件VMware Workstation v7.1.4。这一步主要是为了搭建...
### Hadoop伪分布式模式配置与安装详解 #### 一、前言 在深入探讨Hadoop伪分布式模式的配置与安装之前,我们先简单回顾一下Hadoop的基本概念以及它为何重要。Hadoop是一个开源框架,用于分布式存储和处理大规模...
**Hadoop单机模式与伪分布模式详解** Hadoop是一个开源的分布式计算框架,它允许在廉价硬件上处理大规模数据集。Hadoop提供了多种运行模式,以满足不同环境的需求,其中最常见的两种是单机模式(Local Mode)和伪...
Hadoop 的伪分布式模式是在单机上模拟分布式环境的配置方式。这种配置方式可以模拟分布式环境,方便开发者测试和调试 Hadoop 程序。在伪分布式模式下,数据节点和名称节点均是本身,必须配置 SSH localhost 无密码...
Hadoop伪分布式安装及配置参考步骤 Hadoop是一种分布式系统基础架构,由Apache基金会开发,能够对大量数据进行分布式处理和存储。用户可以轻松地在Hadoop集群上开发和运行处理海量数据的应用程序。Hadoop具有高可靠...
- **伪分布式模式**: - **特点**: 单节点上启动多个组件 (NameNode, DataNode, JobTracker, TaskTracker 等)。 - **用途**: 适用于小规模测试和开发环境。 - **完全分布式模式**: - **特点**: 在多节点集群中部署...