`

hadoop环境安装之单机模式

阅读更多

 

1.下载hadoop安装包
 
2.解压
   tar zxvf  hadoop-0.20.203.0rc1.tar.gz
 
3.设置环境变量
   将解压出来的hadoop目录export到环境变量中
 
4.在hadoop环境变量中设置JAVA_HOME
   vi hadoop-env.sh中写入
    export JAVA_HOME=/home/ymkyve/ytool/jdk1.6.0_24
 
5.安装ssh 及设置自动登录
   $ sudo apt-get install ssh

 $ ssh-keygen -t dsa -P '' -f ~/.ssh/id_dsa  
 $ cat ~/.ssh/id_dsa.pub >> ~/.ssh/authorized_keys

 $ ssh localhost   不需要输密码就可以了

单机模式就可以了,在hadoop安装目录下执行这些命令看看效果就可以了
$ mkdir input  
$ cp conf/*.xml input  
$ bin/hadoop jar hadoop-*-examples.jar grep input output 'dfs[a-z.]+' 
$ cat output/*
 
在单机模式下只要修改hadoop脚本就可以debug了
elif [ "$COMMAND" = "jar" ] ; then
  CLASS=org.apache.hadoop.util.RunJar
  HADOOP_OPTS="$HADOOP_OPTS $HADOOP_CLIENT_OPTS"
  HADOOP_OPTS="$HADOOP_OPTS -Xdebug -Xrunjdwp:transport=dt_socket,address=8787,server=y,suspend=y"
加上这段
 
input/test.txt
aa
b
a
b
d
c


执行go.sh脚本即可 
rm -rf output
hadoop jar hadoop-test.jar input output

查看output的结果
#vi part-r-00000

a       1
aa      1
b       2
c       1
d       1
 
分享到:
评论

相关推荐

    Hadoop环境安装设置(最简单的hadoop单机环境部署教程)

    Hadoop环境安装设置(最简单的hadoop单机环境部署教程) 安装前设置 SSH设置和密钥生成 安装Java.下载Java (JDK<最新版> - X64 ... 下载Hadoop.下载来自Apache基金会软件,使用下面 ... Hadoop操作模式 在单机模式下...

    Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04

    本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结: 1. 安装前的准备工作:创建 hadoop 用户,设置密码,增加...

    Hadoop安装教程_单机_伪分布式配置

    本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式和伪分布式模式。无论您是初学者还是有一定经验的技术人员,本教程都将帮助您顺利完成Hadoop的安装和配置。 #### 二、环境准备 1....

    Hadoop3.1.3安装和单机/伪分布式配置

    - **掌握Hadoop3.1.3的安装与配置**:包括单机模式和伪分布式模式。 - **理解Hadoop的工作原理**:特别是其在不同模式下的运行机制。 - **熟悉Hadoop的常用操作**:如文件上传、数据处理等。 #### 二、实验原理 ##...

    安装Hadoop(单机版和集群)步骤

    【安装Hadoop(单机版和集群)步骤】 在IT领域,Hadoop是一个分布式计算框架,主要用于处理和存储海量数据。本教程将详细介绍如何在Ubuntu 12.10操作系统上安装Hadoop的单机版和集群版。首先,确保你已经在VMware...

    hadoop 单机安装

    ### Hadoop单机模式安装详解 #### 一、前言 Hadoop是一个开源软件框架,用于分布式存储和处理大规模数据集。它最初由Apache软件基金会开发,并被广泛应用于大数据处理领域。对于初学者来说,了解如何在单机模式下...

    云计算应用实验报告 武汉理工大学云计算应用 hadoop单机模式和伪分布式

    单机模式仅在本地启动一个Hadoop进程,而伪分布式模式则模拟多节点集群环境,每个节点在本地运行。 **实验步骤:** 1. **安装Ubuntu 20.04.3**:在虚拟机中安装操作系统,确保系统更新至最新版本。 2. **安装JDK8*...

    hadoop环境配置(单机集群)

    本文旨在详细介绍如何在虚拟机上安装Hadoop环境,并搭建单机集群。通过图文并茂的方式,帮助读者深入理解每一个步骤。 #### 二、准备工作 为了确保安装过程顺利进行,首先需要准备以下环境: - **虚拟机版本**:VM...

    Ubuntu下搭建Hadoop单机模式环境

    本文主要介绍了在Ubuntu系统上Hadoop单机版测试环境的搭建过程。

    从零起步搭建Hadoop单机和伪分布式开发环境图文教程.

    5. 配置Hadoop单机模式:修改Hadoop配置文件,让Hadoop运行在单机模式。 6. 测试Wordcount示例:运行Hadoop自带的Wordcount示例,验证环境搭建是否成功。 搭建伪分布式开发环境的步骤大致与单机模式相似,但是需要...

    Hadoop单机模式的配置与安装

    【Hadoop单机模式配置与安装详解】 在深入探讨Hadoop单机模式的配置与安装之前,首先要明白Hadoop是一个开源的分布式计算框架,由Java编写,因此在安装Hadoop之前,必须确保系统中已安装Java Development Kit (JDK)...

    ubuntu环境下hadoop环境搭建(伪分布模式)

    在Ubuntu环境下搭建Hadoop伪分布式模式,主要是为了模拟多节点Hadoop集群的环境,以便于学习和测试Hadoop的功能。这个过程涉及到多个步骤,包括必要的资源下载、软件安装、环境配置以及Hadoop服务的启动与验证。以下...

    hadoop单机版安装

    本篇将详细介绍如何在单机环境下安装Hadoop,以便初学者理解其基本操作和工作原理。 首先,我们需要了解Hadoop的核心组件。Hadoop主要包括两个主要部分:Hadoop Distributed File System (HDFS) 和 MapReduce。HDFS...

    Hadoop课程实验和报告——Hadoop安装实验报告

    需要注意的是,Hadoop支持三种运行模式:单机单节点模式、单机多节点的伪分布模式和多机多节点分布模式。 二、Hadoop和Eclipse的结合 Hadoop可以与Eclipse集成,以便于项目的开发和调试。首先,需要下载Eclipse,...

    hadoop单机配置

    hadoop单机配置是指在单个机器上安装和配置hadoop环境的过程。下面将逐步介绍hadoop单机配置的详细过程。 一、安装Linux操作系统 安装Linux操作系统是hadoop单机配置的第一步。在这里,我们选择了Ubuntu 11.10作为...

    hadoop 单机安装和集群安装总结

    ### Hadoop单机安装与集群安装相关知识点 #### 一、文档概述 本文档主要针对Hadoop的安装和配置过程进行了详细的说明,旨在简化Hadoop的部署流程。它覆盖了Hadoop单机安装以及集群安装的过程,并且适用于CentOS 5/...

    ubuntu hadoop单机模式安装详解.pdf

    总结,本文档详细阐述了在Ubuntu上安装Hadoop单机模式的完整过程,从操作系统安装到Hadoop用户创建,再到SSH无密码登录,涵盖了构建Hadoop环境所需的基本步骤。对于初学者来说,这是一个很好的起点,为深入学习...

    hadoop-2.6.0单机模式配置文件

    本文将详细讲解如何配置Hadoop 2.6.0的单机模式,以便于初学者理解和实践。 一、Hadoop简介 Hadoop是由Apache基金会开发的分布式计算框架,基于Google的GFS(Google File System)和MapReduce模型。它的核心包括两...

    Cygwin+Eclipse搭建Hadoop单机开发环境-1

    Hadoop的单机模式是开发和测试Hadoop应用程序的理想选择,因为它不需要集群,只需在本地机器上运行。下载Hadoop的源代码或二进制发行版,解压到你电脑上的一个目录,然后更新Hadoop配置文件(如`conf/hadoop-env.sh`...

Global site tag (gtag.js) - Google Analytics