`

Cygwin下Hadoop的安装与配置

阅读更多

Hadoop 支持 Linux 及 Windows 操作系统, 但其官方网站声明 Hadoop 的分布式操作在 Windows 上未做严格测试,建议只把 Windows 作为 Hadoop 的开发平台。在 Windows 环境上的安装步骤如下( Linux 平台类似,且更简单一些):

一、安装Cygwin

下载Cygwin,运行step.exe,选择从网络安装,选择安装路径和临时下载文件的存放路径,这里我将安装路径设为 F:/Cygwin ->Next ,在下面的目录中搜索ssh,注意这里ssh一定要选中,在后面的分布式配置中虚拟主机之间是通过ssh连接的。安装完成之后,把 Cgywin 的安装目录如 F:/Cygwin/bin 加到系统环境变量 PATH 中,这是因为运行 Hadoop 要执行一些 linux 环境下的脚本和命令。

 

 

二、安装Jdk

jdk的版本要求是1.5以上版本,最好是1.6,因为最新版的hadoop默认的是1.6的配置,在环境变量中配置JAVA_HOME,我的jdk位置是D:/Program Files/Java/jdk1.6.0_10

 

 

三、Hadoop

到 Hadoop 官方网站http://hadoop.apache.org下载Hadoop Core,目前 最新的版本是 0.21.0.每个版本之间都会有区别,我选择的是0.20.2版本, 将下载后的安装包解压到一个目录,本文假定解压到 F:/hadoop-0.20.2。

接下来开始配置,修改 conf/hadoop-env.sh 文件,在其中设置 JAVA_HOME 环境变量: export JAVA_HOME="D:/Program Files/Java/jdk1.6.0_10” (因为路径中 Program Files 中间有空格,一定要用双引号将路径引起来),注意如果这样配置在接下来仍会出现Java home is not set的错误的话,那么把export前面的#号去掉,最好直接去掉#以免麻烦。

至此,一切就绪,可以运行 Hadoop 了。以下的运行过程,需要启动 cygwin, 进入模拟 Linux 环境。在下载的 Hadoop Core 包中,带有几个示例程序并且已经打包成了 hadoop-0.20.2-examples.jar。其中有一个 WordCount 程序,功能是统计一批文本文件中各个单词出现的次数,我们先来看看怎么运行这个程序。Hadoop 共有三种运行模式: 单机(非分布式)模式,伪分布式运行模式,分布式运行模式,其中前两种运行模式体现不了 Hadoop 分布式计算的优势,并没有什么实际意义,但对程序的测试及调试很有帮助,我们先从这两种模式入手,了解基于 Hadoop 的分布式并行程序是如何编写和运行的。

 

 

分享到:
评论

相关推荐

    windows下配置cygwin、hadoop等并运行mapreduce及mapreduce程序讲解

    【Windows下配置Cygwin、Hadoop环境及MapReduce程序运行详解】 在Windows操作系统中运行Hadoop和MapReduce程序,通常需要借助Cygwin来模拟Linux环境,因为Hadoop主要设计用于类Unix系统。Cygwin是一个提供Linux环境...

    win7下Cygwin搭建Hadoop开发环境

    1. **下载与安装** 访问 Cygwin 官方网站 [http://www.cygwin.com/](http://www.cygwin.com/) 下载 `setup.exe` 文件。运行此文件时,可以选择自定义安装路径,并选择必要的软件包进行安装。 - **Base 类别**:...

    最新版cygwin4hadoop,cygwin2.761

    在Cygwin4hadoop的压缩包中,"cygwin4hadoop"很可能是包含了一系列预配置的Cygwin安装文件和设置,专门针对Hadoop环境进行了优化。这可能包括了安装脚本、必要的软件包列表,甚至可能有已经配置好的Hadoop二进制文件...

    在Windows上的Cygwin环境上安装Hadoop指南

    下面将详细介绍在Windows上的Cygwin环境下安装Hadoop的步骤,并解决一些常见问题。 首先,我们需要下载并安装Cygwin。访问Cygwin官方网站,选择适合你的Windows系统的安装包。在安装过程中,记得选择"Devel"类别下...

    cygwin+eclipse搭建hadoop开发环境,运行wordcount

    总的来说,这些文档和资料将帮助你搭建一个完整的Hadoop开发环境,从安装Cygwin和Eclipse,到配置Hadoop环境,最后通过运行WordCount实例来验证你的环境是否正确配置。这不仅对于初学者来说是一次很好的学习体验,也...

    Cygwin+Eclipse搭建Hadoop单机开发环境-2

    安装Hadoop的过程中,你需要下载Hadoop的tarball文件,解压到Cygwin的安装路径下。然后,配置Hadoop的环境变量,包括HADOOP_HOME、PATH等,以便在命令行中直接使用Hadoop命令。这通常通过编辑Cygwin的.bashrc或.bash...

    cygwin中安装hadoop+eclipse编译源码并调试

    总结来说,"cygwin中安装hadoop+eclipse编译源码并调试"是一个涉及多步骤的过程,包括安装Cygwin、配置环境、获取和编译Hadoop源码、导入Eclipse项目以及调试源码。这个过程对理解Hadoop的工作原理以及进行定制化...

    hadoop单节点配置

    在安装和配置 Hadoop 之前,需要确保机器上已经安装了以下软件: 1. JAVA 1.6.x:Hadoop 需要 JAVA 1.6.x 或更高版本来运行。 2. ssh:ssh 服务用于远程管理 Hadoop 进程。 3. Cygwin(仅限 Windows):对于 ...

    windows下安装hadoop

    本教程提供了详细的 Windows 下安装 Hadoop 的指导,涵盖了安装 Cygwin、配置环境变量、安装 Hadoop 软件包、配置 Hadoop 集群等步骤。按照本教程的指导,您将能够成功地在 Windows 系统中安装 Hadoop。

    Cygwin+Eclipse搭建Hadoop单机开发环境离线包-cygwin-setup

    在我们的场景中,Cygwin将帮助我们模拟一个与Hadoop兼容的环境。 1. **Cygwin的安装** - 下载Cygwin安装程序:访问Cygwin官方网站下载最新版本的安装程序,如`setup-x86.exe`(32位)。 - 运行安装程序,选择安装...

    hadoop 2.7.4 在 windows下配置文件

    在Windows环境下配置Hadoop 2.7.4是一项技术性的任务,涉及到多个步骤和关键配置文件的设置。Hadoop是一个开源框架,主要用于处理和存储大量数据,尤其适用于大数据分析。在Windows系统上运行Hadoop可能相对复杂,...

    Windows上安装Hadoop

    1. **下载与安装Cygwin**: - 访问Cygwin官方网站,下载最新版本的安装程序。 - 运行安装程序,选择“Direct Connection”以避免网络代理问题。 - 在选择软件包的过程中,确保添加以下关键组件: - `Devel`类别...

Global site tag (gtag.js) - Google Analytics