- 浏览: 39543 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
lenomon:
可以看看这个demo, M2eclipse 设置 Mave ...
Maven学习笔记(二)——Eclipse插件安装(m2eclipse)
Hadoop 支持 Linux 及 Windows 操作系统, 但其官方网站声明 Hadoop 的分布式操作在 Windows 上未做严格测试,建议只把 Windows 作为 Hadoop 的开发平台。在 Windows 环境上的安装步骤如下( Linux 平台类似,且更简单一些):
一、安装Cygwin
下载Cygwin,运行step.exe,选择从网络安装,选择安装路径和临时下载文件的存放路径,这里我将安装路径设为 F:/Cygwin ->Next ,在下面的目录中搜索ssh,注意这里ssh一定要选中,在后面的分布式配置中虚拟主机之间是通过ssh连接的。安装完成之后,把 Cgywin 的安装目录如 F:/Cygwin/bin 加到系统环境变量 PATH 中,这是因为运行 Hadoop 要执行一些 linux 环境下的脚本和命令。
二、安装Jdk
jdk的版本要求是1.5以上版本,最好是1.6,因为最新版的hadoop默认的是1.6的配置,在环境变量中配置JAVA_HOME,我的jdk位置是D:/Program Files/Java/jdk1.6.0_10
三、Hadoop
到 Hadoop 官方网站http://hadoop.apache.org下载Hadoop Core,目前 最新的版本是 0.21.0.每个版本之间都会有区别,我选择的是0.20.2版本, 将下载后的安装包解压到一个目录,本文假定解压到 F:/hadoop-0.20.2。
接下来开始配置,修改 conf/hadoop-env.sh 文件,在其中设置 JAVA_HOME 环境变量: export JAVA_HOME="D:/Program Files/Java/jdk1.6.0_10” (因为路径中 Program Files 中间有空格,一定要用双引号将路径引起来),注意如果这样配置在接下来仍会出现Java home is not set的错误的话,那么把export前面的#号去掉,最好直接去掉#以免麻烦。
至此,一切就绪,可以运行 Hadoop 了。以下的运行过程,需要启动 cygwin, 进入模拟 Linux 环境。在下载的 Hadoop Core 包中,带有几个示例程序并且已经打包成了 hadoop-0.20.2-examples.jar。其中有一个 WordCount 程序,功能是统计一批文本文件中各个单词出现的次数,我们先来看看怎么运行这个程序。Hadoop 共有三种运行模式: 单机(非分布式)模式,伪分布式运行模式,分布式运行模式,其中前两种运行模式体现不了 Hadoop 分布式计算的优势,并没有什么实际意义,但对程序的测试及调试很有帮助,我们先从这两种模式入手,了解基于 Hadoop 的分布式并行程序是如何编写和运行的。
发表评论
-
系统研究Java--容器(二)--使用Abstract类
2011-02-23 14:34 0这个示例在于演示通过继承java.util.Abstract来 ... -
Maven学习笔记(一)——安装与配置
2011-12-24 17:48 11111. 准备工作 操作系统 ... -
Maven学习笔记(二)——Eclipse插件安装(m2eclipse)
2011-12-24 19:06 1539如何安装Eclipse插件 关于如何安装Ecli ... -
Maven学习笔记(三)——坐标和依赖
2011-12-27 12:58 945参考书籍Maven实战:可在InfoQ的Minibook出下载 ... -
`nonmutating' is not defined (Ice)
2012-02-20 14:40 842说明出处:http://download.zeroc.com/ ... -
Java中的所有异常
2011-02-14 13:33 631原文地址:http://www.knowsky.com/540 ... -
Java中为什么实现了Serializable接口就具备了被序列化的能力以及serialVersionUID的作用
2011-02-14 13:38 706Java 规定的内部机制,实现 Serializable 接口 ... -
系统研究Java--容器(一)
2011-02-14 15:12 787如上图:java完整容器的结构图 个人觉得j ... -
Java中的volatile关键字
2011-02-18 10:09 651我们知道,在Java中设 ... -
系统研究Java--数组(一)
2011-02-22 15:55 647数组不可越界,如果越界将会得到一个表示程序错误的Runtim ... -
Java反射经典实例 Java Reflection Cookbook (初级)
2011-02-23 13:09 363原文地址:http://www.blogjava.net/ji ... -
系统研究Java--容器(二)--使用Abstract类
2011-02-23 14:34 626这个示例在于演示通过继承java.util.Abstract来 ... -
系统研究Java--容器(三)--Collection
2011-02-23 15:36 610<!-- ========== METHOD SUMMA ... -
系统研究Java--容器(五)--部分容器的底层实现
2011-02-23 16:28 851List和存储顺序 从List接口展开的实现类有ArrayL ... -
系统研究Java--容器(四)--Map和Set
2011-02-23 17:59 637Map是Java容器的又一长老 ... -
系统研究Java--容器(六)--Collections工具类
2011-03-01 14:36 810<!-- ========== METHOD SUMMA ... -
系统研究Java--I/O(一)
2011-03-03 16:14 604先占个位置,来两个图 -
abstract class 与 interface 的区别
2011-03-07 11:43 711对于abstract class 和 interf ... -
Java几种常用关键字总结
2011-03-25 11:00 6751.abstract abstract关键字可以用来修 ... -
一个简单的验证码生成工具--servlet版本
2011-05-13 21:20 692需要用到servlet-api.jar package co ...
相关推荐
【Windows下配置Cygwin、Hadoop环境及MapReduce程序运行详解】 在Windows操作系统中运行Hadoop和MapReduce程序,通常需要借助Cygwin来模拟Linux环境,因为Hadoop主要设计用于类Unix系统。Cygwin是一个提供Linux环境...
1. **下载与安装** 访问 Cygwin 官方网站 [http://www.cygwin.com/](http://www.cygwin.com/) 下载 `setup.exe` 文件。运行此文件时,可以选择自定义安装路径,并选择必要的软件包进行安装。 - **Base 类别**:...
在Cygwin4hadoop的压缩包中,"cygwin4hadoop"很可能是包含了一系列预配置的Cygwin安装文件和设置,专门针对Hadoop环境进行了优化。这可能包括了安装脚本、必要的软件包列表,甚至可能有已经配置好的Hadoop二进制文件...
下面将详细介绍在Windows上的Cygwin环境下安装Hadoop的步骤,并解决一些常见问题。 首先,我们需要下载并安装Cygwin。访问Cygwin官方网站,选择适合你的Windows系统的安装包。在安装过程中,记得选择"Devel"类别下...
总的来说,这些文档和资料将帮助你搭建一个完整的Hadoop开发环境,从安装Cygwin和Eclipse,到配置Hadoop环境,最后通过运行WordCount实例来验证你的环境是否正确配置。这不仅对于初学者来说是一次很好的学习体验,也...
安装Hadoop的过程中,你需要下载Hadoop的tarball文件,解压到Cygwin的安装路径下。然后,配置Hadoop的环境变量,包括HADOOP_HOME、PATH等,以便在命令行中直接使用Hadoop命令。这通常通过编辑Cygwin的.bashrc或.bash...
总结来说,"cygwin中安装hadoop+eclipse编译源码并调试"是一个涉及多步骤的过程,包括安装Cygwin、配置环境、获取和编译Hadoop源码、导入Eclipse项目以及调试源码。这个过程对理解Hadoop的工作原理以及进行定制化...
在安装和配置 Hadoop 之前,需要确保机器上已经安装了以下软件: 1. JAVA 1.6.x:Hadoop 需要 JAVA 1.6.x 或更高版本来运行。 2. ssh:ssh 服务用于远程管理 Hadoop 进程。 3. Cygwin(仅限 Windows):对于 ...
本教程提供了详细的 Windows 下安装 Hadoop 的指导,涵盖了安装 Cygwin、配置环境变量、安装 Hadoop 软件包、配置 Hadoop 集群等步骤。按照本教程的指导,您将能够成功地在 Windows 系统中安装 Hadoop。
在我们的场景中,Cygwin将帮助我们模拟一个与Hadoop兼容的环境。 1. **Cygwin的安装** - 下载Cygwin安装程序:访问Cygwin官方网站下载最新版本的安装程序,如`setup-x86.exe`(32位)。 - 运行安装程序,选择安装...
在Windows环境下配置Hadoop 2.7.4是一项技术性的任务,涉及到多个步骤和关键配置文件的设置。Hadoop是一个开源框架,主要用于处理和存储大量数据,尤其适用于大数据分析。在Windows系统上运行Hadoop可能相对复杂,...
1. **下载与安装Cygwin**: - 访问Cygwin官方网站,下载最新版本的安装程序。 - 运行安装程序,选择“Direct Connection”以避免网络代理问题。 - 在选择软件包的过程中,确保添加以下关键组件: - `Devel`类别...