1.3　准备Hadoop源代码

tenght

浏览: 53211 次

最近访客更多访客>>

jxqc_job

汽车城路

极品拖拉机

aubdiy

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

1.3　准备Hadoop源代码

在Hadoop的官方网站（http://hadoop.apache.org/）中，可以找到Hadoop项目相关的信息，如图1-14所示。

1.3.1　下载Hadoop

前面在介绍Hadoop生态系统的时候，已经了解到Hadoop发展初期的系统中包括Common（开始使用的名称是Core）、HDFS和MapReduce三部分，现在这些子系统都已经独立，成为Apache的子项目。但在Hadoop 1.0的发行包中，Common、HDFS和MapReduce还是打包在一起，我们只需要下载一个hadoop-1.0.0.tar.gz包即可。注意，Hadoop官方也提供Subversion（SVN）方式的代码下载，SVN地址为http://svn.apache.org/repos/asf/hadoop/common/tags/release-0.1.0/。

熟悉Subversion的读者，也可以通过该地址下载Hadoop1.0版本代码，该Tag也包含了上述三部分的代码。

Apache提供了大量镜像网站，供大家下载它的软件和源码，上面提到的hadoop-1.0.0.tar.gz的一个下载地址为http://apache.etoak.com/hadoop/common/hadoop-1.0.0，如图1-15所示。

该地址包含了Hadoop 1.0的多种发行方式，如64位系统上的hadoop-1.0.0-1.adm64.rpm、不包含源代码的发行包hadoop-1.0.0.bin.tar.gz等。下载的hadoop-1.0.0.tar.gz是包括源代码的Hadoop发行包。

1.3.2　创建Eclipse项目

解压下载的hadoop-1.0.0.tar.gz包，假设解压后Hadoop的根目录是E:\hadoop-1.0.0，启动Cygwin，进入项目的根目录，我们开始将代码导入Eclipse。Hadoop的Ant配置文件build.xml中提供了eclipse任务，该任务可以为Hadoop代码生成Eclipse项目文件，免去创建Eclipse项目所需的大量配置工作。只需在Cygwin下简单地执行“ant eclipse”命令即可，如图1-16所示。

在Ubutu环境下注意安装：ant、libtool。

注意　该过程需要使用UNIX的在线编辑器sed，所以一定要在Cygwin环境里执行上述命令，否则会出错。

命令运行结束后，就可以在Eclipse中创建项目了。打开Eclipse的File→New→Java Project，创建一个新的Java项目，选择项目的位置为Hadoop的根目录，即E:\hadoop-1.0.0，然后单击“Finish”按钮，就完成了Eclipse项目的创建，如图1-17所示。

完成上述工作以后，Eclipse提示一个错误：“Unbound classpath variable: 'ANT_HOME/lib/ant.jar' in project 'hadoop-1.0.0'”。

显然，我们需要设置系统的ANT_HOME变量，让Eclipse能够找到编译源码需要的Ant库，选中项目，然后打开Eclipse的Project→Properties→Java Build Path，在Libraries页编辑（单击“Edit”按钮）出错的项：ANT_HOME/lib/ant.jar，创建变量ANT_HOME（在接下来第一个对话框里单击“Varliable”，第二个对话框里单击“New”按钮），其值为Ant的安装目录，如图1-18所示。

由于本书只分析Common和HDFS两个模块，在Project→Properties→Java Build Path的Source页只保留两个目录，分别是core和hdfs，如图1-19所示。

完成上述操作以后，创建Eclipse项目的任务就完成了。