在eclipse中用maven构建hadoop项目,能够非常方便的下载hadoop所依赖的jar包,而不需要自己一个个导入。
1. 安装maven (略过)
2. eclipse中配置maven (略过)
3. 创建maven项目
New -》 other -》 Maven -》 Maven project 点击next
勾选 use default workspace location 点击 next
选择 all catalogs -> group id现在org.apache.maven.archetypes artifact id选择maven-archetype-quickstart 点击next
填写groupid 和 artifac id 点击finish
4. 创建完毕后,打开pom.xml , 在 dependencies节点下增加:
<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-core</artifactId>
<version>1.1.2</version>
</dependency>
保存并刷新项目,可以看到已经在下载hadoop的jar包了
5. 修改hadoop配置文件
core-site.xml
hdfs-site.xml
mapred-site.xml
6. 接下来就可以开发mapred程序了
注意:在windows下开发完后并运行,会出现权限的问题,需要修改hadoop-core的源码。
解决方法是,修改/hadoop/src/core/org/apache/hadoop/fs/FileUtil.java文件
688-692行注释,然后重新编译源代码,重新打一个hadoop.jar的包。
相关推荐
Eclipse+Maven构建Hadoop项目的方法步骤 Eclipse是集成开发环境(IDE),Maven是项目管理工具,Hadoop是大数据处理框架。本文将详细介绍如何使用Eclipse和Maven构建Hadoop项目。 一、Maven介绍 Maven是一个项目...
【标题】"win下maven创建的hadoop程序demo"涉及了多个IT领域的知识点,包括Windows操作系统、Maven构建工具、...这个案例旨在帮助开发者了解和掌握在Windows上使用Maven构建Hadoop MapReduce程序的基本步骤和方法。
### 使用Maven编译Hadoop 2.7.1 的详细步骤及注意事项 #### 一、编译前的准备 **1.1 下载并解压Hadoop源码包** 根据作者gyqiang的说明,要编译的是Apache Hadoop 2.7.1版本,该版本发布于2016年1月4日,是当时...
综合上述技术,构建Hadoop分布式云盘系统不仅需要理解各个组件的工作原理,还需要掌握它们之间如何协同工作。本培训项目将通过实际搭建和测试Hadoop环境,使学员能够亲手实施每一个步骤,从安装配置到优化维护,确保...
在Hadoop项目中,Maven可以帮助我们管理依赖、构建项目、执行测试和打包应用。通过在pom.xml文件中配置相关依赖,我们可以轻松引入Hadoop的相关库。 3. **Hadoop**: Hadoop是由Apache基金会维护的开源项目,核心...
"mavenaddsrc"可能是指使用Maven构建Hadoop项目。Maven是Java项目管理工具,通过配置pom.xml文件,它可以自动下载依赖、编译代码、打包和执行测试。对于Hadoop项目,Maven可以帮助我们管理Hadoop库和其他相关依赖。 ...
Hadoop Maven Repository是一个重要的工具,它是Java开发人员在构建Hadoop相关项目时使用的资源库。Maven是一个项目管理和综合工具,它帮助开发者管理项目的构建、报告和文档等生命周期过程。而Hadoop Maven ...
而Maven是Java项目管理工具,能够帮助开发者管理和构建项目,包括处理依赖关系。本话题将详细探讨在Maven仓库中关于Hadoop以及与Hadoop相关的Hive依赖。 Hadoop的核心组件包括HDFS(Hadoop Distributed File System...
这是一个基于Java技术栈,利用SpringMVC、Spring、HBase和Maven构建的Hadoop分布式云盘系统的项目。该项目旨在实现一个高效的、可扩展的云存储解决方案,利用Hadoop的分布式特性来处理大规模数据存储需求。 首先,...
在 Hadoop 中,我们可以使用 Maven 构建 Hadoop 项目,简化了 MapReduce 项目的构建过程。Apache Pig 是一个基于 Hadoop 的大规模数据分析工具,提供了 SQL-LIKE 语言叫 Pig Latin,该语言的编译器会把类 SQL 的数据...
Maven是一个项目管理和综合工具,它简化了Java项目的构建、依赖管理和文档生成过程。Hadoop则是一个分布式计算框架,用于处理和存储大规模数据。通过Maven,我们可以方便地管理Hadoop相关库的依赖,使得开发和测试...
Maven则是一个项目管理工具,它能够帮助我们管理项目的依赖关系,自动化构建过程,使得项目的构建和部署更为便捷。 安装Eclipse后,我们需要配置Java开发环境,包括安装JDK,并在Eclipse中设置好Java的路径。接着,...
3. **Maven的POM.xml**:Hadoop项目中的`pom.xml`文件是Maven的项目对象模型,它包含了项目信息、构建指令、依赖关系等。在编译前,你需要检查这个文件,确保所有必要的依赖项都已列出,且版本正确。 4. **依赖管理...
3. **构建Hadoop项目** - **获取Hadoop源码**:从Hadoop官方仓库或GitHub克隆源代码。 - **配置Hadoop的pom.xml**:根据Hadoop项目的需求,可能需要在项目根目录下的pom.xml文件中添加或调整依赖项。 - **构建...
通过Maven,开发者可以轻松地管理和构建Hadoop项目,因为它能自动下载所需的依赖库,并按照特定的生命周期来编译、测试和打包代码。 WordCount程序是Hadoop MapReduce的入门示例,它由两个阶段组成:Map阶段和...
本篇内容将围绕“大数据企业实训项目:基于SpringMVC+Spring+HBase+Maven搭建的Hadoop分”这一主题进行深入探讨。本项目不仅涉及大数据处理的核心技术,还涵盖了当前流行的软件开发框架和工具,是大学生创业项目源码...
【标题】"lzo 2.0.6、hadoop-lzo-master、apache-maven" 涉及的主要是三个关键元素:LZO压缩库、Hadoop-LZO项目以及Apache Maven,这些都是在大数据处理和软件构建领域的重要工具。 【LZO 2.0.6】: LZO(Lempel-...