`

大数据系列2:建立开发环境编写HDFS和Map Reduce程序

阅读更多

1、在eclipse中配置hadoop插件

       hadoop-eclipse-plugin-1.2.1.jar 复制到eclipse/plugins目录下,重启eclipse

2、打开MapReduce视图

       Window-> Open Perspective -> Other 选择Map/Reduce,图标是个蓝色的象。

3、添加一个MapReduce环境

      eclipse下端,控制台旁边会多一个Tab,叫“Map/ReduceLocations”,在下面空白的地方点右键,选择“NewHadoop location...”,在弹出的对话框中填写如下内容:

Location name(取个名字)
Map/Reduce MasterJob TrackerIP和端口,根据mapred-site.xml中配置的mapred.job.tracker来填写)
DFS MasterName NodeIP和端口,根据core-site.xml中配置的fs.default.name来填写)

4、使用eclipseHDFS内容进行操作

    经过上一步骤,左侧“Project Explorer”中应该会出现配置好的HDFS,点击右键,可以进行新建文件夹、删除文件夹、上传文件、下载文件、删除文件等操作。

    注意:每一次操作完在eclipse中不能马上显示变化,必须得刷新一下。 

5、创建MapReduce工程

5.1配置Hadoop路径

      Window-> Preferences 选择 “Hadoop Map/Reduce”,点击“Browse...”选择Hadoop文件夹的路径。这个步骤与运行环境无关,只是在新建工程的时候能将hadoop根目录和lib目录下的所有jar包自动导入。

      5.2创建工程

      File ->New -> Project 选择“Map/ReduceProject”,然后输入项目名称,创建项目。插件会自动把hadoop根目录和lib目录下的所有jar包导入。

      5.3创建Mapper或者Reducer

      File ->New -> Mapper 创建Mapper,自动继承mapred包里面的MapReduceBase并实现Mapper接口。注意:这个插件自动继承的是mapred包里旧版的类和接口,新版的Mapper得自己写。Reducer同理。

 

 

 


 

APDPlat旗下十大开源项目

 

 

 

 

 

 

 

 

 

2
4
分享到:
评论
3 楼 CoderDream 2013-12-02  
不错,感谢分享!
2 楼 fighting_2013 2013-11-13  
往前一步 写道
hadoop2.2.0的eclipse插件有吗,用1.2.1的jar包连接不上!!


你的hadoop 2.2.0 开发环境搞好了吗?我也想知道怎样在hadoop 2.2.0下用eclipse开发
1 楼 往前一步 2013-11-11  
hadoop2.2.0的eclipse插件有吗,用1.2.1的jar包连接不上!!

相关推荐

    大数据技术基础实验报告-MapReduce编程.doc

    总的来说,这个实验报告详细介绍了如何在Eclipse环境中配置MapReduce开发环境,以及如何创建和运行基本的MapReduce作业。理解并掌握这些步骤对于学习和实践大数据处理至关重要,因为MapReduce是处理大规模数据集的...

    hadoop,map,reduce,hdfs

    除了命令行工具之外,HDFS还提供了Java API,允许开发者使用Java语言编写程序来与HDFS进行交互。这为应用程序提供了更灵活的方式来操作HDFS中的数据。 #### MapReduce MapReduce是一种编程模型,用于处理和生成...

    Hadoop大数据期末考试重点

    13. **Windows上的Hadoop开发环境**:在Windows上开发HDFS项目,必须设置Hadoop开发环境,否则会出现错误。 14. **MapReduce的定义**:MapReduce是Hadoop的核心组件,提供了一种并行处理大数据的计算模型。 15. **...

    Hadoop大数据开发基础-PPT课件

    【Hadoop大数据开发基础-PPT课件】是一个涵盖了Hadoop生态系统入门知识的教育资源,适合初学者和希望深入了解大数据处理技术的IT专业人士。本课件主要围绕Hadoop框架展开,包括其设计原理、核心组件以及实际应用。...

    DS_Hadoop:分布式系统项目构建 HDFS 和 MapReduce

    而MapReduce是Hadoop用于大规模数据处理的编程模型,它将复杂的计算任务分解为“映射”(map)和“化简”(reduce)两个阶段,使得在分布式环境中并行处理数据成为可能。 【标签】"Java" 表明这个项目使用Java语言实现...

    大数据实验四-MapReduce编程实践

    2. **实际编程经验积累**:通过编写MapReduce程序,积累了实际编程经验,熟悉了Hadoop和MapReduce的API。 3. **分布式计算的认识**:认识到分布式计算的局限性与优势,在实际应用中需要权衡数据规模和计算需求。 4. ...

    大数据技术与应用基础-教学大纲 (2).pdf

    5. MapReduce应用开发:掌握MapReduce编程模型,理解Map和Reduce阶段的工作流程,学会利用MapReduce解决实际问题。 6. 分布式数据库HBase:学习HBase的NoSQL特性,了解其列族存储模型,掌握HBase集群的安装和API...

    Hadoop大数据开发基础_教案.rar

    《Hadoop大数据开发基础》教程主要涵盖了大数据处理领域中的核心框架——Hadoop的全面学习。这份教案详尽地讲解了从Hadoop的基本概念到实际项目应用的各个环节,旨在帮助初学者掌握Hadoop的大数据处理能力。 第一章...

    Hadoop大数据开发基础

    **Hadoop大数据开发基础** Hadoop是Apache软件基金会的一个开源框架,专为处理和存储大量数据而设计。它以其分布式文件系统(HDFS)和MapReduce计算模型为核心,为企业和研究机构提供了处理海量数据的能力。这份名...

    IT18徐老师大数据完整视频

    4. MapReduce编程:深入讲解MapReduce的工作原理,通过实例演示如何编写Map和Reduce函数,处理实际问题。 5. 数据处理实战:可能包含数据清洗、数据转换、数据统计分析等案例,展示如何利用Hadoop处理大规模数据。 ...

    java操作hdfs.rar

    Java API是与HDFS进行交互的主要方式,它允许开发者编写程序来读取、写入和管理存储在HDFS上的文件。 在使用Java操作HDFS时,首先需要确保你已经在本地环境中安装了Hadoop,并且正确配置了环境变量。这包括设置`...

    清华大学-大数据系统基础-课件

    5. **5 mapreduce_137803753.pdf**:MapReduce的详解,包括Map和Reduce函数的编写、作业调度和容错机制等。 6. **9 nosql_17500381.pdf**:NoSQL数据库的讲解,可能包括其类型、使用场景和数据模型等。 7. **7 ...

    大数据技术基础实验报告-MapReduce编程 (2).docx

    以上就是MapReduce编程的基础知识,包括其工作原理、Eclipse集成开发环境的配置以及在Eclipse中创建和运行MapReduce程序的步骤。掌握这些知识,能帮助开发者更有效地利用Hadoop处理大数据问题。

    基于HDFS的spark分布式Scala程序测试

    除了使用Spark Shell之外,还可以通过IntelliJ IDEA等集成开发环境来编写Scala程序。在IntelliJ IDEA中创建一个新的Scala项目,并添加必要的依赖库(如Spark Core),就可以按照上面的方式编写WordCount程序。 ####...

    大数据技术和应用基础-教学大纲.docx

    5. MapReduce应用开发:通过eclipse环境,理解Map和Reduce的工作流程,掌握编写MapReduce程序的技巧。 6. 分布式数据库HBase:学习HBase的基本概念和API,掌握HBase集群的安装和使用。 7. 数据仓库工具Hive:理解...

    3 大数据基础 - MapReduce

    使用 Java 编写 HDFS 客户端程序需要引入 Hadoop 的依赖包,包括 hadoop-common、hadoop-hdfs、hadoop-client 等。然后在 Java 代码中使用 HDFS 客户端 API 访问 HDFS,进行文件上传、下载、删除等操作。 在使用 ...

    大数据技术基础实验报告-MapReduce编程.docx

    完成以上步骤后,开发者可以编写Map和Reduce函数的逻辑,并在Eclipse中直接运行和调试MapReduce作业,从而高效地处理大数据任务。在实际应用中,MapReduce常用于日志分析、搜索引擎索引构建、社交网络分析等多种场景...

Global site tag (gtag.js) - Google Analytics