`

ChainMapper和ChainReducer的实现原理

 
阅读更多

  由于项目中要用到ChainMapper和ChainReducer来实现数据处理流程的优化,故今天特意花了半天的时间研究了一下这两个类的实现源代码,先总结如下:

 实现类:Chain,ChainMapper , ChainReducer

第一步:配置链

         JobConf

        addMapper

        setReducer

        addMapper

第二步:实现:chain

        configue:

        map:

        reduce:

        close:

       传值还是传引用,使用过程中这点是很重要的,在map后或者reduce后你还需要使用这个值的话,这点是非常重要的。

分享到:
评论
1 楼 chenwq 2012-05-27  
Chain中貌似只有ChainMapper(addMapper),而没有ChainReducer(setReducer)啊?

相关推荐

    Hadoop实战-第二版-陆嘉恒 (2012版)

    1. Hadoop简介2.... Hadoop在yahoo的应用附录A: 云计算在线监测平台附录B: Hadoop安装、运行、使用说明附录C:使用DistributedCache的MapReduce程序附录D:使用ChainMapper和ChainReducer的MapReduce程序

    Hadoop实战-第2版-陆嘉恒.pdf

    1. Hadoop简介2.... Hadoop在yahoo的应用附录A: 云计算在线监测平台附录B: Hadoop安装、运行、使用说明附录C:使用DistributedCache的MapReduce程序附录D:使用ChainMapper和ChainReducer的MapReduce程序

    Hadoop in Action excerpt_index

    ### Hadoop in Action:...书中在第104至107页提到了ChainMapper和ChainReducer的用法。 通过深入理解这些技术和概念,读者能够更好地掌握Hadoop及其生态系统的强大功能,从而在大数据处理和分析领域取得更佳成果。

    hadoop2.5.1api

    此外,MapReduce API提供了新的编程模型,如ChainMapper和ChainReducer,使得开发者可以更方便地组合多个映射和化简操作。 4. **Hadoop Common**:这是Hadoop的基础组件,包含了各种通用工具和服务,如网络通信库、...

    hadoop mapreduce多表关联join多个job相互依赖传递参数

    - **ChainMapper/ChainReducer**:可以链式连接多个mapper或reducer,但并不适用于所有情况,特别是当Job间有复杂依赖时。 - **MultipleInputs/MultipleOutputs**:Hadoop API提供的工具类,用于一个Job处理多个...

    hadoop实践

    或者使用ChainMapper和ChainReducer将多个MapReduce作业串联起来,形成更复杂的处理流程。 #### 六、Hadoop编程最佳实践 为了提高Hadoop程序的性能和可维护性,开发人员应该遵循一些最佳实践,如: - **优化数据...

    Hadoop - Hadoop in Action

    - **ChainMapper和ChainReducer**:在一个MapReduce作业中串联多个Map和Reduce任务。 - **Counters和Progress监控**:监控作业进度和性能指标。 #### Hadoop编程实践 除了基础的MapReduce编程外,Hadoop生态系统还...

    hadoop_program_java

    - MapReduce的工作原理:通过map()函数对数据进行切分和处理,然后reduce()函数进行聚合操作。 3. **Hadoop开发环境**: - 首先,你需要在本地或集群上安装Hadoop,并确保其正确配置和运行。 - 使用IDE(如...

Global site tag (gtag.js) - Google Analytics