`
BlackWing
  • 浏览: 200063 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

shuffle & sort解释

阅读更多
转载请标明出处:http://blackwing.iteye.com/blog/1848401

MR任务,充分利用了缓存进行读写。

1)map端
每个map任务,都会先把数据写到一个环形缓存中,该缓存默认大小是100MB,由io.sort.mb(默认值是100MB)和io.sort.spill.percent(默认值是0.8)共同决定。在默认情况下,当缓存达到80MB时,后台线程就开始把数据spill到磁盘。而map会继续写数据到缓存中,当100MB的缓存写满后,map就会阻塞,直到spill完成。

在spill写数据到磁盘前,线程会根据reducer的数量(例如10个reducer)把输出数据切分为相应个数的partition,在每个partition中,后台线程会对其中的数据进行排序,如果该job有combiner,则此时也会调用combiner对数据进行合并。partition是逻辑划分,是指一个spill的文件中,或逻辑划分为几个partition。

在map结束前,如果有超过min.num.spills.for.combine(默认值3)个spill,则这些spill会被合并成一个分好区的大文件。

每个map生成的数据,会通过http传输给reducer。

2)reduce端
reducer通过http把map输出的数据copy到本地,copy数据的线程数由mapred.reduce.parallel.copies进行设置(默认值5)。

如果map的输出数据足够小,则会直接写入缓存中(由mapred.job.shuffle.input.buffer.percent设置,指占JVM的比例),否则写入磁盘。当缓存数据达到mapred.job.shuffle.merge.percent(默认0.8)或者超过mapred.inmem.merge.threshold(默认1000)个文件,则开始把数据spill到磁盘。此时如果job有combiner,则会调用它以减少写入磁盘的数据。

在数据不断写入磁盘同时,后台线程会把这些数据合并成一个更大的排好序的文件,节省后续合并的时间。当所有map的输出都copy到reducer后,就进入合并排序阶段,生成一个有序的大文件。

总结来说,调用combiner的地方如下:
*map端spill数据到磁盘
*map端,map结束前,合并多个spill
*reduce端spill数据到磁盘

《hadoop in practice》作者的spill过程图解:
http://grepalex.com/2012/09/24/map-partition-sort-spill/
分享到:
评论

相关推荐

    Spark-shuffle机制.pdf

    - shuffle map task数量小于spark.shuffle.sort.bypassMergeThreshold(默认200)。 - 不是排序类的shuffle算子。 - 每个下游task创建一个临时磁盘文件,数据按照key的hash值写入对应的文件。 - 写入磁盘前先...

    shuffle的关键阶段sort(Map端和Reduce端)源码分析

    shuffle 的关键阶段 sort(Map 端和 Reduce 端)源码分析 在 Hadoop 的 MapReduce 框架中,排序是 shuffle 过程中的一个关键阶段。排序的目的是将数据按照特定的顺序排列,以便于后续的处理。今天,我们将深入分析 ...

    Spark 的两种核心 Shuffle 详解.pdf

    Spark Shuffle 分为两种:一种是基于 Hash 的 Shuffle;另一种是基于 Sort 的 Shuffle。

    Spark Shuffle优化-参数调优1

    这个参数控制外部 shuffle 服务的端口号,具体解释同上。 spark.shuffle.sort.bypassMergeThreshold 这个参数控制对于 sort-based ShuffleManager,如果没有进行 map side 聚合,而且 reduce 任务数量少于这个值,...

    mapreduce在hadoop实现词统计和列式统计

    2. **Shuffle & Sort**:Hadoop自动将具有相同键的记录分组在一起,按键进行排序。 3. **Reducer**:Reducer接收相同键的所有值,将它们相加,得到每个单词的总出现次数。 **三、列式统计(mrflowcount)** 列式...

    spark shuffle简介

    5. **Spark 2.0.0**:进一步优化Shuffle,引入了Tungsten-sort Shuffle,这是对Sort-based Shuffle的增强,利用了Tungsten项目中的内存管理技术,提高了排序的效率和内存利用率,同时降低了磁盘使用。 6. **Spark ...

    hadoop源码

    Mapper处理输入数据,Reducer聚合Mapper的输出,Shuffle & Sort则负责数据的排序和分区,确保相同键值的数据被传递给同一个Reducer。源码中包含了JobTracker、TaskTracker和Task的生命周期管理,以及作业提交、调度...

    自己实现MapReduce-Shuffle过程.zip

    2. **Shuffle阶段**:Shuffle阶段介于Map和Reduce之间,它的主要任务是对Map任务的输出进行分区(partition)、排序(sort)和归并(merge)。分区是根据键的哈希值将数据分配到不同的Reducer,排序确保同一键的所有...

    sparkshuffle原理、shuffle操作问题解决和参数调优.doc

    当数量小于等于 spark.shuffle.sort.bypassMergeThreshold 参数的值时(默认为 200),就会启用 bypass 机制。在普通运行机制下,数据会先写入一个内存数据结构中,然后根据不同的 Shuffle 算子选择不同的数据结构。...

    shuffle-and-sort

    在IT领域,"shuffle-and-sort"通常指的是编程中的一种常见操作,涉及到数组或集合的数据处理。这个主题可能是指创建一个程序,它首先打乱(shuffle)一组数据,然后按照特定顺序(sort)重新排列它们。这在各种应用...

    【Spark内核篇04】SparkShuffle解析1

    3. **Bypass Merge SortShuffle**: 当满足特定条件(map任务数量小于`spark.shuffle.sort.bypassMergeThreshold`且非聚合类shuffle算子)时,Spark会使用bypass机制,跳过排序过程。每个task会为每个reducer创建一个...

    【Spark调优篇03】Spark之Shuffle调优1

    SortShuffleManager在某些情况下可以跳过排序,即当Shuffle reduce task数量小于`spark.shuffle.sort.bypassMergeThreshold`参数值时。这可以减少排序的计算开销,但可能导致更多的磁盘文件生成。如果不需要排序,...

    WordCountSort去重复average实例MapR

    【WordCountSort去重复average实例MapReduce编写】是Hadoop大数据处理中的一个经典案例,它主要涉及了数据处理流程中的三个关键步骤:Map、Shuffle(Sort)和Reduce。在这个实例中,我们的目标是对输入文本中的单词...

    spark-shuffle重要类和方法介绍

    SortShuffleManager 是 Spark 中的一种重要类,基于 Sort-base 的 Shuffle,用于在 Mapper 中的每一个 ShuffleMapTask 中产生两个文件:Data 文件和 Index 文件。SortShuffleManager 的主要方法包括: * ...

    MapReduce多语言编程上

    在Map阶段完成后,MapReduce会自动进行Shuffle和Sort操作。Shuffle是将Mapper产生的中间键值对按照键进行分区,并传输到Reduce任务的执行节点。Sort则是对每个分区内的键值对进行排序,确保相同键的所有值会被传递...

    在ShinyMarkdown中创建神奇的网格布局

    5. **利用Shuffle.js功能**: 一旦Shuffle实例化,你就可以利用其提供的API方法,如`shuffle()`来重新排列网格,`shuffle.filter()`来根据条件筛选卡片,或者`shuffle.sort()`来根据特定标准排序卡片。这些功能可以...

    排序算法-基于Java实现的排序算法之BogoSort实现.zip

    在上述代码中,`sort`方法负责整个排序过程,它会一直调用`shuffle`方法对数组进行随机打乱,直到数组通过`isSorted`方法验证为已排序。`isSorted`方法检查数组中的每个元素是否大于前一个元素,如果是,则返回false...

    MapReduce技术原理与实践.pptx

    在执行过程中,系统会进行数据的Shuffle和Sort操作,确保相同Key的Value被传递给同一个Reduce任务。 MapReduce的整体流程包括以下几个阶段: 1. 输入阶段:根据输入文件和Mapper数量,系统将输入数据分割为多个块。...

    Hive大数据倾斜总结

    Hive查询生成多个map reduce job,一个map reduce job又有map,reduce,spill,shuffle,sort等多个阶段,所以针对hive查询的优化可以大致分为针对MR中单个步骤的优化,针对MR全局的优化以及针对整个查询的优化。...

    【MapReduce篇05】MapReduce之Shuffle机制1

    Shuffle过程中的缓冲区大小可以通过`io.sort.mb`参数进行调整,默认为100MB。缓冲区越大,磁盘I/O操作次数越少,从而提高执行效率。 Partitioner是Shuffle过程中的关键组件,用于决定键值对应该分配到哪个Reducer。...

Global site tag (gtag.js) - Google Analytics