hadoop job推测执行 - - ITeye博客

`

essen

浏览: 328662 次
性别:
来自: 北京

最近访客更多访客>>

belllab

czmmiao

killbrokenwolf

lilei_java

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

一EE：插件更新地址：http://download.eclipse. ...
用Eclipse Memory Analyzer查找内存泄露
heipark： Good!
flask-sqlachemy note

hadoop job推测执行

博客分类：

hadoop

阅读更多

什么是推测执行？

所谓的推测执行，就是当所有task都开始运行之后，Job Tracker会统计所有任务的平均进度，如果某个task所在的task node机器配置比较低或者CPU load很高（原因很多），导致任务执行比总体任务的平均执行要慢，此时Job Tracker会启动一个新的任务（duplicate task），原有任务和新任务哪个先执行完就把另外一个kill掉

怎么配置推测执行参数？

推测执行需要设置Job的两个参数：

mapred.map.tasks.speculative.execution

mapred.reduce.tasks.speculative.execution

两个参数的默认值均为true.

推测执行调度策略是什么？

推测执行逻辑：

// 1. Check bottom up for speculative tasks from the running cache

// 2. Check breadth-wise for speculative tasks

// 3. Check non-local tips for speculation

关键逻辑比较执行时间超过平均task执行时间某个百分比，定位为需要推测执行的job

//SPECULATIVE_GAP =0.2
(averageProgress - progress >= SPECULATIVE_GAP ) && (currentTime - startTime >= SPECULATIVE_LAG

P.s. 看源码的时候看到调度map task的策略，故记下。

JobInProgress添加新的maptask的调度策略

// When scheduling a map task:

// 0) Schedule a failed task without considering locality

// 1) Schedule non-running tasks

// 2) Schedule speculative tasks

// 3) Schedule tasks with no location information

map task调度策略：

1、失败的task，不考虑地点

2、没跑过的task

3、推测执行的task

4、nonLocalRunningMaps中的task

分享到：

java volatile关键字 | 用Eclipse Memory Analyzer查找内存泄露

2013-04-08 19:32
浏览 4573
评论(0)
分类:互联网
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

【Yarn篇02】Yarn任务推测执行1: - 当前Job已完成的任务比例至少达到5%，确保有足够的数据进行推测执行的基础。 - 需要开启推测执行的配置参数，例如在Hadoop 2.7.2的`mapred-site.xml`配置文件中，默认设置`mapreduce.map.speculative`和`...

提高hadoop的mapreduce job效率笔记: 7. ** speculative execution（推测执行）**：当某些 Task 运行缓慢时，Hadoop 可以启动额外的 Task 实例来尝试替换它们。这有助于减少整体作业时间，但也可能浪费资源。因此，合理配置推测执行阈值是必要的。 8....

运行hadoop jar: 描述中提到的链接可能是一个博客文章，虽然内容未给出，但我们可以推测它可能包含了如何使用`hadoop jar`命令的详细步骤。通常，这个过程包括以下步骤： 1. **编写Java代码**：首先，你需要编写处理Hadoop数据的...

hadoop 配置项的调优: 2. **mapred.map.tasks.speculative.execution** 和 **mapred.reduce.tasks.speculative.execution**：这两个参数控制是否启用推测执行。当某些任务由于硬件或负载问题执行较慢时，推测执行会启动新的任务副本，加快...

hadoop shell操作与程式开发: 5. **Job提交与监控**：了解如何使用`hadoop jar`命令提交MapReduce作业，并通过Hadoop的Web界面或命令行工具监控作业状态和日志。 6. **错误处理与调试**：学习如何处理Hadoop作业中的常见错误，如数据格式问题、...

hadoop作业调优参数整理及原理: - **mapreduce.map.speculative**和**mapreduce.reduce.speculative**：开启推测执行，提前启动备用任务，以防部分任务执行缓慢。通过理解这些参数的原理和作用，并结合具体作业的特性，可以针对性地进行调优，...

hadoop-examples:https: 由于压缩包文件名称列表仅给出了 "hadoop-examples-master"，我们可以推测这是一个包含了 Hadoop 示例项目的主分支或最新版本的源码库。这个仓库可能包含了多个示例，用于演示如何在 Hadoop 上执行各种操作，如数据...

MapReduce：Nkeys，Nfiles终极解决方案.docx: 1. **取消推测执行**：在早期的解决方案中，可以通过禁用MapReduce的推测执行来减少不完整ORC文件的生成。推测执行是为了提高并行度和效率，但可能会导致同一任务的多个实例同时运行，从而产生冗余输出。 2. **...

Spark运行架构和解析: - **推测执行**: 当遇到慢速执行的Task(straggler)时，将其转移到其他节点上执行。 - **错误处理**: 如果出现shuffle输出丢失的情况，需要报告fetch失败错误。 #### 四、Task的类型及其执行过程 - **两种主要类型...

老虎集团笔试题JAVA-Cloudera-Certified-Hadoop-and-Spark-Developer-practice:代码完成: 同时，由于提到了Cloudera Certified Hadoop and Spark Developer，可以推测试题将结合大数据处理场景，考察考生对Hadoop生态系统和Apache Spark的理解及应用。【标签】：“系统开源”意味着试题可能涉及到开源...

spark内核分析: 在处理任务时，会遇到straggler任务（运行速度慢于其他任务的任务）和shuffle输出丢失的情况，此时任务调度器会进行推测执行，尝试将慢任务放到别的节点上重试，以及处理fetch failed错误。 Partition（分区）是...

分布式调度后端代码.zip: 在"tesseract-job-admin-master"这个子文件夹中，我们可以推测这是项目的主要模块，可能包含了整个分布式调度系统的管理后台。Tesseract这个名字可能是项目或者组件的命名，可能参考了光学字符识别（OCR）中的...

单源最短路径算法(MapReduce)源代码: - **SSPMapper.java**：这部分代码未完全给出，但可以推测它实现了Mapper接口，其功能是对图中的节点进行遍历，并更新节点的距离和颜色状态。通常，每个mapper会处理一部分图数据，并计算出这部分数据中最短路径的...

星环大数据平台_Sqoop数据导入.pdf: 通常情况下，Sqoop命令包括导入数据到HDFS（sqoop import），从HDFS导出数据到关系数据库（sqoop export），以及在数据库之间转移数据（sqoop job）等。总结来说，Sqoop在星环大数据平台中扮演着数据导入导出的...

kettle资料: 1. **工作流与转换**：Kettle的核心概念是工作流（Job）和转换（Transformation）。工作流是一系列转换的组织，它们按顺序执行，而转换则包含了一系列数据处理步骤，每个步骤都有特定的功能，如读取、转换、清洗或...

demodemodemo.zip: 1. **核心概念**：Flink的核心概念包括DataStream API（用于无界和有界数据流）、Job Manager（协调任务执行）、Task Manager（执行任务的工作者节点）以及DataStream转换（如map、filter和join）。 2. **流处理...

spark-master.zip: 当用户提交一个作业（Job）时，Master会根据作业需求和集群资源状况，将作业拆分成多个任务（Task），并将这些任务分配到各个Executor上执行。在"spark-master"这个文件夹中，可能包含了启动和配置Spark Master所...

Hbase官方文档: - 开启推测执行功能可以提高MapReduce作业的整体性能。 #### 七、架构概述 **9.1 概述** - **客户端(Client)**：发送请求至Master。 - **Master**：负责Region的分配和管理。 - **RegionServer**：存储和管理数据...

大数据各类性能调优: - 推测执行可以在一定程度上缓解任务执行中的不平衡问题。启用推测执行需要合理设置相关参数。 ##### 12.7.6 通过“SlowStart”调优 - “SlowStart”机制可以避免任务启动初期的资源争抢，有助于提高整体性能。 ##...

Global site tag (gtag.js) - Google Analytics