`

MapReduce设置参数防止超时

 
阅读更多

1. 如果碰到异常“Task attempt failed to report status for xxx seconds. Killing!”,最可能是碰到死循环了。

2. 如果没有死循环:控制超时的属性是:mapred.task.timeout,默认600000ms,即600s。可以设置成更大的值。可以直接在Jobconf或Configuration中修改(只对本Job起作用),也可以修改mapred-site.xml(对所有Job起作用)。

3. 如果没有死循环,但task执行时间长又不好确定,可以在Reducer或Mapper中主动发送心跳,但需控制发送心跳的频率:

复制代码
    long heartBeatInterval = 100000L;            //主动发心跳的间隔,100s,默认600s超时
    long lastProgressTS = 0;                     //上一次发心跳的时间点
        
    //主动发心跳
    if (System.currentTimeMillis() - lastProgressTS > heartBeatInterval) {
        context.progress();
        lastProgressTS = System.currentTimeMillis();
    }
复制代码

4. 再次,如果对自己的程序有信心不会出现死循环,可以采用更简单的办法:

conf.set("mapred.task.timeout", "0");                        //不检查超时

 

 

 
 
标签: MapReduceHadoop超时Timeout
分享到:
评论

相关推荐

    Hadoop企业优化常用的调优参数.docx

    - `mapreduce.task.timeout` 设置任务超时时间,避免任务长时间无响应造成资源浪费。对于处理大量数据或涉及外部系统交互的任务,可能需要增加此值。 这些参数的调整需要结合实际业务场景进行,比如数据规模、任务...

    CDH集群常用组件关键参数及修改建议.docx

    1.1.6 **系统预留磁盘空间**:`dfs.datanode.du.reserved`参数设定为磁盘总容量的一部分,用于防止磁盘空间耗尽。 1.1.7 **允许失败的卷数**:`dfs.replication.min`和`dfs.replication.max`分别设置最小和最大副本...

    大数据测试方法和工具梳理.docx

    - 超时参数 - JVM参数 7. 常用工具: - Filebench:用于测试文件系统性能,支持模拟多种应用场景,如邮件服务器、数据库、Web服务器等。 大数据测试不仅关注代码的正确性,更关注整个数据生命周期中的性能和...

    hadoop-xml配置

    此外,`mapreduce.task.timeout`定义了任务超时时间,如果超过这个时间,任务会被认为失败。 在实际部署和使用Hadoop时,根据集群的硬件资源、数据量和业务需求,调整这些配置文件的参数至关重要。优化这些配置可以...

    hadoop network

    - **TCP参数调优**:调整TCP的缓冲区大小、重传超时等参数,优化网络效率。 6. **工具**: - **Hadoop命令行工具**:如`hadoop fs`用于文件系统的操作,`hadoop dfsadmin`用于集群管理。 - **Hadoop仪表盘和监控...

    华为网络技术大赛模拟题答案和解析

    例如,在华为路由器上,可以通过修改静态路由的`preference`参数来指定其优先级,值越大优先级越低。 - 示例配置如下: ```plaintext [RTA] ip route-static 10.1.1.0 24 12.1.1.1 [RTA] ip route-static 10.1....

    ES和HADOOP使用问题和需求

    - **最小master节点数**:设置`discovery.zen.minimum_master_nodes`为候选节点数量的一半加1,以防止脑裂现象的发生。 **1.10 分片与副本配置** - **分片数**:增加分片数可以提高写入性能,但过多的分片数可能会...

    分布式系统2019年期末考点1

    全序广播确保消息被所有接收者按照相同顺序接收,防止信息错乱。 Lamport逻辑时钟解决了互斥访问问题,通过为每个进程分配时钟并比较时钟值来决定访问顺序。 因果有序的多播传播保证了消息的顺序,即使在网络延迟...

Global site tag (gtag.js) - Google Analytics