`
小网客
  • 浏览: 1249358 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

Hadoop执行Job时因超时自动kill原因及解决方案

 
阅读更多

Hadoop执行Job时因超时自动kill,信息如下:

Task attempt_201305231045_3281_m_000003_0 failed to report status for 600 seconds. Killing!

原因:

1.执行MR的时间过长,超过了mapred.task.timeout中设置的值

2.MR执行中因业务比较复杂,没有report status从而使得master感觉不到此task的存在而kill

解决方案:

方案1修改mapred-site.xml:

    <property>
        <name>mapred.task.timeout</name>
        <value>600000</value><!--默认为600S-->可以改的更长!
    </property>

方案2根据业务需要手动set值:

conf.setLong("mapred.task.timeout", 900000L);

方案3定时report status

在Mapper或者Reducer的时候,执行复杂的业务操作的时候report status

context.progress();

 

0
0
分享到:
评论

相关推荐

    win7下hadoop job提交

    在Windows 7环境下提交Hadoop作业(Job)是一项技术性的任务,涉及到多个步骤和概念。首先,我们需要了解Hadoop的基本架构。Hadoop是由Apache软件基金会开发的一个开源分布式计算框架,它允许在廉价硬件上处理和存储...

    Hadoop高级编程- 构建与实现大数据解决方案

    作为一个开源框架,Hadoop为海量数据的存储、处理和分析提供了高效且可扩展的解决方案。本文将深入探讨“Hadoop高级编程——构建与实现大数据解决方案”这一主题,旨在帮助读者掌握如何利用Hadoop构建实际的大数据...

    大数据Hadoop平台监控、预警及自动化 共48页.pdf

    3. 自动化操作:大数据Hadoop平台监控、预警及自动化可以自动地执行故障恢复、故障排除和资源分配等操作,以确保Hadoop集群的高效运作和稳定运行。 4. 提高运作效率:大数据Hadoop平台监控、预警及自动化可以自动地...

    Hadoop提交Job执行MR程序代码.zip

    本文将详细解析标题为“Hadoop提交Job执行MR程序代码.zip”的内容,涵盖Hadoop MR程序代码、job提交流程以及MR程序的不同运行模式。 首先,Hadoop MapReduce(简称MR)是基于Google的MapReduce编程模型实现的,主要...

    Hadoop大数据解决方案

    **Hadoop大数据解决方案** 在当前的信息时代,大数据已经成为企业竞争力的关键因素。Hadoop作为开源的分布式计算框架,为处理海量数据提供了强大支持。本解决方案基于Hadoop生态系统,旨在为企业提供高效、灵活且可...

    hadoop 构建与实现大数据解决方案

    ### Hadoop构建与实现大数据解决方案 #### 一、Hadoop简介及重要性 Hadoop是一个开源框架,用于处理和存储大规模的数据集。它基于Google的两篇重要论文——Google File System (GFS) 和 MapReduce 的概念而创建。...

    Hadoop大数据处理-Job提交过程分析

    在Hadoop生态中,提交作业(Job)是将用户编写的程序映射到Hadoop集群并执行处理任务的过程。本文详细分析了Hadoop大数据处理中作业提交的过程。 作业提交过程涉及三个主要组件:JobClient、JobTracker和Job...

    大数据技术之-03-Hadoop学习-Hadoop运行模式及常见错误及解决方案.docx

    大数据技术之 Hadoop 运行模式及常见错误及解决方案 Hadoop 运行模式是大数据技术中的一个重要概念,它决定了 Hadoop 集群的运行方式和性能。在本文中,我们将详细介绍 Hadoop 的三种运行模式:本地运行模式、伪...

    Hadoop集群自动安装

    在进行Hadoop集群自动化安装时,通常涉及以下步骤: 1. **环境准备**:首先,需要准备运行Hadoop集群的硬件资源,这可能包括多台服务器或者虚拟机。确保它们满足Hadoop的最低配置要求,例如内存、CPU和磁盘空间。 ...

    Hadoop大数据平台安全问题和解决方案的综述PDF

    Hadoop大数据平台安全问题和解决方案的综述

    Hadoop高级编程之构建与实现大数据解决方案

    7. **大数据解决方案设计**:如何根据实际业务需求,结合Hadoop及其他工具设计合理的数据处理流程,包括数据清洗、转化、分析和可视化。 8. **案例实战**:通过实际项目或案例,例如日志分析、推荐系统、用户行为...

    Logstash6整合Hadoop-报错与解决方案.docx

    Logstash6整合Hadoop报错与解决方案 Logstash是 Elastic Stack 中的数据处理引擎,可以从多种数据源中提取数据,并对其进行处理和转换,然后将其输出到多种目标中,例如 Elasticsearch、Kafka、Hadoop 等。在大...

    基于Greenplum Hadoop- 分布式平台的大数据解决方案26 - 查询数据(3).zip

    Hadoop 的设计理念是处理大规模数据时,将任务分解成小部分并在多台服务器上并行执行,从而实现高效的数据处理。 在Greenplum 和 Hadoop 的集成方案中,Hadoop 可以作为数据湖存储大量原始、未加工的数据,而...

    Mellanox UDA Hadoop大数据解决方案.pdf

    该解决方案基于RDMA(Remote Direct Memory Access)技术和高效的Merge-Sort算法,能够提高Hadoop集群的数据处理速度,降低每个节点的执行时间,并提供高带宽的InfiniBand和以太网技术。 Mellanox UDA解决方案的...

    hadoop常见问题及解决方法

    hadoop常见问题及解决方法 Hadoop是大数据处理的重要工具,但是在安装和使用Hadoop时,可能会出现一些常见的问题,这些问题可能会导致Hadoop无法正常工作,或者无法达到预期的性能。下面是Hadoop常见的问题及解决...

    利用ansible 自动 安装Hadoop 集群

    这些模板应包含变量,以便在执行时根据目标节点的角色动态填充。 5. **运行Ansible**:最后,执行Ansible剧本以开始部署: ```bash ansible-playbook site.yml ``` 6. **验证与测试**:安装完成后,进行基本的...

Global site tag (gtag.js) - Google Analytics