`

个人Hadoop 错误列表

 
阅读更多

 

错误1:Too many fetch-failures

 

Reduce task 启动后第一个阶段是 shuffle ,即向 map fetch 数据。每次 fetch 都可能因为 connect 超时, read 超时, checksum 错误等原因而失败。 Reduce task 为每个 map 设置了一个计数器,用以记录 fetch map 输出时失败的次数。当失败次数达到一定阈值时,会通知 JobTracker fetch map 输出操作失败次数太多了,并打印如下 log

Failed to fetch map-output from attempt_201105261254_102769_m_001802_0 even after MAX_FETCH_RETRIES_PER_MAP retries... reporting to the JobTracker

其中阈值计算方式为:

max ( MIN_FETCH_RETRIES_PER_MAP ,

getClosestPowerOf2 (( this . maxBackoff * 1000 / BACKOFF_INIT ) + 1));

默认情况下 MIN_FETCH_RETRIES_PER_MAP=2 maxBackoff=300 BACKOFF_INIT=4000 因此默认阈值为 6 ,可通过修改 mapred.reduce.copy.backoff 参数来调整。

当达到阈值后, Reduce task 通过 umbilical 协议告诉 TaskTracker TaskTracker 在下一次 heartbeat 时,通知 JobTracker 。当 JobTracker 发现超过 50% Reduce 汇报 fetch 某个 map 的输出多次失败后, JobTracker failed 掉该 map 并重新调度,打印如下 log

"Too many fetch-failures for output of task: attempt_201105261254_102769_m_001802_0 ... killing it"

 

 

错误2:Task attempt failed to report status for 622 seconds. Killing

The description for mapred.task.timeout which defaults to 600s says "The number of milliseconds before a task will be terminated if it neither reads an input, writes an output, nor updates its status string. "

Increasing the value of mapred.task.timeout might solve the problem, but you need to figure out if more than 600s is actually required for the map task to complete processing the input data or if there is a bug in the code which needs to be debugged.

According to the Hadoop best practices, on average a map task should take a minute or so to process an InputSplit.

 

错误3:Hadoop: Blacklisted tasktracker

 

Put following config in conf/hdfs-site.xml:

<property>
  <name>dfs.hosts</name>
  <value>/full/path/to/whitelisted/node/file</value>
</property>

Use following command to ask Hadoop to refresh node status to based on configuration.

./bin/hadoop dfsadmin -refreshNodes

 

http://serverfault.com/questions/288440/hadoop-blacklisted-tasktracker

 

分享到:
评论

相关推荐

    hadoop和hive调优个人总结

    hadoop和hive调优个人总结 Hadoop和Hive调优是当前大数据处理中非常重要的一部分,如何提高Hadoop和Hive的性能,将直接影响到整个数据处理的效率和质量。本文将总结个人在学习和测试Hive过程中的调优经验,包括...

    hadoop系列教程7

    同时,用户可以查看程序的实时状态、错误信息和运行结果,还可以管理HDFS文件。 为了方便开发,建议将Eclipse和Hadoop解压到一个专门的工作目录中。例如,可以在E盘下创建一个名为HadoopWorkPlat的目录,将Eclipse...

    hadoop2.6.4 eclipse插件

    这个“hadoop2.6.4 eclipse插件”是针对 Hadoop 2.6.4 版本定制的,由个人编译并经过测试,确保了其可用性。 Hadoop 插件的主要功能包括: 1. **项目配置**:插件允许用户在 Eclipse 中创建 Hadoop 项目,并提供...

    hadoop-eclipse-plugin-2.6.0.jar

    3. **提交和监控Job**:编写完MapReduce程序后,可以直接在Eclipse内提交Job到Hadoop集群,并实时监控Job的执行状态,包括进度、错误信息等。 4. **调试MapReduce程序**:提供断点、单步执行等功能,使得调试Hadoop...

    hadoop-eclipse-plugin-2.6.5.jar插件下载

    《Hadoop Eclipse Plugin 2.6.5:Eclipse与Hadoop的桥梁》 在大数据处理领域,Hadoop无疑是一个核心组件,它提供了一个分布式...无论是个人还是团队,都应该充分利用这款强大的插件,提升Hadoop项目开发的效率和质量。

    32位下hadoo2.7.1或2.7.2的hadoop.dll和winutils.exe和hadoop-eclipse-plugin-2.7.1.jar

    hadoop2.7.2应该可以用,自己没试过,如果报UnsatisfiedLinkError: org.apache.hadoop.util.NativeCrc32.nativeComputeChunkedSumsByteArra 错误,s可能hadoop.dll和winutils.exe不兼容,或用的系统位数不对。...

    hadoop shell操作与程式开发

    6. **错误处理与调试**:学习如何处理Hadoop作业中的常见错误,如数据格式问题、资源管理问题等,以及如何有效地调试MapReduce程序。 【描述】提供的链接指向了一个博客文章,虽然具体内容未给出,但可以推测博主...

    Hadoop.Beginners.Guide

    虽然文档中提供的部分内容包含了OCR技术导致的识别错误或漏识别的情况,但通过上下文推断,可以合理推测这些部分与Hadoop的介绍和使用有关,比如Hadoop的版本信息、出版社信息、版权声明等。 综上所述,本书...

    Hadoop2.7.3源码Eclipse工程

    【压缩包子文件的文件名称列表】"hadoop-2.7.3-src"表明主要源代码位于这个文件夹内,包含了Hadoop的所有模块和组件的源代码,如HDFS(Hadoop分布式文件系统)、MapReduce(分布式计算框架)以及YARN(资源调度器)...

    hadoop节点问题.docx

    这些文件可能会包含过期或错误的信息,从而干扰Hadoop集群的正常运行。 3. **重新格式化Hadoop**:完成文件删除操作后,需要使用`hadoop namenode -format`命令重新格式化Hadoop集群。这一步骤会清空所有数据并...

    mac环境下hadoop集群搭建

    在文档的最后,强调了版权和使用说明,明确指出本文档仅用于个人学习和备忘,禁止有营利性行为的单位和个人使用,以防误用导致不必要的侵权问题。同时,文档还提供了联系方式,以便在文档出现错误或者不足时,读者...

    hadoop-eclipse-plugin-2.8.5.jar

    《Hadoop Eclipse Plugin 2.8.5:无缝集成与高效开发》 Hadoop Eclipse Plugin 2.8.5是一款专为Java开发者设计的强大...对于任何需要在Hadoop平台上进行MapReduce编程的团队和个人,这个插件都是一个值得信赖的选择。

    hadoop - hadoop tutorial

    5. **数据隐私**:在分析数据的同时保护个人隐私。 ### Hadoop - 大数据解决方案 #### 传统企业解决方案 传统的企业IT架构通常依赖于集中式的服务器和数据库来处理数据。然而,随着数据量的增加,这种架构变得...

    hadoop集群虚拟机安装详解

    安装过程中,确保选择英文字符集,以避免因字符编码问题导致的错误。在分区选项上,可以选择默认设置,这通常会自动分配合理的磁盘空间,简化安装流程。同时,不进行网络配置,而是选择在安装完成后通过“桥接”模式...

    hadoop3.2.1编译

    - **问题解决**:如果遇到`找不到hadoop.dll`的错误,可能需要检查JDK是否正确安装,或者Hadoop的依赖是否完整。 3. **winutils.exe**: - **作用**:`winutils.exe`是Hadoop在Windows上的一个辅助工具,用于执行...

    hadoop-eclipse-plugin-1.0.0(5个版本)

    2. **编辑器支持**:提供对MapReduce程序的源代码编辑支持,包括语法高亮、代码自动完成和错误检查。 3. **资源管理器视图**:插件添加了一个新的视图,展示Hadoop集群中的文件系统,允许用户浏览、上传、下载文件...

    Hadoop编译需要的jar包

    `findbugs-3.0.0.tar` 包含FindBugs 3.0.0版本,这个工具在Hadoop编译过程中可以用来提升代码质量和可靠性,通过在编译阶段找出可能的错误,避免在运行时出现故障。 4. **Protocol Buffers (Protobuf)**: ...

    eclipse安装hadoop插件

    最后,需要强调的是,以上步骤是基于文本内容的大致描述,具体的安装和配置过程可能需要根据实际使用的Hadoop版本和Eclipse插件版本以及个人环境的具体情况来调整。在操作之前,建议详细查阅相关插件的官方文档,以...

    hadoop.zip windos 单机

    在【压缩包子文件的文件名称列表】中,我们看到只有一个文件名"hadop",这可能是由于简化或者打字错误,实际上应该包含更多组件,如Hadoop的安装包、配置文件、示例数据等。通常,一个完整的Hadoop单机安装包会包括...

Global site tag (gtag.js) - Google Analytics