root@ubuntu:/usr/local/hadoop# bin/hadoop jar hadoop-*-examples.jar wordcount /test1 /test2
11/11/22 20:42:33 INFO input.FileInputFormat: Total input paths to process : 14
11/11/22 20:42:33 INFO mapred.JobClient: Running job: job_201111222034_0001
11/11/22 20:42:34 INFO mapred.JobClient: map 0% reduce 0%
11/11/22 20:45:07 INFO mapred.JobClient: map 14% reduce 0%
11/11/22 20:45:43 INFO mapred.JobClient: map 14% reduce 4%
11/11/22 20:45:54 INFO mapred.JobClient: map 28% reduce 4%
11/11/22 20:46:43 INFO mapred.JobClient: map 57% reduce 4%
11/11/22 20:46:52 INFO mapred.JobClient: map 85% reduce 4%
11/11/22 20:46:55 INFO mapred.JobClient: map 92% reduce 4%
11/11/22 20:46:58 INFO mapred.JobClient: map 100% reduce 4%
11/11/22 20:56:19 INFO mapred.JobClient: Task Id : attempt_201111222034_0001_m_000002_0, Status : FAILED
Too many fetch-failures
11/11/22 20:56:19 WARN mapred.JobClient: Error reading task outputConnection refused
11/11/22 20:56:19 WARN mapred.JobClient: Error reading task outputConnection refused
一、错误分析
Reduce task启动后第一个阶段是shuffle,即向map端fetch数据。每次fetch都可能因为connect超时,read超时,checksum错误等原因而失败。Reduce task为每个map设置了一个计数器,用以记录fetch该map输出时失败的次数。当失败次数达到一定阈值时,会通知JobTracker fetch该map输出操作失败次数太多了,并打印如下log:
Failed to fetch map-output from attempt_201105261254_102769_m_001802_0 even after MAX_FETCH_RETRIES_PER_MAP retries... reporting to the JobTracker
其中阈值计算方式为:
max(MIN_FETCH_RETRIES_PER_MAP,
getClosestPowerOf2((this.maxBackoff * 1000 / BACKOFF_INIT) + 1));
默认情况下MIN_FETCH_RETRIES_PER_MAP=2 maxBackoff=300 BACKOFF_INIT=4000,因此默认阈值为6,可通过修改mapred.reduce.copy.backoff参数来调整。
当达到阈值后,Reduce task通过umbilical协议告诉TaskTracker,TaskTracker在下一次heartbeat时,通知JobTracker。当JobTracker发现超过50%的Reduce汇报fetch某个map的输出多次失败后,JobTracker会failed掉该map并重新调度,打印如下log:
"Too many fetch-failures for output of task: attempt_201105261254_102769_m_001802_0 ... killing it"
二、出错原因及更正:
很可能是节点间的联通不够全面.
1) 检查 、/etc/hosts
要求本机ip 对应 服务 器名
要求要包含所有的服务器ip + 服务器名
本人使用的是虚拟机OS为:ubuntu11.04 ,重启系统后出现该错误,最后发现ubuntu系统在每次启动时,会在/etc/hosts文件最前端添加如下信息:
127.0.0.1 localhost your_hostname
::1 localhost6 your_hostname
若将这两条信息注销掉,(或者把your_hostname删除掉)上述错误即可解决。
2) 检查 .ssh/authorized_keys
要求包含所有服务器(包括其自身)的public key
尽管我们在安装hadoop之前已经配置了各节点的SSH无密码通信,假如有3个IP分别为192.168.128.131 192.168.128.132 192.168.133 ,对应的主机名为master 、 slave1 、 slave2 。从每个节点第一次执行命令$ ssh 主机名(master 、slave1 、slave2) 的时候,会出现一行关于密钥的yes or no ?的提示信息,Enter确认后再次连接就正常了。如果我们没有手动做这一步,如果恰好在hadoop/conf/core-site.xml 及 mpred-site.xml中相应的IP 用主机名代替了,则很可能出现该异常
相关推荐
Too many fetch-failures 是另一个常见的问题,主要是由于结点间的连通不够全面。解决方法是检查 `/etc/hosts` 文件,确保本机 IP 对应服务器名,并包含所有服务器的 IP 和服务器名。同时,检查 `.ssh/authorized_...
二、Too many fetch-failures 这个错误主要是由于结点间的连通不够全面。解决方法是:1) 检查 /etc/hosts 文件,确保本机 IP 对应服务器名,包含所有服务器的 IP 和服务器名。2) 检查 .ssh/authorized_keys 文件,...
- **Too many fetch-failures**:同样与网络问题有关,可以调整MapReduce的配置来减少这类错误的发生。 - **能够启动datanode,但无法访问,也无法结束的错误**:可能是由于防火墙或安全策略阻止了访问。 - **java....
After a transaction commits, its effects will persist even if there are system failures. Consistency and isolation are the most important in describing SQL Server’s locking model. It is up to the ...
顺丰单号发给还是关键是感慨时光飞逝看看
基于.net+SQLserver校园通,适合学生毕设参考,项目可完美运行
PkgModelProposal_rev
环中国自驾公路路线是许多自驾游爱好者的终极梦想,这条路线包括三条主要的国道:G219、G331和G228。 自驾路线的SHP和KML格式文件 环中国自驾路线经过的省份有新疆、西藏、云南、广西、辽宁、吉林、黑龙江、内蒙古、河北、天津、山东、江苏、上海、浙江、福建、广东。
zambell_110216_3cd_adhoc-v2
2024免费微信小程序毕业设计成品,包括源码+数据库+往届论文资料,附带启动教程和安装包。 启动教程:https://www.bilibili.com/video/BV1BfB2YYEnS 讲解视频:https://www.bilibili.com/video/BV1BVKMeZEYr 技术栈:Uniapp+Vue.js+SpringBoot+MySQL。 开发工具:Idea+VSCode+微信开发者工具。
基于Comsol模拟的环盘结构近场耦合效应的增强研究,基于COMSOL的环盘结构近场耦合增强技术研究,comsol环盘近场耦合增强。 ,comsol;环盘;近场耦合;增强,Comsol环盘结构近场耦合效应显著增强
1、文件内容:ws-jaxme-manual-0.5.2-10.el7.rpm以及相关依赖 2、文件形式:tar.gz压缩包 3、安装指令: #Step1、解压 tar -zxvf /mnt/data/output/ws-jaxme-manual-0.5.2-10.el7.tar.gz #Step2、进入解压后的目录,执行安装 sudo rpm -ivh *.rpm 4、更多资源/技术支持:公众号禅静编程坊
资源内项目源码是均来自个人的课程设计、毕业设计或者具体项目,代码都测试ok,都是运行成功后才上传资源,答辩评审绝对信服的,拿来就能用。放心下载使用!源码、说明、论文、数据集一站式服务,拿来就能用的绝对好资源!!! 项目备注 1、该资源内项目代码都经过测试运行成功,功能ok的情况下才上传的,请放心下载使用! 2、本项目适合计算机相关专业(如计科、人工智能、通信工程、自动化、电子信息等)的在校学生、老师或者企业员工下载学习,也适合小白学习进阶,当然也可作为毕设项目、课程设计、大作业、项目初期立项演示等。 3、如果基础还行,也可在此代码基础上进行修改,以实现其他功能,也可用于毕设、课设、作业等。 下载后请首先打开README.md文件(如有),仅供学习参考, 切勿用于商业用途。 4、如有侵权请私信博主,感谢支持
基于Django的个性化餐饮管理系统_1ml1r29h.zip
exceptionLogs.zip
普通人如何抓住DeepSeek红利
开关磁阻电机SRM的PID参数优化研究:基于粒子群算法的联合仿真探索,开关磁阻电机SRM的PID参数优化研究:基于粒子群算法的Matlab与Simulink联合仿真方法,开关磁阻电机SRM的PID参数优化 PID控制开关磁阻电机,粒子群算法优化PID参数(模型里面是matlab和simulink联合仿真) ,开关磁阻电机SRM; PID参数优化; 粒子群算法; MATLAB; Simulink联合仿真,基于粒子群算法的SRM电机PID参数优化
deepseek最新资讯、配置方法、使用技巧,持续更新中
2024免费微信小程序毕业设计成品,包括源码+数据库+往届论文资料,附带启动教程和安装包。 启动教程:https://www.bilibili.com/video/BV1BfB2YYEnS 讲解视频:https://www.bilibili.com/video/BV1BVKMeZEYr 技术栈:Uniapp+Vue.js+SpringBoot+MySQL。 开发工具:Idea+VSCode+微信开发者工具。
金属壁镜面反射BIC特性解析:频率实虚部、Q因子与反射谱计算研究,金属壁镜面反射BIC的频域特性分析与反射谱计算:涵盖实部虚部与Q因子探讨,金属壁镜面反射BIC,包含频率实部虚部,Q因子,反射谱计算 ,金属壁; 镜面反射; BIC; 频率实部虚部; Q因子; 反射谱计算;,金属壁镜面反射BIC:实虚频率分析,Q因子与反射谱计算技术