版本:hive: 0.8.1 hbase:0.92.0 hadoop:1.0.0
错误信息类似如下:
Exception in thread "Thread-169" java.lang.RuntimeException: Error while reading from task log url
at org.apache.hadoop.hive.ql.exec.errors.TaskLogProcessor.getErrors(TaskLogProcessor.java:130)
at org.apache.hadoop.hive.ql.exec.JobDebugger.showJobFailDebugInfo(JobDebugger.java:211)
at org.apache.hadoop.hive.ql.exec.JobDebugger.run(JobDebugger.java:81)
at java.lang.Thread.run(Thread.java:662)
Caused by: java.io.IOException: Server returned HTTP response code: 400 for URL: http://slaver1:50060/tasklog?taskid=attempt_201112211741_0005_m_000000_1&start=-8193
at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1436)
at java.net.URL.openStream(URL.java:1010)
at org.apache.hadoop.hive.ql.exec.errors.TaskLogProcessor.getErrors(TaskLogProcessor.java:120)
... 3 more
FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask
解决过程如下:
看错误日志,url是:
http://slaver1:50060/tasklog?taskid=attempt_201112211741_0005_m_000000_1&start=-8193
再看看HADOOP的源码:TaskLogServlet
String attemptIdStr = request.getParameter("attemptid");
if (attemptIdStr == null) {
response.sendError(HttpServletResponse.SC_BAD_REQUEST,
"Argument attemptid is required");
return;
}
所以taskid应该是attemptid ,应该是hadoop的版本不一致导致的。
然后在浏览器里访问:http://slaver1:50060/tasklog?attemptid=attempt_201112211741_0005_m_000000_1&start=-8193
获得真正的错误信息,class not found 导致的,然后就好办了,把对应的jar包扔到hadoop的lib .
stop-mapred.sh
start-mapred.sh
搞定。
分享到:
相关推荐
- **Hive-HBase整合**:通过核对数据字典,确保Hive外部表和HBase表的字段一致,解决了整合问题。 6. **项目总结**: 项目实施加深了对大数据实际应用和客户需求实现的理解,但也暴露出对Hadoop及其相关框架的...
10. **项目经验**:面试官可能询问你在实际项目中的角色、遇到的问题及解决策略,以此评估你的实战能力和问题解决能力。 以上只是部分可能出现在"大数据面试题分类记录"中的知识点,每个主题下都可能有深入的探讨和...
如果这是一个学习记录,可能包括了同学们对上述技术的理解、实验报告、代码实现及遇到的问题和解决方案。遗憾的是,由于信息不足,无法提供更具体的细节。为了获取更多信息,可以尝试打开“22级2班大数据用码记录....
自2012年起,Hadoop生态还包括Apache Pig、Hive、HBase和Spark等附加软件包,丰富了大数据处理和分析的能力。 总结来说,大数据是一个涵盖了各种类型数据的复杂领域,需要特殊的技术和框架来处理。Hadoop作为其中的...
在Eclipse中调试Hive SQL查询可以让开发者更方便地定位和解决问题。主要步骤包括配置Eclipse的Hive插件、连接Hive服务、编写和执行Hive查询、单步调试SQL执行过程。 ### Hive应用介绍 Hive是一个基于Hadoop的数据...
在处理实时数据流时,可能会遇到Lambda架构的问题,即需要维护实时和离线两种不同的代码库,这增加了开发和维护的复杂性。为解决这个问题,可以将业务逻辑封装为独立单元,使其能在不同执行引擎(如Storm和MapReduce...
它支持多种组件,如 Hadoop、Hive、Kafka、HBase 等,提供了细粒度的访问控制和审计功能。在本场景中,我们关注的是Ranger与YARN(Yet Another Resource Negotiator)的集成,即`ranger-2.0.0-yarn-plugin`,这是一...
这个系列的第三部分可能会深入到某个或多个以上领域,详细阐述项目实施的具体步骤、遇到的问题及解决方案,为读者提供实际操作的指导和经验分享。通过阅读这样的文章,读者可以学习到如何规划和执行一个成功的数仓...