`
attend
  • 浏览: 35038 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

解决hive+hbase整合的时候遇到问题记录

 
阅读更多

版本:hive: 0.8.1 hbase:0.92.0 hadoop:1.0.0

错误信息类似如下:

 

Exception in thread "Thread-169" java.lang.RuntimeException: Error while reading from task log url 

        at org.apache.hadoop.hive.ql.exec.errors.TaskLogProcessor.getErrors(TaskLogProcessor.java:130)

        at org.apache.hadoop.hive.ql.exec.JobDebugger.showJobFailDebugInfo(JobDebugger.java:211) 

        at org.apache.hadoop.hive.ql.exec.JobDebugger.run(JobDebugger.java:81) 

        at java.lang.Thread.run(Thread.java:662) 

Caused by: java.io.IOException: Server returned HTTP response code: 400 for URL: http://slaver1:50060/tasklog?taskid=attempt_201112211741_0005_m_000000_1&start=-8193 

        at sun.net.www.protocol.http.HttpURLConnection.getInputStream(HttpURLConnection.java:1436) 

        at java.net.URL.openStream(URL.java:1010) 

        at org.apache.hadoop.hive.ql.exec.errors.TaskLogProcessor.getErrors(TaskLogProcessor.java:120)

        ... 3 more 

FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.MapRedTask 

 

 

解决过程如下:

 

看错误日志,url是:

 

http://slaver1:50060/tasklog?taskid=attempt_201112211741_0005_m_000000_1&start=-8193 

 

再看看HADOOP的源码:TaskLogServlet 

 

 

 

    String attemptIdStr = request.getParameter("attemptid");

 

 if (attemptIdStr == null) {

 

      response.sendError(HttpServletResponse.SC_BAD_REQUEST, 

                         "Argument attemptid is required");

      return;

    }

所以taskid应该是attemptid ,应该是hadoop的版本不一致导致的。

 

然后在浏览器里访问:http://slaver1:50060/tasklog?attemptid=attempt_201112211741_0005_m_000000_1&start=-8193 

 

获得真正的错误信息,class not found 导致的,然后就好办了,把对应的jar包扔到hadoop的lib .

stop-mapred.sh 

start-mapred.sh

搞定。

 

分享到:
评论
3 楼 serisboy 2012-08-26  
hive-site.xml
<property>
    <name>hive.aux.jars.path</name>
<value>file:///opt/hive/lib/hive-hbase-handler-0.8.1.jar,file:///opt/hive/lib/h
base-0.92.1.jar,file:///opt/hive/lib/zookeeper-3.3.1.jar</value>
  </property>
2 楼 attend 2012-07-05  
@cl499756482  看错误日志里有提示。 我也忘了是哪几个包了。
1 楼 cl499756482 2012-06-15  
具体把什么包放在hadoop lib中?

相关推荐

    大数据离线分析项目(Hadoop).pdf

    - **Hive-HBase整合**:通过核对数据字典,确保Hive外部表和HBase表的字段一致,解决了整合问题。 6. **项目总结**: 项目实施加深了对大数据实际应用和客户需求实现的理解,但也暴露出对Hadoop及其相关框架的...

    大数据面试题分类记录.rar

    10. **项目经验**:面试官可能询问你在实际项目中的角色、遇到的问题及解决策略,以此评估你的实战能力和问题解决能力。 以上只是部分可能出现在"大数据面试题分类记录"中的知识点,每个主题下都可能有深入的探讨和...

    22级2班大数据用码记录.zip

    如果这是一个学习记录,可能包括了同学们对上述技术的理解、实验报告、代码实现及遇到的问题和解决方案。遗憾的是,由于信息不足,无法提供更具体的细节。为了获取更多信息,可以尝试打开“22级2班大数据用码记录....

    大数据技术之Hadoop介绍.pdf

    自2012年起,Hadoop生态还包括Apache Pig、Hive、HBase和Spark等附加软件包,丰富了大数据处理和分析的能力。 总结来说,大数据是一个涵盖了各种类型数据的复杂领域,需要特殊的技术和框架来处理。Hadoop作为其中的...

    Hadoop开发者第一期入门专刊

    在Eclipse中调试Hive SQL查询可以让开发者更方便地定位和解决问题。主要步骤包括配置Eclipse的Hive插件、连接Hive服务、编写和执行Hive查询、单步调试SQL执行过程。 ### Hive应用介绍 Hive是一个基于Hadoop的数据...

    信用卡金融大数据架构与应用.pptx

    在处理实时数据流时,可能会遇到Lambda架构的问题,即需要维护实时和离线两种不同的代码库,这增加了开发和维护的复杂性。为解决这个问题,可以将业务逻辑封装为独立单元,使其能在不同执行引擎(如Storm和MapReduce...

    ranger-2.0.0-yarn-plugin.tar.gz

    它支持多种组件,如 Hadoop、Hive、Kafka、HBase 等,提供了细粒度的访问控制和审计功能。在本场景中,我们关注的是Ranger与YARN(Yet Another Resource Negotiator)的集成,即`ranger-2.0.0-yarn-plugin`,这是一...

    【项目】数仓项目(三)

    这个系列的第三部分可能会深入到某个或多个以上领域,详细阐述项目实施的具体步骤、遇到的问题及解决方案,为读者提供实际操作的指导和经验分享。通过阅读这样的文章,读者可以学习到如何规划和执行一个成功的数仓...

Global site tag (gtag.js) - Google Analytics