`
guoyunsky
  • 浏览: 858977 次
  • 性别: Icon_minigender_1
  • 来自: 上海
博客专栏
3d3a22a0-f00f-3227-8d03-d2bbe672af75
Heritrix源码分析
浏览量:207189
Group-logo
SQL的MapReduce...
浏览量:0
社区版块
存档分类
最新评论

Hadoop Oozie学习笔记(七) E0903: Configuration does not have Jobtracker Kerberos异常解决

 
阅读更多

 

  本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1396801

  欢迎加入Hadoop超级群: 180941958

 

     最近开始监控Oozie所有workflow job,比如跟踪所有workflow job,有失败的job就邮件等通知.或者重启失败的job等.

这个异常就是发生在rerun的过程中.完整的异常如下:

 Unknown exception in doAs
java.lang.reflect.UndeclaredThrowableException: Unknown exception in doAs
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127)
	at org.apache.oozie.service.KerberosHadoopAccessorService.createFileSystem(KerberosHadoopAccessorService.java:194)
	at org.apache.oozie.service.AuthorizationService.authorizeForApp(AuthorizationService.java:283)
	at org.apache.oozie.servlet.BaseJobServlet.checkAuthorizationForApp(BaseJobServlet.java:171)
	at org.apache.oozie.servlet.BaseJobServlet.doPut(BaseJobServlet.java:110)
	at javax.servlet.http.HttpServlet.service(HttpServlet.java:640)
	at org.apache.oozie.servlet.JsonRestServlet.service(JsonRestServlet.java:281)
	at javax.servlet.http.HttpServlet.service(HttpServlet.java:717)
	at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:290)
	at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206)
	at org.apache.oozie.servlet.AuthFilter$2.doFilter(AuthFilter.java:123)
	at com.cloudera.alfredo.server.AuthenticationFilter.doFilter(AuthenticationFilter.java:371)
	at org.apache.oozie.servlet.AuthFilter.doFilter(AuthFilter.java:128)
	at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:235)
	at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206)
	at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233)
	at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191)
	at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127)
	at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102)
	at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109)
	at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298)
	at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:857)
	at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:588)
	at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489)
	at java.lang.Thread.run(Thread.java:662)
Caused by: java.security.PrivilegedActionException: org.apache.oozie.service.HadoopAccessorException: E0903: Configuration does not have Jobtracker Kerberos name or rule
	at java.security.AccessController.doPrivileged(Native Method)
	at javax.security.auth.Subject.doAs(Subject.java:396)
	at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1115)
	... 24 more
Caused by: org.apache.oozie.service.HadoopAccessorException: E0903: Configuration does not have Jobtracker Kerberos name or rule
	at org.apache.oozie.service.KerberosHadoopAccessorService.validateConf(KerberosHadoopAccessorService.java:244)
	at org.apache.oozie.service.KerberosHadoopAccessorService.access$000(KerberosHadoopAccessorService.java:49)
	at org.apache.oozie.service.KerberosHadoopAccessorService$3.run(KerberosHadoopAccessorService.java:202)
	at org.apache.oozie.service.KerberosHadoopAccessorService$3.run(KerberosHadoopAccessorService.java:194)
	... 27 more

 

    网上并没有找到解决方案,也不清楚 Jobtracker Kerberos到底是啥玩意.

于是跟踪下源码看,终于搞定.

    1.解决方案:

          只要在你的workflow/wf_job.properties,也就是你的workflow配置文件加上以下代码就行:

           mapreduce.jobtracker.kerberos.principal=mapred/_HOST@LOCALHOST

           dfs.namenode.kerberos.principal=hdfs/_HOST@LOCALHOST

    2.原理:

       跟踪源码发现,有如下判断之后才会触发该异常:

private void validateConf(Configuration conf) throws HadoopAccessorException {
        if (conf.get(WorkflowAppService.HADOOP_JT_KERBEROS_NAME) == null) {
            throw new HadoopAccessorException(ErrorCode.E0903);
        }
        if (conf.get(WorkflowAppService.HADOOP_NN_KERBEROS_NAME) == null) {
            throw new HadoopAccessorException(ErrorCode.E0904);
        }
    }

        从中可以发现只要Configuration中包含WorkflowAppService.HADOOP_JT_KERBEROS_NAME也就是

mapreduce.jobtracker.kerberos.principal和WorkflowAppService.HADOOP_NN_KERBEROS_NAME(dfs.namenode.kerberos.principal)即可.所以可以在配置文件,或者hadoop/conf/中配置.

 

更多技术文章、感悟、分享、勾搭,请用微信扫描:

1
1
分享到:
评论
1 楼 zhenghangcx 2013-08-09  
你好,我看了你关于oozie的文章,正好我最进也在研究,方便留一个联系方式我么,qq邮箱都行。我的邮箱 zhenghangcx@163.com,大牛向你学习

相关推荐

    oozie-branch-4.1.zip

    《Apache Oozie 4.1 源码解析与Hadoop集成详解》 Apache Oozie 是一个工作流调度系统,用于管理 Hadoop 生态系统中的作业执行。它允许用户定义、调度和协调各种类型的任务,如 MapReduce、Pig、Hive、Spark 等,...

    Oozie调度SparkSQL样例代码_oozie_hive_

    Oozie是Apache Hadoop的一个工作流调度系统,用于管理Hadoop作业的生命周期,而Hive则是一种基于Hadoop的数据仓库工具,允许用户使用SQL(称为HQL)对大规模数据进行查询和分析。本文将详细介绍如何在华为大数据平台...

    国内第一部hadoop面试葵花宝典

    《国内第一部Hadoop面试葵花宝典》是一部针对Hadoop技术面试精心编撰的参考资料,旨在帮助求职者在Hadoop云领域找到理想的工作。这部宝典深入浅出地讲解了Hadoop生态系统中的核心概念、技术和实践应用,为面试者提供...

    Hadoop实战

    通过学习《Hadoop实战》,读者不仅可以掌握Hadoop的基本概念和技术,还能了解到如何在实际项目中部署、管理和优化Hadoop集群,以及解决可能出现的问题。这本书是进入大数据处理领域的宝贵参考资料。

    hadoop 2.6.0 安装包

    - **YARN(Yet Another Resource Negotiator)**:资源管理器,取代了旧版Hadoop中的JobTracker,负责集群资源的管理和调度,提高了系统的可扩展性和资源利用率。 - **HDFS HA(High Availability)**:通过...

    编译好的hadoop-2.7.5

    5. **Hadoop生态**:Hadoop生态系统还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据处理语言)、Oozie(工作流调度器)和ZooKeeper(分布式协调服务)。这些工具与Hadoop紧密集成,...

    hadoop源码归档.zip

    压缩包内的文件主要是法律学习资料,如法考笔记、刑法和民诉的思维导图、讲义等,而不是与Hadoop相关的源代码或IT技术文档。因此,我无法根据这些信息生成关于Hadoop的知识点。 如果您的目标是获取Hadoop的相关知识...

    hadoop 安全设计

    ### Hadoop安全设计 #### 概述 Hadoop作为一个分布式计算框架,在大数据处理领域具有广泛的应用价值。然而,随着其应用范围的不断扩大,Hadoop系统的安全性问题也日益凸显。本文档详细介绍了Hadoop的安全设计原则...

    hadoop_deploy

    9. **Hadoop生态**:Hadoop是大数据处理的基石,其生态系统包括许多其他项目,如Hive(SQL-like查询)、Pig(数据流处理)、Spark(快速计算)、HBase(NoSQL数据库)、Oozie(工作流调度)等,它们共同构建了一个...

    hadoop security design.pdf

    ### Hadoop安全设计知识点概述 #### 一、概述 ##### 1.1 安全风险 在当前Hadoop系统的设计中存在以下主要的安全风险: 1. **用户和服务身份验证缺失**:Hadoop服务未实现对用户和服务的身份验证,这导致了一系列...

    hadoop-0.23.4.tar.gz

    6. **Hadoop Oozie**:一个工作流调度系统,用于管理Hadoop作业和其他系统的任务,如Pig、Hive和Sqoop。 7. **Hadoop ZooKeeper**:一个分布式协调服务,用于管理集群的配置信息、命名服务和分布式同步。 8. **...

    hadoop-2.9.2

    - **YARN(Yet Another Resource Negotiator)**:在2.9.2版本中,Hadoop引入了YARN作为资源管理器,替代了早期的JobTracker,提高了集群资源的利用率和调度效率。 - **HDFS高可用性**:通过NameNode HA,Hadoop...

    hadoop-2.5.2.tar.gz

    总结来说,“hadoop-2.5.2.tar.gz”是Hadoop 2.5.2版本的完整分发包,包含了Hadoop的核心组件、配置文件和文档,适用于搭建、学习和开发分布式大数据处理环境。用户可以通过下载、解压和配置这个压缩包,深入了解和...

    Hadoop架构文档

    《Hadoop架构文档》是一份深入探讨Hadoop分布式文件系统的宝贵资料,对于理解并掌握Hadoop的核心原理和技术栈至关重要。Hadoop是大数据处理领域的重要工具,它的设计目标是处理和存储海量数据,提供高容错性和高扩展...

    hadoop2.2.0

    总结来说,Hadoop 2.2.0作为Hadoop的重要版本,不仅在分布式存储和计算上提供了高效、可靠的解决方案,还在资源管理、高可用性、安全性和性能优化等方面做出了显著改进,为大数据时代的数据处理奠定了坚实基础。...

    远程调用执行Hadoop Map/Reduce

    7. **工具集成**:有许多开源工具可以帮助我们远程提交和管理Hadoop作业,如Hadoop命令行工具、Hadoop的Web UI、Apache Oozie工作流管理系统等。这些工具提供了方便的接口,使开发者能便捷地与集群交互。 8. **安全...

    Hadoop绝佳教程,不下后悔!

    包括HBase(分布式列式数据库)、Hive(数据仓库工具)、Pig(高级数据处理语言)、Spark(快速通用的大数据处理引擎)、Oozie(工作流调度系统)和Zookeeper(分布式协调服务)等,这些都是Hadoop生态系统中的重要...

    hadoop权威指南 第三版 高清中文版

    《Hadoop权威指南》第三版是Hadoop领域的经典著作,为读者提供了全面、深入的Hadoop知识体系。这本书详尽地介绍了Hadoop的核心组件、生态系统、设计原理以及实际应用,帮助开发者和数据工程师掌握大数据处理的关键...

    Hadoop权威指南第三版

    《Hadoop权威指南》第三版是大数据领域的一本经典著作,深入浅出地介绍了Hadoop生态系统的核心技术和应用。Hadoop是Apache基金会开发的一个开源分布式计算框架,它为处理和存储大规模数据提供了强大的支持。第三版的...

    Hadoop权威指南-第3版-修订版-英文版,完整版本

    7. **Hadoop生态**:除了核心的HDFS和MapReduce,Hadoop生态系统还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据分析工具)、Spark(快速通用的大数据处理引擎)、Oozie(工作流调度...

Global site tag (gtag.js) - Google Analytics