本博客属原创文章,转载请注明出处:http://guoyunsky.iteye.com/blog/1396801
欢迎加入Hadoop超级群: 180941958
最近开始监控Oozie所有workflow job,比如跟踪所有workflow job,有失败的job就邮件等通知.或者重启失败的job等.
这个异常就是发生在rerun的过程中.完整的异常如下:
Unknown exception in doAs java.lang.reflect.UndeclaredThrowableException: Unknown exception in doAs at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1127) at org.apache.oozie.service.KerberosHadoopAccessorService.createFileSystem(KerberosHadoopAccessorService.java:194) at org.apache.oozie.service.AuthorizationService.authorizeForApp(AuthorizationService.java:283) at org.apache.oozie.servlet.BaseJobServlet.checkAuthorizationForApp(BaseJobServlet.java:171) at org.apache.oozie.servlet.BaseJobServlet.doPut(BaseJobServlet.java:110) at javax.servlet.http.HttpServlet.service(HttpServlet.java:640) at org.apache.oozie.servlet.JsonRestServlet.service(JsonRestServlet.java:281) at javax.servlet.http.HttpServlet.service(HttpServlet.java:717) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:290) at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) at org.apache.oozie.servlet.AuthFilter$2.doFilter(AuthFilter.java:123) at com.cloudera.alfredo.server.AuthenticationFilter.doFilter(AuthenticationFilter.java:371) at org.apache.oozie.servlet.AuthFilter.doFilter(AuthFilter.java:128) at org.apache.catalina.core.ApplicationFilterChain.internalDoFilter(ApplicationFilterChain.java:235) at org.apache.catalina.core.ApplicationFilterChain.doFilter(ApplicationFilterChain.java:206) at org.apache.catalina.core.StandardWrapperValve.invoke(StandardWrapperValve.java:233) at org.apache.catalina.core.StandardContextValve.invoke(StandardContextValve.java:191) at org.apache.catalina.core.StandardHostValve.invoke(StandardHostValve.java:127) at org.apache.catalina.valves.ErrorReportValve.invoke(ErrorReportValve.java:102) at org.apache.catalina.core.StandardEngineValve.invoke(StandardEngineValve.java:109) at org.apache.catalina.connector.CoyoteAdapter.service(CoyoteAdapter.java:298) at org.apache.coyote.http11.Http11Processor.process(Http11Processor.java:857) at org.apache.coyote.http11.Http11Protocol$Http11ConnectionHandler.process(Http11Protocol.java:588) at org.apache.tomcat.util.net.JIoEndpoint$Worker.run(JIoEndpoint.java:489) at java.lang.Thread.run(Thread.java:662) Caused by: java.security.PrivilegedActionException: org.apache.oozie.service.HadoopAccessorException: E0903: Configuration does not have Jobtracker Kerberos name or rule at java.security.AccessController.doPrivileged(Native Method) at javax.security.auth.Subject.doAs(Subject.java:396) at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1115) ... 24 more Caused by: org.apache.oozie.service.HadoopAccessorException: E0903: Configuration does not have Jobtracker Kerberos name or rule at org.apache.oozie.service.KerberosHadoopAccessorService.validateConf(KerberosHadoopAccessorService.java:244) at org.apache.oozie.service.KerberosHadoopAccessorService.access$000(KerberosHadoopAccessorService.java:49) at org.apache.oozie.service.KerberosHadoopAccessorService$3.run(KerberosHadoopAccessorService.java:202) at org.apache.oozie.service.KerberosHadoopAccessorService$3.run(KerberosHadoopAccessorService.java:194) ... 27 more
网上并没有找到解决方案,也不清楚 Jobtracker Kerberos到底是啥玩意.
于是跟踪下源码看,终于搞定.
1.解决方案:
只要在你的workflow/wf_job.properties,也就是你的workflow配置文件加上以下代码就行:
mapreduce.jobtracker.kerberos.principal=mapred/_HOST@LOCALHOST
dfs.namenode.kerberos.principal=hdfs/_HOST@LOCALHOST
2.原理:
跟踪源码发现,有如下判断之后才会触发该异常:
private void validateConf(Configuration conf) throws HadoopAccessorException { if (conf.get(WorkflowAppService.HADOOP_JT_KERBEROS_NAME) == null) { throw new HadoopAccessorException(ErrorCode.E0903); } if (conf.get(WorkflowAppService.HADOOP_NN_KERBEROS_NAME) == null) { throw new HadoopAccessorException(ErrorCode.E0904); } }
从中可以发现只要Configuration中包含WorkflowAppService.HADOOP_JT_KERBEROS_NAME也就是
mapreduce.jobtracker.kerberos.principal和WorkflowAppService.HADOOP_NN_KERBEROS_NAME(dfs.namenode.kerberos.principal)即可.所以可以在配置文件,或者hadoop/conf/中配置.
更多技术文章、感悟、分享、勾搭,请用微信扫描:
相关推荐
《Apache Oozie 4.1 源码解析与Hadoop集成详解》 Apache Oozie 是一个工作流调度系统,用于管理 Hadoop 生态系统中的作业执行。它允许用户定义、调度和协调各种类型的任务,如 MapReduce、Pig、Hive、Spark 等,...
Oozie是Apache Hadoop的一个工作流调度系统,用于管理Hadoop作业的生命周期,而Hive则是一种基于Hadoop的数据仓库工具,允许用户使用SQL(称为HQL)对大规模数据进行查询和分析。本文将详细介绍如何在华为大数据平台...
《国内第一部Hadoop面试葵花宝典》是一部针对Hadoop技术面试精心编撰的参考资料,旨在帮助求职者在Hadoop云领域找到理想的工作。这部宝典深入浅出地讲解了Hadoop生态系统中的核心概念、技术和实践应用,为面试者提供...
通过学习《Hadoop实战》,读者不仅可以掌握Hadoop的基本概念和技术,还能了解到如何在实际项目中部署、管理和优化Hadoop集群,以及解决可能出现的问题。这本书是进入大数据处理领域的宝贵参考资料。
- **YARN(Yet Another Resource Negotiator)**:资源管理器,取代了旧版Hadoop中的JobTracker,负责集群资源的管理和调度,提高了系统的可扩展性和资源利用率。 - **HDFS HA(High Availability)**:通过...
5. **Hadoop生态**:Hadoop生态系统还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据处理语言)、Oozie(工作流调度器)和ZooKeeper(分布式协调服务)。这些工具与Hadoop紧密集成,...
压缩包内的文件主要是法律学习资料,如法考笔记、刑法和民诉的思维导图、讲义等,而不是与Hadoop相关的源代码或IT技术文档。因此,我无法根据这些信息生成关于Hadoop的知识点。 如果您的目标是获取Hadoop的相关知识...
### Hadoop安全设计 #### 概述 Hadoop作为一个分布式计算框架,在大数据处理领域具有广泛的应用价值。然而,随着其应用范围的不断扩大,Hadoop系统的安全性问题也日益凸显。本文档详细介绍了Hadoop的安全设计原则...
9. **Hadoop生态**:Hadoop是大数据处理的基石,其生态系统包括许多其他项目,如Hive(SQL-like查询)、Pig(数据流处理)、Spark(快速计算)、HBase(NoSQL数据库)、Oozie(工作流调度)等,它们共同构建了一个...
### Hadoop安全设计知识点概述 #### 一、概述 ##### 1.1 安全风险 在当前Hadoop系统的设计中存在以下主要的安全风险: 1. **用户和服务身份验证缺失**:Hadoop服务未实现对用户和服务的身份验证,这导致了一系列...
6. **Hadoop Oozie**:一个工作流调度系统,用于管理Hadoop作业和其他系统的任务,如Pig、Hive和Sqoop。 7. **Hadoop ZooKeeper**:一个分布式协调服务,用于管理集群的配置信息、命名服务和分布式同步。 8. **...
- **YARN(Yet Another Resource Negotiator)**:在2.9.2版本中,Hadoop引入了YARN作为资源管理器,替代了早期的JobTracker,提高了集群资源的利用率和调度效率。 - **HDFS高可用性**:通过NameNode HA,Hadoop...
总结来说,“hadoop-2.5.2.tar.gz”是Hadoop 2.5.2版本的完整分发包,包含了Hadoop的核心组件、配置文件和文档,适用于搭建、学习和开发分布式大数据处理环境。用户可以通过下载、解压和配置这个压缩包,深入了解和...
《Hadoop架构文档》是一份深入探讨Hadoop分布式文件系统的宝贵资料,对于理解并掌握Hadoop的核心原理和技术栈至关重要。Hadoop是大数据处理领域的重要工具,它的设计目标是处理和存储海量数据,提供高容错性和高扩展...
总结来说,Hadoop 2.2.0作为Hadoop的重要版本,不仅在分布式存储和计算上提供了高效、可靠的解决方案,还在资源管理、高可用性、安全性和性能优化等方面做出了显著改进,为大数据时代的数据处理奠定了坚实基础。...
7. **工具集成**:有许多开源工具可以帮助我们远程提交和管理Hadoop作业,如Hadoop命令行工具、Hadoop的Web UI、Apache Oozie工作流管理系统等。这些工具提供了方便的接口,使开发者能便捷地与集群交互。 8. **安全...
包括HBase(分布式列式数据库)、Hive(数据仓库工具)、Pig(高级数据处理语言)、Spark(快速通用的大数据处理引擎)、Oozie(工作流调度系统)和Zookeeper(分布式协调服务)等,这些都是Hadoop生态系统中的重要...
《Hadoop权威指南》第三版是Hadoop领域的经典著作,为读者提供了全面、深入的Hadoop知识体系。这本书详尽地介绍了Hadoop的核心组件、生态系统、设计原理以及实际应用,帮助开发者和数据工程师掌握大数据处理的关键...
《Hadoop权威指南》第三版是大数据领域的一本经典著作,深入浅出地介绍了Hadoop生态系统的核心技术和应用。Hadoop是Apache基金会开发的一个开源分布式计算框架,它为处理和存储大规模数据提供了强大的支持。第三版的...
7. **Hadoop生态**:除了核心的HDFS和MapReduce,Hadoop生态系统还包括许多其他组件,如HBase(分布式数据库)、Hive(数据仓库工具)、Pig(数据分析工具)、Spark(快速通用的大数据处理引擎)、Oozie(工作流调度...