`

hadoop中的问题总结

阅读更多

在做hadoop例子中,Win7远程连接linux服务器上的hadoop 出现一下问题:

 

12/04/24 15:32:44 WARN util.NativeCodeLoader: Unable to load native-hadoop library for your platform... using builtin-java classes where applicable
12/04/24 15:32:44 ERROR security.UserGroupInformation: PriviledgedActionException as:Administrator cause:java.io.IOException: Failed to set permissions of path: 
xxxxxxxx
Exception in thread "main" java.io.IOException: Failed to set permissions of path: xxxxxx
    at org.apache.hadoop.fs.FileUtil.checkReturnValue(FileUtil.java:682)
    at org.apache.hadoop.fs.FileUtil.setPermission(FileUtil.java:655)
    at org.apache.hadoop.fs.RawLocalFileSystem.setPermission(RawLocalFileSystem.java:509)
    at org.apache.hadoop.fs.RawLocalFileSystem.mkdirs(RawLocalFileSystem.java:344)
    at org.apache.hadoop.fs.FilterFileSystem.mkdirs(FilterFileSystem.java:189)
    at org.apache.hadoop.mapreduce.JobSubmissionFiles.getStagingDir(JobSubmissionFiles.java:116)
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:856)
    at org.apache.hadoop.mapred.JobClient$2.run(JobClient.java:850)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:396)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1093)
    at org.apache.hadoop.mapred.JobClient.submitJobInternal(JobClient.java:850)
    at org.apache.hadoop.mapreduce.Job.submit(Job.java:500)
    at org.apache.hadoop.mapreduce.Job.waitForCompletion(Job.java:530)
    at 

 

 经过分析之后,需要修改hadoop的源码,我使用的是hadoop-1.0.4,修改hadoop-core-1.0.4.jar 中对应的org.apache.hadoop.fs.FileUtil 的代码为,如下:

 

 private static void checkReturnValue(boolean rv, File p, 
                                       FsPermission permission
                                       ) throws IOException {
    /**
	if (!rv) {
      throw new IOException("Failed to set permissions of path: " + p + 
                            " to " + 
                            String.format("%04o", permission.toShort()));
    }
	**/
  }

打包之后,重新编译,放到项目中,就可以正常运行了,附件是修改之后,重新编译的hadoop-core-1.0.4.jar

 

分享到:
评论

相关推荐

    Hadoop学习总结

    这包括监控JobTracker(在Hadoop 2.x中变为YARN的ResourceManager)的任务调度、TaskTracker(在Hadoop 2.x中变为NodeManager)的工作状态以及数据传输效率等。通过Hadoop提供的日志和监控工具,如Ganglia、Ambari或...

    Hadoop学习总结.doc

    ### Hadoop 学习总结 #### 一、HDFS简介 **1.1 数据块(Block)** HDFS(Hadoop Distributed File System)是Hadoop的核心组件之一,它主要用于存储大规模的数据集。HDFS默认的基本存储单位是64MB的数据块。与...

    hadoop节点问题.docx

    在Hadoop集群环境中,启动过程中可能会遇到某些关键节点未能正常启动的问题。例如,在启动Hadoop集群时,可能会遇到NameNode无法正常启动的情况。此类问题可能由多种因素引起,包括配置错误、节点ID不匹配等。本文将...

    Hadoop技术答疑汇总

    ### Hadoop技术答疑知识点汇总 #### 一、YARN Log Aggregation - **知识点概述**:YARN(Yet Another Resource Negotiator)中的日志聚合(Log Aggregation)功能是指将作业运行过程中产生的日志文件集中存储到HDFS...

    Hadoop自学书籍汇总

    Hadoop自学书籍汇总

    hadoop常见问题及解决办法

    Hadoop常见问题及解决办法汇总 Hadoop是一个基于Apache的开源大数据处理框架,广泛应用于大数据处理、数据分析和机器学习等领域。然而,在使用Hadoop时,经常会遇到一些常见的问题,这些问题可能会导致Hadoop集群...

    Hadoop学习总结和源码分析

    “Hadoop学习总结之五:Hadoop的运行痕迹.doc”可能涉及监控和日志记录,这是理解Hadoop系统运行状态和问题排查的重要手段。通过监控Hadoop集群的性能指标,如CPU利用率、内存使用情况、磁盘I/O等,可以优化系统配置...

    Hadoop集群搭建总结

    ### Hadoop集群搭建总结 #### 一、Hadoop概述与应用场景 Hadoop是一个由Apache基金会维护的开源分布式计算框架,其主要目标是处理大规模数据集的存储与计算问题。通过Hadoop,用户能够轻松地在分布式环境中开发和...

    hadoop学习资料汇总

    在学习Hadoop的过程中,理解HDFS的工作原理至关重要。HDFS采用了主从结构,由一个NameNode作为主节点管理元数据,多个DataNode作为从节点存储数据块。NameNode负责目录树的维护、文件与数据块的映射,而DataNode则...

    使用hadoop实现WordCount实验报告.docx

    本次实验过程中遇到了如Namenode节点缺失和无法访问Web UI等问题,这些问题通过查阅资料和自我学习得以解决。实验不仅加深了对Hadoop环境配置的理解,也提升了使用Hadoop进行分布式编程的能力。此外,实验过程锻炼了...

    IT面试-Hadoop总结-云计算

    IT面试-Hadoop总结-云计算 Hadoop是当前最流行的云计算技术之一,它是一种分布式的计算模型,包含了分布式文件系统HDFS和计算模型MapReduce。 一、Hadoop基础知识 1. MapReduce大致流程:MapReduce是Hadoop的核心...

    hadoop几个实例

    总的来说,这个压缩包中的Hadoop实例将为初学者提供宝贵的实践经验,帮助他们理解如何在实际项目中运用Hadoop处理大数据问题。通过深入研究这些案例,开发者可以更好地掌握Hadoop的核心原理,并具备解决实际问题的...

    Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf

    Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf Hadoop_Spark相关面试问题总结 - Hadoop知识库.pdf

    windows平台使用hadoop hdfs文件进行中文分词的示例代码

    总结起来,这个示例展示了如何在Windows环境下使用Eclipse和Hadoop插件处理HDFS中的中文文本数据,通过MapReduce完成分词、统计和排序任务。这个过程中涉及到了Hadoop的MapReduce编程模型、中文分词库的使用以及数据...

    Hadoop总结资料Hadoop1.0.3

    【Hadoop总结资料Hadoop1.0.3】 Hadoop是一个开源的分布式计算框架,主要由Apache基金会维护。Hadoop1.0.3是该框架的一个早期版本,它包括了Hadoop的核心组件如HDFS(Hadoop Distributed File System)和MapReduce...

    hadoop面试题汇总

    - **解释**: 在Hadoop 1.x版本中,默认的数据块大小为64MB,在2.x及之后的版本中增加到了128MB。较大的块大小有助于提高存储效率和减少元数据开销。 #### 6. 集群的主要瓶颈 - **知识点**: 对于大多数Hadoop集群而...

    在ubuntu上搭建hadoop总结

    在这个过程中,你将学习到Hadoop的配置、启动和测试方法。这只是一个基础起点,深入学习Hadoop还需要理解其背后的分布式原理和MapReduce编程模型。随着Hadoop生态系统的不断发展,如YARN、Spark等,持续学习和实践是...

    Hadoop使用常见问题以及解决方法

    但是在使用 Hadoop 时,经常会遇到一些常见的问题,本文将对这些问题进行总结和解决。 Shuffle Error: Exceeded MAX_FAILED_UNIQUE_FETCHES 在 Hadoop 中,Shuffle Error 是一个常见的问题,主要是由于系统默认的...

    Hadoop期末考试题总结.doc

    "Hadoop期末考试题总结" 本资源摘要信息主要介绍了Hadoop的相关知识点,涵盖了Hadoop的版本、4V特征、大数据存储、HDFS、MapReduce、SecondaryNameNode、Hadoop shell命令、集群管理工具等方面。 1. Hadoop的最高...

Global site tag (gtag.js) - Google Analytics