`

Hadoop 安装问题和解决方案

阅读更多

 

前几天在Window和Linux主机安装了Hadoop,版本是hadoop-0.21.0,出现了一些环境的问题,记录一下,做下备忘

 

1. cygwin启动Hadoop时候,总是报以下异常:

 java.lang.NoClassDefFoundError: org/apache/hadoop/util/PlatformName

问题分析:出现该错误通常是找不到Main函数,而Hadoop是通过Shell脚本调用Java的Main类的

     解决方法:

 a.修改conf/hadoop-env.sh的JAVA_HOME到本机的正确位置

 export JAVA_HOME=/cygdrive/d/Soft/Java/jdk1.6.0_26

b. 将${HADOOP_HOME}/bin/hadoop-config.sh文件中的第190行的以下内容

 

Java代码     收藏代码
  1. JAVA_PLATFORM=`CLASSPATH=${CLASSPATH} ${JAVA} -Xmx32m ${HADOOP_JAVA_PLATFORM_OPTS} org.apache.hadoop.util.PlatformName | sed -e "s/ /_/g" `  

修改成以下的内容

Java代码     收藏代码
  1. JAVA_PLATFORM=`CLASSPATH=${CLASSPATH} ${JAVA} -Xmx32m -classpath ${HADOOP_COMMON_HOME}/hadoop-common- 0.21 . 0.jar org.apache.hadoop.util.PlatformName | sed -e  "s/ /_/g" `  

 

2.bin/start-all.sh正常,输入bin/start-fds.sh出错,显示以下提示:Hadoop common not found。

     问题分析:出现该问题的原因是没有定义HADOOP_NAME

     处理方法:Linux中为在.bashrc文件中加入 export HADOOP_HOME=$HOME/hadoop-0.21.0

 

3、在操作HDFS的时候发现总是提示以下错误,而无法完成功能的操作:java.io.IOException: File /user/administrator/chen3/NOTICE.txt could only be replicated to 0 nodes, instead of 1

检查datanode日志,发现DateNode与NameNode的命名空间版本不匹配

2011-08-04 11:23:23,065 ERROR org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in /tmp/hadoop-linzm/dfs/data: namenode namespaceID = 775148417; datanode namespaceID = 1771400337

     问题分析:看日志应该是DataNode的命名空间版本与NameNode不一致,重启后也是不能解决。

     处理方法:将/tmp/hadoop-linzm/dfs/data/current/VERSION文件中的namespaceID改为错误日志的提示版本

 

4、将jar放到hadoop中,并执行时候,报以下异常

 

Java代码     收藏代码
  1. [linzm @vm - 360 - 149 - 11 test]$ hadoop jar wordcount/wordcount.jar org.myorg.WordCount wordcount/input wordcount/outpu  
  2. Exception in thread "main" java.io.IOException: Error opening job jar: wordcount/wordcount.jar  
  3.         at org.apache.hadoop.util.RunJar.main(RunJar.java:130 )  
  4. Caused by: java.util.zip.ZipException: error in opening zip file  
  5.         at java.util.zip.ZipFile.open(Native Method)  
  6.         at java.util.zip.ZipFile.<init>(ZipFile.java:114 )  
  7.         at java.util.jar.JarFile.<init>(JarFile.java:133 )  
  8.         at java.util.jar.JarFile.<init>(JarFile.java:70 )  
  9.         at org.apache.hadoop.util.RunJar.main(RunJar.java:128 )  

   问题分析:通常出现这种情况有两种原因:jar报格式坏、文件路径不对。

 处理方法:检查hadoop中文件的大小与本地是一致的,最后查明原因是jar包路径没有输入正确

 

5.官方例子中:http://hadoop.apache.org/common/docs/current/mapred_tutorial.html

运行:bin/hadoop jar /usr/joe/wordcount.jar org.myorg.WordCount /usr/joe/wordcount/input /usr/joe/wordcount/output会抛异常

Exception in thread "main" org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory hdfs://localhost:9000/user/linzm/wordcount/input already exists

        at org.apache.hadoop.mapred.FileOutputFormat.checkOutputSpecs(FileOutputFormat.java:125)

        at org.apache.hadoop.mapreduce.JobSubmitter.checkSpecs(JobSubmitter.java:375)

        at org.apache.hadoop.mapreduce.JobSubmitter.submitJobInternal(JobSubmitter.java:334)

 问题分析:事实上input目录是作为输入,是肯定要的,而Main类已经在jar报中定义了

 处理方法:可以运行的结果命令如下hadoop jar wordcount.jar wordcount/input wordcount/output

 

6、最后是备忘,默认启动的时候NameNode与DataNode管理端口为:

NameNode:http://localhost:50070/,基本功能:列出当前cluster的DataNodes,cluster的基本信息,还可以浏览HDFS文件系统

JobTracker - http://localhost:50030/,基本功能:管理MapReduce

 

更多信息请查看 java进阶网 http://www.javady.com

3
1
分享到:
评论

相关推荐

    Hadoop大数据平台安全问题和解决方案的综述PDF

    Hadoop大数据平台安全问题和解决方案的综述

    Logstash6整合Hadoop-报错与解决方案.docx

    Logstash6 整合 Hadoop 的报错解决方案需要检查多个方面,包括 Hadoop 集群的配置、Logstash 的配置、网络连接、Logstash 和 Hadoop 之间的连接等。只有当所有这些方面都正确无误时,Logstash6 和 Hadoop 才能正确...

    HADOOP的问题和下一代解决方案

    HADOOP问题和下一代解决方案的知识点涉及的内容非常广泛,包括Hadoop的开源特性、商业支持、架构问题以及未来发展趋势等多个方面。下面对这些知识点进行详细阐释。 首先,Apache Hadoop是一个开源的分布式存储和...

    Hadoop大数据平台安全问题和解决方案的综述

    Hadoop大数据平台安全问题和解决方案的综述,可以从这里学习到处理问题的思路。

    [Hadoop] Hadoop 专业解决方案 (英文版)

    [Wrox] Hadoop 专业解决方案 (英文版) [Wrox] Professional Hadoop Solutions (E-Book) ☆ 图书概要:☆ If you're ready to make the most out of massively scalable analytics, you need to know how to take ...

    Hadoop高级编程- 构建与实现大数据解决方案

    作为一个开源框架,Hadoop为海量数据的存储、处理和分析提供了高效且可扩展的解决方案。本文将深入探讨“Hadoop高级编程——构建与实现大数据解决方案”这一主题,旨在帮助读者掌握如何利用Hadoop构建实际的大数据...

    Hadoop datanode启动失败:Hadoop安装目录权限的问题

    ### Hadoop Datanode启动失败:...- **Hadoop故障排查指南**:参考更多关于Hadoop常见问题及其解决方案的文章和资料。 通过以上步骤和建议,可以有效地解决Hadoop Datanode启动失败的问题,并确保Hadoop集群稳定运行。

    Hadoop安装教程_单机_伪分布式配置

    #### 七、常见问题与解决方案 1. **权限问题**:确保所有的Hadoop配置文件和服务都是以hadoop用户身份运行的。 2. **网络问题**:检查网络配置是否正确,确保主机名解析正常。 3. **日志错误**:查阅Hadoop的日志...

    hadoop 构建与实现大数据解决方案

    ### Hadoop构建与实现大数据解决方案 #### 一、Hadoop简介及重要性 Hadoop是一个开源框架,用于处理和存储大规模的数据集。它基于Google的两篇重要论文——Google File System (GFS) 和 MapReduce 的概念而创建。...

    Hadoop大数据解决方案

    本解决方案基于Hadoop生态系统,旨在为企业提供高效、灵活且可扩展的数据处理策略,以实现业务洞察和决策优化。 **一、Hadoop概述** Hadoop是由Apache基金会开发的开源项目,它包含两个核心组件:Hadoop ...

    hadoop集群安装脚本

    自动化安装多系统多软件测试版可能意味着这个脚本不仅能安装Hadoop和Zookeeper,还可能涵盖了其他相关的大数据组件,如Hive、Spark、HBase等,提供了一站式的安装解决方案。这样的脚本大大减少了手动配置的时间,...

    采用 Hadoop 的 FlexPod Select 解决方案.pdf

    【采用 Hadoop 的 FlexPod Select 解决方案】是Cisco和NetApp联合开发的一款针对大数据处理的集成企业级基础设施。该方案旨在帮助企业更快地利用数据,创造业务价值,应对大数据带来的机遇与挑战。大数据通常指由...

    CDH安装手册.rar_cdH_hadoop_hadoop安装手册_大数据_安装部署

    熟悉CDH的常见问题和解决方案,能有效提升集群的稳定性和可用性。 9. **最佳实践** 为了确保CDH集群的高效运行,需要遵循一些最佳实践,如定期清理数据,合理设定HDFS的副本数量,优化MapReduce任务的内存分配等。...

    基于Greenplum Hadoop- 分布式平台的大数据解决方案03 - 安装Greenplum(1)

    总结来说,Greenplum和Hadoop的结合为大数据处理提供了一种强大且灵活的解决方案。通过学习和实践安装Greenplum,可以掌握如何在分布式平台上构建高效的数据分析环境。结合提供的学习资料,将有助于深入理解这个过程...

    [Hadoop] Hadoop 经典解决方案实例 (英文版)

    [Packt Publishing] Hadoop 经典解决方案实例 (英文版) [Packt Publishing] Hadoop Real World Solutions Cookbook (E-Book) ☆ 出版信息:☆ [作者信息] Jonathan R. Owens, Brian Femiano, Jon Lentz [出版...

    Hadoop高级编程之构建与实现大数据解决方案

    在大数据处理领域,Hadoop是一个...通过深入学习这份资料,你将能够熟练掌握Hadoop高级编程技巧,为构建和实现大数据解决方案打下坚实的基础。无论你是初学者还是有经验的开发者,这份文档都将是你不可或缺的学习资源。

Global site tag (gtag.js) - Google Analytics