Hadoop2.6.0搭建问题汇总 -

xinklabi

浏览: 1603720 次
性别:
来自: 吉林

最近访客更多访客>>

jamsbone

bbls

netbuddy

rx78liuliu

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Hadoop2.6.0搭建问题汇总

博客分类：

hadoop

Failed to set setXIncludeAware(true) for parser

遇到此问题一般是jar包冲突的问题。一种情况是我们向java的lib目录添加我们自己的jar包导致hadoop引用jar包的冲突。解决方案就是删除我们自己向系统添加的jar包，重新配置。将自己的jar包或者外部jar放入系统目录会在编译程序时带来方便，但是这不是一种好习惯，我们应该通过修改 CLASSPATH的方式指定jar包路径。

Cannot lock storage /tmp/hadoop-root/dfs/name. The directory isalready locked

这个错误一般是我们在某次配置失败后，hadoop创建该目录，锁定之后失败退出造成的。解决方案就是删除tmp目录下hadoop创建的相关目录，然后重新配置。

localhost Name or service not known

在配置hadoop单节点环境时，需要利用ssh登录localhost。如果按照网上的方式配置之后还是不能正确登录localhost，并报上述错误，可以检查/etc/sysconfig/network和 /etc/hosts下的localhost名字是否一致。有时在某个文件中localhost是注释掉的。

ls: Cannot access .: No such file or directory.

当在hadoop中运行ls命令时常会出现这个错误，这个错误是指hdfs文件系统中当前目录为空，并不是指本地文件系统中当前目录为空。当我们使用hdfs文件系统时，会默认进入/user/username下，这个目录不存在于本地文件系统，而是由hdfs内部管理的一个目录。当我们第一次使用ls命令时，/user/username下是空的，所以会提示上述错误。当我们添加新的文件之后就不再报该错。

Call to localhost/127.0.0.1:9000 failed on connection exception

当在伪分布式环境下运行wordcount示例时，如果报上述错误说明未启动hadoop，利用start-all.sh脚本启动hadoop环境。

jps命令没有datanode运行

一个原因是执行文件系统格式化时，会在namenode数据文件夹（即配置文件中dfs.name.dir在本地系统的路径）中保存一个 current/VERSION文件，记录namespaceID，标识了所格式化的namenode的版本。如果我们频繁的格式化namenode，那么datanode中保存（即配置文件中dfs.data.dir在本地系统的路径）的current/VERSION文件只是你第一次格式化时保存的 namenode的ID，因此就会造成datanode与namenode之间的id不一致。解决方案是清空hadoop的tmp文件，重启格式化 hdfs。

Retrying connect to server: localhost/127.0.0.1:9000

说明hadoop的namenode进程没有启动，导致与namenode无法连接而报错。可以先执行stop-all.sh脚本停止hadoop，然后调用start-all.sh重启hadoop。

jps命令没有namenode运行

一个可能原因是tmp文件，默认的tmp文件每次重新开机会被清空，与此同时namenode的格式化信息就会丢失，于是我们得重新配置一个tmp文件目录。可以通过修改hadoop/conf目录里面的core-site.xml文件，加入以下节点：

<name>hadoop.tmp.dir</name>

<value>/home/chjzh/hadoop_tmp</value>

<description>A base for othertemporary directories.</description>

</property>

然后重新格式化hdfs。

此外，我们可以通过查看hadoop的logs目录下相关namenode日志查看问题来源。datanode不能启动时也可查看日志查找问题来源。

Input path does not exist: hdfs://localhost:9000/user/root/inputfile

运行hadoop程序的时候，输入文件必须先放入hdfs文件系统中，不能是本地文件，如果是本地文件就会报上述找不到文件的错误。解决方案是首先利用put或者copyFromLocal拷贝文件到hdfs中，然后再运行hadoop程序。

提示

利用jps命令查看当前运行的hadoop进程时，和hadoop相关的一系列进程 jobtracker、tasktracker、datanode、namenode和SecondaryNameNode的进程号也是非常接近的，不会出现上千的差异。如果发现它们的进程号差异过大，则往往会出错，这时可以通过重启解决问题。如果多次重启某些进程依旧没有改变，还可以利用kill -9命令强制杀死进程，然后再重启。

1、执行bin/hadoopnamenode –format时提示没有配置JAVA_HOME

linux自带的SDK并不是Sun公司的SDK，而是开源的OpenSDK。为了保险，还是决定重新配置java环境，使用SUN jdk。

2、执行启动命令bin/start-all.sh后出现：JAVA_HOMEis not set

但是执行java -version后可以看到java版本信息，证明系统的jdk没有配置错误。

再次检查hadoop-env.sh中的配置。发现路径虽然改了，但是那个语句还在注释里（#），我忘记把注释去掉了。（摔！）

3、执行jps发现没有启动NameNode以及JobTracker

www.linuxidc.com@www.linuxidc.com:~/hadoop-0.20.2$jps

5457SecondaryNameNode

7491Jps

5672TaskTracker

5323DataNode

根据网友提示，可能是由于运行hadoop的用户对/data/hadoop/name1这个目录没有访问权限。因此，进入root中执行上述命令运行hadoop，结果显示完全正确，只是每次启动一个java程序都要输入密码很麻烦。根据ppt提示进行了免密码ssh设置

4、输入hadoop文件命令的时候总是提示hadoop命令未找到，发现应该输入bin/hadoop所有的hadoop命令由bin/hadoop脚本调用。也可以编辑/etc/profile，如下命令，并执行source /etc/profile

export HADOOP_HOME=XXX
export PATH=$HADOOP/bin:$PATH

5. hadoop datanode启动不起来.转自：http://book.51cto.com/art/201110/298602.htm

如果大家在安装的时候遇到问题，或者按步骤安装完后却不能运行Hadoop，那么建议仔细查看日志信息，Hadoop记录了详尽的日志信息，日志文件保存在logs文件夹内。

无论是启动，还是以后会经常用到的MapReduce中的每一个job，以及HDFS等相关信息，Hadoop均存有日志文件以供分析。

例如：

NameNode和DataNode的namespaceID不一致，这个错误是很多人在安装时会遇到的，日志信息为：

java.io.IOException: Incompatible namespaceIDs in /root/tmp/dfs/data:

NameNode namespaceID = 1307672299; DataNode namespaceID = 389959598

若HDFS一直没有启动，读者可以查询日志，并通过日志进行分析，以上提示信息显示了NameNode和DataNode的namespaceID不一致。

这个问题一般是由于两次或两次以上的格式化NameNode造成的，有两种方法可以解决，第一种方法是删除DataNode的所有资料（及将集群中每个 datanode的/hdfs/data/current中的VERSION删掉，然后执行hadoop namenode -format重启集群，错误消失。<推荐>）；第二种方法是修改每个DataNode的namespaceID（位于/hdfs/data /current/VERSION文件中）<优先>或修改NameNode的namespaceID（位于/hdfs/name /current/VERSION文件中），使其一致。

下面这两种方法在实际应用中也可能会用到。

1）重启坏掉的DataNode或JobTracker。当Hadoop集群的某单个节点出现问题时，一般不必重启整个系统，只须重启这个节点，它会自动连入整个集群。

在坏死的节点上输入如下命令即可：

bin/Hadoop-daemon.sh start DataNode

bin/Hadoop-daemon.sh start jobtracker

2）动态加入DataNode或TaskTracker。这个命令允许用户动态将某个节点加入集群中。

bin/Hadoop-daemon.sh --config ./conf start DataNode

bin/Hadoop-daemon.sh --config ./conf start tasktracker

分享到：

Hadoop eclipse搭建文档汇总 | Java高并发编程的各种陷阱

2015-07-26 23:58
浏览 2015
评论(0)
分类:开源软件
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Mapreduce编程.docx: - 将 `hadoop-eclipse-plugin-2.6.0.jar` 上传至 `/opt/eclipse/plugins/` 目录。 ```bash [hadoop@Slave2 opt]$ cd /opt/eclipse/plugins/ [hadoop@Slave2 plugins]$ ll hadoop* -rw-r--r-- 1 root root ...

hive外部表创建: 1. **Hadoop**：版本为2.6.0。Hadoop提供了一个分布式文件系统（HDFS），用于存储大规模数据集，并提供了MapReduce编程模型来处理这些数据。 2. **Hive**：版本为1.2.1。Hive是一种基于Hadoop的数据仓库工具，它提供...

GUI面板MATLAB直车道线检测.zip: GUI面板MATLAB直车道线检测

（2024年更新）八批中国自由贸易试验区明细数据.xlsx: 截至2024年12月，我国已有八批22个自由贸易试验区，73个片区，本次分享的数据包括自贸区名单、自贸区明细、以及自贸区DID的3份数据一、数据介绍数据名称：中国自由贸易试验区明细数据数据范围：八批自由贸易试验区数据年份：2009-2024年数据样本：496条数据来源：政府公开网站数据整理：内含开放名单、开放网址明细、以及DID数据

【工程项目】MATLAB车辆检测（速度+平均速度+GUI+车流量+详细注释）.zip: 【工程项目】MATLAB车辆检测（速度+平均速度+GUI+车流量+详细注释）

2023年全国计算机二级C语言程序改错题.pdf: 2023年全国计算机二级C语言程序改错题.pdf

基于SpringBoot+Vue的MOBA类游戏攻略分享平台（Java毕业设计，包括源码、数据库、教程）.zip: Java 项目， Java 毕业设计，Java 课程设计，基于 SpringBoot 开发的，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本、软件工具等，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！ 1. 技术组成前端：html、javascript、Vue 后台框架：SpringBoot 开发环境：idea 数据库：MySql（建议用 5.7 版本，8.0 有时候会有坑）数据库工具：navicat 部署环境：Tomcat（建议用 7.x 或者 8.x 版本）， maven 2. 部署如果部署有疑问的话，可以找我咨询 Java工具包下载地址： https://pan.quark.cn/s/eb24351ebac4 后台路径地址：localhost:8080/项目名称/admin/dist/index.html 前台路径地址：localhost:8080/项目名称/front/index.html （无前台不需要输入）

基于SSM+JSP的社区疫情防控管理信息系统+数据库（Java毕业设计，包括源码，教程）.zip: Java 项目， Java 毕业设计，Java 课程设计，基于 SpringBoot 开发的，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本、软件工具等，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！ 1. 技术组成前端：jsp 后台框架：SSM 开发环境：idea 数据库：MySql（建议用 5.7 版本，8.0 有时候会有坑）数据库工具：navicat 部署环境：Tomcat（建议用 7.x 或者 8.x 版本）， maven 2. 部署如果部署有疑问的话，可以找我咨询 Java工具包下载地址： https://pan.quark.cn/s/eb24351ebac4

2023年卫生招聘考试之卫生招聘（计算机信息管理）自测模拟预测题库.pdf: 2023年卫生招聘考试之卫生招聘（计算机信息管理）自测模拟预测题库.pdf

mysql-5.7.26-winx64 vagrant-2.4.3-windows-amd64 seata-server-2.0.0 nacos-server-2.5.0 VirtualBox-6.1: mysql-5.7.26-winx64 vagrant-2.4.3-windows-amd64 seata-server-2.0.0 nacos-server-2.5.0 VirtualBox-6.1

2025年中国企业人才激励现状及发展趋势研究报告: 内容概要：本文是南京蓝腾管理咨询有限公司发布的《2025年中国人才激励白皮书》，聚焦在中国企业管理中人才激励的问题，并结合中国的国情与文化背景，通过对全国18个行业、25个省份、超过千名员工的广泛调查，提出了具有中国特色的管理与激励模式的新思考和解决方案。主要内容涵盖了企业激励措施的现状分析、核心结论、发展趋势预测等方面，其中包括物质和非物质激励、不同层次与年龄的员工激励差异及其对未来企业发展的影响。适合人群：企业管理层，HR从业者以及对公司管理与文化建设感兴趣的读者。使用场景及目标：帮助企业管理人员更好地理解不同群体（性别、职位、地域等）员工的具体激励需求，识别并克服现有激励机制中的短板，进而提升整体绩效、增强员工满意度和忠诚度；同时也为企业未来的管理与激励策略制定提供了前瞻性指导。其他说明：此文档分为免费版和全面版两部分，文中还列举了一些具体的激励实例（如跳海酒馆、西贝等企业的人才激励实践），以及未来研究方向和发展趋势预测等内容。

Java毕业设计-SpringBoot+Vue的考研资讯平台（附源码，数据库）.zip: Java 项目， Java 毕业设计，Java 课程设计，基于 SpringBoot 开发的，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本、软件工具等，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！ 1. 技术组成前端：html、javascript、Vue 后台框架：SpringBoot 开发环境：idea 数据库：MySql（建议用 5.7 版本，8.0 有时候会有坑）数据库工具：navicat 部署环境：Tomcat（建议用 7.x 或者 8.x 版本）， maven 2. 部署如果部署有疑问的话，可以找我咨询 Java工具包下载地址： https://pan.quark.cn/s/eb24351ebac4 后台路径地址：localhost:8080/项目名称/admin/dist/index.html 前台路径地址：localhost:8080/项目名称/front/index.html （无前台不需要输入）

springboot校园在线拍卖系统.zip: ava项目springboot基于springboot的课程设计，包含源码+数据库+毕业论文

基于JAVA的机场航班起降与协调管理系统&毕业设计&毕业论文&数据库&演示视频&源代码: 本次项目是设计一个基于JAVA的机场航班起降与协调管理系统。（1）在经济可行性上来分析的话，该软件是机场内部使用的一个指挥协调软件，属于航空安全投资，本软件开发成本并不高，软件和服务器数据库可以用机场原有的数据库进行开发，比起空难给航空公司造成的损失来说九牛一毛。（2）在技术可行性上来分析的话，该软件主要运用了Java技术、jQuery-easyui和Mysql数据库技术。Java是到目前来说最稳定的、最可靠的软件开发工具；jQuery-easyui虽然是比较新的前台开发技术，但是他的界面新颖整洁，适合于功能性软件的开发；Mysql数据库也是许多大公司都采用的软件项目开发数据库，不仅稳定而且性能可靠，可以用作本次软件的开发。（3）在法律可行性上来分析的话，该软件使用的技术都为开源的软件开发工具和语言，虽然Java等开发技术都存在Sun公司的版权问题，但是Java技术是可以免费使用的，没有涉及到法律上的侵权。（4）在方案可行性上来分析的话，此次软件开发的很大一部分精力都放在了软件的需求分析和设计方面，设计出来的软件可以很好地去实现我们所要完成的软件预先设计的功能。

GUI面板MATLAB的人脸+指纹融合系统.zip: GUI面板MATLAB的人脸+指纹融合系统

2023年全国计算机二级MSoffice高级应用模拟试题资料.pdf: 2023年全国计算机二级MSoffice高级应用模拟试题资料.pdf

航空航天领域翼型振动与颤振分析的MATLAB仿真程序实现及应用: 内容概要：本文档详细记录了一段用于进行航空器机翼加装挂载（如导弹或其他装备）后的结构动力响应分析，特别是对颤振现象研究的 MATLAB 代码片段。主要内容涵盖初始化几何参数、物性参数以及质量特性等基本信息设定，通过定义多个矩阵（弯曲模式、扭转模式）用以描述系统运动方程的形式表达；采用Theodorsen函数表征气动力特性对于系统稳定性的影响；最终利用模态分析确定临界速度并给出最小颤振速率发生位置的相关讨论与实验数据对比验证。适合人群：航空航天专业研究人员，工程物理学者及高等院校飞行器设计方向研究生及以上水平的技术爱好者。使用场景及目标：①理解机翼与附加载体之间的动态交互机制；②掌握利用数学工具进行复杂机械系统的稳定性判断方法；③为实际产品研发提供理论依据和技术支持。其他说明：文档中的部分内容已被省略以保护原创版权，同时确保敏感算法细节不在未经授权的情况下传播。由于文中涉及到大量的矩阵运算以及高级工程力学概念，请在使用前确认自己拥有足够的前置知识。

个人用途,用于学习和交流: 个人用途,用于学习和交流

2023年数模实验报告计算机.pdf: 2023年数模实验报告计算机.pdf

Java毕业设计-SpringBoot+Vue的基于协同过滤算法商品推荐系统（附源码、数据库、教程）.zip: Java 项目， Java 毕业设计，Java 课程设计，基于 SpringBoot 开发的，含有代码注释，新手也可看懂。毕业设计、期末大作业、课程设计、高分必看，下载下来，简单部署，就可以使用。包含：项目源码、数据库脚本、软件工具等，前后端代码都在里面。该系统功能完善、界面美观、操作简单、功能齐全、管理便捷，具有很高的实际应用价值。项目都经过严格调试，确保可以运行！ 1. 技术组成前端：html、javascript、Vue 后台框架：SpringBoot 开发环境：idea 数据库：MySql（建议用 5.7 版本，8.0 有时候会有坑）数据库工具：navicat 部署环境：Tomcat（建议用 7.x 或者 8.x 版本）， maven 2. 部署如果部署有疑问的话，可以找我咨询 Java工具包下载地址： https://pan.quark.cn/s/eb24351ebac4 后台路径地址：localhost:8080/项目名称/admin/dist/index.html 前台路径地址：localhost:8080/项目名称/front/index.html （无前台不需要输入）

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Hadoop2.6.0搭建问题汇总

评论

发表评论

相关推荐

Hadoop eclipse搭建文档汇总

hadoop2.6.0伪分布式和集群环境搭建

Ubuntu hadoop环境配置、集群配置

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）1

Ubuntu上搭建Hadoop环境（单机模式+伪分布模式）

JMX对Hadoop和HBase的集群监控

MurmurHash算法（高运算性能，低碰撞率，hadoop、memcached等使用）

apache hadoop简介及核心机制

最近访客更多访客>>