在这两天的研究与使用过程中,发现了几个比较重要的问题,也是困扰我两天的问题:
1、使用本地代码提交任务
问题由来:
通过对hadoop的学习,发现hadoop目前的工作方式是你自己开发的程序需要打包好,然后使用hadoop的命令加载并运行,使用起来不太方便,想通过本地的eclipse直接运行。
解决方法:
通过查找网上资料发现在hadoop的安装包中有一个目录contrib,里面有eclipse-plugin,但是版本是0.18的版本,目前我使用的是0.20,好像存在兼容问题。
在网上偶然发现一个博客http://www.cnblogs.com/spork/archive/2010/04/07/1706162.html,其中分析了hadoop命令中作业提交的实现原理和方式,并使用java程序实现了该功能,从而解决了使用代码实现作业提交的功能。
但是在使用过程中发现,如果提交作业的开发机用户名和hadoop服务启动时的用户名不一致是会出现权限问题,即不能在HDFS中创建目录,无法设置权限等,解决方式就是在本机创建一个同名用户就可以了。
2、MapRed集群不能正常工作
问题由来:
在使用过程中发现,虽然每个机器上的进程都已经启动完毕了,但是通过hadoop的web客户端查看状态发现如下情况:
在Cluster Summary中的Nodes总是不对,通过查看hadoop_home/logs目录中的hadoop-hadoop-tasktracker-gcpserver.log日志文件发现其中总是连接集群的主节点,总是连接不上在不断的重连。
分析发现,连接的服务地址使用的是hostname,不是ip地址。而在我的环境中hostname是存在重复的。而且我的开发机和服务器不在同一个网段内。
解决方法:
分别对每一台机器设置hosts文件,指定每个服务的hostname和ip,并且保持唯一,在开发机中也指定。重启后解决了该问题。
分享到:
相关推荐
Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程Hadoop安装使用教程...
大数据Hadoop视频教程大数据Hadoop视频教程大数据Hadoop视频教程
这个问题通常出现在数据读取、存储或输出的过程中,对数据分析和应用造成困扰。本篇将深入探讨Hadoop中文乱码问题的原因及解决方案。 首先,我们需要理解Hadoop系统中的编码设置。Hadoop默认使用的是UTF-8编码,但...
本教程中使用的Java版本为jdk-6u31-linux-i586.bin,Linux系统为CentOS6.0,Hadoop版本为hadoop-1.0.0.tar.gz。而Windows开发环境则使用jdk-6u31-windows-i586.exe,并在Windows7旗舰版系统上操作。 在Eclipse开发...
不建议为Hadoop创建独立用户,而是使用root用户进行操作,以简化配置过程。 **4. 修改配置文件** - **core-site.xml**: 这个文件定义了Hadoop文件系统的默认名称节点和临时目录。你需要设置`fs.default.name`为你...
Hadoop安装教程_单机/伪分布式配置_Hadoop2.7.1/Ubuntu 16.04 本教程主要讲述了在 Ubuntu 16.04 环境下安装 Hadoop 2.7.1 的步骤,包括单机模式、伪分布式模式和分布式模式三种安装方式。以下是本教程的知识点总结...
hadoop常见问题及解决方法 Hadoop是大数据处理的重要工具,但是在安装和使用Hadoop时,可能会出现一些常见...这些常见的问题及解决方法,能够帮助用户快速解决Hadoop的安装和使用问题,提高Hadoop的使用效率和稳定性。
《Hadoop入门教程》将详细讲解这些过程,以帮助初学者顺利启动Hadoop。 六、Hadoop编程 了解Hadoop的API和编程模型是必不可少的。MapReduce编程模型允许开发者编写Java程序来实现自定义的Map和Reduce函数。此外,...
- **Hadoop版本**:教程使用的是Hadoop 0.21.0版本。需要注意的是,随着Hadoop的发展,不同版本之间可能存在较大的差异,因此选择合适的版本十分重要。 #### 四、集群角色分配 - **Namenode**:负责管理HDFS的命名...
在安装过程中,我们会遇到各种问题,但通过学习和实践,我们可以克服这些困难,从而深入理解Hadoop及其依赖环境。 首先,安装Hadoop的第一步是创建一个专门的用户账户。在本例中,创建了一个名为"hadoop"的用户,这...
### Hadoop安装教程:单机与伪分布式配置详解 #### 一、引言 Hadoop是一种开源的大数据处理框架,广泛应用于数据存储和处理场景。本文档将详细介绍如何在Ubuntu 14.04环境下安装配置Hadoop 2.6.0版本,包括单机模式...
第一天 hadoop的基本概念 伪分布式hadoop集群安装 hdfs mapreduce 演示 01-hadoop职位需求状况.avi 02-hadoop课程安排.avi 03-hadoop应用场景.avi 04-hadoop对海量数据处理的解决思路.avi 05-hadoop版本选择和...
### Hadoop安装过程详解 #### 一、概述 Hadoop是一种能够处理大量数据的大规模分布式存储与计算框架,常用于构建大数据分析平台。本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的...
### 使用VMware安装Hadoop全过程详解 #### 一、前言 随着大数据技术的发展,Hadoop作为处理海量数据的重要工具之一,在数据存储与处理领域占据了举足轻重的地位。为了更好地学习和掌握Hadoop平台,本文将详细介绍...
Slave启动不起来解决过程如下: 1.环境变了,hadoop没变: Hadoop/etc/hadoop/slaves 的IP地址要变。 5个重要的配置文件逐个检查,IP地址需要变 2.配置文件确认无错误,看日志: 从logs日志中寻找slave的namenode为...
在Hadoop集群环境中,启动过程中可能会遇到某些关键节点未能正常启动的问题。例如,在启动Hadoop集群时,可能会遇到NameNode无法正常启动的情况。此类问题可能由多种因素引起,包括配置错误、节点ID不匹配等。本文将...
hadoop教程ppt.ppt
本教程将详细介绍如何在Windows 10上安装和使用Hadoop,以及如何处理常见的“hadoop.dll”和“winutils.exe”缺失问题。 首先,从提供的压缩包中解压“win10下hadoop2.7.2安装包”,这通常包含Hadoop的二进制文件、...