`
kabike
  • 浏览: 609519 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

hadoop使用过程中的一些问题

 
阅读更多
1 如何知道一个文件在HDFS上block的分布情况
http://stackoverflow.com/questions/6372060/how-to-track-which-data-block-is-in-which-data-node-in-hadoop

2 用windows 电脑向linux hadoop集群上提交job失败
org.apache.hadoop.util.Shell$ExitCodeException: /bin/bash: line 0: fg: no job control

这是hadoop的bug https://issues.apache.org/jira/browse/MAPREDUCE-4052
jira上写的在2.4.0已经被fix,我们用的2.5,需要在配置文件中加入
<property>
  <description>If enabled, user can submit an application cross-platform
  i.e. submit an application from a Windows client to a Linux/Unix server or
  vice versa.
  </description>
  <name>mapreduce.app-submission.cross-platform</name>
  <value>false</value>
</property>


3 如何找到各种mapreduce job的日志,方便查看
http://www.iteblog.com/archives/896

4 如何指定hadoop client的用户名
根据UserGroupInformation的源码分析,可以设置HADOOP_USER_NAME环境变量或者系统属性
      //If we don't have a kerberos user and security is disabled, check
      //if user is specified in the environment or properties
      if (!isSecurityEnabled() && (user == null)) {
        String envUser = System.getenv(HADOOP_USER_NAME);
        if (envUser == null) {
          envUser = System.getProperty(HADOOP_USER_NAME);
        }
        user = envUser == null ? null : new User(envUser);
      }
分享到:
评论

相关推荐

    hadoop安装过程中的问题

    Slave启动不起来解决过程如下: 1.环境变了,hadoop没变: Hadoop/etc/hadoop/slaves 的IP地址要变。 5个重要的配置文件逐个检查,IP地址需要变 2.配置文件确认无错误,看日志: 从logs日志中寻找slave的namenode为...

    hadoop中文乱码问题

    这个问题通常出现在数据读取、存储或输出的过程中,对数据分析和应用造成困扰。本篇将深入探讨Hadoop中文乱码问题的原因及解决方案。 首先,我们需要理解Hadoop系统中的编码设置。Hadoop默认使用的是UTF-8编码,但...

    HADOOP安装过程

    ### Hadoop安装过程详解 #### 一、概述 Hadoop是一种能够处理大量数据的大规模分布式存储与计算框架,常用于构建大数据分析平台。本文档基于一位用户的实践经历,详细介绍了如何在虚拟机环境下安装和配置Hadoop的...

    hadoop常见问题及解决方法

    hadoop常见问题及解决方法 Hadoop是大数据处理的重要工具,但是在安装和使用Hadoop时,可能会出现一些常见...这些常见的问题及解决方法,能够帮助用户快速解决Hadoop的安装和使用问题,提高Hadoop的使用效率和稳定性。

    Hadoop Shuffle过程全解析

    Hadoop Mapreduce过程shuffle过程全解析,Shuffle过程

    使用VMware安装Hadoop全过程

    ### 使用VMware安装Hadoop全过程详解 #### 一、前言 随着大数据技术的发展,Hadoop作为处理海量数据的重要工具之一,在数据存储与处理领域占据了举足轻重的地位。为了更好地学习和掌握Hadoop平台,本文将详细介绍...

    Hadoop2.7.7安装过程

    在安装过程中,我们会遇到各种问题,但通过学习和实践,我们可以克服这些困难,从而深入理解Hadoop及其依赖环境。 首先,安装Hadoop的第一步是创建一个专门的用户账户。在本例中,创建了一个名为"hadoop"的用户,这...

    hadoop安装中的网络配置

    在 hadoop 安装过程中,需要配置 sudoer,以便普通用户可以使用 root 权限。例如,visudo -f /etc/sudoers。 集群主机名及 IP 配置 在 hadoop 安装过程中,需要配置集群主机名及 IP 地址,以便实现集群之间的通信...

    Hadoop datanode启动失败:Hadoop安装目录权限的问题

    - **在安装过程中使用非root用户**:推荐在整个安装过程中都使用一个非`root`用户(如`hadoop`用户),这样可以避免因所有权问题而导致的服务启动失败。 - **合理设置权限**:确保Hadoop安装目录及其子目录具有合理...

    Hadoop HA 搭建(附问题解决方法)

    资源中具体对Hadoop HA平台搭建过程中出现的问题给出了相应的解决办法,图文结合,适合新手学习来用,如果遇到其他,欢迎交流学习

    windows平台使用hadoop hdfs文件进行中文分词的示例代码

    在Windows平台上,利用...这个过程中涉及到了Hadoop的MapReduce编程模型、中文分词库的使用以及数据的分布式处理和结果的聚合。通过这个实例,开发者可以进一步理解大数据处理的流程,为更复杂的文本分析任务打下基础。

    maven仓库中关于Hadoop的一些依赖

    在开发过程中,有时可能需要自定义Maven仓库路径,这可以通过修改`settings.xml`文件实现。在`settings.xml`中,你可以设置`localRepository`属性来指定新的本地仓库位置: ```xml &lt;localRepository&gt;D:/my-maven-...

    hadoop搭建过程.docx

    在IT行业中,大数据处理与分析是一项至关重要的任务,而Apache Hadoop作为开源的分布式计算框架,为处理海量数据提供了强大的支持。本篇文章将详细介绍如何搭建一个Hadoop环境,包括必要的软件下载、配置以及启动...

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程

    Hadoop2.2.0安装配置手册!完全分布式Hadoop集群搭建过程 按照文档中的操作步骤,一步步操作就可以完全实现hadoop2.2.0版本的完全分布式集群搭建过程

    hadoop配置过程.txt

    从linux联网设置到jdk安装hadoop安装,环境变量配置,到hadoop配置文件修改,hadoop文件分发过程。及代码。

    hadoop/bin/hadoop.dll

    6. **使用兼容性模式**:如果可能,尝试以兼容模式运行Hadoop,或者使用如cygwin这样的模拟Linux环境,以减少兼容性问题。 7. **安装工具**:安装如Dependency Walker这样的工具,它可以帮助分析DLL文件的依赖关系...

    Hadoop创建详细过程

    本文中使用的JDK版本是1.8.0_131,属于OpenJDK系列。安装JDK之后,需要设置JAVA_HOME环境变量,让Hadoop知道Java的安装位置。 接着,需要下载Hadoop的压缩包。可以通过wget命令从Apache的镜像站点下载tar.gz格式的...

    hadoop 分布式部署全过程

    在安装 Hadoop 的过程中,我们可能会遇到一些问题,例如虚拟机无法识别 64 位操作系统,解决办法是关闭计算机(非重启),然后进入 BIOS,设置 BIOS 的虚拟化(不打开,默认是工作在 32 位模式的,virtualization ...

    hadoop的dll文件 hadoop.zip

    在提供的信息中,我们关注的是"Hadoop的dll文件",这是一个动态链接库(DLL)文件,通常在Windows操作系统中使用,用于存储可由多个程序共享的功能和资源。Hadoop本身是基于Java的,因此在Windows环境下运行Hadoop...

Global site tag (gtag.js) - Google Analytics