`
阅读更多

这个问题比较蛋疼啊,yarn应用不是自己写的(借鉴他人滴),为了兼容mapreduce v1 所以使用了

org.apache.hadoop.mapreduce.Job 这个类来做客户端连接

如果不考虑兼容问题,可以直接使用 org.apache.hadoop.mapred.JobClient

来说说我碰到的这个问题:在多次执行yarn应用后,发现有成功有失败,而且几率不一定。

这种问题恼火啊,还好hadoop的日志做的还不错

http://192.168.146.13:8088/cluster 这个地址里面很容易找到想要的log,记得换成自己RM的ip。

先说明一下,我的环境里RM 地址为192.168.146.13,资源不能浪费,在RM上我同时启动了NM

查看app的日志,报的都是connectionException

当然就会有以下内容了

2012-12-26 18:14:21,218 INFO [main] org.apache.hadoop.ipc.Client: Retrying connect to server: 0.0.0.0/0.0.0.0:8030. Already tried 0 time(s).

我进行多次测试,发现了里面的问题:

如果container是在RM所在机器的NM上创建,则没有问题;

如果不是则会出现以上这段...一堆Retrying...

检查yarn-site.xml,配置也没问题。

问题就出在

yarn.resourcemanager.scheduler.address

这个配置,不是yarn-site.xml有问题,有问题的其实是客户端程序。

贴段代码

 

Configuration conf = new Configuration();
conf.set("fs.default.name",hdfsUri);
conf.set("fs.hdfs.impl", "org.apache.hadoop.hdfs.DistributedFileSystem");
conf.set("mapreduce.framework.name", "yarn");
conf.set("fs.AbstractFileSystem.hdfs.impl", "org.apache.hadoop.fs.Hdfs");
conf.set("yarn.resourcemanager.address", yarnip+":"+8032); //设置RM 访问位置
//conf.set("yarn.resourcemanager.scheduler.address", yarnip+":"+8030);//设置调度地址
Job job = new Job(conf, "MR2SmokeTest");

问题就出在注释的那一句,我真想不明白啊,RM和NM之间难道连调度也要我去告诉Cluster吗???

还真是这样,如果没有注入调度地址,NM会默认为0.0.0.0:8030...

 

 

 

 

分享到:
评论

相关推荐

    Hadoop 2.2.0 配置文件

    - `etc/hadoop/yarn-site.xml`:YARN是Hadoop的资源管理系统,负责调度和管理集群资源。这里可以配置资源管理器地址(`yarn.resourcemanager.address`)和容器内存大小(`yarn.nodemanager.resource.memory-mb`)等...

    基于SpringBoot的Hadoop-Yarn资源监控系统源码.zip

    在大数据领域,Hadoop是一个广泛使用的开源框架,用于存储和处理大规模数据,而YARN(Yet Another Resource Negotiator)是Hadoop的资源管理系统,负责任务调度和集群资源管理。 【描述】基于SpringBoot的Hadoop-...

    《大数据技术原理与操作应用》第6章习题答案.docx

    10. Hadoop2.0引入YARN作为资源管理调度框架,提高了系统的可扩展性和效率。 11. Hadoop本身具有权限管理和安全措施,确保集群安全运行。 12. 搭建Hadoop HA集群需要预先部署Zookeeper集群,以实现高可用协调。 ...

    iServer集成Hadoop Yarn集群进行分布式分析操作说明

    根据Hadoop的官方文档,配置Hadoop的core-site.xml、hdfs-site.xml、yarn-site.xml等配置文件,包括集群的地址、端口、副本数、内存分配等参数。 1.8. **配置Kerberos** Kerberos是一种强大的安全认证协议,用于...

    hadoop课后题带答案

    3. Hadoop版本:Apache Hadoop的主要发行版本包括Hadoop1.x、Hadoop2.x和Hadoop3.x,其中Hadoop2.x引入了YARN以改进资源调度。 4. Hadoop集群部署:Hadoop可以部署在独立模式(单机测试)、伪分布式模式(单机模拟...

    hadoop-2.7.2-hbase-jar.tar.gz

    这一版本的Hadoop引入了YARN(Yet Another Resource Negotiator),它是Hadoop的资源管理和调度器,旨在提高集群资源利用率和系统整体性能。同时,Hadoop 2.7.2还对HDFS进行了优化,增强了其稳定性和安全性。 HBase...

    《大数据技术原理与操作应用》第6章习题答案.pdf

    17. Hadoop 1.0没有完善的HA策略,而Hadoop 2.0引入了YARN和HDFS HA,提高了系统可靠性。 18. 虽然HDFS有多个副本,但NameNode作为元数据管理节点,仍可能存在单点故障问题。在Hadoop 2.x中,通过HDFS HA可以解决这...

    hadoop.dll、winutils.exe

    `hadoop.dll` 提供了与Hadoop相关的功能,如文件系统操作、网络通信和任务调度等,使得Hadoop能够与Windows系统兼容并执行其核心功能。 另一方面,`winutils.exe` 是Hadoop在Windows上的实用工具程序,它提供了与...

    hadoop2.6.0版本hadoop.dll和winutils.exe

    在Hadoop 2.x系列中,最显著的变化是引入了YARN(Yet Another Resource Negotiator),这是一个资源管理系统,负责调度集群中的计算资源,使得Hadoop不再局限于MapReduce一种计算模型,可以支持更丰富的数据处理框架...

    细细品味Hadoop

    一旦配置完成,我们需要启动Hadoop的各个守护进程,包括DataNode(数据节点,存储数据块)、NodeManager(YARN的节点管理器)、ResourceManager(YARN的全局资源调度器)、NameNode和Secondary NameNode。...

    Win10上操作Hadoop的hadoop2.7.4.rar

    在Windows 10环境下搭建...在实际应用中,还需要考虑网络配置、安全设置、资源调度等复杂因素,但以上内容已经足以让你初步了解Hadoop的操作流程。通过不断实践和学习,你将能更好地理解和掌握Hadoop的分布式计算能力。

    hadoop2.7.2(已配好wins运行环境)

    2. **YARN(Yet Another Resource Negotiator)**:YARN是Hadoop的资源管理系统,负责调度集群资源,管理应用程序生命周期。在Windows上运行YARN需要特定的配置和依赖。 3. **MapReduce**:MapReduce是Hadoop的编程...

    Hadoop2.2.0环境配置详细傻瓜教程

    Hadoop 2.2.0版本引入了一些改进,包括YARN(Yet Another Resource Negotiator),它提供了更好的资源管理和调度。 首先,为了确保顺利进行配置,我们需要关闭防火墙,因为防火墙可能阻止Hadoop进程间的通信。通过...

    hadoop-2.6.0版本所需插件.zip

    这个版本引入了YARN(Yet Another Resource Negotiator),它作为资源管理器,负责集群的资源分配和调度,使得Hadoop的扩展性和灵活性大大增强。同时,Hadoop 2.6.0还改进了容错机制,优化了性能,增强了安全性。 ...

    windows下安装hadoop的依赖库

    - `yarn-site.xml`: 配置YARN(Yet Another Resource Negotiator)资源管理器的参数,影响任务调度和内存分配。 - `mapred-site.xml`: 配置MapReduce框架的参数,比如JobTracker或ResourceManager的位置。 5. *...

    linux编译过的hadoop2.7.6

    1. **YARN(Yet Another Resource Negotiator)**:在2.0版本中引入,作为Hadoop资源管理器,取代了早期版本中的JobTracker,提供了更高效的任务调度和资源分配。 2. **HDFS Federation**:支持多个NameNode,增强了...

    【IT十八掌徐培成】Hadoop第02天-01.Hadoop基础回顾-进程初识-webui.zip

    4. JobTracker:在Hadoop 1.x中,JobTracker负责任务调度和资源管理,而在Hadoop 2.x(YARN)中被ResourceManager取代。 5. TaskTracker:与JobTracker配合,负责执行TaskTracker分配的任务。在Hadoop 2.x中,这一...

    hadoop2.8.3

    8. **YARN**:YARN(Yet Another Resource Negotiator)是Hadoop 2.x引入的新资源管理系统,用于取代旧的JobTracker,负责集群资源管理和任务调度。 9. **安全性和权限**:虽然在Windows上不常用,但在生产环境中,...

    docker一键安装hadoop集群

    4. **YARN**:资源调度器,管理集群的计算资源,为应用程序分配内存和 CPU。 5. **ResourceManager**:YARN 的主节点,负责全局资源管理和调度。 6. **NodeManager**:YARN 的从节点,负责单个节点上的资源管理和...

    Hadoop虚拟机搭建Hadoop-3.3.0集群环境

    2. **资源调度优化**:YARN增强了资源调度策略,提升了整体效率。 3. **安全性和稳定性**:增强了身份验证和授权机制,提供了更好的故障恢复和容错能力。 4. **跨语言支持**:Hadoop现在支持更多的编程语言,如...

Global site tag (gtag.js) - Google Analytics