`
Taoo
  • 浏览: 294989 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

yarn执行mr出现的 内存问题

 
阅读更多
反正就是各种报错,超出内存什么的。
涉及到两个配置文件:yarn-site.xml 和 mapred-site.xml;

yarn-site.xml主要涉及这两个参数:
  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>1536</value>
  </property>
  <property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>1024</value>
  </property>


这两个值不能太大,跟机器的内存有关,具体不知道个什么规矩。


mapred-site.xml主要涉及这两个参数:
        <!-- mem limit for maps  -->
        <property>
                <name>mapreduce.map.memory.mb</name>
                <value>768</value>
        </property>

        <!-- Larger resource limit for reduces  -->
        <property>
                <name>mapreduce.reduce.memory.mb</name>
                <value>768</value>
        </property>

这连个值,不能超过机器的内存,太接近也不行,可能是需要给系统留点内存。
我的机器有的1330M内存,最高只能把这个值设置在1024,大了就会报错。
分享到:
评论

相关推荐

    Yarn常见问题维护手册V1.01

    - `[YARN-20001]` MR 任务运行失败,报虚拟内存不足:这可能是由于任务所需的资源超过了节点可用的内存,或者配置的虚拟内存参数不当。检查 `yarn.nodemanager.resource.memory-mb` 和 `mapreduce.map.memory.mb` ...

    Cloudera的yarn任务监控api

    在MapReduce中,MR Application Master(AM)负责协调任务执行,而MR History Server则保存和提供作业的历史信息。AM通过与Resource Manager交互来请求资源,管理任务的生命周期,并监控任务进度。历史服务器则提供...

    Hadoop YARN 基本架构和发展趋势 - d.pdf

    Hadoop YARN(Yet Another Resource Negotiator)是Apache Hadoop项目中的一个核心组件,它的设计目标是解决早期Hadoop 1.x版本中MapReduce(MRv1)存在的问题,包括扩展性限制、单点故障以及对其他计算框架支持不足...

    hadoop技术内幕mr_hdfs_yarn PDF 3本全

    YARN是Hadoop的第二代资源管理器,它的出现是为了解决早期Hadoop中MapReduce和资源管理混合的问题。YARN将资源管理和作业调度分离,提高了系统的灵活性和效率。 1. **ResourceManager(RM)**:全局资源管理器,...

    Yarn资源调用demo案例

    在实际操作中,我们需要对YARN进行适当的配置,包括设置最大内存、CPU核心数等。这通常在`yarn-site.xml`配置文件中进行。例如: ```xml &lt;name&gt;yarn.nodemanager.resource.memory-mb &lt;value&gt;8192 &lt;name&gt;yarn....

    hive on spark mr 数据开发常见问题解决

    在Hive on Spark MR(MapReduce)数据开发中,开发者经常遇到各种问题,这些问题往往阻碍了工作效率。以下是一些常见的问题及其解决方案: 1. **Shuffle in Fetcher#6 错误** 当Hive作业处理大数据量时,可能会...

    第5章Yarn.pdf第5章Yarn.pdf第5章Yarn.pdf第5章Yarn.pdf

    12. 程序执行完毕后,MR向RM注销自身。 **YARN调度器和调度算法** YARN支持多种调度器,包括FIFO调度器、容量调度器(Capacity Scheduler)和公平调度器(Fair Scheduler)。 1. **FIFO调度器**:简单直观,按...

    hive on tez 常见报错问题收集

    同时,如果物理内存或虚拟内存超出限制,需要调整YARN的配置,如`yarn.scheduler.minimum-allocation-mb`至少设为4096MB,并将`yarn.nodemanager.vmem-check-enabled`设为false,`yarn.nodemanager.vmem-pmem-ratio`...

    Yarn的业界解决方案和未来方向.docx

    2. **NodeManager (NM)**:每个节点上的NodeManager负责管理本机的资源(如内存、CPU等),并接收来自ResourceManager的任务容器(Container)运行请求。NodeManager还负责管理容器的生命周期,包括资源的本地化、隔离...

    大数据&&分布式系统学习过程中一些经验总结.zip

    Job提交执行过程详解黑斑羚impala集群搭建任务&资源调度相关Airflow 实战总结HadoopYarn架构实现解析Yarn-Federation源码串读Hadoop&Yarn Rpc源码剖析MR任务在Hadoop子系统中状态流转Hadoop Pipes Ping Timeout问题...

    MapReduce平台优化详解.pdf

    Yarn的出现,使得Hadoop集群中的资源管理和调度变得更加智能和高效。 Yarn的优点包括: * 把JobTracker分为Resource Manager和Application Master,提高了资源管理和调度的效率 * 支持多种计算框架,包括MR、Storm...

    藏经阁-LLAP_ Sub-Second Analytical Queries in Hive.pdf

    它可以在不需要特殊YARN队列设置的情况下执行并发查询,并提供了多线程执行矢量化操作符管道、异步IO和高效的内存缓存。 2. LLAP的架构概述 LLAP架构主要包括LLAP守护进程、查询执行器、协调器、HiveServer2(查询...

    Hive on Spark安装配置详解.pdf

    为了解决这一问题,Hive引入了Tez和Spark作为替代的执行引擎,其中Hive on Spark因其内存计算的优势,显著提升了处理速度。 在本文中,我们将详细介绍如何在已有的Hadoop集群上安装配置Hive on Spark。首先,确保你...

    MapReduce学习笔记,亲自测试写出来的,1000分都不贵

    ### MapReduce 学习笔记概览 ...通过以上介绍,我们可以了解到 MapReduce 及其在 YARN 上的运行机制,以及如何部署配置和运行 MR 程序。这些知识对于理解和应用 MapReduce 解决实际问题至关重要。

    hadoop2.X新特性介绍

    - **运行在YARN上的MR**:保留原有的编程模型,但通过YARN进行资源管理,提高了资源利用效率。 - **YARN(Yet Another Resource Negotiator)**: - **资源管理系统**:YARN的核心职责在于资源管理,它可以为不同...

    大数据技术实践——Spark词频统计

    5. **Task执行**:Task Scheduler将Task发送给Executor执行,Executor在内存中处理数据。 6. **资源释放**:任务完成后,Executor释放资源,整个过程高效且灵活。 **三、Spark组件** 1. **Spark Core**:基础组件,...

    大数据高频面试题库.docx

    - **YARN Job提交流程**:从客户端提交Job到Resource Manager,再由RM调度到NM执行。 3. **YARN调度器**: - **默认调度器FIFO**:按应用程序提交的顺序执行。 - **调度器分类**:包括FIFO、Capacity Scheduler...

    藏经阁-spark替代HIVE实现ETL作业.pdf

    Spark 执行复杂 SQL 遇到的问题与解决: 1. 在使用 Spark 执行 HSQL 的时候,有时会遇到一些很硬的 Bug。 2. 多个 union 时经常会遇到一些问题,是因为 Hive 和 Spark 的细节处理不同。 Spark 替代 Hive 实现 ETL...

    2023大数据面试题,很全

    脑裂问题与解决 在NameNode HA中,脑裂是指集群中的节点同时认为两个NameNode都是活跃的,导致数据不一致。解决方法是通过ZooKeeper或Heartbeat机制来仲裁,确保只有一个NameNode处于活跃状态。 #### 7. 小文件...

Global site tag (gtag.js) - Google Analytics