yarn执行mr出现的内存问题 - - ITeye博客

`

Taoo

浏览: 295972 次
性别:
来自: 北京

最近访客更多访客>>

huageng520

leisureWong

jack1007

kingding

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

白Rime：楼主在吗，我在装 libxml2 时，出现该问题，有些地方还是 ...
python安装是 -fPIC问题的解决
yeelor： $./configure --prefix=/usr/loca ...
python安装是 -fPIC问题的解决
yeelor： $./configure --prefix=/usr/loca ...
python安装是 -fPIC问题的解决
fuzzball： bo_hai 写道楼主的办法解决我了的问题。给你32个兄弟有 ...
python安装是 -fPIC问题的解决
fuzzball： silent1 写道编译ganglia的时候出现此问题，按楼主 ...
python安装是 -fPIC问题的解决

yarn执行mr出现的内存问题

博客分类：

yarn
mapreduce

阅读更多

反正就是各种报错，超出内存什么的。
涉及到两个配置文件：yarn-site.xml 和 mapred-site.xml；

yarn-site.xml主要涉及这两个参数：

  <property>
    <name>yarn.nodemanager.resource.memory-mb</name>
    <value>1536</value>
  </property>
  <property>
    <name>yarn.scheduler.maximum-allocation-mb</name>
    <value>1024</value>
  </property>

这两个值不能太大，跟机器的内存有关，具体不知道个什么规矩。

mapred-site.xml主要涉及这两个参数：

        <!-- mem limit for maps  -->
        <property>
                <name>mapreduce.map.memory.mb</name>
                <value>768</value>
        </property>

        <!-- Larger resource limit for reduces  -->
        <property>
                <name>mapreduce.reduce.memory.mb</name>
                <value>768</value>
        </property>

这连个值，不能超过机器的内存，太接近也不行，可能是需要给系统留点内存。
我的机器有的1330M内存，最高只能把这个值设置在1024，大了就会报错。

分享到：

pig 部署在hadoop 23上 | hive在YARN下执行mr任务问题

2012-09-15 01:14
浏览 2348
评论(0)
分类:开源软件
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

Yarn常见问题维护手册V1.01: - `[YARN-20001]` MR 任务运行失败，报虚拟内存不足：这可能是由于任务所需的资源超过了节点可用的内存，或者配置的虚拟内存参数不当。检查 `yarn.nodemanager.resource.memory-mb` 和 `mapreduce.map.memory.mb` ...

Cloudera的yarn任务监控api: 在MapReduce中，MR Application Master（AM）负责协调任务执行，而MR History Server则保存和提供作业的历史信息。AM通过与Resource Manager交互来请求资源，管理任务的生命周期，并监控任务进度。历史服务器则提供...

hadoop技术内幕mr_hdfs_yarn PDF 3本全: YARN是Hadoop的第二代资源管理器，它的出现是为了解决早期Hadoop中MapReduce和资源管理混合的问题。YARN将资源管理和作业调度分离，提高了系统的灵活性和效率。 1. **ResourceManager（RM）**：全局资源管理器，...

Hadoop YARN 基本架构和发展趋势 - d.pdf: Hadoop YARN（Yet Another Resource Negotiator）是Apache Hadoop项目中的一个核心组件，它的设计目标是解决早期Hadoop 1.x版本中MapReduce（MRv1）存在的问题，包括扩展性限制、单点故障以及对其他计算框架支持不足...

hive on spark mr 数据开发常见问题解决: 在Hive on Spark MR（MapReduce）数据开发中，开发者经常遇到各种问题，这些问题往往阻碍了工作效率。以下是一些常见的问题及其解决方案： 1. **Shuffle in Fetcher#6 错误** 当Hive作业处理大数据量时，可能会...

Yarn资源调用demo案例: 在实际操作中，我们需要对YARN进行适当的配置，包括设置最大内存、CPU核心数等。这通常在`yarn-site.xml`配置文件中进行。例如： ```xml <name>yarn.nodemanager.resource.memory-mb <value>8192 <name>yarn....

第5章Yarn.pdf第5章Yarn.pdf第5章Yarn.pdf第5章Yarn.pdf: 12. 程序执行完毕后，MR向RM注销自身。 **YARN调度器和调度算法** YARN支持多种调度器，包括FIFO调度器、容量调度器（Capacity Scheduler）和公平调度器（Fair Scheduler）。 1. **FIFO调度器**：简单直观，按...

hive on tez 常见报错问题收集: 同时，如果物理内存或虚拟内存超出限制，需要调整YARN的配置，如`yarn.scheduler.minimum-allocation-mb`至少设为4096MB，并将`yarn.nodemanager.vmem-check-enabled`设为false，`yarn.nodemanager.vmem-pmem-ratio`...

Yarn的业界解决方案和未来方向.docx: 2. **NodeManager (NM)**：每个节点上的NodeManager负责管理本机的资源（如内存、CPU等），并接收来自ResourceManager的任务容器(Container)运行请求。NodeManager还负责管理容器的生命周期，包括资源的本地化、隔离...

大数据&&分布式系统学习过程中一些经验总结.zip: Job提交执行过程详解黑斑羚impala集群搭建任务&资源调度相关Airflow 实战总结HadoopYarn架构实现解析Yarn-Federation源码串读Hadoop&Yarn Rpc源码剖析MR任务在Hadoop子系统中状态流转Hadoop Pipes Ping Timeout问题...

MapReduce平台优化详解.pdf: Yarn的出现，使得Hadoop集群中的资源管理和调度变得更加智能和高效。 Yarn的优点包括： * 把JobTracker分为Resource Manager和Application Master，提高了资源管理和调度的效率 * 支持多种计算框架，包括MR、Storm...

藏经阁-LLAP_ Sub-Second Analytical Queries in Hive.pdf: 它可以在不需要特殊YARN队列设置的情况下执行并发查询，并提供了多线程执行矢量化操作符管道、异步IO和高效的内存缓存。 2. LLAP的架构概述 LLAP架构主要包括LLAP守护进程、查询执行器、协调器、HiveServer2（查询...

Hive on Spark安装配置详解.pdf: 为了解决这一问题，Hive引入了Tez和Spark作为替代的执行引擎，其中Hive on Spark因其内存计算的优势，显著提升了处理速度。在本文中，我们将详细介绍如何在已有的Hadoop集群上安装配置Hive on Spark。首先，确保你...

MapReduce学习笔记，亲自测试写出来的，1000分都不贵: ### MapReduce 学习笔记概览 ...通过以上介绍，我们可以了解到 MapReduce 及其在 YARN 上的运行机制，以及如何部署配置和运行 MR 程序。这些知识对于理解和应用 MapReduce 解决实际问题至关重要。

hadoop2.X新特性介绍: - **运行在YARN上的MR**：保留原有的编程模型，但通过YARN进行资源管理，提高了资源利用效率。 - **YARN（Yet Another Resource Negotiator）**： - **资源管理系统**：YARN的核心职责在于资源管理，它可以为不同...

spark11111111111111111111111: 与传统MR（MapReduce）相比，Spark的优势在于它能够在内存中传递数据，效率更高，同时它的任务处理是以线程级别进行，较MR的进程级别更为轻量。Spark在YARN上的部署有两种模式，client模式和cluster模式，主要区别...

大数据技术实践——Spark词频统计: 5. **Task执行**：Task Scheduler将Task发送给Executor执行，Executor在内存中处理数据。 6. **资源释放**：任务完成后，Executor释放资源，整个过程高效且灵活。 **三、Spark组件** 1. **Spark Core**：基础组件，...

大数据高频面试题库.docx: - **YARN Job提交流程**：从客户端提交Job到Resource Manager，再由RM调度到NM执行。 3. **YARN调度器**： - **默认调度器FIFO**：按应用程序提交的顺序执行。 - **调度器分类**：包括FIFO、Capacity Scheduler...

藏经阁-spark替代HIVE实现ETL作业.pdf: Spark 执行复杂 SQL 遇到的问题与解决： 1. 在使用 Spark 执行 HSQL 的时候，有时会遇到一些很硬的 Bug。 2. 多个 union 时经常会遇到一些问题，是因为 Hive 和 Spark 的细节处理不同。 Spark 替代 Hive 实现 ETL...

Global site tag (gtag.js) - Google Analytics