`
zhaomengsen
  • 浏览: 207560 次
  • 性别: Icon_minigender_1
  • 来自: 河北
社区版块
存档分类
最新评论

mapred.child.java.opts

    博客分类:
  • hive
 
阅读更多
mapred.child.java.opts
这个参数是配置每个map或reduce使用的内存数量。默认的是200M。对于这个参数,我个人认为,如果内存是8G,CPU有8个核,那么就设置成1G就可以了。实际上,在map和reduce的过程中对内存的消耗并不大,但是如果配置的太小,则有可能出现”无可分配内存”的错误。所以,对于这个配置我总结了一个简单的公式:map/reduce的并发数量(总和不大于CPU核数)×mapred.child.java.opts < 该节点机器的总内存。当然也可以等于,不过有点风险而已。
分享到:
评论

相关推荐

    hadoop 2.9.0 mapred-default.xml 属性集

    31. mapred.child.java.opts 设置子进程的JVM参数,例如堆大小。 32. mapred.child.env 设置子进程的环境变量。 33. mapreduce.admin.user.env 定义管理员用户的环境。 34. yarn.app.mapreduce.am.log.level 定义...

    hadoop调用matlab程序[文].pdf

    在`mapred-site.xml`中,添加`mapred.child.env`属性来指定`LD_LIBRARY_PATH`,以及`mapred.child.java.opts`以控制每个任务的最大内存。 在Java程序中,我们可以通过`Configuration`对象设置这些环境变量。例如,...

    集群Hadoop性能测试

    - **mapred.child.java.opts**: 设置每个任务的JVM堆内存。增大内存分配可以优化任务执行。 2. **core-site.xml配置测试**: - **io.seqfile.compress.blocksize**: 块压缩的最小大小。测试结果显示,块压缩的...

    hadoop 配置项的调优

    3. **mapred.child.java.opts**:该配置用于设定JVM进程的最大堆内存。由于reduce任务通常需要更大的内存,因此合理设置此参数可避免内存溢出,但也不能设置得过大,否则可能增加GC开销。 4. **Input Split的大小**...

    hadoop单机版

    - `mapred-site.xml`: 配置JobTracker地址(`mapred.job.tracker`)、系统目录(`mapred.system.dir`)、本地工作目录(`mapred.local.dir`)以及子任务JVM内存参数(`mapred.child.java.opts`)。 8. **修改masters和...

    hadoop安装使用教程

    - **`mapred.child.java.opts`**: 设置MapReduce任务中的Java进程的最大内存。 - **`dfs.block.size`**: 数据块的大小,默认为128MB,这里设置为5MB以适应较小的测试数据集。 ##### Master和Slave节点配置 1. **...

    Hadopp集群运用过程中碰到的问题

    - 解决方法:通过修改mapred-site.xml文件,增大mapred.child.java.opts属性的值,以增加JVM堆内存。 - **错误现象2:could only be replicated to 0 nodes, instead of 1** - 原因:HDFS的副本复制出现问题。 ...

    Hadoop performance models

    | pTaskMem | mapred.child.java.opts | -Xmx200m | MapReduce 子进程 Java 内存大小 | | pMaxMapsPerNode | mapred.tasktracker.map.tasks.max | 2 | 单节点最大 Map 任务数 | | pMaxRedPerNode | mapred....

    Hadoop FAQ--浙江大学数学系方建勇.doc

    - `mapred.child.java.opts = -Xmx512m`:为 MapReduce 子进程分配内存。 - `fs.inmemory.size.mb = 200`:内存在缓存中的大小。 - `io.sort.factor = 100`:排序因子。 - `io.sort.mb = 200`:排序内存大小。 ...

    Hadoop学习总结之五:Hadoop的运行痕迹

    - `mapred.child.java.opts`: 设置Task JVM的远程调试监听端口为8333 #### 四、追踪Hadoop运行痕迹的方法 ##### 1. 日志文件分析 - **NameNode日志**: - 位于`/var/log/hadoop/hadoop-namenode-namenode.out` ...

    hive优化总结

    例如,可以修改mapred.child.java.opts参数来增加内存大小,以避免内存溢出错误。 2. 表设计优化 Hive的表设计也很重要。在创建表时,可以在hive-site.xml文件中配置默认的仓库路径。同时,在执行JOIN操作时,应该...

    hadoop2部署配置文件

    你可以在这里调整`HADOOP_MAPRED_HOME`,以及MapReduce作业的执行参数,如`HADOOP_MAPRED.child.java.opts`。 4. **slaves**: 这个文件列出了集群中的所有工作节点(slaves),即DataNodes和NodeManagers。每个节点...

    hadoop集群各种配置文件

    3. `mapred.map.child.java.opts`和`mapred.reduce.child.java.opts`分别设置了Map任务和Reduce任务子进程的Java堆大小,分别为512MB和1024MB。 最后,`hadoop-env.sh`是Hadoop环境变量的配置,它定义了运行Hadoop...

    CSDN TUP第四期雅虎讲师PPT(.pdf)

    &lt;name&gt;mapred.child.java.opts &lt;value&gt;-Xmx512m &lt;final&gt;true ``` #### 五、性能调优 性能调优对于提升Hadoop应用程序的效率至关重要。从用户角度来看,目标是减少端到端的执行时间,从而加快相同数据量下的...

    Hive常见错误及解决方案.docx

    &lt;name&gt;mapred.child.java.opts &lt;value&gt;-Xmx1024m ``` Hive 是一个功能强大且复杂的工具,它的使用需要有一定的经验和知识。但是,当出现错误时,不要担心,只需要按照上述解决方案进行解决即可。

    Hadoop 参数配置优化.docx

    9. **mapred.child.java.opts**: 默认为-Xmx200m,限制了JVM子进程的最大内存。可以调整为-Xmx1024m或更高,但需注意避免浪费资源,根据任务复杂度和数据量选择合适值。 10. **mapreduce.jobtracker.handler....

    Hadoop集群配置及MapReduce开发手册

    - **内存优化**: 调整Hadoop配置文件中的内存参数,如`mapred.child.java.opts`、`yarn.nodemanager.resource.memory-mb`等,以提高系统的内存利用率。 - **master优化**: 对Namenode进行优化,比如增加缓存大小、...

    Hadoop的全部配置

    - **`mapred.child.java.opts---Xmx200m`**:限制了MapReduce任务的子进程最大堆内存为200MB。 - **`mapreduce.jobtracker.retiredjobs.cache.size--1000`**:设置了作业追踪器缓存已退休作业的最大数量为1000个。...

    《Hadoop开发者》第四期

    - **内存配置**:根据服务器硬件配置调整`mapred.child.java.opts`等内存相关参数。 - **任务数量**:根据集群规模调整`mapred.map.tasks`和`mapred.reduce.tasks`的数量。 - **网络带宽**:优化网络配置以减少数据...

Global site tag (gtag.js) - Google Analytics