Hadoop YARN中内存和CPU两种资源的调度和隔离

乡里伢崽

浏览: 112516 次
性别:
来自: 深圳

最近访客更多访客>>

loginboot

gaojingsong

eliot4u

benwudashi

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

yarn

Hadoop YARN同时支持内存和CPU两种资源的调度（默认只支持内存，如果想进一步调度CPU，需要自己进行一些配置），本文将介绍YARN是如何对这些资源进行调度和隔离的。

在YARN中，资源管理由ResourceManager和NodeManager共同完成，其中，ResourceManager中的调度器负责资源的分配，而NodeManager则负责资源的供给和隔离。ResourceManager将某个NodeManager上资源分配给任务（这就是所谓的“资源调度”）后，NodeManager需按照要求为任务提供相应的资源，甚至保证这些资源应具有独占性，为任务运行提供基础的保证，这就是所谓的资源隔离。

关于Hadoop YARN资源调度器的详细介绍，可参考我的这篇文章：YARN/MRv2 Resource Manager深入剖析—资源调度器。

在正式介绍具体的资源调度和隔离之前，先品味一下内存和CPU这两种资源的特点，这是两种性质不同的资源。内存资源的多少会会决定任务的生死，如果内存不够，任务可能会运行失败；相比之下，CPU资源则不同，它只会决定任务运行的快慢，不会对生死产生影响。

【YARN中内存资源的调度和隔离】

基于以上考虑，YARN允许用户配置每个节点上可用的物理内存资源，注意，这里是“可用的”，因为一个节点上的内存会被若干个服务共享，比如一部分给YARN，一部分给HDFS，一部分给HBase等，YARN配置的只是自己可以使用的，配置参数如下：

（1）yarn.nodemanager.resource.memory-mb

表示该节点上YARN可使用的物理内存总量，默认是8192（MB），注意，如果你的节点内存资源不够8GB，则需要调减小这个值，而YARN不会智能的探测节点的物理内存总量。

（2）yarn.nodemanager.vmem-pmem-ratio

任务每使用1MB物理内存，最多可使用虚拟内存量，默认是2.1。

（3） yarn.nodemanager.pmem-check-enabled

是否启动一个线程检查每个任务正使用的物理内存量，如果任务超出分配值，则直接将其杀掉，默认是true。

（4） yarn.nodemanager.vmem-check-enabled

是否启动一个线程检查每个任务正使用的虚拟内存量，如果任务超出分配值，则直接将其杀掉，默认是true。

（5）yarn.scheduler.minimum-allocation-mb

单个任务可申请的最少物理内存量，默认是1024（MB），如果一个任务申请的物理内存量少于该值，则该对应的值改为这个数。

（6）yarn.scheduler.maximum-allocation-mb

单个任务可申请的最多物理内存量，默认是8192（MB）。

默认情况下，YARN采用了线程监控的方法判断任务是否超量使用内存，一旦发现超量，则直接将其杀死。由于Cgroups对内存的控制缺乏灵活性（即任务任何时刻不能超过内存上限，如果超过，则直接将其杀死或者报OOM），而Java进程在创建瞬间内存将翻倍，之后骤降到正常值，这种情况下，采用线程监控的方式更加灵活（当发现进程树内存瞬间翻倍超过设定值时，可认为是正常现象，不会将任务杀死），因此YARN未提供Cgroups内存隔离机制。

【YARN中CPU资源的调度和隔离】

在YARN中，CPU资源的组织方式仍在探索中，目前（2.2.0版本）只是一个初步的，非常粗粒度的实现方式，更细粒度的CPU划分方式已经提出来了，正在完善和实现中。

目前的CPU被划分成虚拟CPU（CPU virtual Core），这里的虚拟CPU是YARN自己引入的概念，初衷是，考虑到不同节点的CPU性能可能不同，每个CPU具有的计算能力也是不一样的，比如某个物理CPU的计算能力可能是另外一个物理CPU的2倍，这时候，你可以通过为第一个物理CPU多配置几个虚拟CPU弥补这种差异。用户提交作业时，可以指定每个任务需要的虚拟CPU个数。在YARN中，CPU相关配置参数如下：

（1）yarn.nodemanager.resource.cpu-vcores

表示该节点上YARN可使用的虚拟CPU个数，默认是8，注意，目前推荐将该值设值为与物理CPU核数数目相同。如果你的节点CPU核数不够8个，则需要调减小这个值，而YARN不会智能的探测节点的物理CPU总数。

（2） yarn.scheduler.minimum-allocation-vcores

单个任务可申请的最小虚拟CPU个数，默认是1，如果一个任务申请的CPU个数少于该数，则该对应的值改为这个数。

（3）yarn.scheduler.maximum-allocation-vcores

单个任务可申请的最多虚拟CPU个数，默认是32。

默认情况下，YARN是不会对CPU资源进行调度的，你需要配置相应的资源调度器让你支持，具体可参考我的这两篇文章：

（1）Hadoop YARN配置参数剖析（4）—Fair Scheduler相关参数

（2）Hadoop YARN配置参数剖析（5）—Capacity Scheduler相关参数

默认情况下，NodeManager不会对CPU资源进行任何隔离，你可以通过启用Cgroups让你支持CPU隔离。

由于CPU资源的独特性，目前这种CPU分配方式仍然是粗粒度的。举个例子，很多任务可能是IO密集型的，消耗的CPU资源非常少，如果此时你为它分配一个CPU，则是一种严重浪费，你完全可以让他与其他几个任务公用一个CPU，也就是说，我们需要支持更粒度的CPU表达方式。

借鉴亚马逊EC2中CPU资源的划分方式，即提出了CPU最小单位为EC2 Compute Unit（ECU），一个ECU代表相当于1.0-1.2 GHz 2007 Opteron or 2007 Xeon处理器的处理能力。YARN提出了CPU最小单位YARN Compute Unit（YCU），目前这个数是一个整数，默认是720，由参数yarn.nodemanager.resource.cpu-ycus-per-core设置，表示一个CPU core具备的计算能力（该feature在2.2.0版本中并不存在，可能增加到2.3.0版本中），这样，用户提交作业时，直接指定需要的YCU即可，比如指定值为360，表示用1/2个CPU core，实际表现为，只使用一个CPU core的1/2计算时间。注意，在操作系统层，CPU资源是按照时间片分配的，你可以说，一个进程使用1/3的CPU时间片，或者1/5的时间片。对于CPU资源划分和调度的探讨，可参考以下几个链接：

https://issues.apache.org/jira/browse/YARN-1089

https://issues.apache.org/jira/browse/YARN-1024

Hadoop 新特性、改进、优化和Bug分析系列5：YARN-3

【总结】

目前，YARN 内存资源调度借鉴了Hadoop 1.0中的方式，比较合理，但CPU资源的调度方式仍在不断改进中，目前只是一个初步的粗糙实现，相信在不久的将来，YARN 中CPU资源的调度将更加完善。

分享到：

zookeeper的伪分布式搭建 | Hadoop YARN配置参数剖析(5)—Capacity S ...

2015-01-07 11:22
浏览 669
评论(0)
分类:编程语言
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

的最全韩顺平php入门到精通全套笔记.doc ): 【PHP入门】 PHP（Hypertext Preprocessor）是一种广泛使用的开源服务器端脚本语言，尤其适用于Web开发，能够嵌入HTML中。本篇笔记基于韩顺平老师的讲解，全面覆盖了从基础到精通的PHP知识体系。 1. **HTML基础** HTML，即超文本标记语言，用于创建网页内容。它包括各种标签来定义网页结构，如`<html>`、`<head>`、`<body>`等。HTML与CSS结合使用，可以实现页面样式控制。HTML5作为最新版本，引入了更多增强功能，如离线存储、拖放功能和媒体元素等。运行HTML有两种方式：本地运行（直接通过浏览器打开文件）和远程访问（通过HTTP协议在服务器上运行）。 2. **动态网页技术** 动态网页能够根据用户输入或服务器状态变化实时更新内容。PHP作为动态网页开发的重要技术之一，具有跨平台、安全性高、效率好、成本低、易于学习和丰富的开源社区支持等优点。PHP可以连接多种数据库，如MySQL，并在PHP4、PHP5和PHP6（及后续版本）中逐。内容来源于网络分享，如有侵权请联系我删除。另外如果没有积分的同学需要下载，请私信我。

花生好坏缺陷识别数据集,7262张图片，支持yolov7格式的标注，识别准确率在95.7%: 花生好坏缺陷识别数据集,7262张图片，支持yolov7格式的标注，识别准确率在95.7% 两种标签： Good，Bad 花生好坏缺陷识别数据集,7262张图片，支持yolo，coco json，pasical voc xml格式的标注，识别准确率在95.7% 详情查看地址：https://backend.blog.csdn.net/article/details/144983881

总务科（基建办）2024年工作总结.doc: 总务科（基建办）2024年工作总结.doc

基于springboot+vue的相亲网站（Java毕业设计，附源码，部署教程）.zip: 该项目包含完整的前后端代码、数据库脚本和相关工具，简单部署即可运行。功能完善、界面美观、操作简单，具有很高的实际应用价值，非常适合作为Java毕业设计或Java课程设计使用。所有项目均经过严格调试，确保可运行！下载后即可快速部署和使用。 1 适用场景：毕业设计期末大作业课程设计 2 项目特点：代码完整：详细代码注释，适合新手学习和使用功能强大：涵盖常见的核心功能，满足大部分课程设计需求部署简单：有基础的人，只需按照教程操作，轻松完成本地或服务器部署高质量代码：经过严格测试，确保无错误，稳定运行 3 技术栈和工具前端：HTML + Vue.js 后端框架：Spring Boot 开发环境：IntelliJ IDEA 数据库：MySQL（建议使用 5.7 版本，更稳定）数据库可视化工具：Navicat 部署环境：Tomcat（推荐 7.x 或 8.x 版本），Maven

广东省高清卫星地图全图: 广东省高清卫星地图全图

智能聊天机器人在电商客服领域的应用研究与开发毕业设计报告: 本文聚焦智能聊天机器人于电商客服领域的应用，开篇点明研究背景，剖析电商发展促使客服需求暴增，传统客服乏力，智能机器人应运而生。接着详述电商客服发展脉络、现存痛点，如高峰拥堵、知识滞后、服务同质化等。核心技术涵盖自然语言处理、机器学习、知识图谱，系统采用微服务架构，各模块分工协作。开发流程包括精细调研、多元数据采集、模型选型调优等。创新应用体现于售前精准导购、沉浸式营销，售中订单跟踪、答疑，售后问题处理与回访。经量化指标与用户调研评估成效显著，虽有挑战，但未来借助新技术有望重塑电商服务生态，助力企业与消费者双赢。

基于springboot+vue的人口老龄化社区服务与管理平台（Java毕业设计，附源码，部署教程）.zip: 该项目包含完整的前后端代码、数据库脚本和相关工具，简单部署即可运行。功能完善、界面美观、操作简单，具有很高的实际应用价值，非常适合作为Java毕业设计或Java课程设计使用。所有项目均经过严格调试，确保可运行！下载后即可快速部署和使用。 1 适用场景：毕业设计期末大作业课程设计 2 项目特点：代码完整：详细代码注释，适合新手学习和使用功能强大：涵盖常见的核心功能，满足大部分课程设计需求部署简单：有基础的人，只需按照教程操作，轻松完成本地或服务器部署高质量代码：经过严格测试，确保无错误，稳定运行 3 技术栈和工具前端：HTML + Vue.js 后端框架：Spring Boot 开发环境：IntelliJ IDEA 数据库：MySQL（建议使用 5.7 版本，更稳定）数据库可视化工具：Navicat 部署环境：Tomcat（推荐 7.x 或 8.x 版本），Maven

eap2025010741566905-1-1.pdf: eap2025010741566905-1-1.pdf

双馈风机MATLAB simulink模型多个模型打包发送: 双馈风机MATLAB simulink模型多个模型打包发送

小熊汉字笔顺学习软件 v2.0: 给小孩找的，看着还不错，分享出来~

基于springboot+vue的美容院管理系统（Java毕业设计，附源码，部署教程）.zip: 该项目包含完整的前后端代码、数据库脚本和相关工具，简单部署即可运行。功能完善、界面美观、操作简单，具有很高的实际应用价值，非常适合作为Java毕业设计或Java课程设计使用。所有项目均经过严格调试，确保可运行！下载后即可快速部署和使用。 1 适用场景：毕业设计期末大作业课程设计 2 项目特点：代码完整：详细代码注释，适合新手学习和使用功能强大：涵盖常见的核心功能，满足大部分课程设计需求部署简单：有基础的人，只需按照教程操作，轻松完成本地或服务器部署高质量代码：经过严格测试，确保无错误，稳定运行 3 技术栈和工具前端：HTML + Vue.js 后端框架：Spring Boot 开发环境：IntelliJ IDEA 数据库：MySQL（建议使用 5.7 版本，更稳定）数据库可视化工具：Navicat 部署环境：Tomcat（推荐 7.x 或 8.x 版本），Maven

bcolz-1.2.1-cp38-cp38-win-amd64.whl.rar: bcolz-1.2.1-cp38-cp38-win-amd64.whl.rar

自动驾驶技术中域控制单元(DCU)的核心作用与发展前景: 内容概要：本文详尽阐述了自动驾驶技术中的域控制单元(DCU)及其重要性。首先介绍了ADAS（高级驾驶辅助系统）和AD（自动驾驶）的区别和发展现状。接着讨论了域控制单元作为高级ECU，在自动驾驶系统中扮演的重要角色，包括高性能计算、高效的数据处理能力和与其他子系统的紧密配合。文中详细解释了DCU的构成元素——收发器、SoC、MCU和电源管理等模块的工作原理和技术细节，同时也探讨了市场趋势和技术发展趋势，如高集成度、智能化、低功耗等方面。最后展望了DCU在未来域集中式EE架构下的广阔应用前景。适用人群：从事汽车工程、自动驾驶技术和嵌入式软件开发的专业技术人员，以及对此领域感兴趣的科研工作者。使用场景及目标：①帮助开发者深入了解自动驾驶系统组成尤其是DCU的设计理念和技术特征；②指导相关领域的研究者把握当前行业发展动态和技术前沿。其他说明：本文不仅深入浅出地讲解了专业知识，而且引用了一些作者个人感悟的文字，增加了可读性和启发性。

Java与Python编程语言特性、应用场景及其学习选择: 内容概要：文章主要介绍了Java和Python这两种流行的编程语言之间的区别和联系。首先详细讲述了Java的基本特性，包括跨平台性、面向对象编程、类型安全、自动化内存管理和多线程支持等特点，并概述了其在企业级开发中的广泛应用。接着深入探讨了Python的特点，指出它的简明语法、灵活性以及丰富的生态体系，特别提到了其在数据分析、人工智能等前沿领域的优势。文中还比较了两者的应用场景和技术实现方式的不同之处。最后为初学者提出了基于个人职业发展目标来选择编程语言的建议。适合人群：对编程有兴趣的学生、编程新手以及想要转换编程方向的技术人员。使用场景及目标：有助于读者理解两种编程语言各自的优劣，便于在实际工作中或者个人兴趣发展中做出明智的选择。其他说明：通过对比讲解，不仅展示了两种编程语言的共同点，还强调了它们各自独特的优势所在。这有助于加深读者对其本质特征的认识，从而更好地应对不同类型的编程任务和挑战。

Java 飞机订票系统实训报告: Java 飞机订票系统实训报告，有数据库

easy-interceptor修改请求头和响应头.zip: easy-interceptor修改请求头和响应头.zip

Python身份证识别系统源码（精准度非常高）.zip: Python身份证识别系统源码（精准度非常高）.zip，个人大三大作业设计项目、经导师指导并认可通过的高分设计项目，评审分99分，代码完整确保可以运行，小白也可以亲自搞定，主要针对计算机相关专业的正在做毕设的学生和需要项目实战练习的学习者，也可作为课程设计、期末大作业。 Python身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系统源码（精准度非常高）.zipPython身份证识别系

【电磁】基于matlab微带线中的电势和场分布【含Matlab源码 10949期】.zip: Matlab领域上传的视频是由对应的完整代码运行得来的，完整代码皆可运行，亲测可用，适合小白； 1、从视频里可见完整代码的内容主函数：main.m；调用函数：其他m文件；无需运行运行结果效果图； 2、代码运行版本 Matlab 2019b；若运行有误，根据提示修改；若不会，私信博主； 3、运行操作步骤步骤一：将所有文件放到Matlab的当前文件夹中；步骤二：双击打开main.m文件；步骤三：点击运行，等程序运行完得到结果； 4、仿真咨询如需其他服务，可私信博主； 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作

一个利用深度学习模型（LSTM 网络）对电商用户咨询文本进行意图分类的python源码: 功能：利用深度学习模型（LSTM 网络）对电商用户咨询文本进行意图分类，相比简单规则匹配，能处理更复杂、语义模糊的文本，精准识别用户需求。技术要点：使用 TensorFlow 构建 LSTM 模型，包括文本预处理将文本数字化，Embedding 层将数字映射为向量，LSTM 层捕捉序列特征，Dense 层输出分类结果，通过训练优化模型参数，实现准确意图识别。

国产银河麒麟V10和统信系统(linux)没有root用户的解决办法: 国产银河麒麟V10和统信系统(linux)没有root用户的解决办法。如何在没有root用户的情况下，开通和启用root用户

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论