`

统一资源管理与调度平台(系统)介绍

 
阅读更多

1.背景

随着互联网的高速发展,基于数据密集型应用的计算框架不断出现,从支持离线处理的MapReduce,到支持在线处理的Storm,从迭代式计算框架Spark到流式处理框架S4,…,各种框架诞生于不同的公司或者实验室,它们各有所长,各自解决了某一类应用问题。而在大部分互联网公司中,这几种框架可能都会采用,比如对于搜索引擎公司,可能的技术方案如下:网页建索引采用MapReduce框架,自然语言处理/数据挖掘采用Spark(网页PageRank计算,聚类分类算法等,【注】Spark现在不太成熟,很少有公司尝试使用),对性能要求很高的数据挖掘算法用MPI等。考虑到资源利用率,运维成本,数据共享等因素,公司一般希望将所有这些框架部署到一个公共的集群中,让它们共享集群的资源,并对资源进行统一使用,这样,便诞生了资源统一管理与调度平台,典型代表是Mesos和YARN。

本文总结了资源统一管理与调度平台产生背景以及它们所应具有的特点,并对比了当前比较有名的资源统一管理与调度平台Mesos和YARN。

2.资源统一管理和调度平台具有的特点

(1)支持多种计算框架

资源统一管理和调度平台应该提供一个全局的资源管理器。所有接入的框架要先向该全局资源管理器申请资源,申请成功之后,再由框架自身的调度器决定资源交由哪个任务使用,也就是说,整个大的系统是个双层调度器,第一层是统一管理和调度平台提供的,另外一层是框架自身的调度器。

资源统一管理和调度平台应该提供资源隔离。不同的框架中的不同任务往往需要的资源(内存,CPU,网络IO等)不同,它们运行在同一个集群中,会相互干扰,为此,应该提供一种资源隔离机制避免任务之间由资源争用导致效率下降。

(2)扩展性

现有的分布式计算框架都会将系统扩展性作为一个非常重要的设计目标,比如Hadoop,好的扩展性意味着系统能够随着业务的扩展线性扩展。资源统一管理和调度平台融入多种计算框架后,不应该破坏这种特性,也就是说,统一管理和调度平台不应该成为制约框架进行水平扩展。

(3)容错性

同扩展性类似,容错性也是当前分布式计算框架的一个重要设计目标,统一管理和调度平台在保持原有框架的容错特性基础上,自己本身也应具有良好的容错性。

(4) 高资源利用率

如果采用静态资源分配,也就是每个计算框架分配一个集群,往往由于作业自身的特点或者作业提交频率等原因,集群利用率很低。当将各种框架部署到同一个大的集群中,进行统一管理和调度后,由于各种作业交错且作业提交频率大幅度升高,则为资源利用率的提升增加了机会。

(5)细粒度的资源分配

细粒度的资源分配是指直接按照任务实际需求分配资源,而不是像MapReduce那样将槽位作为资源分配单位。这种分配机制可大大提高资源利用率。

3.当前比较有名的开源资源统一管理和调度平台

当前比较有名的开源资源统一管理和调度平台有两个,一个是Mesos,另外一个是YARN,下面依次对这两个系统进行介绍。

3.1Mesos

Mesos诞生于UC Berkeley的一个研究项目,现已成为Apache Incubator中的项目,当前有一些公司使用Mesos管理集群资源,比如Twitter。

总体上看,Mesos是一个master/slave结构,其中,master是非常轻量级的,仅保存了framework(各种计算框架称为framework)和mesos slave的一些状态,而这些状态很容易通过framework和slave重新注册而重构,因而很容易使用了zookeeper解决mesos master的单点故障问题。

Mesos master实际上是一个全局资源调度器,采用某种策略将某个slave上的空闲资源分配给某一个framework,各种framework通过自己的调度器向Mesos master注册,以接入到Mesos中;而Mesos slave主要功能是汇报任务的状态和启动各个framework的executor(比如Hadoop的excutor就是TaskTracker)。

3.2YARN

YARN是下一代MapReduce,即MRv2,是在第一代MapReduce基础上演变而来的,主要是为了解决原始Hadoop扩展性较差,不支持多计算框架而提出的。它完全不同于Hadoop MapReduce,所有代码全部重写而成。整个平台由Resource Manager(master,功能是资源分配)和Node Manager组成(slave,功能是节点管理)。较于HadoopMapReduce,其最大特点是将JobTracker拆分成Resource Manager和Application Master,其中Resource Manager是全局的资源管理器,仅负责资源分配(由于Resource Manager功能简单,所以不会严重制约系统的扩展性),而Application Master对应一个具体的application(如Hadoop job, Spark Job等),主要负责application的资源申请,启动各个任务和运行状态监控(没有调度功能)。

4.Mesos与YARN比较

Mesos与YARN主要在以下几方面有明显不同:

(1)框架担任的角色

在Mesos中,各种计算框架是完全融入Mesos中的,也就是说,如果你想在Mesos中添加一个新的计算框架,首先需要在Mesos中部署一套该框架;而在YARN中,各种框架作为client端的library使用,仅仅是你编写的程序的一个库,不需要事先部署一套该框架。从这点上说,YARN运行和使用起来更加方便。

(2)调度机制

Mesos采用了双层调度策略,第一层是Mesos master将空闲资源分配给某个框架,而第二层是计算框架自带的调度器对分配到的空闲资源进行分配,也就是说,Mesos将大部分调度任务授权给了计算框架;而YARN是一个单层调度架构,各种框架的任务一视同仁,全由Resource Manager进行统一调度。总结来说,Mesos master首先完成粗粒度的资源分配,即:将资源分配给框架,然后由框架进行细粒度的资源分配;而Resource manager直接进行细粒度的分配,即:直接将资源分配给某个任务(Task)。

其他各个特性对比如下表:

5.Mesos与YARN发展情况

个人认为Mesos和YARN均不成熟,很多承诺的功能还未实现或者实现得不全,但总体看,它们发展很快,尤其是YARN,在去年年末推出Hadoop-0.23.0后,近期又推出Hadoop-0.23.1。随着各种计算框架(如Spark,S4,Storm等)的日趋成熟,一个统一的资源管理和调度平台将不可或缺。

另一个与Mesos和YARN类似的系统是Facebook开源的Hadoop Coroca,具体可参考:“Hadoop Corona介绍”

分享到:
评论

相关推荐

    基于GIS的水资源调度管理系统

    第四章讨论了GIS技术给水资源调度管理带来的机遇与挑战,并构想了一个基于GIS的水资源管理系统,该系统具备基本地理信息功能、流域水资源管理查询功能以及多个应用模型的水资源管理、调度应用功能。 在第五章中,...

    宏达 车辆 调度管理系统

    有效的车辆管理不仅能够保证企业运营的顺畅进行,还能提高资源利用效率,降低成本,宏达车辆调度管理系统正是为这一需求而生的智能软件解决方案。 宏达车辆调度管理系统的核心功能之一是车辆基本信息管理,这为车辆...

    煤炭集团公司综合调度统一平台的研究与应用

    基于SOA、Web GIS、Java EE、数据交换等技术,研究并设计了高度集成的煤炭集团公司综合调度统一平台,克服了现有系统存在功能相对单一、数据孤岛严重的问题。平台主要包括表现层、业务层、数据层、集成层四层架构,其中...

    基于Web的煤矿生产调度管理系统的设计

    在煤矿生产调度系统中,可能需要存储矿井的地质数据、生产记录、调度信息等。数据库设计的好坏直接关系到数据的准确性和系统的运行效率。例如,数据库表中的字段可能需要设置为Unique或Primary key来确保数据的唯一...

    统一资源调度平台建设实践.pdf

    总结来说,构建统一资源调度平台是一个复杂而系统的过程,它要求我们在虚拟化技术、资源抽象、调度策略制定等多个方面进行深入的设计和优化。随着技术的不断发展,资源调度平台的建设实践也在不断进步,提供了更多...

    黄河水资源管理调度监控指挥系统研制与推广.docx

    随着我国水利工程建设的不断推进和完善,黄河水资源管理调度监控指挥系统的研制与推广显得尤为重要。该系统的成功实施,不仅提升了水资源管理的智能化程度,而且极大地优化了水资源的分配,为保障黄河水流稳定、防止...

    pbs作业调度系统讲义

    首先,PBS作业调度系统支持异构平台,用户可以通过Unix、NT等操作系统的多种硬件进行操作。它支持API、GUI、CLI和WEB等接口,使得管理变得更加方便。同时,PBS是源代码开放的,用户可以获得详细的用户文档,帮助使用...

    黄河水资源管理调度监控论文.doc

    然后,论文详细介绍了“黄河水资源管理调度监控指挥系统”的设计思想和系统设计原则,包括遵循黄委黄河水资源统一管理、水量统一调度、总量控制、分级管理、分级负责和系统科学先进、经济实用的原则。 论文还详细...

    CDN调度管理平台建设解决方案共23页.pptx

    本解决方案提供了一整套的CDN 调度管理平台架构,涵盖内容管理、分发系统、GSLB 调度系统、运营管理系统、监控运维系统等多个方面。 内容管理 内容管理是 CDN 调度管理平台的核心组件,负责管理和同步内容资源。...

    AGV调度系统解决方案设计.pdf

    3. 交通管制:在受限区域,调度系统管理AGV的通行顺序,防止碰撞或堵塞,确保安全高效的运行。 4. 现场设备信号采集与动作控制:调度系统监控设备状态,必要时发送控制信号,支持自动化装卸操作。 5. MES或ERP接口:...

    阿里统一调度系统SIGMA介绍.pptx

    阿里统一调度系统SIGMA是阿里巴巴内部使用的一种高效资源调度解决方案,旨在提高资源利用率,保障业务稳定性,并优化运维效率。SIGMA的设计与演进反映了调度系统领域的发展趋势,它结合了开源与闭源技术的优点,特别...

    阿里巴巴统一调度系统SIGMA介绍.pptx

    在传统模式下,由于各个业务单元(BU)的资源管理独立,导致了多套调度系统的存在,资源分配不均,尤其是在双11等高峰期,部分资源可能被过度使用,而其他资源则被闲置。SIGMA通过统一调度,实现了云化架构,使得...

    大数据存储及分层实践-3-3 腾讯大数据调度平台-US.zip

    这个平台是腾讯内部大规模数据处理的核心组件,旨在高效、稳定地管理并调度海量数据的计算任务。本实践主要探讨了如何利用该平台实现大数据的高效存储、管理与分析,以及其背后的分层策略。以下是关于这一主题的详细...

    电力调度管理信息系统的开发与应用

    管理子系统,辅助调度中心进行科学化管理,为电网调度运行和职能管理提供 及时的、全面的、准确的信息服务,有助于全面的掌握系统的运行情况,提高 管理水平。 b. 建 设和完善原有的基于Intemet技术的内部网络,开发...

    四川省水资源智能调度管理系统设计思考.pdf

    总之,四川省水资源智能调度管理系统的建设是一项复杂而重要的任务,它将整合现代信息技术,提升水资源管理的科学性和智能化程度,为四川省乃至长江、黄河上游的生态保护和水源涵养提供强有力的支持。这不仅是科技...

    统一调度sigma-调度和策略.pdf

    统一调度系统sigma的介绍涵盖了该系统的发展历史、整体架构、调度策略与算法的具体实践、资源管理与调度优化以及未来展望等多方面的内容,以下是对这些知识点的详细介绍。 首先,统一调度系统sigma是阿里巴巴在统一...

    圣世信通水资源智能调度管理系统.pdf

    为了应对这些挑战,研发出了一款创新的水资源管理解决方案——圣世信通水资源智能调度管理系统。此系统不仅融合了最新的智能系统技术和人工智能,还通过系统开发提供专业指导和参考文献,对优化水资源调度和管理有着...

    基于业务统一部署与管理的资源调度算法.pdf

    综上所述,基于业务统一部署与管理的资源调度算法是针对云计算环境下资源管理的创新解决方案。它强调业务的实时管理和灵活适应,通过软硬约束的转化实现对多样业务需求的优化调度。这种算法对于提升云计算系统的整体...

    广播电视监测监管与指挥调度平台综合系统.pdf

    本文旨在探讨广播电视监测监管与指挥调度平台综合系统的构建和功能,其目的是为了提高广播电视事业的管理和服务质量。该系统能够实现对广播电视节目的监测、管理和调度,为观众提供更好地媒体服务。 为了实现该系统...

Global site tag (gtag.js) - Google Analytics