`
1028826685
  • 浏览: 936848 次
  • 性别: Icon_minigender_1
  • 来自: 重庆
社区版块
存档分类

分布式任务调度

 
阅读更多

宙斯是一个完整的Hadoop的作业平台

从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期

从功能上来说,支持:

Hadoop MapReduce任务的调试运行

Hive任务的调试运行

Shell任务的运行

Hive元数据的可视化查询与数据预览

Hadoop任务的自动调度

完整的文档管理

 

宙斯开源,不仅仅是开源技术,更是开源产品。

 

 

 

课程介绍:详解Hadoop作业平台宙斯Zeus

 

课程大纲:

zeus简介

zeus架构

zeus与其他调度系统对比

支持yarn的zeus2

zeus使用注意事项

zeus2的后续计划

 

【适合群体】 :

1. 系统架构师、系统分析师、高级程序员、资深开发人员。  

2. 牵涉到大数据处理的数据中心运行、规划、设计负责人。  

3. 政府机关,金融保险、移动和互联网等大数据来源单位的负责人。  

4. 高校、科研院所涉及到大数据与分布式数据处理的项目负责人。  

5. 数据仓库管理人员、建模人员,分析和开发人员、系统管理人员、数据库管理人员以及对数据仓库感兴趣的其他人员。 

 

 

以下是视频过程QA:

 

这个跟tws调度是不是有些像?

答:对tws不是很了解,具体不太请求,跟oozie比较像

 

Zeus也是apache的开源组件吗?代码托管到哪了?

答:不是apache的,是阿里的,github地址为https://github.com/alibaba/zeus

 

Master挂掉之后worker还会继续执行作业吗?

答:Worker会杀死自身的任务,然后连接到新的Master

 

zookeeper在里面起什么作用?

答:主要是做任务失败通知,不是必须的

 

taobao不用这个了吗?github上都一年没更新了?Zeus在阿里主要做那块任务?

答:淘宝据我了解一直在使用,代码现在确实没有更新,所有有新版zeus2:https://github.com/michael8335/zeus2

 

好像淘宝有个开源项目tbschedule任务调度系统,和这个有什么区别?

答:tbschedule也是一个批处理调度引擎,但zeus更专注与hadoop

 

Worker竞争分布式锁,会不会死锁呢?

答:不会,原子操作

 

可以举一个Zeus实际的应用实例吗?

答:很多公司都用来做hadoop集群调度,最常用的就是MR和Hive

 

如果使用用zeus还是zues2好?

答:这个还是根据实际情况来,如果是hadoop1,最好直接用zeus,如果是hadoop2,个人建议使用zeus2

 

当前正在执行的所有worker的任务清单,存储在哪里?如果当前master宕机,新的master怎么能取到、并重新下发任务?

答:任务每个关键点都会记录在数据库中,新Master直接从数据库中就可以获得

 

新的Master怎么知道之前所有正在执行的任务,然后下发?

答:新Master可以从数据库的任务历史表中获取正在执行的任务

 

zeus对算法的管理与调度,支持样本数据的模拟结果吗?因为算法场景和效率区别还是比较大得

答:zeus只是一个工作流引擎,具体的算法是自己的job实现

 

zeus在淘宝应用规模有多大?请老师再介绍一下宙斯诞生发展的背景过程.

答:这个应用规模不便说,背景主要是为了给hadoop集群提供友好的调度管理

zeus和azkaban和oozie做一下比较?

答:都是hadoop集群的工作流引擎

 

使用宙斯的任务调度跑HiveQL有时会遇到找不到hive表或者找不到jar包的情况,但是手动执行重跑又可以执行了,请问这个是怎么回事?

答:这个是环境变量没有配置正确的原因

 

zeus支持yarn吗?想问一下宙斯1现在存在哪些bug?

答:zeus1不支持,zeus2支持,具体的BUG可以到https://github.com/michael8335/zeus2 wiki中查看

 

宙斯的master和yearn的ResourceManager有啥联系吗?

答:没有

 

公司在用宙斯任务调度时不时的有任务进入任务队列不执行的情况,然后就只能重启宙斯,这也是宙斯1的bug吧?

答:这个得具体分析,可以私下联系我

 

请问现在可以对接到Hadoop2.4版本吗?什么时候支持hive0.13

答:没有,暂时没有必要

分享到:
评论

相关推荐

    灵活,可靠和快速的分布式任务重试和分布式任务调度平台

    灵活,可靠和快速的分布式任务重试和分布式任务调度平台。其核心采用分区模式实现,具备高度可伸缩性和容错性的分布式系统。拥有完善的权限管理、强大的告警监控功能和友好的界面交互。欢迎大家接入并使用。 可重放...

    基于Java的分布式任务调度框架设计源码

    本源码项目是基于Java的分布式任务调度框架设计,包含1201个文件,主要使用Java、CSS、JavaScript和Shell编程语言。该项目是一个分布式任务调度框架,旨在帮助开发者更高效地管理和调度任务。系统提供了实时任务、...

    spring分布式任务调度

    改分布式任务调度特性如下: 1、简单:支持通过Web页面对任务进行CRUD操作,操作简单,一分钟上手; 2、动态:支持动态修改任务状态、暂停/恢复任务,以及终止运行中任务,即时生效; 3、调度中心HA(中心式):调度...

    面向计算密集型任务的分布式任务调度平台设计与实现.pdf

    分布式任务调度平台的出现,就是为了应对上述挑战。它通过合理设计和实现,不仅能够提高资源的利用率和系统的稳定性,还能满足生产中对于复杂任务编排和计算密集型任务的性能要求。在设计和实现这样的平台时,需要...

    实时处理系统分布式任务调度PPT

    实时处理系统分布式任务调度PPT主要探讨了在大数据背景下,如何高效、稳定地处理电信运营商生产系统的实时数据。这一主题涵盖了大数据技术、计费系统、实时处理、Hadoop/HBase以及分布式计算等多个重要知识点。 ...

    基于Java核心的xxl-job分布式任务调度平台设计源码

    该项目为基于Java核心的xxl-job分布式任务调度平台,源代码包含287个文件,涵盖133个Java源文件、35个PNG图片、35个JavaScript文件、16个XML配置文件、12个CSS样式表、11个FTL模板文件、6个属性文件、3个Markdown...

    分布式任务调度平台XXL-JOB(Oracle版)

    这里分享自己已经跑起来的Oracle版本分布式任务调度平台XXL-JOB资源。 官方只有Mysql版本的DEMO,由于近期单位项目需要,将原来DEMO稍作修改后改成了oracle版本,主要修改工作包括修改配置文件,数据库连接方式,pom...

    基于动态负载均衡的分布式任务调度算法研究.pdf

    本文研究了基于动态负载均衡的分布式任务调度算法,旨在解决传统分布式任务调度中节点负载不均衡问题,从而提高系统性能。 动态负载均衡是指在任务调度过程中,根据系统内各节点的实时性能指标,如CPU利用率、内存...

    schedule-job, 基于Spring Boot Quartz 的分布式任务调度系统.zip

    【标题】:基于Spring Boot和Quartz的分布式任务调度系统 在现代企业级应用中,任务调度是一项重要的功能,用于按预定的时间间隔执行特定的任务,例如数据同步、报表生成、清理过期数据等。本项目名为“schedule-...

    XXL-JOB分布式任务调度系统培训PPT

    "XXL-JOB分布式任务调度系统培训PPT" XXL-JOB分布式任务调度系统是当前 Java 生态中的一种流行的分布式任务调度系统。它提供了多种功能特性,如支持 cron 表达式、支持多种任务类型、支持任务优先级、支持任务依赖...

    分布式任务调度平台XXL-JOB

    分布式任务调度平台XXL-JOB

    dotnet-分布式任务调度系统纯NET打造的重量级大数据实时计算平台

    分布式任务调度系统是现代企业IT架构中的重要组成部分,它能够高效地管理并执行大量异步任务,确保系统在高并发、大数据量环境下依然保持稳定和高效。本文将深入探讨基于.NET构建的分布式任务调度系统——AntJob,...

    阿里云 专有云企业版 V3.8.1 分布式任务调度ScheduleX 用户指南 20190910

    阿里云 专有云企业版 V3.8.1 分布式任务调度ScheduleX 用户指南旨在提供关于分布式任务调度SchedulerX 的详细信息和操作指南,以帮助用户快速上手和理解分布式任务调度SchedulerX 的功能和应用。 法律声明是阿里云...

    分布式任务调度框架elastic-job-lite

    分布式任务调度框架Elastic-Job-Lite是当当网推出的一款轻量级无中心化任务调度解决方案,旨在解决大规模分布式环境下的任务调度问题。这款框架的设计理念是将任务的执行与调度分离,使得任务调度器无需关注具体的...

    大数据平台:分布式任务调度系统.zip

    在大数据领域,分布式任务调度系统是核心组成部分之一,它负责协调和管理大数据处理流程中的各种任务,确保数据处理高效、可靠地进行。本压缩包"大数据平台:分布式任务调度系统.zip"内包含的"Taier-master"可能是一...

    Elastic-Job分布式任务调度视频教程

    2、课程价值本着从解决生产实际问题出发,讲授分布式任务调度的实现方案,本课程采用当当网开源的Elastic-job任务调度产品作为技术方案,从Elastic-job的应用、原理、项目实战三方面进行讲解,通过学习本课程可以...

    阿里云 专有云企业版 V3.8.1 分布式任务调度ScheduleX 运维指南 20190910

    阿里云专有云企业版V3.8.1分布式任务调度ScheduleX运维指南 阿里云专有云企业版V3.8.1分布式任务调度ScheduleX运维指南是阿里云提供的一份详细的运维指南,旨在帮助用户更好地了解和使用ScheduleX分布式任务调度...

    分布式任务调度框架 集合

    对TBSchedule分布式任务调度进行了简单改造 3. light-task-scheduler LTS是一个轻量级分布式任务调度框架。有三种角色, JobClient, JobTracker, TaskTracker。 4. uncode-schedule 基于zookeeper+spring task的...

    ELasticJob分布式任务调度视频

    ELasticJob分布式任务调度从基础到工作的实际开发中都可以用到的技术,但是技术是学不完的,需要在看完视频后多练习才能更好的成功

Global site tag (gtag.js) - Google Analytics