`
wbj0110
  • 浏览: 1599198 次
  • 性别: Icon_minigender_1
  • 来自: 上海
文章分类
社区版块
存档分类
最新评论

淘宝Hadoop作业平台 宙斯Zeus(转)

    博客分类:
  • Zeus
阅读更多

宙斯(zeus)是什么

宙斯是一个完整的Hadoop的作业平台
从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期

从功能上来说,支持:
Hadoop MapReduce任务的调试运行
Hive任务的调试运行
Shell任务的运行
Hive元数据的可视化查询与数据预览
Hadoop任务的自动调度
完整的文档管理

宙斯开源,不仅仅是开源技术,更是开源产品

开发中心,一个文档管理,开发调试的环境,在任务上线前的主要工作区域
调度中心,生产任务的调度环境,当任务调试通过后,在此处配置调度信息进行生产调度

宙斯运行原理

使用指南

快速启动(Quick Start):
1.设置配置项
在/web/src/main/filter/antx.properties 中对配置项进行设置
设置完成后,复制到${user.home}/antx.properties处
2.pom.xml本地jar地址修改
在/web/pom.xml中修改properties中的local.highcharts
因为此jar不在maven仓库中,此jar已经在/web/libs/highcharts-1.4.0.jar
将systemPath路径设置为绝对路径
3.数据库配置
zeus数据库:/web/src/main/resources/persistence.xml中对数据库进行配置
hive元数据库:/web/src/main/resources/templates/hive-site.xml中对Hive metastore数据库进行配置
4.打包
mvn package
打包在/web/target/exploded/zeus-web.war下
使用tomcat之类容器运行即可

以上步骤可以保证这个web项目正常启动,如果需要正式上线此项目,还需要配置以下内容:
1.动态模板配置
宙斯系统中有很多模板是可以动态修改的,包括以下一些,建议在正式运行之前都配置好
首页展示内容 启动后参见页面指南
首页通知内容 启动后参见页面指南
hive 默认udf函数 com.taobao.zeus.jobs.sub.HiveJob实现TODO内容

2.登陆系统
宙斯不包含单独的注册系统
建议使用单点登陆来实现登陆
大致原理:
(1) web.xml添加一个filter,用来跳转到单点登陆系统
(2) Spring容器中添加一个Bean,实现com.taobao.zeus.web.Login.Filter.SSOLogin接口

3.配置hadoop相关环境 默认的hadoop-site.xml和hive-site.xml在 /web/src/main/resources/templates下
修改相应的配置以对应相应的hadoop集群

4.超级管理员配置 在com.taobao.zeus.store.Super中进行配置

分享到:
评论

相关推荐

    CSDN在线培训——详解Hadoop作业平台宙斯Zeus

    宙斯是一个完整的Hadoop的作业平台 从Hadoop任务的调试运行到生产任务的周期调度 宙斯支持任务的整个生命周期 从功能上来说,支持: Hadoop MapReduce任务的调试运行 Hive任务的调试运行 Shell任务的运行 Hive元...

    如何使用eclipse调试Hadoop作业

    Eclipse作为一款强大的Java集成开发环境,为开发者提供了丰富的工具来调试Java应用程序,包括基于Hadoop的作业。本篇文章将详细阐述如何利用Eclipse有效地调试Hadoop作业,以及与之相关的源码分析和工具使用技巧。 ...

    Hive及Hadoop作业调优

    标题《Hive及Hadoop作业调优》与描述《阿里巴巴内部hive优化经验文档》指明了本文档的核心内容,它涉及到了在大数据处理领域内,如何针对Hive以及Hadoop作业进行优化的详细方法和经验分享。标签“hive”, “hadoop”...

    hadoop实验+作业.zip

    这个"hadop实验+作业.zip"文件显然包含了一些与Hadoop相关的实验和作业资料,可能是某个课程或培训项目的材料。以下是对这些知识点的详细解释: 一、Hadoop概述 Hadoop是由Apache软件基金会开发的一个开源框架,它...

    hadoop大数据平台技术与应用 --课后习题参考答案.pdf

    - Hadoop的核心组件包括HadoopCommon(通用组件)、HDFS(分布式文件系统)、YARN(资源管理与作业调度)和MapReduce(分布式计算模型)。 - Hadoop生态圈的组件及其作用包含数据采集工具Sqoop、数据传输工具Flume...

    Hadoop集群作业的调度算法

    ### Hadoop集群作业的调度算法详解 #### 一、引言 随着大数据技术的发展,Hadoop作为一款开源的大数据处理框架,在数据存储和处理方面扮演着至关重要的角色。Hadoop的核心组件之一是MapReduce,这是一种分布式计算...

    hadoop云计算平台作业调度算法的研究.ppt

    Hadoop云计算平台作业调度算法的研究 本文主要研究了Hadoop云计算平台作业调度算法,并对其进行了深入的分析和研究。论文主要分为三个部分:Hadoop关键技术、作业调度流程和论文主要研究内容。 首先,论文对Hadoop...

    hadoop作业调度研究

    hadoop作业调度的原理和使用流程 hdfs的原理 mapreduce编程

    hadoop作业记录档案

    "hadoop作业记录档案"可能指的是在Hadoop生态系统中执行的各种作业(jobs)的详细日志和记录,这些记录对于理解作业的运行状态、诊断问题以及优化性能至关重要。 Hadoop的核心组件包括HDFS(Hadoop Distributed ...

    Hadoop云计算平台搭建最详细过程(共22页).pdf

    Hadoop云计算平台搭建最详细过程 一、Hadoop云计算平台简介 Hadoop是Apache软件基金会旗下的开源分布式计算框架,主要用于存储和处理大规模数据。Hadoop云计算平台是基于Hadoop的云计算解决方案,提供了强大的数据...

    Hadoop平台下的作业调度算法研究与改进_夏祎

    Hadoop平台下的作业调度算法研究与改进

    Hadoop大数据平台运维杂记.pptx

    Hadoop大数据平台运维杂记 Hadoop大数据平台运维杂记是关于Hadoop大数据平台的运维经验总结,主要涵盖了Hadoop集群的使用情况、安装升级、Cloudera Manager、Hadoop的发展历程、常见事故处理等方面的内容。 一、...

    Hadoop作业.docx

    "Hadoop作业" Hadoop 是一个由 Apache 基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop 实现了一个分布式文件系统,...

    大数据云计算技术 淘宝网Hadoop与数据分析 taobao数据团队(共30页).ppt

    总结来说,Hadoop在淘宝网的大数据处理中扮演了至关重要的角色,通过高效的分布式计算和数据分析,为电商平台提供了强大的数据支撑。随着技术的不断发展,Hadoop及其生态系统将持续演进,以应对更复杂的业务挑战和更...

    Hadoop云计算平台搭建最详细过程

    Hadoop云计算平台搭建最详细过程

    国科大Hadoop作业.pdf

    国科大Hadoop作业.pdf

    hadoop2.7.1平台搭建

    hadoop2.7.1平台搭建

Global site tag (gtag.js) - Google Analytics