`
housheng33
  • 浏览: 236436 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

ETL自动化设计思路

    博客分类:
  • BI
 
阅读更多
这段时间很充实!

工具:DB2  JAVA 存储过程

1:分析业务,整理成每一主题需要的维与指标,形成源PDM!

2:分析以前的业务系统中的表,并形成主题的数据来源于业务库的字段映射,形成源表-中间表-目标表的,形成维度表。形成仓库PDM

3:根据仓库PDM,建立好各个表。

4:ETL,java写一个方法,参数为{存储过程名,目标表名,目标字段,源表名(一个或者多个),源表字段,条件,抽取起始时间,抽取终止时间}

//异常处理
//日志记录
//索引处理

最终生成存储过程。将各个存储过程以及各参数的信息写到存储过程表中。

调用为:call 存储过程名(抽取起始时间,抽取终止时间)

5:DB2任务中心,sql 存储过程表,执行存储过程自动完成ETL

前3步重点在业务模型!
后2步重点在设计、存储过程!
以上是两个月的小结!




接下来:FM,TS,AS,BI
qq:331932672
分享到:
评论

相关推荐

    传统数据仓库ETL设计报告

    元数据驱动ETL意味着通过配置元数据来自动化ETL过程,减少了人工干预,提高了灵活性和可维护性。当业务逻辑发生变化时,系统自动通知ETL实施人员,他们根据变更内容配置ETL元数据,生成相应的ETL作业(ETLJOB),并...

    一个ETL系统的设计与实现

    ### 一个ETL系统的设计与实现...综上所述,本文详细介绍了ETL系统的设计思路、关键技术以及初步实现情况,并通过实验验证了系统的有效性。这一研究成果有望为国内企业提供更加高效、易用且经济实惠的数据处理解决方案。

    ETLAssitant总体设计说明书

    本文档主要介绍了ETLAssistant这一工具的总体设计思路,其目的是解决在开发新SDM(Schema Data Model)时手动从模型中复制元数据到Excel模板中的问题。这种方式不仅耗时,而且容易出现错误。通过ETLAssistant,可以...

    ETL_Project

    5. **ETL自动化与调度** 在实际项目中,ETL过程通常需要自动化和定时运行。这可能涉及到使用任务调度器如`APScheduler`或集成在CI/CD(持续集成/持续部署)流程中。Jupyter Notebook的输出可以导出为Python脚本,...

    咨科和讯 白皮书 面向服务体系结构的数据集成

    - **自动化ETL流程**:利用先进的ETL工具自动化数据抽取、清洗、转换和加载过程,提高效率。 - **高性能架构设计**:采用分布式处理技术和并行计算框架来提升数据处理能力。 #### 五、案例分析:Informatica在SOA中...

    RestSparkEtl:通过rest api接口实现spark Etl

    - **监控与调度**:通过HTTP请求触发ETL,便于集成到自动化工作流或监控系统。 7. **优势** - **易用性**:通过HTTP接口,非技术人员也能轻松触发数据处理任务。 - **灵活性**:可以动态调整作业参数,适应不同...

    易往一体化系统解决方案.zip

    《易往一体化系统解决方案》是针对企业信息化管理需求所提出的一种综合性的系统设计思路。该方案旨在通过集成各个业务模块,实现数据共享、流程优化,从而提升企业的运营效率和决策精度。以下是对这一主题的详细解析...

    大数据平台架构及建设思路PPT课件.pptx

    大数据的应用场景非常广泛,包括客户关系管理、网络运维、财务管理、供应链管理、办公自动化等方面。在大数据平台架构中,需要考虑到数据采集、存储、处理、分析和应用等多个方面,并且需要具备海量数据处理、高效...

    基于FME的CAD测绘规划成果入库一体化.pdf

    在CAD测绘规划成果入库一体化方案中,作者强调了规范化模板设计的重要性,这有助于实现数据的批量自动化转换。FME Workbench模板功能能够通过FME函数连接,根据质量检测体系的要求,考虑空间和属性功能,从而实现...

    分布式异构供热数据源集成方法研究.pdf

    国外的集中供热发展经历了四个阶段:单纯分散供热、集中供热建设、供热综合发展、自动化供热控制。我国城市集中供热系统的发展历程亦是从无到有、从小到大,尽管目前大部分供热企业已经引入了实时监控系统,但各企业...

    海量数据的优化思路

    "上线脚本.txt"可能包含了这些操作的自动化脚本。 7. 源码优化:标签中的“源码”提示我们关注代码层面的优化。编写高效的算法、避免内存泄漏、减少磁盘I/O操作,都是提升处理速度的关键。 8. 工具选择:合理利用...

    集团主大数据管理系统平台解决方案设计.docx

    【集团主大数据管理系统平台解决方案设计】 在现代企业的信息化管理中,...通过以上方案,集团可以实现主数据的有效整合,提高数据质量,降低系统集成难度,提升业务流程的自动化程度,从而促进整体信息化水平的提升。

    BI Kettle文档汇集.rar

    "Kettle命令行使用说明.pdf"和"Kettle_命令行使用.pdf"则专注于Kettle的命令行界面,这是自动化任务和脚本化工作流的重要工具。这两份文档将教你如何通过命令行来控制和监控Kettle的执行。 "Kettle集群.pdf"可能...

    数据仓库概念汇总,来自IT-Pub

    SQL Analysis Server 在OLAP(联机分析处理)方面表现出色,而OWB则更加注重于ETL过程的自动化和支持。 ### 数据仓库在统计系统中的应用 数据仓库系统从技术角度而言,是指满足Inmon提出的“数据仓库”基本模型的...

    企业财务经营五力分析解决方案(37页).pptx

    #### 二、方案整体设计思路 本解决方案旨在通过构建一套完整的财务经营五力分析平台,帮助企业实现以下目标: 1. **内部财务控制**:加强内部控制机制,确保财务数据的准确性与可靠性。 2. **资金筹集与财务核算**...

    大数据架构设计

    5. **自动化监控与运维**:实施自动化监控工具,实时监控系统性能,及时发现并解决问题。 #### 四、高质量软件架构设计 **什么是架构设计?** 架构设计是软件工程的一个重要组成部分,旨在定义系统的结构、行为...

    数据交换平台的设计方案,架构方案,总体建设思路整体解决方案.ppt

    同时,管理工具提供了图形化界面,便于用户进行服务和流程的开发与管理,通过API、URL、定时调度等方式与第三方系统交互,实现自动化数据交换任务。这种灵活且强大的平台设计,无疑为企业提供了高效、稳定的数据交换...

    基于信息整合共享数据平台.ppt

    其中,统一身份认证确保用户安全访问,办公自动化系统提升工作效率,统一信息门户则作为信息展示的集中入口。共享数据平台是核心,它连接并整合各个已有的业务数据库,建立共享数据库、共享数据中心和共享数据库,...

    综合报表系统的方案设计.doc

    - **项目建设目标**:旨在实现自动化报表生成、多维度数据分析、用户自定义报表等功能,提升决策效率。 2. **业务需求分析** - **数据中心需求**:强调对数据存储、整合和管理的需求,可能需要构建一个高效的数据...

Global site tag (gtag.js) - Google Analytics