`
oycn0755
  • 浏览: 113702 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

项目描述之ODS(二)

 
阅读更多


运作数据存储ODS(Operational Data Store),ODS系统是面向主题的、集成的、可变的、数据是最新的或是接近最新的、细节的5个基本特征;是基于某个主题相关一组数据的集合,而不局限在某个应用系统,从业务关联的角度看数据,而不是基于传统的应用角度看数据。

 

 

数据采集(ETL)设计原则
1.基于现有技术,优先采用DataStage作为数据采集工具;
2.使用DataStage进行进行数据采集时,采用落地DataSet文件,供DataStage向ODS写入数据使用,且成功完成ODS数据写入后,将该DataSet文件删除;
3.原则上源系统数据量小于100万Table,采用全量获取方式,并最终Update/Insert到ODS目标表中;原则上源系统数据量大于100万Table,采用增量获取方式,并最终Update/Insert到ODS目标表中;
4.基于时间戳方式进行抓取是,若源系统数据量大于100万Table,根据需要每月月中或每周周日将近期(具体周期依赖该表对应的业务,例如可以三个月前之后的数据,也可以一个月前之后的数据)数据Update/Insert到ODS目标表中,以减少数据漏抓的几率;
5.为减少因业务系统数据删除对ODS的影响,每月月中或每周周日对数据进行比对,将在业务系统中删除的数据在ODS中进行删除处理;
6.原则上一个主题一个DataStage Project(工程),Project下来自不同系统采用不同Category进行划分。

分享到:
评论

相关推荐

    数据中心ODS磁盘组扩容实施方案

    该数据中心ODS磁盘组扩容实施方案详细地描述了从前期准备到实施步骤的全过程。通过这一系列操作,不仅能够有效提升数据中心的存储容量,还能确保系统的稳定性和可靠性,从而避免因存储空间不足而导致的数据处理瓶颈...

    IBM给电信作的ODS数据模型设计

    IBM的ODS数据模型设计分为多个阶段,其中第二阶段主要是对第一阶段模型的细化和完善。在这个阶段,IBM增加了对集团数据模型(包括最新的SID模型)的深入理解,并详细描述了贵阳电信ODS模型与集团各模型之间的关系。...

    ODS设计文档

    - **预期读者**:主要包括项目团队成员、业务分析师、系统架构师、数据库管理员以及其他相关利益方。 - **术语释义**:对文档中出现的专业术语进行定义和解释,帮助读者更好地理解文档内容。 #### 二、概述 ODS是...

    marcosjanini.github.io:ODS项目

    HTML是互联网的基石之一,用于描述网页的结构和内容。通过使用各种标签,HTML能够定义文本、图片、链接、表格等元素的样式和布局。在这个ODS项目中,HTML文件可能被用来创建用户友好的界面,展示数据和相关信息。...

    neuro-ontology:创建该存储库是为了跟踪OWL本体的进度。 本体是用Protégé创建的,通常描述项目中涉及的元数据。 在这个时候,本体集中在神经科学的项目上。 与本体一起出现的是ODS表,其中概述了其内容

    在"neuro-ontology"这个项目中,其主要目标是跟踪和管理OWL(Web Ontology Language)本体的发展,这是专门针对神经科学项目的数据元数据进行描述的工具。 OWL是一种基于XML的语言,被设计用于创建、共享和使用本体...

    项目管理需求分析

    在描述中提到的系统是一个综合性的业务流程管理系统,旨在通过自动化和规范化流程来提升效率和控制经济信息度。 该系统的核心功能模块包括: 1. **项目管理子系统**:由PMO(项目管理办公室)负责执行,涵盖了项目...

    C1030_贴片电感_VHF160808H4N7ST_规格书_FH(风华)贴片电感规格书.PDF

    该规格书详细描述了FH(风华)贴片电感的规格要求,涵盖了产品的外形尺寸、内部结构、电性能参数、可靠性试验项目、产品包装、推荐焊接条件、清洗、存储要求、ODS(消耗臭氧层物质)的使用情况和注意事项等方面的...

    自我介绍及项目串讲.doc 大数据项目+项目介绍+面试辅导

    在这个项目中,使用了阿里数仓架构,可能包含ODS(原始数据层)、DWD(明细数据层)、DWS(汇总数据层)和DSW(决策支持层)等层次,确保数据的层层清洗和转化,提供高效分析。 2. **实时处理**:实时模块使用Flume...

    ods:开放数据结构(在Rust中)

    综上所述,"ods"项目是Rust编程语言中的一个开放数据结构库,它涵盖了各种数据结构的实现,以及与之相关的Rust语言特性。理解和利用这个库,需要对Rust编程和数据结构有深入的理解。通过阅读源代码、运行示例和测试...

    企业级大数据项目之数据仓库.docx

    本项目提出的数仓框架将数据仓库分为ODS(贴源层)、DW(数仓层)和APP(应用层)三层,其中DW层进一步细分为事实层、维度层和宽表层。 在ODS层,数据保持接近原始状态,主要用于快速访问和临时存储。DW层则负责...

    gnc2ods-开源

    【描述】提到的OpenOffice XML筛选器,是这个工具的核心组件。它允许用户将GnuCash的会计数据导入到OpenOffice的Calc组件中,便于进行更直观的数据分析、报表制作和共享。通过这一筛选器,用户无需手动复制粘贴或...

    csvkml:将CSV和ODS转换为KML(KMZ)-开源

    这些数据可以包括经纬度坐标、名称、描述等,它们会被用来在地图上显示标记、路径或者热力图。生成的KML或KMZ文件可以直接在Google Earth中打开,让用户直观地看到数据在地理空间中的分布。 在提供的压缩包文件中,...

    ODS-Open-Raadsinformatie:https

    ODS开放理事会信息 《公开委员会信息的公开API规范》描述了公开市政委员会信息的标准。 消息中数据的信息模型的起点是Open Council信息的信息模型。 要开发的RESTfull API操作的技术交换协议的起点是政府范围的API...

    尚硅谷大数据项目之电商数仓电商数据仓库系统1

    【尚硅谷大数据项目之电商数仓电商数据仓库系统1】主要涵盖了数据仓库的构建和理论,包括数仓分层、命名规范、范式理论、关系建模与维度建模,以及核心的维度表和事实表。 1. **数仓分层**:数据仓库的分层设计是...

    软件项目开发的全套文档提纲

    2. **概要设计说明书(ODS - Outline Design Specification)**:这份文档涵盖了系统架构和模块划分,描述了软件的主要组成部分、接口关系以及数据结构。它还包括了设计决策的概述,帮助开发人员理解软件的总体结构和...

    大数据项目之电商数仓(3电商数据仓库系统)V4.2.2.docx

    《大数据项目之电商数仓(3电商数据仓库系统)V4.2.2》文档主要阐述了电商领域的大数据处理和数据仓库构建的关键概念和技术。本文档的核心内容围绕数仓的分层、理论基础以及数据建模方法展开。 首先,数仓的分层...

    项目介绍3.docx

    在面试中描述自己的项目经验时,应该从实际操作的角度出发,具体地展示自己的技能和解决问题的能力。以一位转型者的实际经历为例,在参与一个电商数仓项目中,这位转型者担任了关键角色,负责从零开始搭建数据平台、...

    marker-ods-consulting.github.io:团队写作空间

    在分析“marker-ods-consulting.github.io-main”这个压缩文件名时,我们可以推测这可能包含了主分支(通常为“main”或“master”)的源代码或内容,该分支是GitHub项目的核心部分。这个压缩文件很可能包含HTML、...

    项目介绍12.docx

    - **维度表**:描述事实的辅助信息,如用户、商品、日期等,特征为宽且行数较少,内容相对固定。 - **事实表**:包含业务事件的度量值,如订单金额,特征为大且列数较少,内容频繁变动。 在面试时,这些项目经验...

    openATFX-开源

    【描述】中提到的"开源 ASAM ODS ATFX 驱动程序 Java 库"意味着这个库是公开的,允许任何人查看、使用、修改和分发其源代码。这种开放源代码的方式鼓励社区协作,促进技术创新,并且降低了开发者的入门门槛。通过...

Global site tag (gtag.js) - Google Analytics