数据仓库的架构看起来天马行空。其中定义的集中架构模式已被无数人无数项目验证n次。数据仓库中心数据流部分或者也称之为数据架构将是把DW结构与项目的实时,企业的运作规则紧紧地绑定到了一起。
细想DW的数据方向可以从数据流架构、数据管理架构、企业的业务数据架构、数据安全、数据质量架构来分别阐述DW中数据流的表现。
我们来看第一个部分数据流的架构,从设计上来看应该是设计数据流需要多少个层次,每个层次的数据含义或数据流向要有适合自己的特性、以后的扩展性。拆分DW架构,其中的ODS是否只是为数据仓库做数据准备?还是是否按照业务主线穿起支持统一视图,或是否为了方便屏蔽Source 源的异构性,或为某个企业统一维度、是否按照主题划分、或考虑是为考虑到超大交易数据量进行阶梯预先处理。
拿集中式的架构方式中的EDW(EDS)是否需要保持最小粒度或是否计划和条件的去建设范式模式(3nf/准3nf或只做到2nf)、是否采用多个数据集市、多个的数据集市是否全部需要统一维度建模需要。数据集市到底要解答哪些问题或满足那些BI功能。
每部分的不同问题都决定了数据流架构需要如何设计,同时也决定一个企业上数据仓库的演进步骤等因素。
看到数据这个词首先会想到存了多少数据,换句话说考虑历史存储方式,需要根据数据的价值和使用频率。这里倒是可以参考DW2.0理论定义。
数据是要保存的粒度,可以当成是存储方式的角度、从粒度上讲有维度模型的DW需要最小粒度。比较独立的时间维度在数据集市上到底是需要多大的粒度。从应用维度表与事实表的联系密度是多少。需要多少的维度信息放到事实表中。是否为了牺牲存储来形成大的宽表,方便报表或数据挖掘。
分享到:
相关推荐
6. **数据集市**:在DW2.0架构中,数据集市作为特定业务领域的小型数据仓库,提供快速的报表和分析服务。它们可以是星型或雪花型模型,以便于特定用户群体进行高效分析。 7. **实时与流处理**:随着实时数据需求的...
2. **架构设计**:根据业务需求和技术标准,设计企业整体架构,包括业务架构、数据架构、应用架构和技术架构等。 3. **架构评审**:组织专家对架构设计进行评审,确保架构设计的合理性和可行性。 4. **架构实施**:...
数据仓库架构设计是构建高效、稳定的信息系统的关键。在本文中,我们将深入探讨两种主流的数据仓库架构:企业信息工厂(Corporate Information Factory,CIF)和多维体系结构(Multidimensional Architecture,MD)...
4. 实时计算与流处理:随着实时数据处理的重要性日益增强,苏宁数据中台采用了实时计算框架,如Apache Flink或Spark Streaming,实现数据的即时处理和响应,满足实时业务需求。 5. 开放接口与服务化:数据中台以...
- **业务流程自动化**:SOA和DW的结合还支持业务流程的自动化,通过实时数据流和智能分析,企业可以自动触发特定的业务规则和工作流,提高运营效率。 #### 五、结论 综上所述,基于企业架构(EA)的企业信息化建设...
5. **数据分层**:在BI架构中,通常会分为ODS(操作数据存储)、DWM(数据仓库模型)和DW(数据仓库)等层次。ODS用于快速摄取原始数据,DWM进行初步清洗和转换,DW则为高级分析提供结构化的数据。 6. **数据治理**...
书中全面而细致地介绍了ETL的设计与开发,从需求分析到架构设计,再到数据流管理和实施与运维,最后还包括了对实时流ETL系统深入讨论的特殊部分。全书不仅提供了一系列实用的知识点,还提供了一系列工具和技术,帮助...
《Synopsys DMA Controller 数据手册》是针对Synopsys公司设计的AHB(Advanced High-Performance Bus)DMA控制器的专业文档,这份资料详细介绍了该控制器的架构、功能、配置选项以及如何在系统中集成和使用。...
银行IT应用体系架构是指银行领域内信息技术应用的整体布局与设计,它包括了系统架构的构建、信息流的组织、数据管理、业务流程、安全性保障等多个层面。在现代化的银行体系中,IT应用体系架构对于银行的业务效率、...
例如,业务1、2、3可以通过MQ(消息队列)进行数据集成,通过JOIN、ETL操作处理数据,然后进入MPP(大规模并行处理)数据库进行计算,最后通过DW(数据仓库)和DS(数据服务)为业务提供数据支持。 在选择消息队列...
在数据仓库和商业智能(DW/BI)的领域中,ETL(Extract-Transform-Load,抽取-转换-加载)是构建整个数据体系的基石。...ETL的设计和实施需要精心规划和管理,其工作量和重要性都是整个DW/BI系统中最为显著的。
3. **架构设计**:选择合适的架构模式,规划数据流路径。 4. **模型设计**:根据业务场景选择模型类型,定义实体和属性。 5. **ETL开发**:编写数据转换和加载脚本,确保数据清洗和整合。 6. **调度配置**:设置数据...
- **实时分析**:支持实时数据流的处理和分析,满足即时决策的需求。 - **混合云架构**:结合公有云和私有云的优势,提供灵活的数据管理和访问方式。 - **AI/ML集成**:利用人工智能和机器学习技术增强数据分析能力...
2. **Bstar.jpg**:可能是一个图片文件,用于实验中的网站设计或作为示例数据。 3. **alter.php**:此文件可能是用来修改数据库表结构的PHP脚本,比如添加、删除或更改列。 4. **showtable.php**:展示数据库表内容...
在实时数据整合场景中,OGG被用于将关系型数据库(如Oracle、MySQL)的数据实时同步到ODS(Operational Data Store)、DW(Data Warehouse)和BigData等数据集中平台。通过这种方式,业务A、业务B和业务C的数据可以...
- 数据仓库设计和架构的最佳实践文档。 - ETL过程的脚本或代码片段。 - 关于如何优化PowerBuilder应用程序以适应大数据量处理的指南。 - 教程或培训材料,帮助开发者理解和掌握使用PowerBuilder进行数据仓库开发的...
在Lambda架构中,实时数据流首先通过实时计算引擎(如Spark Streaming)进行处理,然后这些结果与离线批处理的结果合并,形成最终一致性的视图。这种架构可以实现快速响应,并保持数据的准确性。然而,Lambda架构也...
这有助于理解数据流的方向以及各部件如何协同工作来实现高效的数据传输。 #### 1.3 特性 DW_ahb_icm具有以下特点: - 支持多种AHB配置选项,以适应不同应用的需求。 - 提供了高级电源管理功能,有助于降低功耗。 -...
RTL代码是描述数字电路行为的关键部分,它们定义了数据流和时序控制,为最终的物理实现提供基础。这个Verilog实现可能包括了8051的指令集、时钟管理、总线接口、存储器映射、中断系统等关键组件。 8051的指令集是其...
总的来说,Mader的“dw数值nasm读出使用方法四”可能涉及了如何高效地处理和操作内存中的DW数值,包括读取、存储、计算以及与其他数据结构交互。熟练掌握这些技能对于编写低级别程序或系统级代码是至关重要的。在...