今天读了《数据仓库》第一章,做个总结。
读了本章有以下感悟:
1、理解了什么事数据仓库
2、结合浙江移动网优项目将目前项目中遇到的问题及自己发现的一些遗留问题与书籍中描述的方法论进行印证,发现部分问题是设计时没有以数据仓库方式设计导致的。
3、了解了数据仓库开发流程,也解释了为什么当初会发生2感悟中遇到的问题。
4、了解了数据仓库中对于重要性要素与OLTP中重要性要素是不同的。比如相应时间。
5、DSS环境(DSS决策支持系统)的响应事件与在线事物处理(OLTP)环境中的响应事件有很大不同。在DSS中相应时间不是决定性的,响应地,在DSS数据仓库环境中相应事件以分钟和小时计,在某些情况下以天记。(和浙江网优项目要求相去甚远,目前还没想好如何将此方法论应用到项目的修改中。)
6、原始数据和导出数据有很大差异,它们不能存在于同一数据库中,甚至不能共存于同一个环境下。作者对此给出一个硬件的解释(书1.4节):在数据仓库环境中,存在一个根本不同 的硬件利用模型,即利用的二元模型。要命利用全部硬件,要么根本不用硬件。所以可以针对操作型处理优化机器,或者针对数据仓库处理优化机器。但是不能在同一台设备上同时实现两者。(操作型是永远100%使用硬件环境)
下面是第一章最后的小结:
本章讨论了数据仓库的起源及其所适合的更大的体系结构化环境。这个体系结构化环境伴随着信息处理的哥哥不同阶段的历史一直演化发展。体系结构化环境中的数据和
处理有四个层次---操作层、数据仓库层、部门/数据集市层和个体层。
数据仓库是根据源自操作型环境中的应用数据建立起来的。吧这些应用数据转到数据仓库中是要进行集成(个人理解用“数据汇总”比较合适)。数据集成的任务是非常
复杂和乏味的。数据从数据仓库流入部门/数据集市环境。部门/数据集市环境中的数据是根据部门的独特处理需求形成的。
数据仓库是在一种与传统应用系统使用的开发方式完全不同观点另一种方式指导下开发的。传统应用时按照SDLC(可理解为瀑布模型的开发方式)开发生命周期开发的,
而数据仓库则是在一种螺旋式开发方法学的知道下开发的。螺旋式开发方法要求先开发数据仓库的几个小部门,然后对数据仓库的其他小部门以反复的方式进行开发。
数据仓库环境的用户以一种完全不同的方式使用系统,数据仓库用户不像操作型环境用户那样能够直接定义需求,而是工作在一种发现的模式下。数据仓库的用户说:“
给我看下我说我想要的东西,然后,我才能告诉你我真正想要什么。”
分享到:
相关推荐
1. **数据仓库架构**:数据仓库的架构通常包括数据源、ETL(抽取、转换、加载)、数据存储、OLAP(在线分析处理)和前端工具等组件。Jerome 分析了四种主要的架构类型,分别是传统的数据仓库架构、企业信息工厂、...
数据仓库读书笔记.pdf
数据仓库学习笔记是一个重要的资源,尤其对于那些希望深入理解数据仓库技术的人来说。在这个Word文档中,作者详尽地概述了数据仓库的关键概念、设计原则以及实际应用。以下是一些主要的知识点: 一、数据仓库的基本...
本书论述在设计和建造数据仓库中涉及的所有主要问题,... 本书主要是面向数据仓库的设计、开发和管理人员,以及构造和使用现代信息系统的人员,也适于信息处理方面的高校师生和从事传统数据库系统技术工作的人阅读。
1. **数据仓库与 OLTP 系统的对比**: 数据仓库(Data Warehouse)和在线事务处理(OLTP)系统是两种截然不同的数据库应用场景。OLTP系统主要服务于实时业务操作,强调高并发的事务处理和数据插入更新能力。而数据...
本文将以计算机书籍的读书笔记为参考,探讨ASP.NET框架的运作机制和数据仓库的核心概念,为构建和理解这两项技术提供详实的指导。 ASP.NET是一种广泛使用的Web应用框架,其在.NET平台上构建,允许开发者使用.NET...
数据挖掘可以挖掘的数据类型包括数据库数据、数据仓库、事务数据、时间序列数据、数据流、空间数据、工程设计数据、超文本和多媒体数据等。 数据挖掘的功能包括特征化与区分、频繁模式、关联和相关性挖掘、分类与...
数据中台与数据仓库的差异在于,数据仓库主要用于管理决策和业务分析,而数据中台的目标是将数据服务化,深入到各个业务环节。数据中台与现有信息架构并非竞争关系,而是互补和促进的关系,共同服务于企业的数字化...
《数据仓库与数据挖掘技术原理及应用》读书笔记模板x.pptx
感谢刘的整理:)这本书是数据库题库考试的参考书。
这可能涉及到云计算平台的选择与部署,数据仓库和大数据平台的建设,以及各种新兴技术的集成。 此外,数字化转型中的数据治理不容忽视。数据是数字化转型的燃料,因此,建立有效的数据治理机制,确保数据的质量、...
《数据仓库原理》系列博文,是笔者在学习数据仓库与商业智能时的读书笔记,现重新梳理思路,分享在这里,希望读者批评指正。 本系列主要包括以下几部分内容: [1].数据库与数据仓库 为什么有了数据库还...
《SQL Server 202x数据挖掘与商业智能完全解决方案》读书笔记模板是基于SQL Server 2005的商业智能解决方案的详细讲解,涵盖了数据仓库、商业智能、数据挖掘、商务智能应用、数据报表、OLAP和ETL等方面的知识点。...
数据服务体系建设则关注如何将处理后的数据以服务的形式提供给企业内外部的用户,如通过API接口或者数据仓库实现数据的查询和分析。这需要构建高效的数据服务体系,满足不同时效性和应用场景的需求。 最后,数据中...
数据仓库笔记.docx可能包含了关于数据仓库设计原则、ETL流程详解、数据模型设计实例、性能优化技巧以及工具使用心得等内容。通过阅读这份文档,你可以深入理解数据仓库的概念、构建方法和最佳实践,从而更好地应用于...
读书笔记:本仓库是算法学习的专题笔记内容来源于《数据结构与算法之美》、《Hello算法》和《算法第四版》
"医疗大数据分析与应用读书笔记模板" 本书将对医疗大数据进行全面、透彻的分析,从医疗大数据的现状开始,介绍医疗大数据方向的统计、数据挖掘、数据预处理、建模以及可视化等技术与应用。此外,还介绍了医疗领域的...