一直觉得数据仓库很遥远,毕竟它对资源的要求很高:经济,统计,计算机等综合能力。
数据仓库是面向决策支持的应用,用于提供一个统一的视角。在过去对于不同的部门来说,对每个客户的认识是片面的,也许客户部门会认为一个总投诉的客户肯定不是一个好客户,但对于财务部门来说该客户为公司创造了利润,是个好客户。对于市场部门来说,他还想交叉销售一些其他服务,但实际上每个员工都只是了解他们的客户的一部门,数据仓库就是要把这些来自不同应用,不同系统的数据整理,组织到一起,“集中”处理,形成一个全企业的single view.
应该看到的是大量数据是数据仓库的基础,没有大量的历史和当前数据,那么数据仓库就是空谈。但数据仓库不是一个data storage,不是简单地把各个业务系统的数据装进去。而是需要很好的重新组织,形成一个良好的data model。任何一个成功的数据仓库项目都要求对行业要有深刻的认识,才可能帮助客户提炼需求,整理业务,规划战略。目前国内具备数据仓库实施能力的非常少,原因就是没有足够的行业顾问咨询能力。通常数据仓库的数据要求完整,一致,相关性,原子化(不可分割),因此进入数据仓库的数据都要进行ETL。
数据仓库不是一个产品,而是一个不断完善的过程。对于没有真正接触过的数据仓库的大多数企业,他们很难理解这个。毕竟这与以往的系统有着太大的区别。简单说来数据仓库的建设是一个螺旋式上升的过程。曾经有位国外的数据仓库专家认为数据仓库的实施应该是阶段性实施,把一个个大目标分割成数个小步骤,迅速地实现一个一个小目标,让客户尽快的体会实施带来的好处,这将大大推动客户的需求和主动性。曾经有人说数据仓库很容易就做成一个报表系统,其实数据仓库的实施有多个阶段,最初实现报表功能,接着是分析功能,再次是预测功能。
我觉得数据仓库可以是一个不错的报表系统,尤其是跨部门、跨业务的报表,这是相当具有吸引力的,而且对于初次使用数据仓库的客户这是最为直接的成果。但应该注意到,数据仓库应该不断向前发展,实现DSS的功能,这是数据仓库实施厂商和客户互动的结果,不能指望客户与你站在一个高度。
数据仓库在国内刚起步,实施起来可参考,可借鉴的只有国外的案例。这在一定程度上不利于数据仓库的,但谁在其中推动了市场的发展,谁就赢得了巨大的中国市场。国内可以做数据仓库的只有很少几个行业,主要是生产系统不完备,历史数据有限,但就是这些行业也是一个很大的市场。
数据集市是数据仓库面向主题的商业视图,它包含比数据仓库少得多的数据量。通常数据仓库是面向全企业的,而数据集市则是面向部门级的。数据集市是放在dw中,还是单独拿出来,这要从多个角度考虑:费用,性能,用户量,并发访问量。如果有必要则可以把数据集市单独拿出来,定期从数据仓库中refresh。
再说一下olap的问题,其实对于一些predined的业务问题,可以利用cube解决,首先是速度快,不必从dw/dm中重新组织数据,另外,数量众多的ad hoc很容易把dw/dm拖垮。而对于一些临时的动态的查询,可以根据需要从数据集市/数据仓库中执行,但这要求it部门的参与,并且通常有严格的访问控制。
数据仓库是面向决策支持的应用,用于提供一个统一的视角。在过去对于不同的部门来说,对每个客户的认识是片面的,也许客户部门会认为一个总投诉的客户肯定不是一个好客户,但对于财务部门来说该客户为公司创造了利润,是个好客户。对于市场部门来说,他还想交叉销售一些其他服务,但实际上每个员工都只是了解他们的客户的一部门,数据仓库就是要把这些来自不同应用,不同系统的数据整理,组织到一起,“集中”处理,形成一个全企业的single view.
应该看到的是大量数据是数据仓库的基础,没有大量的历史和当前数据,那么数据仓库就是空谈。但数据仓库不是一个data storage,不是简单地把各个业务系统的数据装进去。而是需要很好的重新组织,形成一个良好的data model。任何一个成功的数据仓库项目都要求对行业要有深刻的认识,才可能帮助客户提炼需求,整理业务,规划战略。目前国内具备数据仓库实施能力的非常少,原因就是没有足够的行业顾问咨询能力。通常数据仓库的数据要求完整,一致,相关性,原子化(不可分割),因此进入数据仓库的数据都要进行ETL。
数据仓库不是一个产品,而是一个不断完善的过程。对于没有真正接触过的数据仓库的大多数企业,他们很难理解这个。毕竟这与以往的系统有着太大的区别。简单说来数据仓库的建设是一个螺旋式上升的过程。曾经有位国外的数据仓库专家认为数据仓库的实施应该是阶段性实施,把一个个大目标分割成数个小步骤,迅速地实现一个一个小目标,让客户尽快的体会实施带来的好处,这将大大推动客户的需求和主动性。曾经有人说数据仓库很容易就做成一个报表系统,其实数据仓库的实施有多个阶段,最初实现报表功能,接着是分析功能,再次是预测功能。
我觉得数据仓库可以是一个不错的报表系统,尤其是跨部门、跨业务的报表,这是相当具有吸引力的,而且对于初次使用数据仓库的客户这是最为直接的成果。但应该注意到,数据仓库应该不断向前发展,实现DSS的功能,这是数据仓库实施厂商和客户互动的结果,不能指望客户与你站在一个高度。
数据仓库在国内刚起步,实施起来可参考,可借鉴的只有国外的案例。这在一定程度上不利于数据仓库的,但谁在其中推动了市场的发展,谁就赢得了巨大的中国市场。国内可以做数据仓库的只有很少几个行业,主要是生产系统不完备,历史数据有限,但就是这些行业也是一个很大的市场。
数据集市是数据仓库面向主题的商业视图,它包含比数据仓库少得多的数据量。通常数据仓库是面向全企业的,而数据集市则是面向部门级的。数据集市是放在dw中,还是单独拿出来,这要从多个角度考虑:费用,性能,用户量,并发访问量。如果有必要则可以把数据集市单独拿出来,定期从数据仓库中refresh。
再说一下olap的问题,其实对于一些predined的业务问题,可以利用cube解决,首先是速度快,不必从dw/dm中重新组织数据,另外,数量众多的ad hoc很容易把dw/dm拖垮。而对于一些临时的动态的查询,可以根据需要从数据集市/数据仓库中执行,但这要求it部门的参与,并且通常有严格的访问控制。
发表评论
-
Oracle函数介绍:decode
2011-12-10 14:49 743Sql代码 select sum( ... -
任重道远迁移路之DB2到Oracle
2011-11-25 10:56 813迁移之路任重而道远, ... -
GLOBAL_NAMES参数的详细研究
2011-11-23 12:59 882Oracle数据库GLOBAL_NAMES参数的相关知识是 ... -
Oracle作业job 没有自动调度起来
2011-11-22 11:52 1346Oracle作业job 没有自动调度起来 问题:有一同事报 ... -
Oracle与MySQL的几点区别
2011-11-21 11:46 728Oracle数据库与MySQL数据库的区别是本文我们主要要介绍 ... -
Oracle 丢失更新问题的解决方案
2011-11-18 14:44 732丢失更新是数据中一个比较常见的经典问题,在做项目时我们有时可能 ... -
ORACLE 临时表空间使用率过高的原因及临时解决方案
2011-11-16 15:47 773数据库temp临时表空间增 ... -
Oracle 10g创建表空间步骤详解
2011-11-15 11:11 751Oracle 10g数据库中,当在数据库中创建用户时,基于应用 ... -
Oracle中的软解析和硬解析
2011-10-14 14:04 668问题一:哪个进程 ... -
F5 BIG-IP支持运行Oracle
2011-10-13 15:14 71010月13日,全球领先的应用交付网络厂商 F5 Netwo ... -
Oracle移动应用跨整个企业应用产品组合,发展势头迅猛
2011-10-12 14:39 1098甲骨文应用开发集 ... -
甲骨文推出oracle社交网络
2011-10-11 14:08 753在甲骨文全球大会 ... -
oracle数据库完整性约束规则
2011-10-10 15:28 631完整性约束用于增强数据的完整性,Oracle提供了5种完整 ... -
Oracle融合应用软件为企业在云计算中带来新的业务变革
2011-10-09 16:18 737Oracle融合应 ... -
Oracle 与戴尔携手:IT与业务融为一体
2011-10-08 14:55 6402011年10月4日,在Oracle Op ... -
应用Oracle组件实现动态Web数据库
2011-09-29 15:45 7911、用Oracle WebServer构建Web数据库应用 ... -
怎样做好数据库管家 怎么管理Oracle数据库
2011-09-28 15:01 696Oracle是一个最早商 ... -
http://www.oracleonline.net/home.php?mod=space&uid=7029&do=blog&quickforward=1&i
2011-09-27 11:56 2275凤凰网科技讯 北京时间9月27日消息,据彭博社报道,甲骨文联席 ... -
甲骨文教育基金会诚邀学生参加2012
2011-09-23 16:38 615· 2012年ThinkQuest竞赛由甲骨文教育基金会( ... -
Oracle在MySQL中新增商业扩展插件
2011-09-20 13:40 564racle目前宣布,支持为MySQL数据库新增商业扩展插件,但 ...
相关推荐
综上所述,《Oracle 10g数据仓库实践》这本书详细地介绍了Oracle 10g数据仓库的相关技术和应用案例,覆盖了从概念介绍到实际部署的各个方面,对于希望深入了解Oracle 10g数据仓库技术的人来说是非常有价值的参考资料...
根据提供的文档信息,本文将对《Oracle_10g数据仓库实践(最全面)》这一资料中的关键知识点进行深入解析,旨在为读者提供一个全面、系统的学习指南。 ### 一、Oracle 10g 数据仓库简介 #### 1.1 数据仓库概念与...
### 基于Oracle10g的数据仓库实践 #### 一、Oracle10g与数据仓库概述 在当今数字化时代,数据仓库技术已经成为企业信息化建设的重要组成部分。Oracle10g作为一款先进的数据库管理系统,在构建高效稳定的数据仓库...
Oracle认证是IT行业内备受认可的专业资格证书,特别是对于那些专注于数据库管理和开发的人员。"最新OCP题库(ORACLE认证必备)" 提供的是帮助考生准备Oracle Certified Professional (OCP) 考试的资源,这个题库包含...
Oracle DBA(数据库管理员)认证是Oracle公司提供的一项专业资格认证,旨在证明持证者具有管理和维护Oracle数据库系统的专业知识和技能。这个题库包含了Oracle DBA认证考试中可能遇到的各种问题,涵盖了数据库管理的...
Oracle认证分为多个级别,包括Oracle Certified Associate (OCA),Oracle Certified Professional (OCP),以及更高级别的Oracle Certified Master (OCM)等。 #### Oracle 10g OCP 认证考试科目及费用 ##### SQL...
1. **数据仓库优化**:Oracle9i加强了对数据仓库的支持,如星型和雪花模式的快速查询优化,以及快速装载和并行执行数据加载。 2. **分区功能增强**:引入了更多类型的分区方法,如范围分区、列表分区、哈希分区和...
Oracle 11g OCP(Oracle Certified Professional)认证是Oracle公司为数据库管理员提供的一项专业资格认证,证明持证者具备管理Oracle 11g数据库的高级技能。"053"通常代表一个特定的考试部分或主题集。在这个场景中...
Oracle认证是IT行业内公认的数据库管理专业证书,涵盖了Oracle数据库的各种技术与最佳实践。在准备Oracle认证,特别是OCP(Oracle Certified Professional)级别的考试时,掌握RMAN(Recovery Manager)的使用是至关...
8. Oracle认证:Oracle认证证书(如Oracle Database SQL Certified Expert)是证明个人专业技能的重要标准之一。通过官方的认证考试,可以证明你掌握了Oracle数据库的相关知识和技能。 9. 持续学习:数据库技术不断...
例如,文件名"service-data-sync-oracle-producer"可能是一个数据同步服务的生产者部分,它负责从Oracle数据库中抓取增量数据并将其发送到其他系统,如消息队列或数据仓库。 在实现过程中,开发者可能需要关注以下...
3. 数据仓库和BI(Business Intelligence):Oracle Data Warehouse Builder和Oracle Business Intelligence Suite,为企业提供数据整合、分析和报告工具。 三、Oracle通讯应用 在电信行业,Oracle提供了一系列专...
这些认证通常旨在验证个人在构建、设计和管理数据仓库系统方面的知识和技能。以下是一些可能涵盖的关键知识点,这些知识点可能会出现在数据仓库的考证考试中: 1. **数据仓库概念**:理解数据仓库的基本定义,包括...
它在企业级数据集成、灾难恢复、数据仓库加载和大数据集成中发挥着关键作用。 本书主要涵盖了以下几个核心知识点: 1. **Oracle GoldenGate基础**:首先,书籍会介绍Oracle GoldenGate的基本概念,包括其工作原理...
Oracle的ojdbc驱动是连接Java应用程序到Oracle数据库的关键组件,特别是在使用Maven作为构建工具时。`ojdbc6-11.2.0.1.0.jar`是Oracle JDBC驱动程序的一个版本,专为Java 6设计。这个特定的版本支持Oracle数据库11g ...
* 数据仓库:Oracle8i 可以用于构建数据仓库,提供数据分析和报表服务。 五、Oracle8i 的安全性 * 认证和授权:Oracle8i 采用了基于角色的访问控制(RBAC)机制,确保数据的安全性和可靠性。 * 数据加密:Oracle8i...
3. **数据仓库加载和数据湖提取**:实现实时数据仓库和运营报告,提升数据分析能力,支持与Oracle Data Integrator 19c等ETL工具的无缝集成,以及Oracle Exadata、ADW和ATP等认证平台的数据捕获和交付。 4. **实时...
- **数据仓库优化**:针对数据仓库查询进行性能优化。 - **安全性增强**:加强了数据加密、身份验证等安全机制。 - **资源管理器**:实现资源使用情况的精细控制。 - **闪回技术**:支持数据恢复至特定时间点。 ...
Oracle是全球最受欢迎的关系型数据库管理系统之一,广泛应用于企业级应用、数据仓库以及云计算服务。 Oracle数据库的核心概念包括: 1. **数据模型**:Oracle基于关系型数据模型,它通过表格、列和行来组织数据,...