`
honeybinshun
  • 浏览: 62503 次
  • 性别: Icon_minigender_1
  • 来自: 北京
社区版块
存档分类
最新评论

DW2.0与第一代数据仓库的区别

 
阅读更多
    DW2.0新一代数据仓库环境的架构。DW2.0和第一代数据仓库有很大的差别。四个最大的差别如下:
     *随着数据进入并存储于数据仓库,产生了对数据生命周期的认识。
     *数据仓库总包含非结构化数据。
     *DW2.0环境包含元数据。
     *DW2.0的技术基础能够随着时间而变化。
     DW2.0有四个主要的生命周期区:
    *交互区,数据仓库以更新模式在交易响应时间水平下完成构建。
     *整合区,数据在这里经过整合并完成分析处理。
     *近线去,作为整合区数据的一个缓存区域。
     *归档区,存放访问概率显著下降但仍有可能被访问的数据。
     DW2.0既包含结构化数据,也包含非结构化数据。非结构化文本进入数据仓库之前必须首先要经过一个整合过程。整合过程对于为文本分析提供非结构化文本非常必要。如果非结构化文本未经整合,就无法有效地进行文本分析。
     为非结构化数据进入DW2.0环境做准备的主要任务之一就是清楚“废话”。另一项必做的工作就是术语规范化。文本必须同时拥有特殊的和一般的两种参考,以便成功地进行文本分析。
     元数据是DW2.0的一个重要组成部分,它有以下几个级别:
     *企业级
     *本地级
     *业务级
     *技术级
     要想获得成功,DW2.0环境必须建立在可随时间变化的技术基础之上。
分享到:
评论

相关推荐

    DW 2.0: the Architecture for the Next Generation of Data Warehousing

    DW2.0描述的架构有不同于第一代数据仓库的的一些特点,这些特点包括但不限于: 1,DW2.0提出了数据仓库生命周期概念,把整个系统分为四个区:交互区、整合区、近线区、归档区;四个区中数据年龄逐渐增大。 2,DW2.0...

    DW 2.0 The Architecture for the Next Generation of Data Warehousing

    总的来说,DW 2.0 作为一种下一代数据仓库架构,通过引入对数据生命周期的深入理解、高级架构设计以及标准化的一致性,解决了第一代数据仓库中存在的诸多问题。它为企业提供了更加高效、可靠和灵活的数据管理平台,...

    DW2.0 and Data Quality

    DW2.0旨在通过提供一种持续的质量改进机制来提高企业对数据仓库投资的价值。 **特点:** 1. **生命周期管理:**认识到数据在其整个生命周期中的价值变化,并采取相应措施确保数据质量。 2. **非结构化数据的融合:...

    Morgan Kaufmann - Data Warehouse 2.0

    1. **数据生命周期管理**:与第一代数据仓库相比,DW2.0更加重视数据在其整个生命周期中的管理和处理。不再仅仅是将数据放置在磁盘上就称之为数据仓库,而是认识到一旦数据进入数据仓库后,其本身也具备一定的生命...

    第二代数据仓库展望

    第二代数据仓库在继承第一代数据仓库的基础上,着重在数据仓库的生命周期、数据访问模式、结构化与非结构化数据处理、以及元数据的管理和应用等方面进行了深入的拓展和改进。以下是对第二代数据仓库技术特点和发展...

Global site tag (gtag.js) - Google Analytics