`
samjavaeye
  • 浏览: 193719 次
  • 性别: Icon_minigender_1
  • 来自: 深圳
社区版块
存档分类
最新评论

ETL简介

阅读更多

本文摘录自百度百科

 简介

  ETLExtraction-Transformation-Loading的缩写,中文名称为数据提取、转换和加载

 

  ETL工具有:OWB(Oracle Warehouse Builder)、ODI(Oracle Data Integrator)、Informatic PowerCenter、AICloudETL、DataStage、Repository Explorer、Beeload、Kettle、DataSpider

作用

  ETL负责将分布的、异构数据源中的数据如关系数据、平面数据文件等抽取到临时中间层后进行清洗、转换、集成,最后加载到数据仓库或数据集市中,成为联机分析处理、数据挖掘的基础。

 

  ETL是数据仓库中的非常重要的一环。它是承前启后的必要的一步。相对于关系数据库,数据仓库技术没有严格的数学理论基础,它更面向实际工程应用。所以从工程应用的角度来考虑,按着物理数据模型的要求加载数据并对数据进行一些系列处理,处理过程与经验直接相关,同时这部分的工作直接关系数据仓库中数据的质量,从而影响到联机分析处理和数据挖掘的结果的质量。

 

  数据仓库是一个独立的数据环境,需要通过抽取过程将数据从联机事务处理环境、外部数据源和脱机的数据存储介质导入到数据仓库中;在技术上,ETL主要涉及到关联、转换、增量、调度和监控等几个方面;数据仓库系统中数据不要求与联机事务处理系统中数据实时同步,所以ETL可以定时进行。但多个ETL的操作时间、顺序和成败对数据仓库中信息的有效性至关重要。

 

        目前,ETL工具的典型代表有:Informatica、Datastage、OWB、微软DTS、Beeload、Kettle……

 

     开源的工具有eclips的etl插件:cloveretl

分享到:
评论

相关推荐

    ETL简介,介绍了ETL的基础知识

    介绍ETL

    ETL规范.doc

    * 第 2 章:ETL 简介 * 第 3 章:ETL 设计规范 ETL 简介 ETL 是数据集成的重要步骤,涉及到数据的抽取、转换和加载。ETL 的主要目的是为了将数据从源系统中抽取出来,经过转换和加工后,加载到目标系统中。 ETL ...

    ETL-数据集成开发规范

    2 ETL简介: ETL是数据仓库系统中用于将分散、异构的数据源抽取出来,经过清洗、转换后加载到目标数据仓库的过程。它涵盖了数据的提取、转换和加载三个核心步骤。 3 开发ETL需要的背景知识: 在进行ETL开发前,...

    关于ETL的开发规范, 统一开发标准

    ETL简介: ETL过程通常包括三个主要步骤:抽取(Extract)是指从各种数据源获取数据;转换(Transform)是对数据进行清洗、校验、聚合等操作,以符合目标系统的要求;加载(Load)是将经过转换的数据存入目标系统,...

    informatic ETl流程

    #### 一、Informatica ETL 简介 Informatica 是一款广泛应用于企业数据集成领域的软件工具,尤其在ETL(Extract, Transform, Load)过程中扮演着极其重要的角色。ETL过程是指从源系统中抽取数据,对数据进行清洗、...

    Clover DX ETL

    ### 一、Clover DX ETL简介 #### 1.1 定义 Clover DX 是一款企业级的数据集成平台,它支持高效的数据提取(Extract)、转换(Transform)和加载(Load),简称ETL。该平台不仅适用于传统数据库之间的数据迁移,还...

    ETL Automation 工具简介.pptx

    ETL Automation 是由 Teradata 公司发布的 ETL 流程调度产品,使用 JAVA 程序开发,支持跨平台部署,安装、维护简单。

    ETL数据增量抽取方案.pdf

    #### 一、ETL简介及重要性 **ETL**(Extract, Transform, Load)是指从多个数据源抽取数据、转换数据格式并将其加载到目标系统的过程。随着公安行业的信息化建设不断推进,大量的业务系统被开发出来用于处理内外部...

    《完全ETL开发规范》

    2. **ETL简介** - ETL过程包括三个主要阶段:数据抽取(Extract),数据转换(Transform),数据加载(Load)。 - 抽取是从多个源系统获取数据,转换是对数据进行清洗、格式化、计算等操作,加载则是将处理后的...

    ETL Automation使用手册

    ETL Automation 简介 ETL Automation 是一个功能强大且灵活的数据集成工具,旨在帮助用户快速高效地完成数据提取、转换和加载(ETL)过程。该工具支持多种数据源、目标系统和数据格式,提供了灵活的数据转换和加载...

    ETL 以及 KETTLE 简介

    ### ETL 以及 KETTLE 简介 #### 1. 什么是ETL ETL是指**数据抽取(Extract)、转换(Transform)、装载(Load)**的过程,它是构建数据仓库的重要环节。数据仓库是一种面向主题的、集成的、稳定的且随时间不断变化...

    ETL Automation 使用手册 Version 2.6.0 中文

    ETL Automation 简介 ETL Automation 是一个基于服务器的数据集成平台,旨在提供一个自动化的数据集成解决方案。该平台可以实现数据的提取、转换和加载,提供了一个灵活的数据集成解决方案。 安装 ETL Automation ...

    ETL和ODI简介

    ETL的介绍和ORACLE ODI的简介

    ETL概述及部分工具比较

    ### ETL概述及部分工具比较 #### ETL概念解析 ETL是Extract(提取)、Transform(转换)和Load(加载)三个英文单词的首字母缩写,是数据仓库技术中的核心流程之一。在数据集成领域,ETL过程主要用于将来自不同源的...

    ETL Automation 使用手册Version 2.6.0(PDF版)

    #### ETL Automation 简介 - **定义**: ETL Automation 是一种自动化工具,用于简化数据仓库环境中数据提取(Extraction)、转换(Transformation)和加载(Loading)的过程。 - **重要性**: 在数据仓库项目的初期...

    达梦ETL批量流程向导

    #### 二、达梦ETL批量流程向导简介 “达梦ETL批量流程向导”是达梦数据库管理系统提供的一个功能模块,旨在帮助用户通过简单的向导式操作实现批量数据转换任务的快速创建与管理。该工具支持多种数据源类型,并能够...

    ETL_with_Luigi:用Luigi建立ETL管道

    Luigi的ETL管道 ... 简介... Luigi通过监视基于Web的界面为用户提供查看整个过程的方法。 为此,请在文件目录中打开的命令提示符下运行luigid 下一步...由于我们需要首先提取在第一个任务中分配为Class ExtractD

    面向数据集成的ETL技术研究

    1.ETL简介随着企业信息化建设的发展,巨大的投资为企业建立了众多的信息系统,以帮助企业进行内外部业务的处理和管理工作。但是随着信息系统的增加,各自孤立工作的信息系统将会造成大量的冗余数据和业务人员的重复...

    ETL开发宝典

    通过这份文档,读者可以全面了解ETL开发的过程,从理论到实践,从架构设计到日常运维,从系统简介到使用指南,为数据仓库的实施提供了宝贵的经验和参考资料。对于那些希望深入了解数据仓库以及ETL流程的读者来说,这...

Global site tag (gtag.js) - Google Analytics