`
viwo
  • 浏览: 221867 次
  • 性别: Icon_minigender_1
  • 来自: 大连
社区版块
存档分类
最新评论

DTS增量导出方案汇总

阅读更多

1.触发器
    这是一个非常简单直接的解决方案,我们只需要将DTS引擎驻留在比如windows服务中,该引擎通过数据库的触发器事件获取源表数据更新的所有情况,即增量,然后相应的更新目的表。然而,由谁来创建触发器了?
    我们DTS系统的任务是将数据从一个表迁移到另外一个表,它所拥有的权限是:
(1)读取源表
(2)读写目的表
    我们没有创建触发器的权限,更别说接收触发器的事件了。
    触发器方案马上被否决!

2.查询数据库的增量记录
    触发器方案被否决后,我们退而求其次,我们希望所有的数据库都提供了某种机制,能让我们查询指定表的增量记录。比如,我们给出一个时间段和指定表的名称,调用数据库的某个函数或存储过程或扩展SQL命令,数据库返回一个结果数据集,这个数据集中包含了指定的时间段内,指定表中有哪些数据是新添加的、哪些数据被删除了、哪些数据是更新过的。如果能进行这样的数据库增量查询,那么增量导出也会比较简单。
    为此,我们寻找了相关的资料,主要针对Oracle和SqlServer,到现在为止,还没有发现其中的一个数据库内置了类似的机制。其实,我们可以想想,数据库当然可以实现这样的机制,但是代价可能非常高昂。比如,数据库要记录“删除增量”,如果对应的指定表没有设置主键,数据库该用什么来唯一标志被删除的记录了,可能的办法是使用临时表把被删除的记录完整的记录下来,如果要完整的记录下被删除的记录,那么临时表的大纲就需要与指定表的大纲完全相同。因此,数据库需要为每个表都建一个大纲完全相同的表来存储这些增量记录。随时间流逝,无疑,这些临时表中的数据会越来越多,那么,谁来负责删除这些临时表中的增量记录数据了?该删除哪些增量记录了?
    我们知道,大多数据库都实现了增量备份的功能,如果增量备份不是采用主条记录比对的话,可能就是使用了临时表,这样,增量备份的时刻就是数据库清空临时表的最佳时机。但是对于随机的、可重复性的增量导出来说,还存在清空临时表的时机吗?也许你刚刚清空了临时表的部分记录,而我再一次类似的增量导出可能需要用到你刚清除的那些增量记录。
    看来,我们希望所有的数据库(不仅仅是Oracle和SqlServer)提供一种机制、自动为我们记录所有时间内每个表的增量是不太可能的。该方案被否决。

3.双排序逐条记录比对
    我们再一次退而求其次,采用最笨的逐条记录比对的方法。最笨的方案中也可以用一些效率较高的技巧,我们首先考虑到的是双排序逐条记录比对。
    所谓双排序,只的是对存在于源表中的记录和目的表中的记录都采用主键排序的方式,这样通过主键值相同来识别匹配的记录,然后再比对其余的字段来判断数据是否更新;如果源表中的某条记录在目的表中没有找到匹配,表明这条记录是新增加的。
   如何判断那条记录是删除的?通常的做法是采用反向遍历,即从目标表中选取一条记录,然后遍历源表,如果没有发现这条记录,则表明发现了一个删除增量。
    采用双排序的方法,可以很快的识别删除增量。我们分别为已排序的源记录和已排序的目标记录设置一个指针,这个指针只能单步前进,然后将两个指针指向的记录拿出来进行主键值比较,如果发现相同,则说明发现了匹配,处理该条记录,然后两个指针各前进一步;如果源主键值较小,则说明该条记录是新增加的;如果源主键值较大,则说明目的指针指向的当前记录已经在源表中被删除,这是一个删除增量。
    这种方案似乎是可行的,虽然要逐条比对,但是效率也不会太低。
    可是,如果所操作的表采用的是联合主键了(即,联合主键中的任何一个键的数据都可能是重复的,但是将它们联合起来,在表中却又是唯一的)?我们仍然可以进行实现排序,记录匹配也同样可以进行,只不多前面我们通过主键值相等来进行匹配,这里需要通过多个列的值全相等来进行匹配。
    我们再考虑复杂一点的情况,如果主键进行了分裂,或者参与了合并的情况了?经过排序后,主键的值是有序的,可是主键分裂的值(或者合并后的目标值)却不一定是有序的。这样就没有办法进行双排序操作了。因为当操作源数据中的任意一条记录时,都可能需要遍历目的表中的所有记录。

4.单排序逐条记录比对
    我们现在采用的方法是单排序逐条记录比对,即只对源表记录排序,然后逐条记录处理。这样效率要低得多,但是任务反而变得单纯些。效率最低的地方体现在识别“删除增量”,因为要用到反向遍历操作。我们希望找到更好的方法来替代它。

     在实际的实现中,你可能还会遇到一些困难,比如,我们的源表/目的表中的记录非常多,所以不可能一次将它们读入到内存中,我们需要分页。标准的sql不支持分页,针对不同的数据库有不同的实现方式,特别是当复杂的排序(如联合主键排序)掺杂在其中时,分页操作更为困难。再就是,对BLOB、CLOB、LOB数据的比对,是否要一个一个byte的进行比较来决定其是否为“更新增量”了?
    另外,我们需要对增量导出做更细粒度的控制,比如可以让其选择在增量导出时能分别控制开启或关闭“Add增量”、“Update增量”、“Delete增量”的导出。如果我们确信不需要“Delete增量”导出,那么就可以节省大量的导出执行时间。

5.利用SQLServer提供的DTS工具
   在源库与目标库相关的表上加时间戳并创建索引,然后用DTS按时间戳抽取 。

分享到:
评论

相关推荐

    MSSQL 通过DTS导入导出数据

    **MSSQL 通过DTS导入导出数据详解** 在SQL Server中,Data Transformation Services(DTS)是一种强大的工具,用于在不同的数据源之间移动和转换数据。它为数据库管理员和开发人员提供了一种灵活的方式来处理数据...

    利用DTS导入_导出向导实现SQL Server数据库表的数据转换.pdf

    在探讨如何使用DTS(数据转换服务)导入/导出向导实现SQL Server数据库表的数据转换这一主题时,首先需要了解数据转换服务(DTS)的作用和重要性。DTS是SQL Server提供的一组工具和服务,用于从不同源提取、转换和合并...

    数据库导入导出工具(dts 1.2)

    总的来说,DTS 1.2版是数据库管理员和开发人员的强大助手,通过解决自增长主键和大文件导出的问题,它提升了数据迁移的稳定性和效率,从而确保了数据的完整性和一致性。对于那些处理大规模数据的组织来说,这是一个...

    利用SQL Server的DTS操作EXCEL、Access等数据表的导入导出

    利用 SQL Server 的 DTS 操作 EXCEL、Access 等数据表的导入导出 本文将为大家介绍如何利用 SQL Server 的 DTS 操作 EXCEL、Access 等数据表的导入导出。该操作可以帮助大家轻松地将数据从 EXCEL、Access 等数据表...

    SQLServer2005_DTS.msi 导入导出工具安装

    SQLServer 2005 导入导出工具,安装后一般会在C:\Program Files\Microsoft SQL Server\90\DTS\Binn\DTSWizard.exe

    数据库导入导出工具(dts)

    数据库导入导出工具(DTS)是针对数据库管理和迁移的一款实用软件,主要功能在于帮助用户高效、安全地将数据从一个数据库系统迁移到另一个。在本案例中,DTS已经实现了对MySQL数据库的支持,允许用户通过属性文件...

    dts-bundle, 导出 app. d. ts文件作为外部模块定义.zip

    dts-bundle, 导出 app. d. ts文件作为外部模块定义 dts包 导出 app. d. ts文件作为外部 MODULE 定义主要用例是为( commonjs/amd )/Bower 模块生成定义,因此应用程序代码应该遵循外部模块 Pattern ( 使用 import/e

    导入导出工具

    在Oracle数据库管理中,导入导出工具是两个至关重要的实用程序,用于数据迁移、备份和恢复。这两个工具分别是`exp.exe`(导出工具)和`imp.exe`(导入工具),它们通常位于Oracle安装目录的`bin`子目录下。 **导出...

    数据传输 DTS功能概述 DTS向导向导实现数据的导入和导出PPT课件.pptx

    数据传输 DTS功能概述 DTS向导向导实现数据的导入和导出PPT课件.pptx

    利用SQLServer的DTS操作EXCEL、Access等数据表的导入导出.pdf

    利用 SQL Server 的 DTS 操作 EXCEL、Access 等数据表的导入导出 数据库管理员经常需要将数据从一个数据库迁移到另一个数据库中,或者将数据从外部数据源导入到数据库中。在 SQL Server 中,我们可以使用 DTS(Data...

    数据库实验指导之导入导出

    通过这次实验,你不仅会学会使用DTS向导进行数据导入导出,还将深化对数据库管理和数据迁移的理解,这对任何涉及数据处理的工作都是宝贵的实践经验。请参照“实验八 导入导出.doc”文档进行详细步骤的学习和实践,...

    MX Player DTS 包

    MX Player DTS 包是一款专为MX Player播放器设计的扩展包,旨在解决用户在播放包含DTS(Digital Theater System)音效的视频时遇到的无声或音质问题。DTS是一种高级的多声道音频编码格式,常用于电影和高质量的家庭...

    数据传输 DTS功能概述 DTS向导向导实现数据的导入和导出PPT学习教案.pptx

    在本PPT学习教案中,我们将深入探讨DTS的功能概述以及如何利用DTS向导实现数据的导入和导出。 1. **DTS功能概述** DTS提供了多种数据传输工具,每种工具针对不同的数据迁移场景。这些工具包括: - **导入/导出...

    sqlserver-dts简介

    2. 导入/导出向导(Import/Export Wizard):用于构建相对简单的 DTS 数据包,支持数据迁移和简单转换。 3. DTSRun:一个命令提示符实用程序,用于执行已有的 DTS 数据包。 4. DTSRunUI:DTSRun 的图形化界面,允许...

    DTS数据服务解决方案打破数据孤岛.pdf

    腾讯云DTS(Database Transmission Service)数据服务解决方案旨在打破数据孤岛,实现从同构到异构环境的数据高效流动。DTS支持多种数据库类型的迁移,包括MySQL、MariaDB、PostgreSQL、Redis、MongoDB等关系型...

    SQLServer2005 DTS 补丁(For SQL Server 2000 DTS)

    总的来说,SQL Server 2005 DTS 补丁是一个重要的升级,它允许用户在新的数据库环境中继续利用他们原有的DTS解决方案,同时享受性能和安全性的提升。在迁移到更现代的SSIS之前,这个补丁是保持业务连续性和数据集成...

    foobar2000 DTS插件

    foobar2000的DTS插件之选用 许多foobar2000迷都说foobar2000无法播放 DTS 文件(.wav;.dts;多声道DTS-CD碟片),原因之一是DTS文件的版本与播放器不相符;原因之二是方法不对。现发几个不同版本的DTS插件供选用。 ...

    数据库数据导出工具

    数据库数据导出工具是IT行业中一个非常实用的软件应用,主要用于从数据库中提取并保存数据。这类工具通常具有用户友好的界面,允许用户通过输入数据库的相关连接信息,如服务器地址、端口、数据库名称、用户名和密码...

Global site tag (gtag.js) - Google Analytics