DTS增量导出方案汇总

viwo

浏览: 222770 次
性别:
来自: 大连

最近访客更多访客>>

hdhuql

yinter

MIss_LI

fire-boy

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

博客分类：

数据库

Oracle SQL Windows

1.触发器
    这是一个非常简单直接的解决方案，我们只需要将DTS引擎驻留在比如windows服务中，该引擎通过数据库的触发器事件获取源表数据更新的所有情况，即增量，然后相应的更新目的表。然而，由谁来创建触发器了？
    我们DTS系统的任务是将数据从一个表迁移到另外一个表，它所拥有的权限是：
（1）读取源表
（2）读写目的表
    我们没有创建触发器的权限，更别说接收触发器的事件了。
    触发器方案马上被否决！

2.查询数据库的增量记录
    触发器方案被否决后，我们退而求其次，我们希望所有的数据库都提供了某种机制，能让我们查询指定表的增量记录。比如，我们给出一个时间段和指定表的名称，调用数据库的某个函数或存储过程或扩展SQL命令，数据库返回一个结果数据集，这个数据集中包含了指定的时间段内，指定表中有哪些数据是新添加的、哪些数据被删除了、哪些数据是更新过的。如果能进行这样的数据库增量查询，那么增量导出也会比较简单。
    为此，我们寻找了相关的资料，主要针对Oracle和SqlServer，到现在为止，还没有发现其中的一个数据库内置了类似的机制。其实，我们可以想想，数据库当然可以实现这样的机制，但是代价可能非常高昂。比如，数据库要记录“删除增量”，如果对应的指定表没有设置主键，数据库该用什么来唯一标志被删除的记录了，可能的办法是使用临时表把被删除的记录完整的记录下来，如果要完整的记录下被删除的记录，那么临时表的大纲就需要与指定表的大纲完全相同。因此，数据库需要为每个表都建一个大纲完全相同的表来存储这些增量记录。随时间流逝，无疑，这些临时表中的数据会越来越多，那么，谁来负责删除这些临时表中的增量记录数据了？该删除哪些增量记录了？
    我们知道，大多数据库都实现了增量备份的功能，如果增量备份不是采用主条记录比对的话，可能就是使用了临时表，这样，增量备份的时刻就是数据库清空临时表的最佳时机。但是对于随机的、可重复性的增量导出来说，还存在清空临时表的时机吗？也许你刚刚清空了临时表的部分记录，而我再一次类似的增量导出可能需要用到你刚清除的那些增量记录。
    看来，我们希望所有的数据库（不仅仅是Oracle和SqlServer）提供一种机制、自动为我们记录所有时间内每个表的增量是不太可能的。该方案被否决。

3.双排序逐条记录比对
    我们再一次退而求其次，采用最笨的逐条记录比对的方法。最笨的方案中也可以用一些效率较高的技巧，我们首先考虑到的是双排序逐条记录比对。
    所谓双排序，只的是对存在于源表中的记录和目的表中的记录都采用主键排序的方式，这样通过主键值相同来识别匹配的记录，然后再比对其余的字段来判断数据是否更新；如果源表中的某条记录在目的表中没有找到匹配，表明这条记录是新增加的。
   如何判断那条记录是删除的？通常的做法是采用反向遍历，即从目标表中选取一条记录，然后遍历源表，如果没有发现这条记录，则表明发现了一个删除增量。
    采用双排序的方法，可以很快的识别删除增量。我们分别为已排序的源记录和已排序的目标记录设置一个指针，这个指针只能单步前进，然后将两个指针指向的记录拿出来进行主键值比较，如果发现相同，则说明发现了匹配，处理该条记录，然后两个指针各前进一步；如果源主键值较小，则说明该条记录是新增加的；如果源主键值较大，则说明目的指针指向的当前记录已经在源表中被删除，这是一个删除增量。
    这种方案似乎是可行的，虽然要逐条比对，但是效率也不会太低。
    可是，如果所操作的表采用的是联合主键了（即，联合主键中的任何一个键的数据都可能是重复的，但是将它们联合起来，在表中却又是唯一的）？我们仍然可以进行实现排序，记录匹配也同样可以进行，只不多前面我们通过主键值相等来进行匹配，这里需要通过多个列的值全相等来进行匹配。
    我们再考虑复杂一点的情况，如果主键进行了分裂，或者参与了合并的情况了？经过排序后，主键的值是有序的，可是主键分裂的值（或者合并后的目标值）却不一定是有序的。这样就没有办法进行双排序操作了。因为当操作源数据中的任意一条记录时，都可能需要遍历目的表中的所有记录。

4.单排序逐条记录比对
我们现在采用的方法是单排序逐条记录比对，即只对源表记录排序，然后逐条记录处理。这样效率要低得多，但是任务反而变得单纯些。效率最低的地方体现在识别“删除增量”，因为要用到反向遍历操作。我们希望找到更好的方法来替代它。

在实际的实现中，你可能还会遇到一些困难，比如，我们的源表/目的表中的记录非常多，所以不可能一次将它们读入到内存中，我们需要分页。标准的sql不支持分页，针对不同的数据库有不同的实现方式，特别是当复杂的排序（如联合主键排序）掺杂在其中时，分页操作更为困难。再就是，对BLOB、CLOB、LOB数据的比对，是否要一个一个byte的进行比较来决定其是否为“更新增量”了？
另外，我们需要对增量导出做更细粒度的控制，比如可以让其选择在增量导出时能分别控制开启或关闭“Add增量”、“Update增量”、“Delete增量”的导出。如果我们确信不需要“Delete增量”导出，那么就可以节省大量的导出执行时间。

5.利用SQLServer提供的DTS工具
在源库与目标库相关的表上加时间戳并创建索引，然后用DTS按时间戳抽取。

分享到：

SQLServer和Oracle常用函数对比

2007-03-06 19:00
浏览 3035
评论(0)
查看更多

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip: # 【spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip】中包含：中文文档：【spring-ai-bedrock-converse-1.0.0-M7-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【spring-ai-bedrock-converse-1.0.0-M7.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【spring-ai-bedrock-converse-1.0.0-M7.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【spring-ai-bedrock-converse-1.0.0-M7.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【spring-ai-bedrock-converse-1.0.0-M7-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： spring-ai-bedrock-converse-1.0.0-M7.jar中文文档.zip,java,spring-ai-bedrock-converse-1.0.0-M7.jar,org.springframework.ai,spring-ai-bedrock-converse,1.0.0-M7,org.springframework.ai.bedrock.converse,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,springframework,spring,ai,bedrock,converse,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【spring-ai-bedrock-converse-1

房地产 -可视化管理课件.ppt: 房地产 -可视化管理课件.ppt

tokenizers-0.18.0.jar中文-英文对照文档.zip: # 【tokenizers-***.jar***文档.zip】中包含： ***文档：【tokenizers-***-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【tokenizers-***.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【tokenizers-***.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【tokenizers-***.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【tokenizers-***-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： tokenizers-***.jar***文档.zip,java,tokenizers-***.jar,ai.djl.huggingface,tokenizers,***,ai.djl.engine.rust,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,djl,huggingface,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【tokenizers-***.jar***文档.zip】，再解压其中的【tokenizers-***-javadoc-API文档-中文(简体)版.zip】，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件； # Maven依赖： ``` <dependency> <groupId>ai.djl.huggingface</groupId> <artifactId>tokenizers</artifactId> <version>***</version> </dependency> ``` # Gradle依赖： ``` Gradle: implementation group: 'ai.djl.huggingface', name: 'tokenizers', version: '***' Gradle (Short): implementation 'ai.djl.huggingface:tokenizers:***' Gradle (Kotlin): implementation("ai.djl.huggingface:tokenizers:***") ``` # 含有的 Java package（包）： ``` ai.djl.engine.rust ai.djl.engine.rust.zoo ai.djl.huggingface.tokenizers ai.djl.huggingface.tokenizers.jni ai.djl.huggingface.translator ai.djl.huggingface.zoo ``` # 含有的 Java class（类）： ``` ai.djl.engine.rust.RsEngine ai.djl.engine.rust.RsEngineProvider ai.djl.engine.rust.RsModel ai.djl.engine.rust.RsNDArray ai.djl.engine.rust.RsNDArrayEx ai.djl.engine.rust.RsNDArrayIndexer ai.djl.engine.rust.RsNDManager ai.djl.engine.rust.RsSymbolBlock ai.djl.engine.rust.RustLibrary ai.djl.engine.rust.zoo.RsModelZoo ai.djl.engine.rust.zoo.RsZooProvider ai.djl.huggingface.tokenizers.Encoding ai.djl.huggingface.tokenizers.HuggingFaceTokenizer ai.djl.huggingface.tokenizers.HuggingFaceTokenizer.Builder ai.djl.hu

基于MATLAB的BP神经网络预测模型构建与应用: 内容概要：本文详细介绍了如何使用MATLAB构建和应用BP神经网络预测模型。首先，通过读取Excel数据并进行预处理，如归一化处理，确保数据的一致性和有效性。接着，配置网络结构，选择合适的训练算法（如SCG），设置训练参数（如最大迭代次数、目标误差等）。然后，进行模型训练，并通过可视化窗口实时监控训练过程。训练完成后，利用测试集评估模型性能，计算均方误差（MSE）和相关系数（R²），并通过图表展示预测效果。最后，将训练好的模型保存以便后续调用，并提供了一个简单的预测函数，确保新数据能够正确地进行归一化和预测。适合人群：具有一定MATLAB基础，从事数据分析、机器学习领域的研究人员和技术人员。使用场景及目标：适用于需要对多维数据进行预测的任务，如电力负荷预测、金融数据分析等。主要目标是帮助用户快速搭建一个可用的BP神经网络预测系统，提高预测准确性。其他说明：文中提供了完整的代码框架和详细的注释，便于理解和修改。同时，强调了数据预处理的重要性以及一些常见的注意事项，如数据量的要求、归一化的必要性等。

tokenizers-0.22.1.jar中文-英文对照文档.zip: # 【tokenizers-***.jar***文档.zip】中包含： ***文档：【tokenizers-***-javadoc-API文档-中文(简体)版.zip】 jar包下载地址：【tokenizers-***.jar下载地址(官方地址+国内镜像地址).txt】 Maven依赖：【tokenizers-***.jar Maven依赖信息(可用于项目pom.xml).txt】 Gradle依赖：【tokenizers-***.jar Gradle依赖信息(可用于项目build.gradle).txt】源代码下载地址：【tokenizers-***-sources.jar下载地址(官方地址+国内镜像地址).txt】 # 本文件关键字： tokenizers-***.jar***文档.zip,java,tokenizers-***.jar,ai.djl.huggingface,tokenizers,***,ai.djl.engine.rust,jar包,Maven,第三方jar包,组件,开源组件,第三方组件,Gradle,djl,huggingface,中文API文档,手册,开发手册,使用手册,参考手册 # 使用方法：解压【tokenizers-***.jar***文档.zip】，再解压其中的【tokenizers-***-javadoc-API文档-中文(简体)版.zip】，双击【index.html】文件，即可用浏览器打开、进行查看。 # 特殊说明： ·本文档为人性化翻译，精心制作，请放心使用。 ·只翻译了该翻译的内容，如：注释、说明、描述、用法讲解等； ·不该翻译的内容保持原样，如：类名、方法名、包名、类型、关键字、代码等。 # 温馨提示：（1）为了防止解压后路径太长导致浏览器无法打开，推荐在解压时选择“解压到当前文件夹”（放心，自带文件夹，文件不会散落一地）；（2）有时，一套Java组件会有多个jar，所以在下载前，请仔细阅读本篇描述，以确保这就是你需要的文件； # Maven依赖： ``` <dependency> <groupId>ai.djl.huggingface</groupId> <artifactId>tokenizers</artifactId> <version>***</version> </dependency> ``` # Gradle依赖： ``` Gradle: implementation group: 'ai.djl.huggingface', name: 'tokenizers', version: '***' Gradle (Short): implementation 'ai.djl.huggingface:tokenizers:***' Gradle (Kotlin): implementation("ai.djl.huggingface:tokenizers:***") ``` # 含有的 Java package（包）： ``` ai.djl.engine.rust ai.djl.engine.rust.zoo ai.djl.huggingface.tokenizers ai.djl.huggingface.tokenizers.jni ai.djl.huggingface.translator ai.djl.huggingface.zoo ``` # 含有的 Java class（类）： ``` ai.djl.engine.rust.RsEngine ai.djl.engine.rust.RsEngineProvider ai.djl.engine.rust.RsModel ai.djl.engine.rust.RsNDArray ai.djl.engine.rust.RsNDArrayEx ai.djl.engine.rust.RsNDArrayIndexer ai.djl.engine.rust.RsNDManager ai.djl.engine.rust.RsSymbolBlock ai.djl.engine.rust.RustLibrary ai.djl.engine.rust.zoo.RsModelZoo ai.djl.engine.rust.zoo.RsZooProvider ai.djl.huggingface.tokenizers.Encoding ai.djl.huggingface.tokenizers.HuggingFaceTokenizer ai.djl.huggingface.tokenizers.HuggingFaceTokenizer.Builder ai.djl.hu

基于蒙特卡洛算法的电动汽车对IEEE 33节点电网影响的研究及应用场景分析: 内容概要：本文探讨了电动汽车（EV）对IEEE 33节点电网的影响，特别是汽车负荷预测与节点潮流网损、压损计算。通过蒙特卡洛算法模拟电动汽车负荷的时空特性，研究了四种不同场景下电动汽车接入电网的影响。具体包括：负荷接入前后的网损与电压计算、不同节点接入时的变化、不同时段充电的影响以及不同负荷大小对电网的影响。通过这些分析，揭示了电动汽车充电行为对电网的具体影响机制，为未来的电网规划和优化提供了重要参考。适合人群：从事电力系统研究的专业人士、电网规划工程师、电动汽车行业从业者、能源政策制定者。使用场景及目标：①评估电动汽车大规模接入对现有电网基础设施的压力；②优化电动汽车充电设施的布局和运营策略；③为相关政策和技术标准的制定提供科学依据。其他说明：文中提供的Python代码片段用于辅助理解和验证理论分析，实际应用中需要更复杂的模型和详细的电网参数。

房地产 -【万科经典-第五园】第五园产品推介会.ppt: 房地产 -【万科经典-第五园】第五园产品推介会.ppt

稳压器件.SchLib: 稳压器件.SchLib

1.jpg: 1

模拟符号.SCHLIB: 模拟符号.SCHLIB

基于Simulink的三相电压型逆变器SPWM与电压单闭环控制仿真: 内容概要：本文详细介绍了如何在Simulink中构建并仿真三相电压型逆变器的SPWM调制和电压单闭环控制系统。首先，搭建了由六个IGBT组成的三相全桥逆变电路，并设置了LC滤波器和1000V直流电源。接着，利用PWM Generator模块生成SPWM波形，设置载波频率为2kHz，调制波为50Hz工频正弦波。为了实现精确的电压控制，采用了abc/dq变换将三相电压信号转换到旋转坐标系，并通过锁相环（PLL）进行同步角度跟踪。电压闭环控制使用了带有抗饱和处理的PI调节器，确保输出电压稳定。此外，文中还讨论了标幺值处理方法及其优势，以及如何通过FFT分析验证输出波形的质量。适用人群：电力电子工程师、自动化控制专业学生、从事逆变器研究的技术人员。使用场景及目标：适用于希望深入了解三相电压型逆变器控制原理和技术实现的研究人员和工程师。主要目标是掌握SPWM调制技术和电压单闭环控制的设计与调试方法，提高系统的稳定性和效率。其他说明：文中提供了详细的建模步骤和参数设置指南，帮助读者快速上手并在实践中不断优化模型性能。同时，强调了一些常见的调试技巧和注意事项，如载波频率的选择、积分器防饱和处理等。

【蓝桥杯EDA】客观题解析：第十三届立创EDA出品省赛模拟题一.pdf: 【蓝桥杯EDA】客观题解析

房地产 -物业苏州设备房管理标准.ppt: 房地产 -物业苏州设备房管理标准.ppt

3.png: 3

房地产 -2024H1房地产市场总结与展望（新房篇）.docx: 房地产 -2024H1房地产市场总结与展望（新房篇）.docx

LabVIEW与PLC基于TCP协议的自动化数据交互解决方案: 内容概要：本文详细介绍了利用LabVIEW与PLC进行自动化数据交互的技术方案，涵盖参数管理、TCP通信、串口扫描、数据转移等方面。首先，通过配置文件(INI)实现参数的自动加载与保存，确保参数修改不影响程序运行。其次，在TCP通信方面采用异步模式和心跳包设计，增强通信稳定性，并加入CRC16校验避免数据丢失。对于串口扫描，则通过VISA配置实现状态触发，确保进出站检测的准确性。最后，针对不同类型的数据转移提出具体方法，如TDMS文件存储策略，确保高效可靠的数据处理。适合人群：从事工业自动化领域的工程师和技术人员，尤其是熟悉LabVIEW和PLC编程的从业者。使用场景及目标：适用于需要将LabVIEW作为上位机与PLC进行数据交互的工业生产线环境，旨在提高系统的自动化程度、稳定性和易维护性。其他说明：文中提供了多个实用代码片段和注意事项，帮助读者更好地理解和应用相关技术。

d65689da7ed20e21882a634f8f5ce6c9_faad2735d293907fb32f7c5837f7302a.png: d65689da7ed20e21882a634f8f5ce6c9_faad2735d293907fb32f7c5837f7302a

信息安全管理和技术的综合练习题集（NISP&CISP）: 内容概要：本文档《NISP&CISP考试题库.pdf》汇集了大量关于信息安全专业领域的练习题，涵盖风险评估、安全策略、访问控制、恶意代码防范、加密技术、安全模型等多个方面。文档通过选择题的形式探讨了信息安全保障、风险管理和技术实施等核心内容，强调了信息安全保障的动态性和持续性，以及信息安全管理体系（ISMS）的重要性。文档还详细介绍了多种安全技术和标准，如ISO27001、GB/T 22080、SSE-CMM、CC标准等，并通过具体案例和场景分析，帮助读者理解如何在实际环境中应用这些标准和技术。适用人群：文档适用于信息安全领域的从业者，尤其是准备参加NISP（国家信息安全水平考试）和CISP（注册信息安全专业人员）认证考试的考生，以及从事信息安全管理工作、对信息安全有兴趣的技术人员。使用场景及目标：①帮助考生系统复习信息安全领域的基础知识和技能，为考试做准备；②为企业内部信息安全培训提供参考资料；③加深信息安全从业人员对安全标准和技术的理解，提升其在实际工作中的应用能力；④帮助信息安全管理者了解如何构建和维护有效的信息安全管理体系。其他说明：文档不仅提供了理论知识，还结合了实际案例，有助于读者理解信息安全的复杂性和多样性。文档强调了信息安全的多层次、多维度特性，指出信息安全不仅依赖于技术手段，还需要结合管理措施和人员培训。此外，文档中的题目设计贴近实际工作场景，能够有效提升读者应对信息安全挑战的能力。

3dmax插件K_Tools.v2.6.ms: 3dmax插件K_Tools.v2.6

【数学建模竞赛】华中杯数学建模竞赛介绍：参赛指南与备赛建议: 内容概要：“华中杯”是由华中地区高校或相关机构举办的数学建模竞赛，旨在培养学生的创新能力和团队合作精神。比赛主要面向全国高校在校生（以本科生为主，部分赛事允许研究生参加），采用团队赛形式（3人一组），参赛队伍需在72小时内完成建模、编程及论文写作。竞赛一般在每年4月或5月举行，设有多个奖项，具体比例根据参赛队伍数量确定。; 适合人群：对数学建模感兴趣并希望提升自身能力的全国高校在校生（本科生为主，部分赛事允许研究生参加）。; 使用场景及目标：①帮助学生了解数学建模竞赛的形式与流程；②为参赛者提供备赛建议，如学习往届真题、掌握Matlab、Python、LaTeX等工具以及明确团队分工；③鼓励学生关注官方通知，确保获取最新赛程和规则信息。; 其他说明：2025年的具体赛程、规则可能会有所调整，请以“华中杯数学建模竞赛官网”或主办方通知为准。可通过学校数学系或相关社团获取报名信息。

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论