`
tigers
  • 浏览: 34058 次
  • 性别: Icon_minigender_1
  • 来自: 上海
社区版块
存档分类
最新评论

数据集成

阅读更多
数据集成是许多大型企事业单位扩展新业务应用的基础。下面简单谈谈我对数据集成软件产品的一些想法。
数据从源流到目标,一般是由一个称之为“任务”的角色来完成。“任务”接受传给它的关于源、目标以及投递之物这些信息,并准备工作。而任务A和兄弟任务B,C之间还有可能需要同步交互来协同完成整个事情,因此就有了状态任务,比如A,B,C都有两个状态:未完成、已完成,A-B-C必须得在前者完成之后才能执行自己,这样后续的任务就必须能够获知前面任务的状态信息。进一步来说,假如一两个状态信息还不足以支撑业务需求的话,那么就有了引入工作流概念的必要了。工作流引擎掌控着所有任务的状态信息,它主宰着所有任务的生命。那么,上面的任务A,B,C就不需要自己去读取兄弟任务的状态信息,而是由引擎这个大管家来统一调度各个任务了。就好比有三个营:侦查营,坦克营和步兵营。假设作战计划是,先由侦查营出动,侦查完毕之后坦克营出动扫清敌障,最后由步兵营完成山头占领。引擎就像是给三个营安了一个团长,而没有引擎则三个营只能靠通信兵频繁通信报告自己并了解兄弟营的状态了。一个流程包含几个任务,那么在实际的数据整合中,由于源数据是不断的增加的,我们需要不断的调度流程来完成数据集成,比如每个交易日的交易时间段都需要调度一个流程,因此在工作流之上,还需要引入调度器的概念,这个调度器就是负责流程在什么时候启动,启动的周期是多长等等。
总结以上来说,我们的领域模型就是:任务——流程——调度器。
以上,只是说明白了我们的软件该如何工作,下面该谈谈软件本身该长啥样了。总体由两块服务组件构成:
       Repository Service Component资源库组件;
       Integrating Service Component集成组件。
资源库组件负责任务、流程和调度器的定制,并保存到资源库中。集成组件读取资源库,运行并监控这些任务、流程和调度器。这样的划分,好比一个公司,首先由管理层作决策,然后交给执行层去执行。道理是相似的,区别在于,执行的监控在公司还是有管理层来掌握,而在软件中则是由执行者自己掌握。
分享到:
评论

相关推荐

    基于kettle实现的web版数据集成平台,致力于提供web可拖拽的数据集成平台。.zip

    数据集成是IT领域中至关重要的一个环节,尤其是在大数据和数据分析时代。Kettle,又称为Pentaho Data Integration(PDI),是一种开源的数据集成工具,它提供了强大的ETL(Extract, Transform, Load)功能,用于从...

    基于Java与Web技术的KettleWeb数据集成平台源码

    项目概述:KettleWeb数据集成平台是一款基于Java与Web技术的开源数据集成工具。此平台源码基于Kettle原生版本6.1.0.1开发,扩展了Web端操作功能,便于用户进行数据集成工作。 技术栈:项目主要采用Java语言进行开发...

    医疗数据交换平台HIE-与数据集成平台不同的建设解决方案.ppt

    医疗数据交换平台HIE-与数据集成平台不同的建设解决方案.ppt医疗数据交换平台HIE-与数据集成平台不同的建设解决方案.ppt医疗数据交换平台HIE-与数据集成平台不同的建设解决方案.ppt医疗数据交换平台HIE-与数据集成...

    EAI中本体异构数据集成中间件的设计与实现

    提出了在企业应用集成EAI(Enterprise Application Integration)中基于本体的异构数据集成中间件,通过使用本体描述语 言(OWL)对数据源进行建模,提高了系统集成的灵活性,隔离了数据源模式的变化,使得局部数据源...

    基于大数据的Web数据集成及数据挖掘技术.pdf

    大数据时代下,Web数据集成与数据挖掘技术的应用对信息的整合和分析起到了至关重要的作用。随着信息技术的不断发展,互联网数据信息的量与日俱增,数据的类型也变得更加多样化,包括文本、图形图像、声音等,数据的...

    Deep Web 数据集成问题研究

    ### Deep Web 数据集成问题研究 #### 一、引言与背景 随着互联网的迅猛发展,全球范围内的信息量呈指数级增长,其中大量的信息隐藏在所谓的Deep Web之中。不同于Surface Web,即那些可以通过传统搜索引擎轻松索引...

    大型集团企业数据集成研究.docx

    ### 大型集团企业数据集成研究 #### 一、引言与背景 随着全球经济一体化的推进及企业国际化步伐的加快,大型集团企业面临着前所未有的发展机遇与挑战。这些企业通常拥有广泛的业务布局,涵盖多个行业和地区,为了...

    基于XML的企业异构数据集成方法研究

    ### 基于XML的企业异构数据集成方法研究 #### XML与企业数据集成的重要性 XML(可扩展标记语言)作为一种标准化的数据表示和交换格式,自1998年由W3C发布以来,已在信息技术领域展现出巨大潜力。尤其在企业级应用...

    分布式数据库中数据集成与共享的研究进展.pdf

    分布式数据库的核心在于数据集成与共享,这不仅包括不同数据库间的数据集成和共享,也涵盖了网络环境下的数据集成和共享,目的是为了提高数据的利用效率和处理能力。 分布式数据库研究的热点主要集中在以下几个方面...

    云GIS环境下分布式空间数据集成技术研究.pdf

    云计算技术的发展,尤其是基于Web应用的互联网技术、并行计算、分布式计算和虚拟化技术的成熟与广泛使用,为解决空间数据集成提供了新的可能性。云计算环境下的分布式空间数据集成技术可以将分布在不同网络节点的...

    天然气生产数据集成整合与智能分析系统.docx

    天然气生产数据集成整合与智能分析系统 本系统旨在提高天然气开发生产实时数据的利用率,提升数据质量,减少基层员工的工作负担。该系统基于“源头采集、智能核准、全面共享”的原则,通过集成生产数据、实时数据...

    基于 Flink CDC 打造 企业级实时数据集成方案.pdf

    Flink CDC 实时数据集成方案 Flink CDC 是基于 Flink 的 Change Data Capture(CDC)技术,旨在提供实时数据集成方案。 CDC 技术主要面向数据库的变更,是用于捕获数据库中数据变更的技术。 Flink CDC 实现了全增量...

    中国企业数据集成与数据质量市场白皮书

    中国企业数据集成与数据质量市场白皮书

    基于OPC技术的实时数据集成应用.pdf

    OPC(OLE for Process Control)是一种专为过程控制设计的技术,旨在促进工业自动化领域的数据集成和开放性。这项技术的诞生源于工业界对于不同设备间无缝通信的需求,它提供了一个开放的、统一的标准接口,使得来自...

    数据集成综述

    就大型企业和政府部门的信息化而言,信息系统建设通 ...为解决这一问题,人们开始关注数据集成研究。数据集成的核 心任务是要将互相关联的分布式异构数据源集成到一起,使 用户能够以透明的方式访问这些数据源。

    PLM、ERP、APS、MES几种信息系统的数据集成.docx

    PLM、ERP、APS、MES几种信息系统的数据集成.docx

Global site tag (gtag.js) - Google Analytics