浏览 1644 次
锁定老帖子 主题:数据集成
精华帖 (0) :: 良好帖 (0) :: 新手帖 (0) :: 隐藏帖 (0)
|
|
---|---|
作者 | 正文 |
发表时间:2008-03-30
数据从源流到目标,一般是由一个称之为“任务”的角色来完成。“任务”接受传给它的关于源、目标以及投递之物这些信息,并准备工作。而任务A和兄弟任务B,C之间还有可能需要同步交互来协同完成整个事情,因此就有了状态任务,比如A,B,C都有两个状态:未完成、已完成,A-B-C必须得在前者完成之后才能执行自己,这样后续的任务就必须能够获知前面任务的状态信息。进一步来说,假如一两个状态信息还不足以支撑业务需求的话,那么就有了引入工作流概念的必要了。工作流引擎掌控着所有任务的状态信息,它主宰着所有任务的生命。那么,上面的任务A,B,C就不需要自己去读取兄弟任务的状态信息,而是由引擎这个大管家来统一调度各个任务了。就好比有三个营:侦查营,坦克营和步兵营。假设作战计划是,先由侦查营出动,侦查完毕之后坦克营出动扫清敌障,最后由步兵营完成山头占领。引擎就像是给三个营安了一个团长,而没有引擎则三个营只能靠通信兵频繁通信报告自己并了解兄弟营的状态了。一个流程包含几个任务,那么在实际的数据整合中,由于源数据是不断的增加的,我们需要不断的调度流程来完成数据集成,比如每个交易日的交易时间段都需要调度一个流程,因此在工作流之上,还需要引入调度器的概念,这个调度器就是负责流程在什么时候启动,启动的周期是多长等等。 总结以上来说,我们的领域模型就是:任务——流程——调度器。 以上,只是说明白了我们的软件该如何工作,下面该谈谈软件本身该长啥样了。总体由两块服务组件构成: Repository Service Component资源库组件; Integrating Service Component集成组件。 资源库组件负责任务、流程和调度器的定制,并保存到资源库中。集成组件读取资源库,运行并监控这些任务、流程和调度器。这样的划分,好比一个公司,首先由管理层作决策,然后交给执行层去执行。道理是相似的,区别在于,执行的监控在公司还是有管理层来掌握,而在软件中则是由执行者自己掌握。 声明:ITeye文章版权属于作者,受法律保护。没有作者书面许可不得转载。
推荐链接
|
|
返回顶楼 | |