`

企业基于 XML 的统一数据模型

阅读更多

企业的多渠道整合架构及统一数据模型需求

随着企业业务的增长,企业的系统也在不断增长中。这些系统有的是提供给内部用户使用,有的是为外部客户使用,通过多种渠道访问企业的业务,形成了如下架构图中的多渠道的企业架构。如银行的多渠道架构,客户可以通过浏览器的网上银行,手机银行,高柜,低柜台,电话银行,ATM 服务等等来进行银行业务办理。


图 1. 企业前端渠道应用的特点 – 多渠道、以客户为中心
图 1. 企业前端渠道应用的特点 – 多渠道、以客户为中心

在企业的业务系统增长中,由于不同的业务系统构建时间不一样,业务目标侧重点也不一样,更重要的是企业没有站在企业架构的层次来统一的考虑供多渠道的企业的统一数据字典,使得企业的各个业务系统中数字字典混乱,甚至互相冲突。这造成了诸多的弊端,如:

  1. 不同业务系统重复定义数字字典,不便于重用,并增加开发部门的开发工作量
  2. 没有统一的数据字典,不便于后期统一维护(修改,更新,删除)。
  3. 没有统一的数据字典,不便于数据集成。如客户在银行网点已经填写了一系列的客户信息,当过几天去申请信用卡的时候,用户被同样的要求输入几天前刚提供的信息。给终端用户也造成了诸多不便。
  4. 没有统一的数据字典,造成不同的业务系统的数据规范不同意,如向同一个用户在不同的业务系统中要相同的数据。如客户在某银行申请了储蓄卡账号,被要求输入了一系列的客户信息,其中包括职业一项。当该用户信用卡申请表单中也被要求输入一些列信息,也包括职业一栏目。但是这两项的填写选项,输入格式完全不一样。造成了同样的信息在不同的业务系统中规范完全不统一的问题。

企业需要一个通用的数据字典在企业架构层次被所有的业务系统所重用。本文介绍的基于 XML 的数字字典方案—— Context 数字字典可以为企业的多渠道系统提供统一的数据字典,包括类型定义,数据结构定义,校验规则,转换规则等。基于 XML 的统一数据字典,解决了上面的所有缺点。另外还提供了下面这些优点:

  1. 基于 XML 语言,支持多平台、多渠道,容易被各个业务系统所重用。
  2. 学习曲线快,不懂技术的业务人员也可以编辑企业数字字典。对高级技能程序员的依赖减少。本案在土耳其有个客户,利用 Context 数据字典工具,聘请了一些高中生就可以使用工具进行开发。
  3. 缩短开发周期。XML 简单易读,可以手工编辑或者借助一些 XML 编辑工具快速编辑。
  4. 便于格式转换,容易与第三方或合作伙伴企业之间进行通讯和业务调用。

根据上面的分析,我们知道企业多渠道 统一数据字典能够解决企业当前碰到的一些问题,具备商业可行性。接下来的篇幅将介绍 Context 数据字典的架构、设计、以及应用实例。

 

 

统一数据模型的架构

企业统一的基于 XML 的 Context 数据模型是构建在上下文 (Context) 基础上的。Context 是针对某一上下文操作定义的包含企业数据和服务的对象。不同的 Context 可以通过父子链接组成一个 Context 树。


图 2. Context 树状结构实例
图 2. Context 树状结构实例

基于 XML 的 Context 统一数据模型在架构设计上具有以下特性:

  1. 支持数据的层次化存取

    Context 数据模型最为独特的特性就是通过 Context 树支持数据的层次化。在 Context 树里不同层次的 Context 存放着不同层次和级别的数据和服务。每个子 Context 可以访问它的父 Context 和祖先 Context 的数据和服务。同时通过根上下文(Root Context)可以对整个 Context 树进行遍历和管理。

  2. 完全基于 XML 的统一定义和工具支持

    在 Context 数据字典里,Context 树的定义,包括 Context 里包含的数据和服务的定义,以及数据类型的定义,都是完全基于 XML 的。 同时有一系列工具支持数据字典的创建和编辑。这一切都大大提高了数据字典的开发和维护效率。

  3. 支持企业业务数据共享

    通过 Context tree, 父 Context 的数据可以被子 Context 所共享。比如,对于企业服务端的多渠道应用,一些跨渠道的共享数据可以放在 root context 中被各渠道不同交易的 Context 所共享。再比如,对于网上银行的应用,每个登录用户的用户信息可以放到每个用户单独的 session context 中,此 session context 被此用户执行的不同交易的 context 共享。

  4. 统一的数据访问接口

    Context 数据字典提供了对外的统一的访问接口,不同的数据类型和持久化模式的数据都可以通过统一的接口进行操作。

  5. 支持数据持久化

    Context 数据模型按是否支持持久化可以分为 Local Context 和 remote context。Local Context 不能被持久化且只能在同一个 JVM 里被访问和共享。Remote Context 可以被持久化到数据库中,并可以被跨 JVM 访问。

  6. 多平台、可扩展

    Context 数据字典的底层实现是基于 java 的,因此也具有跨平台的可移植性。同时 Context 数据字典的数据项和类型都支持被用户扩展, 平且用户可以设定自定义的数据校验器和转换器。

统一数据模型的元素  

数据类型 Type 定义

企业数据类型可包含 Type 类型和 Generic 类型。Type 数据元素代表业务对象,如日期(Date)、帐户列表(AccountList)、金额(Money)。它与非 Type 数据元素的主要区别是:Type 数据包含业务类型和业务规则信息,其中业务规则信息可包括数据显示格式、数据值域等等。Type 包含一个或者多个 Property Descriptors 来存储业务规则信息,而非 Type 类型则没有。一个典型的 Type 定义如下:


清单 1. 典型类型定义实例

				
 <type id="Money" implClass="com.ibm.btt.base.DataField"> 
 <Descriptor id="typeDefault" 
		 implClass="com.ibm.btt.base.types.ext.FloatDescriptor"> 
  <Converter convTypes="default" 
 implClass="com.ibm.btt.base.types.ext.FloatConverter"/> 
  <Validator implClass="com.ibm.btt.base.types.ext.FloatValidator" 
  lowerLimit="0"/> 
 </Descriptor > 
 </type> 

Money 使用 Validator 确保了它的最小值为 0,Converter 将数据元素转化为字符串(String)类型。

现实世界中的数据分为两类:简单型和复合型。姓名(Name)属于一个简单型,而个人信息 { 姓名,住址,资产 } 则属于复合型。 同理 Type 也分为 Simple 型和 Compound 型,Simple Type 仅包含一个 Property Descriptor,或者说该 Type 仅由一个 Property Descriptor 描述。Compound Type 含有多个 Property Descriptor:一个默认的 Property Descriptor,多个指向其他子 Type 的 Property Descriptor。


清单 2. 带有校验的类型定义实例

				
 <type id="String" implClass="com.ibm.btt.base.DataField"> 
  <descriptor id="typeDefault" 
 implClass="com.ibm.btt.base.types.ext.StringPropertyDescriptor"> 
 <Converter convTypes="default,host" 
 implClass="com.ibm.btt.base.types.ext.StringConverter"/> 
  <Validator implClass="com.ibm.btt.base.types.ext.StringValidator"/> 
  </descriptor> 
 </type> 

 <type id="PersonInfo" implClass="com.ibm.btt.base.KeyedCollection"> 
  <descriptor id="typeDefault"
         implClass="com.ibm.btt.base.types.KCollPropertyDescriptor"/> 
  <dataDescriptor id="name"     refType="String"/> 
  <dataDescriptor id="address" refType="String"/> 
  <dataDescriptor id="asset" refType="Money"/> 
 </type> 

用户可以通过如下方法使用 PersonInfo 数据类型:


清单 3. 使用 PersonInfo 数据类型实例

				
 KeyedCollection info = (KeyedCollection)DSEType.readObject("PersonInfo"); 
 info.setValueAt("name", "Tom"); 
 info.setValueAt("address", "ZhongShan Road, Xian"); 
 info.setValueAt("asset", new Float(5000)); 

数据及复杂数据项 Data 定义

统一企业数据模型中使用 XML 描述数据字典,XML 的层次结构与现实世界数据对象结构天衣无缝的映射。用户无需做概念抽象,可以非常简单实现从设计到代码的转换。为了适应现实中的层次数据结构,统一数据模型引入组合设计模式(Composite Pattern)描述数据对象关系。如图所示:


图 3. 数据类型层次图
图 3. 数据类型层次图

数据模型的最顶端为抽象类 Data Element,它定义了数据元素或者集合类的共有信息 ID 和描述信息。一个数据元素可以是单值或者是集合,这在最大程度上实现了代码重用。DataField 是统一数据模型中唯一可赋值的单元数据,在内存中每个 Field 包含一个值(Value)实例用来存储数据值。DataField 定义示例如下:

				 <field id="field1" description="This is an example"/> 
 Keyed Collection 是一个有序的数据集合,使用数据名称来访问其中的数据元素,
所以出现在同一个 Keyed Collection 的数据名称必须唯一。可以简单的把 Keyed Collection 
想象为字典(Dictionary),内部的数据元素被组织为键值对(Key-value pairs),如下所示:
 <kColl id="coll1"> 
  <field id="field1"/> 
  <field id="field2"/> 
 </kColl> 
 Indexed Collection 类似数组,使用位置(Position)访问其内部元素,
所有内部元素为同一种类型。如图所示。如需访问 customer 中的街道信息,
可以使用组合键:
customerListData.2.address.street。


图 4. 复杂数据类型实例
图 4. 复杂数据类型实例

若很多个数据元素均包含一些相同数据元素,为了避免重复代码,使用引用标签代替这些重复定义。


清单 4. 引用标签实例

				
 <kColl id="coll1"> 
  <field id="field1"/> 
  <field id="field2"/> 
 </kColl> 

 <iColl id="icoll1" size="2"> 
  <refData refId="coll1"/> 
 </iColl> 

数据结构 Context 定义

Context 定义了一个操作或者业务实体的资源集合(数据和服务)。Context 作为基本资源模型将应用系统中各 Operation 松散的耦合在一起,Operation 交互只需要将 Context 中数据格式化后双向传递。

Context 被组织成为树状结构,顶层是通用资源,底层为专用资源。Context 树在系统中有且只有一个,因此所有的用户操作可以共享 Context 树中的资源。例如,一个用户 Context 包含用户级信息,同时它含有几个子 Context,分别包含一些操作信息。Context 采用职责链模式,当 Operation 请求一些数据或者服务时,但在当前的 Operation Context 中无法找到这些资源信息,会自动从 Parent context 中查找,直到找到资源为止。一个典型的 Context 定义如下所示:


清单 5. Context 定义实例

				
 <context id="myWorkstation" type="workstation" parent="myBranch"> 
  <refKColl refId="myWorkstationData" /> 
  <refService refId="msreService" type="service" alias="msre"/> 
 </context> 

如前所述,Context 为所有 Operation 所共享,当位于多个线程中 Operation 同时访问同一个资源时,系统会自动将访问所有 Context Tree 上的请求串行化,这样可以确保资源(数据)访问的有效性和正确性。

程序是由算法和数据构成,算法在执行的过程中会用到其他辅助的服务资源,例如记录日志,访问数据库,连接服务器等服务资源。在统一企业数据模型中,将算法定义为 Operation,

数据和资源均被定义在 Context 中,而 Context 中包含数据(Data)和辅助资源(Service)。如前所述,Context 采用职责链模式,设计 Context 层次结构时需按照物理意义指明每个 Context 的责任。例如,在银行柜员(Teller)系统中,如果某个数据是被在同一支行(Branch)服务器所管辖的所有工作占共享,那么将该数据定义在支行层次(branch-level)的 Context 中。若工作站 Context (Workstation Context)是 Branch Context 的孩子,那么 Branch Context 的资源对于 WorkStation Context 是可见的。在 Context 内部每个资源都有一个名字,但在 Context 树中可以存在相同名字的资源,访问 Context 内部资源时,由底至上找到第一个同名的资源即可。

企业统一数据模型实例

在这里介绍使用 Context 数据模型实现多渠道银行应用的一个实例。此银行实现柜员桌面富客户端和网上银行的多渠道整合,并重用服务端的业务逻辑如账户查询、转账等。在这里假设富客户端通过 Java Client 渠道,网上银行通过 HTML Client 渠道接入服务端。在服务端我们定义 Context 数据模型如下:


图 5. 服务器端的 Context 树状结构实例
图 5. 服务器端的 Context 树状结构实例

这里 BranchServerCtx 被定义为 Root Context, 它包含跨渠道的数据和服务, 如后端连接,日志服务等。Java Channel Context 和 Html Channel Context 被定义为 BranchServerCtx 的子 Context, 它们包含渠道连接特性的数据如客户端类型数据。在各自渠道 Context 下,分别下挂 Session Context。它们包含的是和用户会话相关的共用数据,如客户信息,账户信息等。在通过各渠道执行交易的时候,系统在运行时动态创建交易操作的 Operation Context, 并链接到 Session Context 上。各交易的 Operation Context 如 AccountQueryCtx 和 TransferCtx 都能共享 Session Context 的数据。并通过 Session Context 共享 Channel Context 和 BranchServerCtx 的数据。

首先定义的是 branchServer Context,它是 Root Context,它包含共享的银行数据和服务资源,如下所示:


清单 6. 企业数据字典定义实例

				
 <context id="branchServer" parent="nil" type="branch"> 
  <refKColl refId="branchData"/> 
  <refService alias="CSServer" refId="realCSServer" type="cs"/> 
  <refService refId="CommunicationsPool" alias="pool" type="pool"/> 
 </context> 

 <kColl id="branchData"> 
  <refData refId="BranchId"/> 
 </kColl> 

 // 然后定义渠道上下文 Channel Context, 它是父 Context 是 branchServer Context。
 <context id="javaChannelCtx" parent="branchServer" type="op"> 
 <refKColl refId="javaChannelData"/> 
 </context> 

 <kColl id="javaChannelData"> 
  <refData refId="clientType"/> 
 </kColl> 

 // 接下来定义的是渠道会话 Context,它包含用户登录后的会话上下文操作所用到的数据如用户 ID、
客户信息、账户信息等。Session Context 在用户登录后会被创建并链接为 Channel Context
 的子 Context。为了简洁起见,下面只列出了 Java 渠道的 Session Context 定义。
 <context id="javaSessionCtx" type="op"> 
 <refKColl refId="javaSessionData"/> 
 </context> 

 // 在上面会话上下文包含的是一个集合数据 javaSessionData, 它被定义为一个 
KeyedCollection 如下:
 <kColl id="javaSessionData"> 
  <refData refId="TID"/> 
  <refData refId="UserId"/> 
 <refData refId="CustomerId"/> 
  <refData refId="CustomerName"/> 
  <refData refId="AccountList "/> 
  <refData refId="HostBuff"/> 
  <refData refId="sessionID"/> 
 </kColl> 

 // 在其中包含的账户信息被定义为一个账户类型数据的数组 (Indexed Collection)。
 <iColl id="AccountList"> 
  <refData refId="account "/> 
 </iColl> 

  <data id="account" refType="Account"/> 

 // 账户类型定义如下:
 <type id="Account" implClass="com.ibm.dse.base.KeyedCollection"> 
 <descriptor id="typeDefault" 
 implClass="com.ibm.dse.base.types.KCollPropertyDescriptor"/> 
  <dataDescriptor id="Name" refType="String"/> 
  <dataDescriptor id="Type" refType="String"/> 
  <dataDescriptor id="AccountNumber" refType="String"/> 
  <dataDescriptor id="Balance" refType="Amount"/> 
  </type> 

 // 最后我们需要针对交易操作定义 Operation Context, 如针对转账交易定义 
transferOperationCtx。转账交易 Context 是 Session Context 的子 Context,
能共享上层链路上所有 Context 的数据。
 <context id="transferOperationCtx" type="oper"> 
  <refKColl refId="accountTransferData"/> 
 </context> 

 <kColl id="accountTransferData"> 
 <data id="acctFrom" refType="String"> 
  <param id="isMandatory" value="true" /> 
  </data> 
  <data id="acctTo" refType="String"> 
  <param id="isMandatory" value="true" /> 
  </data> 
  <data id="amount" refType="String"> 
  <param id="isMandatory" value="true" /> 
  </data> 
  < data id="AccountBalance" refType="Money"/> 
  <field id="outcome" /> 
  <field id="TrxReplyCode" /> 
  <field id="TrxErrorMessage" /> 
  </kColl> 

通过以上的 Context 数据模型定义实例,可以看到对于企业复杂数据结构和类型的支持非常充分,并且各个层次的数据定义在逻辑上很清晰,能很好的支持数据共享,减少数据冗余,并且支持不同业务渠道的数据整合。

总结

随着企业应用复杂度增加,使用基于 XML 中间语言的统一数据模型能够降低企业数据字典的建立、维护的复杂性,为企业带来技术价值和业务价值。

文章作者根据在行业应用框架中间件的工作经验,抽象和介绍了基于 XML 中间语言的统一数据模型 Context 的架构、组件、设计原理、以及使用实例。

原文:http://www.ibm.com/developerworks/cn/xml/x-1009chenxm/index.html?ca=drs-

分享到:
评论

相关推荐

    基于XML的数据集成方案

    - 定义了一套统一的XML数据模型,用于描述银行与保险公司之间交换的所有数据类型。 - 开发了相应的XSLT脚本,用于将各方原有的数据格式转换为统一的XML格式。 - 构建了一个中心化的数据集成平台,用于接收、转换和...

    基于XML列控系统数据模型建立.pdf

    在这篇文章中,我们可以看到基于XML的列控系统数据模型建立方法可以解决当前列控系统数据模型的各种问题,实现统一的数据描述方式,提高工程实施效率和数据安全性。该方法将会在我国轨道交通智能化、信息化的发展中...

    一种XML数据库的数据模型PDF,深层次讲解XML

    - **XML数据库分类**:包括基于DOM的、基于SAX的和基于XML模式的数据库,每种都有其特定的优缺点和适用场景。 4. **查询XML数据**: - **XPath(XML Path Language)**:用于选取XML文档中的节点,通过路径表达式...

    基于XML的Web数据挖掘模型的设计研究.pdf

    该模块的功能是对检索得到的数据使用XML技术进行预处理,建立半结构化的数据模型,抽取其特征的元数据,并以结构化的形式保存,为挖掘模块提供所需的数据。 #### 挖掘器模块 不同的挖掘算法适用于不同的需求和方法...

    基于xml数据库集成的一篇好文章呀

    ### 基于XML数据库集成的关键知识点 #### 一、XML与数据库集成概述 XML(Extensible Markup Language)是一种标记语言,它允许定义任意数量的自定义标记来描述数据,从而使得数据能够在不同系统间进行交换。随着...

    基于XML的异构数据集成中间件研究.pdf

    异构数据集成中间件应用是指基于 XML 的异构数据集成中间件在企业中的应用实例,例如在医院数字化档案平台的开发实例中,使用基于 XML 的异构数据集成中间件解决了医院数字化档案平台的异构数据交换问题。

    基于XML的Web数据挖掘系统的研究与设计

    半结构化数据源则需解决数据模型和查询集成问题。 #### XML在数据挖掘中的应用 XML作为一种元数据描述语言,提供了标准化的数据交换和存储格式,使得数据的集成和查询更为便捷。在数据挖掘领域,XML的应用主要集中...

    基于XML的Web文本挖掘模型的研究与设计

    XML数据模型与半结构化数据的对应关系,使其在Web数据挖掘中扮演着关键角色。通过XML,可以为Web数据提供统一的结构框架,简化数据源的处理,同时保留数据的半结构化特性,便于进一步的分析和挖掘。 #### 基于XML的...

    论文研究-基于XML的.NET通用数据访问模型的研究.pdf

    异构数据库是指那些来自不同厂商、基于不同技术的数据库系统,这些系统可能使用不同的数据模型、查询语言和接口。在企业级的应用中,经常需要管理多种这样的异构数据库。***通过提供统一的数据访问接口(比如,通过...

    基于XML的三层CS模型.doc

    总的来说,基于XML的三层CS模型提供了一种强大的解决方案,尤其适用于需要高效数据交换和处理的大型分布式系统。通过XML,不仅可以简化数据处理流程,还可以提升系统的可维护性和扩展性,从而在信息技术领域中广泛受...

    基于XML的电子商务集成系统的研究与实现

    ### 基于XML的电子商务集成系统的研究与实现 #### 摘要解析与核心概念 随着互联网技术的快速发展及普及,人们的工作生活方式发生了翻天覆地的变化。电子化手段逐渐取代传统方式,成为日常生活中的重要组成部分。...

    论文研究-基于XML的空间信息元数据标准研究 .pdf

    制定基于XML的空间信息元数据标准,意味着需要建立一种统一的数据接口标准,这不仅有利于通用GIS平台的开发,也有助于不同GIS平台之间的协同工作。基于XML的元数据标准成为空间信息元数据标准的具体实施模式和规范,...

    基于SOA的数据协同模型

    在基于SOA的数据协同模型中,Web服务作为统一的数据接入接口,将各种异构、分布的数据源封装成标准服务,通过数据集成总线连接,形成松耦合的平台,确保信息共享。服务协同引擎是这个系统的核心,它负责数据流模型的...

    基于XML的图书馆馆务信息系统设计与实现

    通过将XML作为一种抽象数据库结构的描述模型,可以建立统一的数据结构描述方式。具体来说,可以通过XML文档定义数据库结构,再通过XSL(Extensible Stylesheet Language)转换成SQL语法,执行这些SQL语句以生成物理...

    基于XML进行Web数据挖掘的探讨.pdf

    根据提供的文件信息,以下是关于“基于XML进行Web数据挖掘的探讨”的知识点分析: 1. Web数据挖掘技术概念 随着互联网技术的飞速发展,网络上的信息量呈爆炸性增长。在这样的背景下,Web数据挖掘技术应运而生。Web...

    基于IEC61970的CIM_XML电力系统数据模型的校验模块的设计.pdf

    针对基于CIM/XML的电力系统数据模型,校验模块的设计至关重要,因为它确保了数据模型的正确性。校验模块通常包括三个方面:语义校验、语法校验和参数匹配度校验。语义校验检查模型中的实体对象和关系是否符合电力...

Global site tag (gtag.js) - Google Analytics