这是一个真实数据仓库项目中的案例。某公司要建立一个员工数据仓库,需要从多个业务系统集成员工相关的信息。由于历史的原因,该公司现存的四个业务系统中都包含员工数据,这四个业务系统是HR、OA、考勤和绩效考核系统。这些系统是彼此独立的,有些是采购的商业软件,有些是公司自己开发的。每个系统中都有员工和组织机构表,存储员工编号、姓名、所在部门等属性。各个系统的员工数据并不一致。例如,员工入职或离职时,HR系统会更新员工数据,但OA系统的更新可能会滞后很长时间。项目的目标是建立一个全公司唯一的、一致的人员信息库。
我们的思路是利用一系列经过仔细定义的参照表或转换表取代那些所谓硬编码的转换程序。其优点是很明显的:转换功能动态化,并能适应多变的环境。对于建立在许多不同数据源之上的数据仓库来说,这是一项非常重要的基础工作。具体方案如下:
-
建立标准码表用以辅助数据转换处理
-
建立与标准值转化有关的函数或子程序
-
建立非标准值与标准值对照的映像表,或者别名与标准名的对照表。
下面的问题是确定标准值的来源。从业务的角度看,HR系统的数据相对来说是最准确的,因为员工或组织机构的变化,最先反应到该系统的数据更新中。以HR系统中的员工表数据为标准是比较合适的选择。有了标准值后,还要建立一个映像表,把其它系统的员工数据和标准值对应起来。比方说有一个员工的编号在HR系统中为101,在其它三个系统中的编号分别是102、103、104,我们建立的映像表应该与下表类似。
DW条目名称 | DW标准值 | 业务系统 | 数据来源 | 源值 |
员工编号 | 101 | HR | HR库.表名.列名 | 101 |
员工编号 | 101 | OA | OA库.表名.列名 | 102 |
员工编号 | 101 | 考勤 | 考勤库.表名.列名 | 103 |
员工编号 | 101 | 绩效 | 绩效库.表名.列名 | 104 |
这张表建立在数据仓库的模式中,人员数据从各个系统抽取来以后,与标准值映像表关联,从而形成统一的标准数据。映像表被其它源数据引用,是数据一致性的关键,其维护应该与HR系统同步。因此在ETL过程中应该首先处理HR表和映像表。
分享到:
相关推荐
ISO27001标准要求与文件对照表 ISO27001标准要求与文件对照表是根据ISO27001标准的要求,形成了一份公司信息安全体系文件与标准规范的对照表。这份文件对照表对于需要了解ISO27001标准的要求和公司现有标准规范如何...
3. **读写操作**:根据解析出的功能码(如0x03表示读保持寄存器,0x06表示写单个保持寄存器),从设备使用地址对照表定位并处理数据。 4. **构建响应**:处理完请求后,从设备构造一个响应,包含请求的结果(如读取...
这样的对照表对于处理汉字与拼音之间的转换、建立汉字拼音数据库或进行汉字输入法开发等工作非常有用。例如,开发者可以利用这份表格快速查询某个汉字的GBK编码,或者根据编码找到汉字的正确发音。 描述中提到的“2...
标题中的“世界国家中英文对照表 sql代码”指的是一个数据库脚本,用于创建或更新一个包含全球各国中英文名称对应关系的数据表。这个数据表在各种国际化的软件系统、数据分析项目或者地理信息系统中非常有用,它能...
如“项目监督与控制”(监控项目进度和质量)、“风险管理”(识别和应对潜在风险)、“质量管理”(确保质量标准的执行)、“度量与分析”(收集数据并进行分析以改进过程)、“配置管理”(管理项目中的变更和版本...
本文件标题为“1000个金蝶K3数据表中英对照表(含二次开发)”,说明了文档包含了金蝶K3系统中的1000个数据表的名称及其字段的中英文对照,并且提到了涉及二次开发的内容。二次开发通常是指在现有软件基础上,根据企业...
### 西门子专业词汇中英文对照表解析 #### Service & Support 西门子作为全球知名的电气化、自动化以及数字化领域的技术领导者,在其产品和服务中使用了大量的专业术语。本篇文章将详细解读这些术语,帮助读者更好...
例如,在搜索引擎中,拼音对照表可以帮助建立拼音索引,使用户可以通过输入拼音来搜索汉字内容。在自然语言处理中,拼音信息有助于进行语音识别和词性标注。在教育软件中,它可以作为学习拼音的辅助工具。同时,对于...
汉字与拼音对照表提供了汉字和它们的标准普通话拼音的一一对应关系,例如“汉字”对应的拼音是“hànzì”。这种对照表对于学习汉语的人来说是基础工具,对于程序员来说则是实现汉字转拼音功能的关键数据源。 3. **...
这个Excel文件“gbk汉字编码拼音对照表21004个字全.xlsx”便于用户查阅和导入到数据库中,可以用于教学、研究或开发项目,如建立汉字拼音转换工具,或者优化汉字输入法的候选词列表。通过这样的数据资源,我们可以更...
### ITIL术语中英文对照表知识点详解 #### Absorbedoverhead 可分摊间接费用 **定义**:指在企业或项目的运营过程中产生的、不能直接归属于某个具体产品或服务的成本,但这些成本最终会根据一定的规则分配到不同的...
### PROTEUS ARES 7资源中英文对照表解析 #### 概述 Proteus ARES是一款功能强大的电路设计软件,它集成了原理图绘制、电路仿真、PCB设计等功能,广泛应用于电子产品的开发与设计领域。本篇文章将根据提供的部分...
最后,“Create”(创建)菜单是建立新对象的地方,包括“Standard Primitives”(标准图元),如“Box”(立方体)、“Cone”(圆锥体)等,这些都是3D建模的基础元素。 通过以上对3Dmax2014中英文对照表的详细...
OSI(开放系统互连)参考模型是一种国际标准框架,用于描述计算机网络通信的七层结构,而TCP/IP(传输控制协议/互联网协议)...通过对照表,初学者能更清晰地了解不同层之间的关系和功能,为网络学习打下坚实的基础。
1. **构建索引**:首先,需建立一个基于汉字拼音对照表的索引结构。索引可以是简单的哈希表,也可以是更复杂的树形结构,如Trie树(字典树),以提高查询效率。 2. **拼音转换**:用户输入拼音后,算法会将输入的...
25. **pub_funccodetocode**: 功能代码对照表,建立了系统功能与外部系统或标准编码体系之间的联系,促进了跨系统集成。 26. **pub_function**: 系统功能表,详述了系统提供的各项服务和功能,为权限管理和接口调用...
CMMI文件清单中英文对照表是理解和实施CMMI模型的重要参考资料。 **CMMI模型结构**: CMMI模型分为五个成熟度级别:初始级(Level 1)、已管理级(Level 2)、已定义级(Level 3)、量化管理级(Level 4)和持续...
9. **省内小区代码与区号对照表(lac_home_code)**:建立了小区代码与区号的关联,便于精确计费。 10. **时长类型表(duration_type)**:定义了不同的通话时长类别,如本地通话、长途通话、漫游通话等,为计费...
### DB2错误码对照表详解 #### 概述 DB2是IBM开发的一款关系数据库管理系统,在企业级应用中广泛使用。对于DB2开发者和DBA来说,了解DB2的错误码及其含义至关重要,这有助于快速定位问题并进行有效调试。本文档提供...