wikipedia上面关于information integration的说明实在是不敢恭维(不少我看来是错误的或者非常片面):
Information integration
(II) (also called information fusion
, deduplication
and referential integrity
)
is the merging of information from disparate sources with differing
conceptual, contextual and typographical representations. It is used in data mining
and consolidation of data from unstructured or semi-structured resources. Typically, information integration
refers to textual representations of knowledge but is sometimes applied to rich media content.
Among the technologies
available to integrate information are string metrics
that allow detection of similar text in different data sources by fuzzy matching
.
信息集成,个人觉得还没有成为一门成熟的学科,所以并没有严格的定义、方法、体系。下面都是我个人的一些看法了:
要集成,首先要明确目的,最终应该是形成一个knowledge base吧,将heterogeneous的信息整合(integrate)而不是收集(collect)到一起。其中heterogeneous是关键,也是最挑战的地方。
其次信息存储是否结构化 database -> XML -> ontology。这里面最成熟的应该是数据库级别的集成了,典型的解决方案就是data warehouse。但是数据仓库里面的集成需要很多认为参与制定集成的规则,自动化程度很低,比如ETL的过程。
要集成,信息的mapping或者matching是核心。这就是最新很火的research topics: schema matching和ontology matching。
待续
分享到:
相关推荐
IBM的信息集成解决方案通常基于其强大的数据管理平台,如IBM Information Server,这个平台提供了全面的数据集成能力,包括数据质量、主数据管理、数据虚拟化和信息生命周期管理等关键功能。通过这些工具,企业可以...
根据给定的文件信息,本知识点将围绕“An Inspection Information Integration System of CAD and CMM.pdf”的内容展开。文件描述了一个用于集成计算机辅助设计(CAD)和坐标测量机(CMM)的检测信息集成系统。该...
本书主要探讨了信息聚合和数据集成模式(Patterns: Information Aggregation and Data Integration with DB2 Information Integrator),这些模式为解决企业级信息集成问题提供了实用的方法论。通过利用IBM DB2 ...
本标准定义了民用运输机场信息集成系统相关的术语,包括airport information integration system、integration platform、airport operation database、enterprise service bus等。 4. 缩略语 本标准定义了民用...
MSDN Integration Utility是一个专为开发者设计的实用工具,它的主要功能是将独立的.chm(Microsoft HTML Help)和.chi(Index Information File)文件集成到MSDN(Microsoft Developer Network)6.0中。这个工具的...
2. 智能信息集成系统(Intelligent Information Integration System):这项技术的核心是基于Android移动设备实现的,其目的在于集成和智能化地处理各类信息,以便用户能够随时随地通过移动设备获得他们需要的信息。...
信息系统项目管理师(Certified Information Systems Project Manager, CISP)是一个高级别的认证,侧重于信息技术项目管理的全面知识和技能。通过这个认证,专业人士可以证明他们有能力管理复杂的信息系统项目,...
医疗信息系统集成(Medical Information System Integration)是将不同的医疗信息系统连接在一起,实现数据共享、业务协同的关键技术。本文将详细介绍医疗信息系统集成的基本框架,并深入探讨其中涉及的主要集成技术...
信息工程方法论(IEM,Information Engineering Methodology)是一种用于构建和集成大型信息系统的理论与实践框架,由詹姆斯·马丁(James Martin)在20世纪80年代初提出。IEM旨在解决“信息孤岛”问题,即多个独立...
首先需要了解几个核心概念:信息系统(Information System)和信息系统集成(System Integration)。 信息系统是以计算机硬件、网络、存储、软件和规章制度等组成的一个体系,其主要职能是数据(信息)的获取、处理...
计算机信息系统集成(CIS,Computer Information System Integration)是IT领域中的一个重要概念,它涉及将不同的硬件、软件和网络组件组合成一个协调运作的整体系统。在这个过程中,项目经理扮演着至关重要的角色,...
地理信息系统(Geographic Information System, GIS)是一种用于采集、存储、管理、分析和展示地理空间数据的系统。GIS能够将地图数据与其他形式的数据相结合,提供更深入的空间分析功能。 **2.2 GIS数据模型** ...
* 集成平台: hospital information system integration platform) 数据库设计 医院信息化建设项目的数据库设计是指通过信息化手段,实现医院的数据库设计。该设计包括以下几个方面: * 数据库管理系统: ...
hospital Information Integration Platform的设计原则 1.1 中心机房建设 hospital 信息集成平台的建设需要考虑到中心机房的建设,满足需要,考虑冗余,以确保系统的高可用性和高可靠性。 1.2 客户终端需求 ...
2. **系统集成聚合定义信息** (System Integration Aggregate Definition Information): 这部分包含对集成系统的详细描述,如接口规格、系统架构、集成要求以及预期的系统性能。这些信息有助于确保每个组件在集成...
分析人员和程序员使用开放信息集成工具套件(Open II)来加速组织之间的数据集成和协调。 OpenII有一个中立的架构存储库,用于浏览和比较各种数据模型。 OpenII被构建为基于Eclipse 3.x的富客户端平台应用程序。 ...
系统通过集成各类信息源,如SCADA(Supervisory Control And Data Acquisition)系统、GIS(Geographic Information System)以及各种智能设备的数据,实现多维度信息的整合。这种信息交互使得故障定位更加精确,能...