`
yydcj
  • 浏览: 61612 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论

本体(Ontology)综述

阅读更多

本体作为一种能在语义和知识层次 上描述领域概念的建模工具,其目标是捕获相关领域的知识,确定该领域内共同认可的词汇,通过概念之间的关系来描述概念的语义,提供对该领域知识的共同理 解。语义Web(the Semantic Web)是在本体理论基础之上对现有Web所进行的扩展[15],其目标是使Web上的信息具有计算机可以理解的语义,在本体的支持下实现信息系统间语义 上的互操作性,以及对Web资源所进行的智能访问和检索[16]。充分实现语义Web的潜力,需要大规模采用基于本体的方法来共享信息和资源,本体是语义 Web得以实现的基础和关键。

本章主要介绍论文工作涉及的本体、语义Web、语义Web服务等基本概念。

1.1 Ontology

Ontology的概念最早源于亚里士多德(公元前384-322年)对事物存在本质的研 究,在哲学上的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的一个系统的解释或说明,关心客观现实的抽象本质[17]。近几 年,Ontology作为信息抽象和知识描述的工具,被计算机领域所采用。

计算机领域的Ontology是否应该叫做“本体”,存在一定的争议。目 前,Ontology主要有“本体”和“本体论”两种中文译法。大连海事大学智能信息处理学科梯队的黄映辉教授从人工智能引入Ontology时候 Ontology的定义开始,分析了Ontology的哲学意义和Ontology被引入到计算机领域后的实质内容,认为计算机领域的Ontology不 应该译作“本体”或者“本体论”。Ontology作为从哲学领域借用的术语,其实质是“概念模型”,应该被翻译为“本体论模型”[19]。

将Ontology翻译成“本体”已经是计算机领域一个约定俗成的做法。本文在讨论 Ontology的时候,为了行文方便并符合业界习惯,仍然使用“本体”的说法。这里讨论的本体的相关知识,均限于计算机领域的本体。

1.1.1 本体的定义

本体在计算机领域的定义经历了一个演化过程。在人工智能界,最早给出本体定义的是 Neches等人,他们将本体定义为“给出构成相关领域词汇的基本术语和关系,以及利用这些术语和关系构成的规定这些词汇外延的规则的定义[19]”。 1993年,Gruber给出了本体的一个最为流行的定义,即“本体是概念模型的明确的规范说明[20]”。后来,Borst在此基础上,给出了本体的另 外一种定义:“本体是共享概念模型的形式化规范说明[21]”。

Studer等人在对本体做了深入研究后,扩展了Gruber的定义,认为“本体是共享概念 模型的明确的形式化规范说明(An ontology is a formal, explicit specification of a shared conceptualisation.)[22]”。该定义包含四层含义:

1)概念模型(Conceptualization),即本体是通过抽象客观世界的概念而得 到的模型,它表示的含义独立于具体的环境状态;

2)明确性(Explicit),即本体所使用的概念及在这些概念之上的约束都有明确的定 义,没有二义性;

3)形式化(Formal),即本体是计算机可处理的,而不是自然语言;

4)共享(Shared),即本体体现的是共同认可的知识,反映的是相关领域中公认的概念集 合,它所针对的是团体而不是个体。

本体的目标是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词 汇,并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义[23]。

1.1.2 本体建模元语

本体中的知识是通过类、关系、函数、公理和实例来形式化地表示的[20]。Perez等人用 分类法组织了本体,归纳出5个基本的建模元语[24]:

1)          类(Classes)或概念(Concepts)

指任何事务,如工作描述、功能、行为、策略和推理过程。从语义上讲,它表示的是对象的集合, 其定义包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。

2)          关系(Relations)

在领域中概念之间的交互作用,形式上定义为n维笛卡儿积的子集。如子类关系 (subClassOf)。在语义上关系对应于对象元组的集合。

3)          函数(Functions)

一类特殊的关系。该关系的前n-1个元素可以唯一决定第n个元素。形式化的定义为F: C1×C2×…×Cn-1→Cn。如motherOf就是一个函数,motherOf(x, y)表示y是x的母亲。

4)          公理(Axioms)

代表永真断言,如概念乙属于概念甲的范围。

5)          实例(Instances)

代表元素。从语义上讲实例表示的就是对象。

本体与面向对象的理论非常类似,但这两者本质是不同的。本体是对某个领域静态概念模型的描 述。面向对象是一种软件开发方法,主要思想是使用对象、类、继承、封装、消息和多态等基本概念来构造系统。在面向对象的理论中,对象或类不仅包括描述对象 静态特征的属性,也包括描述对象动态特征(行为)的方法。对象的属性和方法结合在一起形成一个独立的系统单位,尽可能对外隐蔽对象的内部细节,对外提供统 一的接口。

1.1.3 本体描述语言

本体描述语言起源于人工智能(Artificial Intelligence, AI)领域对知识表示的研究,这方面的本体描述语言主要有:KIF(Knowledge Interchange Format)[25]、Ontolingua[4]、OKBC(Open Knowledge Base Connectivity)[26]、OCML(Operational Conceptual Modeling Language)[27]、Frame logic[28]、Loom[29]等。近年来,随着Web技术的发展,Web与本体理论的结合成为必然趋势,诞生了一些Web本体描述语言,主要有 RDF(Resource Description Framework)[30]、RDF Schema[31]和SHOE(Simple HTML Ontology Extension)[32]等。

描述逻辑(Description Logics, DLs)[33]是人工智能领域研究的一种重要的知识表示语言,目前正被积极应用于本体的描述。以描述逻辑为基础的本体描述语言主要有OIL[34]、 DAML+OIL[35]和OWL[1]。

Web本体语言OWL(Web Ontology Language, OWL)[1]是W3C2004年推荐的本体描述语言的标准,是在WWW上发布和共享本体的语义标记语言。OWL作为RDF/RDF(S)的扩展,是在 DAML+OIL的基础上发展起来的,目的是提供更多的原语以支持更加丰富的语义表达并支持推理。OWL 有三个子语言:OWL Lite、OWL DL和OWL Full。其中,OWL Lite用于提供给那些只需要一个分类层次和简单属性约束的用户。推理系统能够保证计算完备性(即所有的结论都能被计算出来)和可判定性(即所有计算都在 有限时间完成)。OWL Full支持那些需要在语法自由的RDF上进行最大程度表达的用户,它允许一个本体在预定义的(RDF或OWL)词汇表上增加词汇。

1.1.4 本体构建的准则

目前已有的本体很多,出于对各自问题域和具体工程的考虑,构造本体的过程也是各不相同的。由 于没有一个标准的本体构造方法,不少研究人员出于指导开发本体的目的,从实践出发,提出了不少有益于构造本体的标准。下面列举一些在实践中被证明比较有用 的本体构建准则。

1)          清晰性和客观性(Clarity and Objectivity)[20]:本体应该通过客观定义和自然语言文档对所定义的术语给出明确的、客观的语义定义。

2)          完全性(Completeness)[20]:本体所给出的术语定义是完整的,完全能表达所描述术语的含义。

3)          一致性(Coherence)[20]:由术语得出的推论与术语本身的含义是相容的,即支持与其定义相一致的推理,不会产生矛盾;所定义的公理以及用自然 语言进行说明的文档也应该具有一致性。

4)          最大单调可扩展性(Maximum Monotonic Extendibility)[20]:向本体中添加通用或专用的术语时,不需要修改其已有的概念定义和内容,支持在已有的概念基础上定义新术语。

5)          最小本体承诺(Minimal Ontological Commitments)[20]:本体约定应该最小,对待建模对象应给出尽可能少的约束。而所谓的承诺,在本体中指的是对怎样以一致的、相容的方式使用 共享词汇所达成的共识。一般地,本体约定只要能够满足特定的知识共享需求即可,这可以通过定义约束最弱的公理以及只定义交流所需的词汇来保证。

6)          本体描述原则(Ontological Distinction Principle)[36]:本体中的类应该是互不相交的。

7)          概念层次多样化(Diversification of hierarchies)增强多继承机制的能力[37]。

8)          模块化设计(Modularity)以最小化模块化之间的耦合度[38]。

9)          语义距离最小化(Minimization of the semantic distance)[37]:兄弟概念之间的语义距离最小化,尽可能把含义相似的概念抽象出来,用相同的元语来表示。

10)      命名标准化(Standardization of names)[37]:尽可能使用标准的名字。

在这十条准则中,Gruber在1995年所给出的五条原则(上述十条原则的前五条)最具有 影响力。这十条构建准则给出了构造本体的基本思路和框架,然而,明显的不足之处就是它们所反映的内容非常模糊且难于把握。目前人们普遍认为,在构造特定领 域的本体的过程中,需要领域专家的参与。

1.1.5 本体的应用

本体的应用主要涉及两个方面:第一,本体作为一种能在知识层提供知识共享和重用的工具在语义 Web中的应用;第二,在信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题[23]。

常规的基于关键词的信息检索技术已不能满足用户在语义上和知识上的需求,寻找新的检索方法也 就成为目前研究的热点。本体具有良好的概念层次结构和对逻辑推理的支持,因而在信息检索,特别是在基于知识的检索中得到了广泛的应用。由于本体具有能通过 概念之间的关系来表达概念语义的能力,所以能够提高检索的查全率(Recall)和查准率(Precision)。

传统的信息集成技术很难解决信息源之间的结构和语义的异构,要解决这些问题,根本的方法就是 要减少、甚至消除在概念和用词上的混乱,达成对事物相互一致的共同认识,并将其作为一种统一的框架和基础。因此,将本体技术引入到信息集成中来,对异构信 息进行形式化和规范化表示,以期解决传统信息集成中存在的语法和语义异构问题。在信息集成中使用本体具有以下优势:首先,本体提供了一个共享词汇库,可作 为与数据源的稳定的概念接口,并且独立于数据源模式;其次,本的描述能力可以解决同名异义及异名同义,描述概念间的相互关系,显示的描述数据的语义,支持 相关信息源之间的信息交换,提高应用的互操作性,促进领域知识共享和重用;第三,由于本体的描述能力,配合推理机可以进行一些推理查询,发掘一些蕴涵的数 据关系。

 

 

参考文献:

 

[1]    Sean Bechhofer, Frank van Harmelen and Jim Hendler et al. OWL Web Ontology Language Reference. W3C Recommendation 10 February 2004. http://www.w3.org/TR/owl-ref/

[2]    Jennifer Golbeck, Gilberto Fragoso, Frank Hartel and Jim Hendler et al. The national cancer institute’s thesaurus and ontology. Journal of Web Semantics, 1(1), 2003.

[3]    The Gene Ontology Consortium. Gene ontology: tool for the unification of biology. Nature Genetics, 2000, 25:25-29.

[4]    Ontolingua Ontology Library. http://www.ksl.stanford.edu/software/ontolingua/

[5]    Knowledge Web. http://knowledgeweb.semanticweb.org/

[6]    Rector, A. Napoli and G. Stamou et al. Report on modularization of ontologies. Technical report, Knowledge Web Deliverable D2.1.3.1. 2005.

[7]    Natalya F. Noy and Mark A. Musen. Specifying Ontology Views by Traversal. In Proceedings of the International Semantic Web Conference (ISWC), 2004.

[8]    Paul Doran. Ontology Reuse via Ontology Modularisation. In Proceedings of KnowledgeWeb PhD Symposium 2006. Budva, Montenegro, 2006.

[9]    Julian Seidenberg and Alan Rector. Web ontology segmentation: Analysis, classification and use. In Proceedings of the World Wide Web Conference (WWW), Edinburgh. 2006.6.

[10] Bernardo Cuenca Grau. Combination and Integration of Ontologies on the Semantic Web. PhD thesis, Dpto. de Informatica, Universitat de Valencia, Spain, 2005.

[11] Heiner Stuckenschmidt and Michel C. A. Klein. Structure-based partitioning of large concept hierarchies. In Proceedings of International Semantic Web Conference, 2004:289-303.

[12] Alexander Borgida and Luciano Serafini. Distributed description logics: Directed domain correspondences in federated information sources. In Proceedings of CoopIS/DOA/ODBASE, 2002:36-53.

[13] Oliver Kutz, Frank Wolter and Michael Zakharyaschevy. Connecting abstract description systems. In Proceedings of the 8th International Conference of Knowledge Representation and Reasoning (KR-2002, Toulouse), Morgan Kaufmann, 2002:215-227.

[14] Jie Bao, Doina Caragea, and Vasant Honavar. Towards collaborative environments for ontology construction and sharing. In Proceedings of International Symposium on Collaborative Technologies and Systems (CTS 2006), 2006:99-108.

[15] Tim Berners-Lee, Hendler, and Lassila. The Semantic Web. Scientific American, 2001, 284(5), 34-43.

[16] 邓志鸿,唐世渭,张铭等. 本体论研究综述. 计算机研究与发展, 2004, 41(17):1041-1052.

[17] 邓志鸿,唐世渭,张铭等. Ontology研究综述.北京大学学报(自然科学版), 2002, 38(5):730-738.

[18] Neches R, Fikes R E, and Gruber T R et al. Enabling Technology for Knowledge Sharing. AIMagazine, 1991, 12(3):36-56.

[19] 黄映辉, 李冠宇. Ontology的实质是“本体论模型”. 计算机工程与应用, 2007, 43(23):12-14.

[20] Thomas R. Gruber. Towards principles for the design of ontologies used for knowledge sharing. International Journal of Human-Computer Studies, 1995, 43:907-928.

[21] Borst W N. Construction of Engineering Ontologies for Knowledge Sharing and Reuse. PhD thesis, University of Twente, Enschede, 1997.

[22] Studer R, Benjamins V R, Fensel D. Knowledge Engineering,Principles and Methods. Data and Knowledge Engineer-ing, 1998, 25(1-2):161-197.

[23] 宋炜,张铭. 语义网简明教程. 北京:高等教育出版社,2004.

摘自:http://imarine.blog.163.com/blog/static/51380183200861373316920/

分享到:
评论

相关推荐

    本体研究综述或Ontology研究综述

    本体研究初学者可以下着看一看,本资源不要资源分,是关于本体的研究综述,或说ontology研究综述

    ontology本体研究综述(期刊论文)

    一篇介绍本体研究现状的论文,比较宏观的介绍了本体的定义、发展、分类与应用。比较适合作为素材引用。

    本体研究综述

    ### 本体研究综述 #### 一、引言 随着信息技术的迅速发展,人们面临着越来越多的数据管理和知识表达的需求。特别是在互联网技术普及之后,如何有效地组织、管理并利用网络上庞大的信息资源,成为了亟待解决的问题...

    Ontology研究综述_邓志鸿

    Ontology(本体论)是计算机科学领域的重要概念模型,它的核心是描述概念及概念之间的关系,通过这种方式来表达概念的语义信息。Ontology的概念最初来源于哲学领域,用于解释和阐述客观存在的系统,随后被引入人工...

    owl本体语言综述(详尽的讲解)

    OWL(Web Ontology Language)是W3C推荐的一种网络本体语言标准,旨在明确表达本体中的概念含义和语义关系,以促进领域知识的共享和理解。它为语义网(Semantic Web)的实现提供了关键的技术支持,后者是现有Web的...

    这是一篇关于本体构建研究综述的文章

    本体(Ontology)源自哲学概念,在信息处理领域特别是人工智能、语义网、知识管理、信息检索和人机交互等方面发挥着重要作用。随着信息技术的发展,本体已经成为研究热点之一。本体可以被定义为正式定义术语间关系的...

    本体概念、描述语言和方法论方面的综述

    本体概念(Ontology)起源于哲学领域,可以追溯到公元前古希腊哲学家亚里士多德(384-322 b.c.)。在哲学中,本体的定义为“对世界上客观存在物的系统地描述,即存在论”,是客观存在的一个系统的解释或说明,关心的...

    信息安全本体研究综述:基于2010—2016年.pdf

    本体论(Ontology)在信息安全领域中,是一种描述和定义概念及概念间关系的方式,旨在实现信息共享和互操作性的标准化。本综述文章主要针对2010年至2016年期间信息安全本体的研究成果进行回顾,内容涵盖了安全防御、...

    基于文本的本体学习研究综述

    ### 基于文本的本体学习研究综述 #### 引言 随着信息技术的快速发展,本体(Ontology)作为知识表示的重要手段之一,在计算机科学领域的应用日益广泛。本体不仅能够支持知识的共享与复用,还能促进不同领域间的...

    基于语义Web的本体映射方法综述

    ### 基于语义Web的本体映射方法综述 #### 引言 互联网作为现代社会信息交换的重要平台,正以前所未有的速度扩展和发展。然而,当前互联网上大部分信息是以HTML等人类可读的格式存储的,这对智能程序来说并不友好。...

    本体映射最近研究情况综述

    ### 本体映射最近研究情况综述 #### 摘要 随着互联网技术的发展,语义网(Semantic Web)成为研究热点之一。语义网旨在通过机器可读的形式表示网络上的信息,使得计算机能够理解这些信息并进行智能处理。在这一...

    有关本体研究的十几篇论文

    3. **Ontology在数字图书馆领域中的应用与研究综述**: 数字图书馆利用本体技术可以更好地组织和检索信息资源。论文可能总结了本体在元数据标准化、信息发现和知识整合等方面的应用案例和挑战。 4. **本体编辑工具...

    我国地理本体理论与方法研究进展

    其核心概念本体(Ontology)起源于哲学领域,它是一种关于“存在”的科学,尝试对客观世界进行抽象描述和系统解释。本体论在哲学中讨论的问题至今仍然十分热络,而在科学技术领域,尤其是在语义互联网、语义建模和...

    数据挖掘中的本体应用研究综述.pdf

    本体(Ontology)原为哲学领域概念,在人工智能领域得到应用,特别是在描述领域知识方面。1991年,Neches等人首次定义了本体,它包括领域词汇的基本术语、关系及构成这些术语和关系的规则。本体在生物科学、化学等...

    本体的概念、描述语言和方法论的综述

    "一篇关于本体的概念、描述语言和方法论的综述.doc"很可能提供了对本体概念的全面介绍,包括其基本元素(如类、属性和实例)和关键术语。此外,文档可能会详细介绍描述语言,如OWL(Web本体语言)和RDF(资源描述...

    基于基因本体的语义相似度计算方法研究综述.docx

    《基于基因本体的语义相似度计算方法研究综述》 基因本体(Gene Ontology,GO)作为生物学领域的重要资源,它为基因和基因产物的属性提供了规范化的描述,涵盖分子功能、生物过程和细胞组件三个核心方面。自1998年...

    基于本体的语义相似度和相关度计算研究综述

    ### 基于本体的语义相似度和相关度计算研究综述 #### 一、语义相似度与相关度的基本概念 语义相似度(Semantic Similarity)与语义相关度(Semantic Relatedness)是自然语言处理(NLP)领域中的两个核心概念。...

Global site tag (gtag.js) - Google Analytics