`

COM原理及应用---- 结构化存储

    博客分类:
  • COM
阅读更多

1、结构化存储

       COM的结构化存储(structured storage)机制,也称为永久存储(persistent storage)机制。结构化存储可以说是软件存储技术的一个重要进展,COM针对组件软件的需要,在文件系统的基础上,提出了结构化存储的概念。利用结构化存储,组件程序之间可很好地协同工作,一个组件程序可以与另一个组件程序共享同一个文件,就如同一个应用程序与另一个应用程序共享同一个磁盘文件系统一样。

       COM定义了结构化存储的规范,包括一组接口和实现这些接口成员函数的一些规则;同时COM也提供了结构化存储的实现,即复合文档技术。复合文档技术是 OLE的基础。OLE最初的目标是在文档中嵌入或链接对象,当然现在OLE的发展已经超出了这个范围,但复合文档仍然是OLE的基础存储技术。

 

2、结构化存储的引入

       组件化程序设计方法把应用系统设计成多个组件程序,如何在这些组件程序之间以共享方式访问同一个文件是组件化程序设计必须要解决的问题。而多个组件通过文件句柄访问共享文件难以实现,结构化存储技术“借用”文件系统的概念,在文件内部构造了一个类似于文件系统的树状层次结构,解决了这一问题。

       结构化存储的层次结构的节点可以是两种对象:存储对象和流对象,每个存储对象或者流对象都是一个可独立进行读写操作的对象,组件程序只对它拥有的节点对象进行操作。从应用系统整体上看,这些组件程序在共享访问同一个文件。

 

3、文件系统

       操作系统的诞生把应用程序与底层存储设备隔离开来,操作系统为应用程序的运行提供了基本的抽象环境,它可以处理所有与存储设备有关的基本操作。同时,操作系统引入了文件系统的概念,允许多个应用程序共享同一个存储设备。而且,操作系统为应用程序提供了一种抽象的流式存储结构,应用程序仍然独立地访问它自己的存储空间,不同应用程序相互之间不受干扰。

 

4、文件系统与结构化存储的框图


5、存储对象和流对象

       对于一个完整的存储操作来说,它被分为两个层次:应用程序调用API函数;操作系统提供API函数的实现。COM库提供了结构化存储的实现,它提供了一组接口和API函数供组件程序调用来完成实际的存储操作。因此,结构化存储定义的存储对象和流对象由COM库实现,应用程序或者组件程序并不需要实现这两个对象,就好比应用程序不需要实现文件句柄或者目录对象一样。

       流对象非常类似于单独的磁盘文件,它也是进行数据读写操作的基本对象,利用流对象可以保存各种类型的数据,它有自身的访问权限和一个独立的搜索指针。流对象也用一个字符串作为其名称,就好像文件名一样。流对象是一个由COM实现的组件对象,它实现了基本的COM接口IStream,应用程序通过 IStream接口访问流对象,进行各种数据访问操作。

       存储对象类似于目录对象,它也有一个字符串名称,但它本身并没有存储数据信息,它作为其子存储对象和子流对象的容器,只记录了这些子对象的信息。存储对象暴露IStorage接口,客户程序通过IStorage接口对存储对象进行操作。

       应用程序或者组件程序可以通过结构化存储机制共享同一个复合文件,存储对象和流对象也可以在这些程序之间被共享访问,即使这些程序运行在不同的进程中。

 

6、结构化存储特性――访问模式

       存储对象和流对象支持两种基本的访问模式:直接访问和事务访问模式。在直接访问模式下,程序对存储对象或者流对象的修改操作马上生效;而在事务模式下,程序对存储对象或者流对象所作的修改被缓存起来,只有当提交(Commit)时才真正有效,如果调用Revert成员函数,则可以恢复到上次提交或刚打开时的状态。

 

7、结构化存储特性――事务机制

       在结构化存储的树状层次结构中,事务特性可以适用于所有层次上的对象,因此,事务特性可以嵌套使用。

       事务机制需要消耗较多系统资源。

 

8、结构化存储特性――命名规则

       在结构化存储的树状层次结构中,每个存储对象和流对象都有一个字符串名字。

       根存储对象的名字实际上就是复合文档的文件名,所以根存储对象的命名规则受文件系统影响,它遵守文件系统的命名约定。与创建和打开根存储对象有关的函数中,直接使用文件名即可。所有非根存储对象和流对象都由它们的父对象管理,由于它们存在于文件内部,因此它们的命名规则遵守COM给出的约定。

 

9、结构化存储特性――增量访问

       增量访问的意义在于减少了保存和打开文件时的操作时间和降低了应用程序对系统资源的要求。

       对于大的复合文件的编辑操作,内存往往是个瓶颈,结构化存储本身也需要消耗一些系统内存资源,但它实现的增量访问反而降低了应用程序对内存的要求,同时也提高了系统的性能。

       结构化存储也带来了另一个问题,那就是空间回收的管理。频繁地对同一个复合文件进行修改、保存,则文件的尺寸总是在增长,原因在于删除对象时,COM只是把这些所占用的磁盘空间标记为“未用”,而没有释放这些磁盘空间。当然COM以后可能会重用这些空间,但在重用之前,这些空间仍保留在文件中。解决这个问题的方法是:首先创建一个新的复合文件,然后调用原先根存储对象的CopyTo函数,把以前的树结构复制到新的根存储中,则新的复合文件没有碎片空间。

       Microsoft Access或Word产生的文件就会出现这种情况。

 

10、结构化存储实现:复合文档

       从结构化存储的对象结构可以看出,要在特定的系统平台上实现结构化存储,关键在两方面:一是如何把根存储与底层存储介质结合起来,二是实现存储对象和流对象。

复合文档通过一个被称为“LockBytes”的对象,把根存储与底层的存储介质联系起来,其他的子对象则通过根存储与底层存储介质进行数据通信,从而实现了整个结构化存储体系结构。底层介质不仅可以是磁盘文件,复合文档也允许是内存空间,甚至是用户自定义的虚拟空间。LockBytes对象实际上是所有存储介质的一种抽象表达方式,它把存储介质描述成一般化的字节序列,不管是磁盘文件还是内存区域都可以按字节序列对待。

COM库提供了缺省的基于文件句柄操作的LockBytes对象,我们可以利用此 LockBytes对象建立复合文件。COM库还提供了基于内存的LockBytes对象,我们可以利用内存LockBytes对象建立内存中的复合文档。而且,COM还允许我们实现自己的LockBytes对象,并在自定义LockBytes对象的基础上建立复合文档。

 

11、复合文档API函数

       创建复合文档API函数:StgCreateDocfile和StgCreateDocfileOnLockBytes。

       打开已经存在的复合文档API函数:StgOpenStorage和StgOpenStorageOnLockBytes。

       在内存基础上创建LockBytes对象或者流对象的API函数:CreateILockBytesOnHGlobal、 GetHGlobalFromILockBytes、CreateStreamOnHGlobal、GetHGlobalFromStream。

       其他的API函数:StgIsStorageFile和StgSetTimes。

 

12、零内存保存特性和IRootStorage接口

       复合文档通过LockBytes对象把根存储对象与底层的文件操作隔离开来,所以我们在访问存储对象或者流对象时避开了文件句柄操作。当我们用事务方式打开复合文件时,COM实际上用到了三个文件句柄,一个是复合文件句柄,另一个是临时文件句柄,该临时文件记录了存储对象操作过程中的修改信息,还有一个句柄用作在零内存情况下保存文件时预分配的文件句柄。

 

13、存储对象、流对象和文件的CLSID信息

       通过IStorage接口的SetClass函数可以为一个存储对象赋一个CLSID标识符,并可通过Stat函数获取此CLSID值。实际上,存储对象通过此CLSID值把它与一段可执行代码联系起来,当客户程序希望执行与存储对象相联系的代码时,它利用CLSID值,并调用 CoCreateInstamce函数创建一个COM对象,再把存储对象交给COM对象,由它处理存储对象。这样的COM对象称为永久对象(persistent object),它通常实现了IPersist***接口,比如IPersistFile、IPersistStorage、 IPersistStream和IPersistStreamInit等,客户程序通过这些接口进行数据交换。

       COM也提供了几个API函数用于存储对象或者流对象执行与CLSID有关的一些常规操作:

(1)WriteClassStg和ReadClassStg函数封装了 IStorage::SetClass和IStorage::Stat成员函数,可以完成存储对象的CLSID的设置和获取操作。存储对象只是个容器,它本身不包含数据信息,所以它的CLSID信息被写在其下面的一个子流对象中,其名字为“\x01CompObj”。

(2)WriteClassStm和ReadClassStm函数使用一致的格式在流对象的当前位置分别写或者读CLSID信息,通常情况下,我们在流的起始处放置CLSID信息。

(3)GetClassFile函数返回一个与给定文件相联系的CLSID。Windows桌面环境利用它把数据文件与应用程序联系起来,实现了桌面环境中的数据驱动机制。

对于非复合文档,Windows提供了两种方法可以建立这样的联系。

(1)Windows系统注册记录了文件扩展名与ProgID之间的联系,而ProgID又指定了CLSID,所以该文件扩展名与CLSID联系起来了。

(2)Windows系统注册表提供了一些文件匹配规则,在HKEY_CLASSES_ROOT\FilType键下记录了一些CLSID与它们的匹配规则。

 

14、复合文档与结构化存储

       结构化存储是COM规范的一部分,它描述了一个理想的存储机制,而复合文档作为它在Windows平台上的实现,它利用操作系统的特点增加了一些新的特性,但也不可避免地受到一些限制。复合文档是目前Windows平台上的基本存储机制。

 

15、永久接口

       客户程序通过永久接口维护永久对象的状态信息,而状态信息可以被存放在各种介质中,比如存储对象、流对象或者文件中,根据介质的不同,COM定义了四个常用的永久接口:IPersistFile、IPersistStorage、IPersistStream和IPersistStreamInit,它们都派生自基本的IPersist接口。客户程序可以向永久对象请求这些接口,然后通过接口读写对象的状态信息。

 

16、永久对象的存储特性

       永久对象通过三种介质保存状态数据,分别为流对象、存储对象和文件。永久对象在三种介质上保存状态数据的特性是不同的,操作过程也是不同的。

       实际上,一个永久对象可以实现多个永久接口以便提供多种介质的存储支持。从程序实现来讲,这是一个多接口支持问题,从客户程序来讲,它只能使用一种接口,根据客户程序的特性,它可以优先选择一个永久接口。

分享到:
评论

相关推荐

    数据库原理及应用-第二章简答题答案.docx

    数据库原理及应用是计算机科学中的核心课程之一,主要研究如何高效、安全地存储和管理数据。本章讨论了关系模型的基础知识,包括完整性规则、实体完整性和参照完整性、关系的性质以及不同类型的连接操作。 1. 完整...

    数据库系统原理及应用-存储过程.ppt

    ### 数据库系统原理及应用-存储过程 #### 一、存储过程基本知识 **概念** 存储过程(Stored Procedure)是一种预先定义并存储于数据库服务器上的SQL指令集合,它能够通过参数化的方式接受输入数据,执行复杂的...

    XML原理与应用-夏天

    - 数据存储:XML数据库用于存储结构化但非SQL格式的数据。 4. 夏天资源详解: - 实验指导书.docx:可能包含了一系列实践操作步骤,帮助学习者通过实际操作理解XML的使用。 - 教案:可能包含了教学计划、讲解重点...

    《数据库原理及应用-MySQL》课程教学大纲.docx

    "《数据库原理及应用-MySQL》课程教学大纲" 《数据库原理及应用-MySQL》课程教学大纲是计算机类专业的必修课,是一门重要的专业基础课。课程的主要目标是使学生掌握数据库系统基本概念、原理和基本技术,熟练使用 ...

    XML原理与应用-袁俊PDF完整版

    XML的设计目标是传输和存储数据,而非显示数据,因此它的重点在于数据的结构化表示,而不是外观样式。袁俊的《XML原理与应用》一书深入浅出地讲解了XML的核心概念和技术,为读者提供了全面的XML学习资源。 XML的...

    数据库系统原理及应用-语法与流程控制-PPT课件.ppt

    【数据库系统原理及应用-语法与流程控制】 在数据库领域,了解和掌握SQL语言,特别是Transact-SQL(T-SQL)是至关重要的。Transact-SQL是微软为SQL语言扩展的一种版本,广泛应用于SQL Server 2000中。T-SQL的主要...

    单片机原理及应用-教学课件-张国锋-主编-第章-单片机基础知识(与“单片机”相关共54张).pptx

    单片机原理及应用教学课件主要讲解了单片机的基础知识,包括单片机的定义、特点、发展历程、典型结构、数制转换以及在不同领域的广泛应用。以下是详细的知识点解析: 1. **单片机的基本概念**: - 单片机是将微型...

    数据库原理及应用-期末考试试题及答案.doc

    数据库原理及应用是计算机科学中的重要分支,主要研究如何有效地组织、存储和管理数据。这份文档,"数据库原理及应用-期末考试试题及答案.doc",涵盖了数据库的基础知识,包括概念、模式设计、数据操作、事务管理和...

    数据库原理及应用-SQLServer版

    数据库原理及应用是IT领域中的一个关键主题,尤其在SQL Server版本中,它涉及了大量数据存储、管理和分析的知识。SQL Server是由微软公司开发的关系型数据库管理系统,广泛应用于企业级的数据存储和处理。 首先,...

    Chapter5-厦门大学-林子雨-大数据技术原理与应用-第五章-NoSQL数据库31.pptx

    NoSQL 数据库可以实现高效的简单查询,但是不具备高度结构化查询等特性,复杂查询的性能不尽人意,而关系数据库借助于索引机制可以实现快速查询。 5.4 NoSQL 的四大类型 ------------------- NoSQL 数据库可以分为...

    数据库原理及应用-习题答案

    ### 数据库原理及应用知识点详解 #### 第 1 章 数据库基础 **知识点一:数据与信息的概念** - **数据**: 对客观事物、事件的记录与描述,包括连续数据(如声音、图像)和离散数据(如符号、文字)。 - **信息**: ...

    MCS-51单片机原理及应用实例

    《MCS-51单片机原理及应用实例》是一本深入探讨MCS-51系列单片机的书籍,适合电子电路初学者和进阶者阅读。MCS-51,也称为8051,是英特尔公司推出的一种经典8位微控制器,广泛应用于各种嵌入式系统设计。下面我们将...

    mysql数据库原理及引擎-MySQL数据库原理及应用PDF

    《MySQL数据库原理及应用》从教学实际出发,系统地介绍了MySQL数据库的有关原理和基本操作,主要内容包括数据库技术概述、MySQL概述、数据库基本操作、数据表、索引、结构化查询语言SQL、视图、触发器、存储过程和...

    嵌入式系统原理及应用——基于ARM Cortex-M3内核的STM32F103系列微控制器.zip

    1.5.6汽车电子31◆嵌入式系统原理及应用目录1.5.7金融商业31 1.5.8生物医学32 1.5.9信息家电32 1.6本章小结34 习题134 第2章嵌入式系统开发35 2.1嵌入式系统的开发环境、开发工具和调试方式35 2.1.1嵌入式...

    安徽大学2009-2010数据库原理及应用-期末考试试题及答案1

    这份考试试题覆盖了数据库系统的核心概念,包括数据库的层次结构、数据独立性、视图、关系代数、事务处理、数据恢复、规范化理论、并发控制和数据库设计等多个重要方面,全面测试了学生对数据库原理及应用的理解和...

    嵌入式系统原理及应用(基于Cortex-A8处理器).zip

    在“嵌入式系统原理及应用(基于Cortex-A8处理器)”这个主题中,我们将深入探讨该领域的核心概念以及Cortex-A8处理器的特性和应用。 Cortex-A8是ARM公司设计的一款高性能、低功耗的处理器内核,广泛应用于智能手机...

    数据库原理及应用-考试题3.doc

    数据库原理及应用是一门重要的IT课程,主要探讨如何有效地存储、管理和检索数据,以支持企业的决策和运营。考试题3可能包含了多项选择题、填空题、问答题等多种类型的题目,旨在考核学生对数据库基础知识、概念和...

    数据库原理及应用-期末考试试题及答案复习课程.docx

    【数据库原理及应用】课程复习知识点: 1. 数据库(DB)、数据库管理系统(DBMS)和数据库系统(DBS)的关系: - DBS(数据库系统)包括DB(数据库)和DBMS(数据库管理系统),是整个数据库环境的总称。 - DB...

    数据库原理及应用-期末考试题及答案.doc

    数据库原理及应用是计算机科学中的一个重要领域,它涵盖了数据存储、数据管理以及数据查询等多个方面的内容。本题目的重点在于数据库管理系统(DBMS)、数据库(DB)和数据库系统(DBS)的关系,以及数据库设计、...

Global site tag (gtag.js) - Google Analytics