用户对文件的观察和使用是从自身处理文件中数据时采用的组织方式来看待文件组织形式。这种从用户关点出发所见到的文件组织形式称为文件的逻辑组织。
系统设计人员看待文件时要考虑文件具体在存储设备中如何放置、如何组织如何实现存取等细节,这与存储介质的存储性能有关。文件在存储设备上的存储组织形式称为文件的物理组织。
1 文件的逻辑组织
文件的逻辑组织通常分为两种形式,即有结构文件和无结构文件。
1)有结构文件
又称作记录式文件,它在逻辑上可被看成一组连续记录的集合,即文件是由若干个相关的记录组成。每个记录是一组相关的数据集合,用于描述一个对象某个方面的属性。
记录式文件按其记录的长度是否相同又可分为:定长记录文件和变长记录文件两种。
(1)定长记录文件:指文件中所有记录的长度都相同。文件的长度可用记录的数目来表示。定长记录处理方便,开销小,被广泛用于数据处理中。
(2)变长记录文件:指文件中各记录的长度不相同。在处理之前每个记录的长度是已知的。
2)无结构文件
无结构文件是指文件内部不再划分记录,它是由一组相关信息组成的有序字符流,即流式文件,其长度直接按字节计算。如大量的源程序、可执行程序、库函数等采用的文件形式是无结构文件形式。在UNIX系统中,所有的普通文件都被看做是流式文件,系统不对文件进行格式处理。
2 文件的物理组织
几种基本的文件物理存储组织形式:
1)连续文件
连续文件(又称做顺序文件)是基于磁带设备的最简单的物理文件结构,它是把一个逻辑上连续的文件信息存放在连续编号的物理块(或物理记录)中。
连续文件的优点是在顺序存取时速度较快,常用于存放系统文件,如操作系统文件、编译程序文件和其它由系统提供的实用程序文件,因为这类文件往往被从头至尾依次存取。
但连续文件也存在如下缺点:
(1)要求建立文件时就确定它的长度,依此来分配相应的存储空间,这往往很难实现。
(2)不便于文件的动态扩充。
(3)可能出现外部碎片,就是在存储介质上存在很多空闲块,但它们都不连续,无法被连续的文件使用,从而造成浪费。
2)串连文件
为克服连续文件的缺点,可把一个逻辑上连续的文件分散存放在不同的物理块中,这些物理块不要求连续,也不必规则排列。为了使系统能找到下一个逻辑块所在的物理块,可在各物理块中设立一个指针(称为连接字),它指示该文件的下一个物理块。
串连文件克服了连续文件的缺点,但它又带来新的问题:
(1)一般仅适于对信息的顺序访问,而不利于对文件的随机存取。
(2)每个物理块上增加一个连接字,为信息管理添加了一些麻烦。
3)FAT文件
串连文件的缺点可通过把连接字放在一个内存表格中的方式加以克服。这种在内存中的表格就称为文件分配表(FAT,File Allocation Table)。
由于连接字保存在FAT表项中,因此整个盘块都可以用来存放数据。另外,也更容易实现随机存取了。与串连文件相似,在文件目录中要添加一个整数,标明该文件的起始盘块号。
这种方法的主要缺点是整个FAT必须在系统工作期间始终驻留在内存中,从而占用了较多内存空间。当然,可以把这个表移到分页内存中,采用调页方式进行管理。但是,仍然要占用大量的虚存空间和盘空间,同时也会产生额外缺页问题。
4)索引文件
索引文件是实现非连续分配的另一种方案:系统为每个文件建立一个索引表。其中的表项指出存放该文件的各个物理块号,而整个索引表由文件说明项指出。
这种结构除了具备串连文件的优点之外,还克服了它的缺点。它可以方便地进行随机存取。但是这种组织形式需要增加索引表带来的空间开销。如果这些表格仅放在盘上,那么在存取文件时首先得取出索引表,然后才能查表、得到物理块号。这样就至少增加了一次访盘操作,从而降低了存取文件的速度,加重了 I/O负担。一种改进办法是同时把索引表部分或全部地放人内存。这是以内存空间为代价来换取存取速度的改善。
5)多重索引文件
为了用户使用方便,系统一般不应限制文件的大小。如果文件很大,那么不仅存放文件信息需要大量盘块,而且相应的索引表也必然很大。在这种情况下把索引表整个放在内存是不合适的,为此引出多重索引结构(又称多级索引结构)。在这种结构中采用了间接索引方式,即由最初索引项中得到某一盘块号,该块中存放的信息是另一组盘块号;而后者每一块中又可存放下一组盘块号(或者是文件本身信息),这样间接几级(通常为1~3级),最末尾的盘块中存放的信息一定是文件内容。例如,UNIX文件系统就采用了多重索引的方式。
这种方法具有一般索引文件的优点,但也存在间接索引需要多次访盘而影响速度的缺点。由于UNIX分时环境中多数文件都较小,这就大大减弱了其缺点所造成的不利影响。
分享到:
相关推荐
数据库模型是数据库设计的核心组成部分,它为数据组织和存储提供了理论框架。在数据库领域,主要存在三种模型:概念模型、逻辑模型和物理模型,每种模型都有其独特的用途和特点。 1. 概念模型(Conceptual Model)...
文件逻辑组织和物理组织决定了文件在磁盘上的存储方式,目录结构帮助用户快速查找文件。文件系统的安全性包括访问控制、备份和恢复等功能。 6. **设备管理**:设备分为独占设备和共享设备,设备驱动程序是操作系统...
本文章通过介绍空间数据物理组织的相关知识点,深入探讨了文件组织的各种方式及其对空间数据库性能的影响。通过理解这些基本概念和技术细节,读者可以更好地设计和优化空间数据库系统,以满足高效数据处理的需求。
2. **文件逻辑组织和物理组织**:逻辑组织是用户视角的文件结构,如顺序、链接、索引等;物理组织是实际在磁盘上的存储形式,如连续、链接、索引等。 3. **文件目录管理**:用于记录文件名、位置、属性等信息,方便...
2. **文件逻辑组织和物理组织**:逻辑组织关注文件内容,物理组织关注存储方式。 3. **目录结构**:单级、多级、树状结构等。 4. **文件存取控制**:权限设置,确保数据安全。 5. **文件操作**:创建、删除、读、写...
只有正确地组织和存储文件,才能快速地检索和读取文件中的数据。 文件组织与文件格式是信息存储与检索的重要组成部分。它涉及到文件的存储方式、组织形式、存取方式、驻留介质和处理方式等多个方面。只有正确地组织...
3. **概念结构设计**:这是数据库设计的初期阶段,主要关注如何抽象和组织数据。在这个阶段,开发者会创建实体-关系(E-R)模型,表示图书馆中的实体(如书籍、读者、借阅记录等)及其之间的关系。E-R图通过矩形表示...
文件的逻辑结构和物理结构是计算机科学中关于文件组织和管理的重要概念,它们对文件的操作和算法实现有着深远的影响。逻辑结构关注的是用户如何理解和访问文件中的数据,而物理结构则涉及这些数据实际如何存储在硬件...
文件管理是操作系统的五大职能之一,主要涉及文件的逻辑组织和物理组织,目录的结构和管理。所谓文件管理,就是操作系统中实现文件统一管理的一组软件、被管理的文件以及为实施文件管理所需要的一些数据结构的总称...
在计算机科学领域,物理文件的存储过程是数据管理的关键部分,涉及到如何在磁盘等存储介质上有效地组织和检索数据。本文将深入探讨两种重要的物理文件类型——串联文件(Serial Files)和索引文件(Indexed Files)...
文件的逻辑结构和物理结构是计算机科学中关于文件组织和管理的重要概念,它们对文件的操作和算法实现有着深远的影响。逻辑结构关注的是用户如何理解和操作文件,而物理结构则涉及操作系统如何在磁盘等存储设备上实际...
在Oracle数据库中,数据的组织和存储方式既包括逻辑层面的抽象,也涉及到实际在硬盘上的物理布局。本章主要探讨了4个主题:Oracle数据库的逻辑结构、物理结构、数据字典以及Oracle的内存结构。 首先,我们来看...
SD5000表结构物理模型文件是数据库设计中的一个重要组成部分,主要用来描述数据库的物理存储结构和数据组织方式。这个文件通常包含了数据库中的表、字段、索引、关系以及其他对象的详细定义,用于指导数据库的创建和...
- **定义**:控制文件存储了数据库的物理结构信息,如数据文件和重做日志文件的位置、名称等。 - **作用**:控制文件是启动和运行Oracle数据库所必需的,丢失控制文件会导致数据库无法正常启动。 4. **归档日志...
数据库存储结构文件记录的组织和索引技术 在探讨数据库存储结构时,我们需要了解数据库的组成部分,即逻辑、物理和性能特征。数据库系统(DBS)由多个物理和逻辑对象组成,包括表、视图、索引和模式、锁、触发器、...
文件的组织结构与存取方法是计算机科学中关于数据存储和访问的重要概念,主要涉及到文件在逻辑和物理层面的组织形式以及数据的读取方式。本文将深入探讨这两个方面。 首先,文件的逻辑结构是从用户的角度出发,忽视...
AIX 5.3版本提供了强大的磁盘管理和文件系统工具,使得系统管理员能够高效地创建逻辑卷、添加文件系统以及挂载它们以供使用。以下是对这些核心概念的详细解释: **1. 逻辑卷(Logical Volume)** 在AIX中,逻辑卷...
操作系统文件管理系统是操作系统的核心组成部分,它负责管理和控制文件的存储、访问、组织和保护。在这个实验中,我们探讨的是一个针对DOS系统设计的简单二级文件系统,它使用C语言编写,并在Turbo C(TC)环境下运行...