`
duooluu
  • 浏览: 59022 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
文章分类
社区版块
存档分类
最新评论

Berkeley DB Hash、Btree、Queue、Recno选择

阅读更多

来自:http://hi.baidu.com/xinzsky/blog/item/0652048176a794ddbd3e1ec5.html

 

在数据库应用中,数据访问方式对应数据在硬盘上的存储格式和操作方法。在编写应用时,选择合适的算法可以极大的提高运算速度。大多数数据库都选用Btree算法,DB也不例外,同时还提供Hash算法、Recno算法和Queue算法。Berkeley DB的强大之一是它为这几种算法提供了差不多相同的接口,这表明当你要使用另一种算法时修改程序是简单的。程序在需要对特殊数据结构和存取模式操作时,通过不同的算法可以轻易的解决。

大多数应用要么在Btree和Hash算法之间,要么在Queue和Recno算法之间选择。

Hash 还是 Btree?
当记录号不是用于数据存取的主键时,应该使用 Hash和Btree算法。 (如果记录号是用于数据存取的一个二级关键字,那么还是可以选择Btree算法,因为它支持一个主键和一个记录号同时存取。)

Btree中的主键是有序存储,记录间的关联是依靠次序。并且其结构能随数据的插入和删除进行动态调整。为了代码的简单,DB没有实现对关键字的前缀码压缩。Btree支持对数据查询、插入、删除的常数级速度。关键字可以为任意的数据结构。 因此,当在主键有序时,Btree算法应该被使用。例如,如果主键是时间戳, 那么8点时间戳后面跟随的就是9点时间戳, 这种情况下,Btree算法一般是正确的选择。再来个例子:如果主键是名字,应用需要取出所有同姓的记录,那么Btree 存取方法同样是个好选择。

Hash 和 Btree 两种方式在小的数据集合上几乎没有性能的差别。不过,由于Hash使用的是扩展线性HASH算法(extended linear hashing),可以根据HASH表的增长进行适当的调整。所以当一个数据集合足够大且关键字为随机分布时,采用Hash算法比较好。

Queue 还是 Recno?
当用记录号作为数据存取的主键时,应该使用 Queue和Recno存取方法。记录号由算法本身生成。实际上,这和关系型数据库中逻辑主键通常定义为int AUTO型是同一个概念。两者基本上都是建立在Btree算法之上,提供存储有序数据的接口。Queue的优势在于:由于其记录为定长,在插入操作时把记录插入到队列的尾部,所以速度最快,而且它执行上锁和并发处理的水平也相当高。 Recno 的长处在于它支持一些Queue不能实现的特征,比如可变长记录和支持flat-text文件。

记录号可以是可变的或者不变的: 可变指的是当记录被删除或者插入记录号发生变化;不变指的是记录号无论数据库如何操作,记录号都不会发生改变。 基于记录号存取在Btree方式下也是可行的。但是,记录号是可变,当记录删除或插入时,数据库内的其他记录的记录号都将发生改变。 Queue存取方法总是用固定的方式运行,不管数据库如何操作,记录号始终改变。 Recno 可以被设置为不变和可变两种形式。

另外,Recno为数据库提供支持flat-text文件的永久存储和数据在读或修改时提供一个快速的临时存储空间。

Choose Database Access Method

Access Method

Description

Choosing Occasion

B+

关键字有序存储,并且其结构能随数据的插入和删除进行动态调整。为了代码的简单,Berkeley DB没有实现对关键字的前缀码压缩。B+树支持对数据查询、插入、删除的常数级速度。关键字可以为任意的数据结构。

1 Key为复杂类型时。

2 Key有序时。

Hash

DB中实际使用的是扩展线性HASH算法(extended linear hashing),可以根据HASH表的增长进行适当的调整。关键字可以为任意的数据结构。

1 Key为复杂类型。

2 当数据较大且key随机分布时。

 

Recno

要求每一个记录都有一个逻辑纪录号,逻辑纪录号由算法本身生成。相当于关系数据库中的自动增长字段。Recho建立在B+树算法之上,提供了一个存储有序数据的接口。记录的长度可以为定长或不定长。

1 key为逻辑记录号时。

2 当非高并发的情况下。

Queue

Recno方式接近, 只不过记录的长度为定长。数据以定长记录方式存储在队列中,插入操作把记录插入到队列的尾部,相比之下插入速度是最快的。

1 1、当key为逻辑记录号时。

2 定长记录。

3 高并发的情况下。

 

分享到:
评论

相关推荐

    Berkeley DB数据库最新版

    Berkeley DB提供了多种存储引擎,如Btree、Hash、Queue和Recno,每种引擎都有其特定的适用场景。例如,Btree引擎适合于范围查询,Hash引擎则适合于等值查询。 **6. 应用场景** Berkeley DB常用于配置管理、日志记录...

    Berkeley DB C++编程入门教

    在“BerkeleyDB概念”部分,文档会介绍Berkeley DB的基本概念,如BTree和Hash数据库的访问方式选择,以及Queue和Recno之间的选择。 接下来,教程会讨论数据库的限制与可移植性、环境设置、异常处理和错误返回。然后...

    Berkeley DB数据库C语言入门教程.doc

    Berkeley DB 提供了多种访问方式,包括 BTree、Hash、Queue 和 Recno 等。这些访问方式可以根据不同的应用场景和需求选择合适的方式。在选择访问方式时,我们需要考虑到数据库的大小、访问速度、内存使用量等因素。 ...

    BerkeleyDB编程手册

    - **嵌入式环境**:对于资源有限的设备,如嵌入式系统,BerkeleyDB的小巧轻便使其成为理想的选择。 #### 四、BerkeleyDB提供的服务 BerkeleyDB不仅仅是一个简单的数据存储工具,它还提供了许多额外的功能和服务: -...

    Berkeley db使用方法简介(c接口)

    - `DBTYPE type`:数据库访问类型,如 `DB_BTREE`、`DB_HASH` 等。 - `u_int32_t flags`:打开标志位,如 `DB_CREATE`、`DB_TRUNCATE` 等。 - `mode_t mode`:文件模式,默认使用默认值即可。 **示例代码:** ...

    BerkeleyDB-Core-JAVA-GSG.pdf

    - 在选择BTree还是Hash时,如果数据的查询顺序很重要,则倾向于使用BTree;如果需要更快的写入速度,则选择Hash。 - Queue和Recno则分别针对具有特定顺序需求和固定大小记录的需求场景。 **3. 数据库限制与可移植...

    berkeley DB使用

    ### Berkeley DB 使用详解 ...Berkeley DB 的灵活性和强大的功能使其成为很多应用程序的理想选择。对于开发者而言,掌握Berkeley DB 的使用方法不仅可以提高数据处理效率,还能增强程序的健壮性。

    Python bsddb模块操作Berkeley DB数据库介绍

    4. 数据访问方法:Berkeley DB提供了四种数据访问方法,分别是btree、hash、queue和recno。每种方法具有不同的特点和适用场景: - btree:使用树形结构来组织数据,适合进行快速查找和范围查询。它能存储任意复杂的...

    Berkely DB java

    Berkeley DB 支持四种不同的访问方法:B+树 (BTree)、哈希 (Hash)、队列 (Queue) 和记录编号 (Recno)。 - **B+树 (BTree)**:适用于需要基于范围查询的数据集。 - **哈希 (Hash)**:适用于快速查找操作,但不支持...

    db-2.7.7.tar.gz

    2. **多种数据模型**:支持Btree、Hash、Queue和Recno等数据模型,适应不同应用场景。 3. **多线程编程**:支持多线程编程,允许多个并发访问,提高系统性能。 4. **内存映射**:利用内存映射技术,使得数据读取更快...

    BDB++-开源

    6. **多种访问方法**:除了基本的键值对,Berkeley DB 还提供了 Btree、Hash、Queue 和 Recno 等多种数据组织方式,适应不同的应用场景。 **BDB++ 的优势** 1. **易用性**:BDB++ 的 C++ 标准库风格 API 使得其更...

Global site tag (gtag.js) - Google Analytics