Bitcask模型:
1.日志型的数据文件
何谓日志型?就是append only,所有写操作只追加而不修改老的数据,就像我们的各种服务器日志一样。在Bitcask模型中,数据文件以日志型只增不减的写入文件,而文件有一 定的大小限制,当文件大小增加到相应的限制时,就会产生一个新的文件,老的文件将只读不写。在任意时间点,只有一个文件是可写的,在Bitcask模型中 称其为active data file,而其他的已经达到限制大小的文件,称为older data file,如下图:
文件中的数据结构非常简单,是一条一条的数据写入操作,每一条数据的结构如下:
上面数据项分别为key,value,key的大小,value的大小,时间戳(应该是),以及对前面几项做的crc校验值。(数据删除操作也不会删除旧的条目,而是将value设定为一个特殊的值以作标示)
数据文件中就是连续一条条上面格式的数据,如下图:
好了,上面是日志型的数据文件,如果数据文件这样持续的存下去,肯定是会无限膨胀的,为了解决个问题,和其他日志型存储系统一样Bitcask也有一个定期的merge操作。
merge操作,即定期将所有older data file中的数据扫描一遍并生成新的data file(没有包括active data file 是因为它还在不停写入),这里的merge其实就是将对同一个key的多个操作以只保留最新一个的原则进行删除。每次merge后,新生成的数据文件就不 再有冗余数据了。
2.基于hash表的索引数据
上面讲到的是数据文件,日志类型的数据文件会让我们的写入操作非常快(日志型的优势之一是将磁盘当作磁带,进行顺序读写的效率非常高),而如果在这样的日志型数据上进行key值查找,那将是一件非常低效的事情。于是我们需要使用一些方法来提高查找效率。
例如在Bigtable中,使用bloom-filter算法为每一个数据文件维护一个bloom-filter 的数据块,以此来判定一个值是否在某一个数据文件中。
而在Bitcask模型中,我们使用了另一种方法,使用了一个基于hash表的索引数据结构。
在Bitcask模型中,除了存储在磁盘上的数据文件,还有另外一块数据,那就是存储在内存中的hash表,hash表的作用是通过key值快速的定位到value的位置。hash表的结构大致如下图所示:
hash表对应的这个结构中包括了三个用于定位数据value的信息,分别是文件id号(file_id),value值在文件中的位置(value_pos),value值的大小(value_sz),于是我们通过读取file_id对应文件的value_pos开始的value_sz个字节,就得到了我们需要的value值。整个过程如下图所示:
由于多了一个hash表的存在,我们的写操作就需要多更新一块内容,即这个hash表的对应关系。于是一个写操作就需要进行一次顺序的磁盘写入和一次内存操作。
3.有用的hint file
至此,Bitcask模型基本上已经讲述完成,而这一节讲到的hint file,则是一个有用的技巧,本人认为并不一定是Bitcask模型的必须特性。
从上面我们可以知道,我们称其为索引的hash表,是存储在内存中的,虽然在各自的实现中可以做一些持久化的保证,但是Bitcask模型中并不对在断电或重启后的hash表数据不丢失做出保证。
因此,如果我们不做额外的工作,那么我们启动时重建hash表时,就需要整个扫描一遍我们的数据文件,如果数据文件很大,这将是一个非常耗时的过程。因此Bitcask模型中包含了一个称作hint file的部分,目的在于提高重建hash表的速度。
我们上面讲到在old data file进行merge操作时,会产生新的data file,而Bitcask模型实际还鼓励生成一个hint file,这个hint file中每一项的数据结构,与data file中的数据结构非常相似,不同的是他并不存储具体的value值,而是存储value的位置(像在hash表中的一样),其结构如下图:
这样,在重建hash表时,就不需要再扫描所有data file文件,而仅仅需要将hint file中的数据一行行读取并重建即可。大大提高了利用数据文件重启数据库的速度。
结语:
以上就是Bitcask数据模型的所有内容,非常之精简易懂,但是记住,他只是一个模型,如果我们要实现一个基于Bitcask的存储系统的话,相信还有很多工作要做,还有很多细节可以优化。有兴趣的同学可以看一看Riak或豆瓣beansdb 0.5.2 版本的源码。
相关推荐
### Bitcask:一种日志结构哈希表的深度解析 #### 一、Bitcask的诞生背景与设计理念 Bitcask的起源紧密关联于分布式数据库Riak的发展历史。在Riak键值对集群中,每个节点采用可插拔的本地存储,这种设计允许几乎...
RoseDB 是一款高效且可靠的键值(KV)存储引擎,其设计灵感来源于 Bitcask 存储模型。Bitcask 模型是日志结构化存储的一种体现,它在数据库领域中被广泛应用,因其简单性、高效性和易扩展性而备受青睐。RoseDB 在这...
bitcask, 因为你需要另一个密钥/值存储引擎 Bitcask - 用于快速键/值数据的日志结构哈希表 Bitcask使用了"rebar"构建系统,但是我们提供了一个包装文件,以便在顶层运行"制作"。Bitcask需要 Erlang R14B04或者更高...
python-bitcask 启发KV商店的Python实现。 密钥存储在内存中的哈希表(Python字典)中。 每个键都映射到一个条目,该条目指示在一次搜索中可以在磁盘上找到该值的位置。 免责声明:不适用于生产。 在设计数据密集...
Bitcask 采用Bitcask存储模型 顺序写,随机读 采用变长编码,大大节约内存空间,抛弃了论文中的TimeStamp 支持多线程 Benchmark key int 类型 4个字节 value 1--2000个长度的随机字符串 put 1000000 ,cost 45.656 ms ...
该项目是一个基于_Bitcask_存储模型的_KV_数据库。Bitcask_是一种高性能的持久化存储_-Bitcask-KV-
### Bitcask:一种日志结构哈希表的起源与设计 #### 背景介绍 Bitcask的诞生紧密地关联着分布式数据库Riak的发展历史。在Riak的键值对集群中,每个节点都使用可插拔的本地存储方案;也就是说,几乎任何键值对形状...
FreshDB 是一款基于 Bitcask 模式的轻量级键值数据库,专为高效、快速的数据存储和检索设计。在IT行业中,键值数据库因其简单的数据模型和高性能特性,常被用于缓存、日志记录以及分布式系统中的数据存储。FreshDB ...
Bitcask 是用于快速键/值数据的日志结构哈希表。 Bitcask 的注意事项 我选择将 Bitcask 源代码包含在库中,而不是要求将包装库作为依赖项的常用方法。 这将大大简化获取和编译库。 从不利的方面来说,这意味着更新...
注意:请仔细阅读以确认使用Bitcask是否适合您的需求。 bitcask非常适合: 根据默认配置存储成千上万的键/值对。 使用每个密钥64个字节和64kB值的默认配置(可配置),1M密钥将消耗大约600-700MB的内存〜65-70GB的...
Go语言(也称为Golang)是由Google开发的一种静态强类型、编译型的编程语言。它旨在成为一门简单、高效、安全和并发的编程语言,特别适用于构建高性能的服务器和分布式系统。以下是Go语言的一些主要特点和优势: ...
Seqcask 与 bitcask 相比有以下区别; 在 RAM 中保留约 35% 的密钥 顺序键而不是变量 仅支持put和get ,不支持update或delete 不支持buckets 当然,Seqcask 与 bitcask 具有相同的优势: 单个寻求检索任何值! ...
数据库课程设计 在过去,我也分享了一些免费的SQL课程,我的读者喜欢这些课程,但反馈是他们想要更全面和更深入的材料,这就是为什么我要为这两个初学者提供最好的SQL和数据库课程列表的原因和经验丰富的程序员。...
bitcask用Go编写的高性能键/值存储,具有可预测的读/写性能和高吞吐量。 使用类似于Riak的Bitcask磁盘布局(LSM + WAL)获得功能更完善的Redis兼容的bitcask用Go编写的高性能键/值存储,具有可预测的读/写性能和高...
比特桶文件数据库的FUSE文件系统。 受启发。入门安装bitcaskfs : go get github.com/prologic/bitcaskfs挂载一个 Bitcask 数据库: bitcaskfs -p /path/to/db /path/to/mount执照bitcaskfs根据条款获得
分布式哈希表(Distributed Hash Table,简称DHT)是一种在分布式系统中用以实现大规模数据存储和快速定位的算法。DHT通过分布式的方式将数据以键值对的形式存储在各个节点上,从而实现无需中心服务器的高效数据管理...
基于Bitcask的磁盘存储 命令支持筏 与现有的Redis客户端兼容 用法 $ go get github.com/prologic/bitraft $ bitraft 码头工人 您还可以使用: $ docker pull prologic/bitraft $ docker run -d -p 4920:4920 pro...
bitcask NoSQL 数据结构 数据结构 数据结构 数据结构 数据结构
Rosedb NoSQL数据库源码:包含85个文件,主要使用Go和Shell开发,基于bitcask模型,支持多种数据结构,适合构建高性能、可扩展的数据存储解决方案。
Rosedb是一个采用Go语言实现的NoSQL数据库,基于高效的bitcask模型设计。该数据库原生支持多种数据结构,提供了丰富的数据存储和检索能力。 技术构成: - 主要编程语言:Go - 文件构成:共85个文件,包括: - Go源...