`

redis之压缩列表源码剖析

阅读更多

形象化设计模式实战             HELLO!架构                     redis命令源码解析

 

用过Redis的应该对其哈希命令不陌生,在探索其实现之前,先得了解Redis的一个内部映射数据结构——压缩列表。

 

1、zipList的结构

找到ziplist.c文件,在代码注释中:

 * The general layout of the ziplist is as follows:
 * <zlbytes><zltail><zllen><entry><entry><zlend>

 

 

//注意这三个定义,新建时会使用。
#define ZIPLIST_BYTES(zl)       (*((uint32_t*)(zl))) //32位unsigned int,4个字节
#define ZIPLIST_TAIL_OFFSET(zl) (*((uint32_t*)((zl)+sizeof(uint32_t))))
#define ZIPLIST_LENGTH(zl)      (*((uint16_t*)((zl)+sizeof(uint32_t)*2))) //16位unsigned int,2个字节
/* Create a new empty ziplist. 
 *
 * 创建并返回一个新的 ziplist 
 *
 * T = O(1)
 */
unsigned char *ziplistNew(void) {

    // ZIPLIST_HEADER_SIZE 是 ziplist 表头的大小
    // 1 字节是表末端 ZIP_END 的大小
    unsigned int bytes = ZIPLIST_HEADER_SIZE+1;

    // 为表头和表末端分配空间
    unsigned char *zl = zmalloc(bytes);

    // 初始化<zlbytes>,整个ziplist 占用的内存字节数,对ziplist 进行内存重分配,或者计算末端时使用。
    ZIPLIST_BYTES(zl) = intrev32ifbe(bytes);
    // 初始化<zltail>,到达ziplist 表尾节点的偏移量。通过这个偏移量,可以在不遍历整个ziplist 的前提下,弹出表尾节点。
    ZIPLIST_TAIL_OFFSET(zl) = intrev32ifbe(ZIPLIST_HEADER_SIZE);
    // 新的list还没有entry,所以为0
    ZIPLIST_LENGTH(zl) = 0;
    // 初始化<zlend>,用于标记ziplist的末端
    zl[bytes-1] = ZIP_END;

    return zl;
}

 

成功后,ziplist结构如图所示:

 

2、节点(entry)的结构

 

+-----------------------+---------------+-----------+-------------+

 

| pre_entry_length | encoding | length | content |

 

+-----------------------+----------------+-----------+-------------+

pre_entry_length:记录了前一个节点的长度,通过这个值,可以进行指针计算,从而跳转到上一个节点,占用1或5字节。
encoding            :content的数据类型,值为00,01,10,11,占用两bit。
length                 :content的长度,占用1-5字节(和encoding一起)。
content               :真正要保存的数据。
 
这里知道个大概就好,后面会详解。
 
 

3、几个重要的宏

 
这里先看两个宏,因为插入节点时会用到。
/* Decode the number of bytes required to store the length of the previous
 * element, from the perspective of the entry pointed to by 'ptr'. 
 *
 * 解码 ptr 指针,
 * 取出编码前置节点长度所需的字节数,并将它保存到 prevlensize 变量中。
 *
 * T = O(1)
 */
#define ZIP_DECODE_PREVLENSIZE(ptr, prevlensize) do {                          \
    if ((ptr)[0] < ZIP_BIGLEN) {                                               \
        (prevlensize) = 1;                                                     \
    } else {                                                                   \
        (prevlensize) = 5;                                                     \
    }                                                                          \
} while(0);
ZIP_BIGLEN为254。
根据编码方式的不同,pre_entry_length 域可能占用1 字节或者5 字节:
• 1 字节:如果前一节点的长度小于254 字节,那么只使用一个字节保存它的值。
• 5 字节:如果前一节点的长度大于等于254 字节,那么将第1 个字节的值设为254 ,然后用接下来的4 个字节保存实际长度。
 
/* Extract the encoding from the byte pointed by 'ptr' and set it into
 * 'encoding'. 
 *
 * 从 ptr 中取出节点值的编码类型,并将它保存到 encoding 变量中。
 *
 * T = O(1)
 */
#define ZIP_ENTRY_ENCODING(ptr, encoding) do {  \
    (encoding) = (ptr[0]); \
    if ((encoding) < ZIP_STR_MASK) (encoding) &= ZIP_STR_MASK; \
} while(0)
ZIP_STR_MASK为0xc0,二进制就是11000000,与11000000取&,只能四种结果:11000000,1000000,01000000,00000000,这就是之前说encoding类型的由来。

 
/* Decode the length encoded in 'ptr'. The 'encoding' variable will hold the
 * entries encoding, the 'lensize' variable will hold the number of bytes
 * required to encode the entries length, and the 'len' variable will hold the
 * entries length. 
 *
 * 解码 ptr 指针,取出列表节点的相关信息,并将它们保存在以下变量中:
 *
 * - encoding 保存节点值的编码类型。
 *
 * - lensize 保存编码节点长度所需的字节数。
 *
 * - len 保存节点的长度。
 *
 * T = O(1)
 */
#define ZIP_DECODE_LENGTH(ptr, encoding, lensize, len) do {                    \
                                                                               \
    /* 取出值的编码类型 */                                                     \
    ZIP_ENTRY_ENCODING((ptr), (encoding));                                     \
                                                                               \
    /* 字符串编码 */                                                           \
    if ((encoding) < ZIP_STR_MASK) {                                           \
        if ((encoding) == ZIP_STR_06B) {                                       \
            (lensize) = 1;                                                     \
            (len) = (ptr)[0] & 0x3f;                                           \
        } else if ((encoding) == ZIP_STR_14B) {                                \
            (lensize) = 2;                                                     \
            (len) = (((ptr)[0] & 0x3f) << 8) | (ptr)[1];                       \
        } else if (encoding == ZIP_STR_32B) {                                  \
            (lensize) = 5;                                                     \
            (len) = ((ptr)[1] << 24) |                                         \
                    ((ptr)[2] << 16) |                                         \
                    ((ptr)[3] <<  8) |                                         \
                    ((ptr)[4]);                                                \
        } else {                                                               \
            assert(NULL);                                                      \
        }                                                                      \
                                                                               \
    /* 整数编码 */                                                             \
    } else {                                                                   \
        (lensize) = 1;                                                         \
        (len) = zipIntSize(encoding);                                          \
    }                                                                          \
} while(0);
</pre><pre name="code" class="cpp">/*
 * 字符串编码类型
 */
#define ZIP_STR_06B (0 << 6)
#define ZIP_STR_14B (1 << 6)
#define ZIP_STR_32B (2 << 6)
ZIP_STR_06B就是00000000,ZIP_STR_14B就是01000000,ZIP_STR_32B就是10000000,
 
00开头:1 byte ,长度小于等于63 字节的字符数组。
01开头:2 byte, 长度小于等于16383 字节的字符数组。
10开头:5 byte ,长度小于等于4294967295 的字符数组。
11开头:表示content 部分保存着整数。
 
结构略显复杂,感觉好省内存啊,哈哈。
 

4、插入节点

 
由于代码量太大,所以代码不贴出。
大致步骤:
1. 记录到达ziplist 末端所需的偏移量(因为之后的内存重分配可能会改变ziplist 的地址,因此记录偏移量而不是保存指针)
2. 根据新节点要保存的值,计算出编码这个值所需的空间大小,以及编码它前一个节点的长度所需的空间大小,然后对ziplist 进行内存重分配(如果不是末端,还需要计算出节点的相对偏移量:nextdiff,如果nextdiff不等于0,需要对list进行联动更新)。
3. 设置新节点的各项属性:pre_entry_length 、encoding 、length 和content 。
4. 更新ziplist 的各项属性,比如记录空间占用的zlbytes ,到达表尾节点的偏移量zltail,以及记录节点数量的zllen
 
大致图解:

 
这里解释一下__ziplistCascadeUpdate:就是在nextdiff不等于0时触发,新节点后面节点的pre_entry_length是1字节,但新节点的长度需要5字节,这样就需要更改新节点后面的节点的pre_entry_length,然而,因为新节点后面节点的空间长度改变了,所以程序又必须检查它的后继节点,看它的pre_entry_length 能否编码新长度,如果不能的话,程序又需要继续对下一个节点进行扩容,这就是__ziplistCascadeUpdate要做的。这种检查的时间复杂度是O(N2),但是这种概率比较小。
值得注意的是在抖动过程中,只扩展,不收缩,因为可能会出现重复的扩展——收缩——再扩展——再收缩的抖动(flapping)效果,这样只会降低Redis的性能。
 
内存映射数据结构可以节省大量的内存,不过,因为内存映射数据结构的编码和操作方式要比内部数据结构要复杂得多,所以内存映射数据结构所占用的CPU 时间会比作用类似的内部数据结构要多。
压缩列表解析到这了,查找(遍历列表查找),删除(移除后和insert一样进行__ziplistCascadeUpdate)没什么难点,有兴趣可以自己看下源码。

 

3
3
分享到:
评论

相关推荐

    redis 3.2.8 的源码注释.zip

    dict.hRedis剖析和注释(四源码)--- 跳转表(skiplist) t_zset.c和redis.hRedis剖析和注释(五源码)---整数集合(intset) intset.c 和 intset.hRedis剖析和注释(六源码)--- 压缩列表(ziplist) ziplist.c 和 ...

    python入门到高级全栈工程师培训 第3期 附课件代码

    09 继承顺序之mro线性顺序列表 10 在python2中的继承顺序是什么 11 在子类中调用父类方法 12 super调用父类的方法 13 选择系统作业讲解 第26章 01 学生自主复习 02 分享列表 03 多态 04 封装 05 面向对象概念总结 ...

    studyyii-源码.rar

    《深入理解Yii框架:从源码剖析到实战应用》 Yii框架是一款高性能的PHP框架,专为Web2.0应用开发而设计。"studyyii-源码.rar"中的源码资源,为我们提供了深入学习Yii框架的机会,让我们有机会直接接触并理解其内部...

    leveldb-1.7.0.tar.gz

    《深入解析Google LevelDB:1.7.0版本源码剖析》 Google的LevelDB是一款高效、轻量级的键值对存储系统,被广泛应用于嵌入式系统、日志记录、缓存以及分布式系统等领域。它以简洁的API、优秀的性能和可靠性著称。在...

    PHP实例开发源码-willblog php博客系统.zip

    8. 性能优化:通过缓存(如memcached或redis)、GZIP压缩、页面静态化等手段提升网站性能。 "使用须知.txt"文件可能是项目开发者的提示文档,包括安装步骤、环境配置、运行条件等信息,对理解和部署willblog系统至...

    网站测速代码

    - **缓存策略**:使用Redis或Memcached进行数据缓存。 - **代码优化**:避免冗余计算,减少循环,使用更高效的数据结构和算法。 7. **工具使用** - **Google PageSpeed Insights**:评估网页性能并提供优化建议...

    基于PHP的后盾网HDPHP框架源码.zip

    本压缩包包含的是HDPHP框架的源码,为开发者提供了学习和研究的宝贵资源。接下来,我们将深入探讨HDPHP框架的核心特性、设计理念以及在实际开发中的应用。 一、HDPHP框架概述 HDPHP框架以其简洁的架构和高效的性能...

    音乐网站管理系统-毕业设计.zip

    虽然不包含在“压缩包子文件的文件名称列表”中,但通常前端会使用React、Vue或Angular等现代JavaScript框架,配合Bootstrap或Element UI等UI库,构建用户友好的界面。 7. **测试与部署** 使用JUnit进行单元测试...

    各大知名网站系统架构

    【压缩包子文件的文件名称列表】:系统框架 这个“系统框架”可能是对各大知名网站系统架构的一种抽象或简化模型,它可能包含了各个组件的概览,如Web服务器、应用服务器、数据库服务器、消息队列等,以及它们之间...

Global site tag (gtag.js) - Google Analytics