源码 6：破旧立新 —— 探索「紧凑列表」内部

Redis 5.0 又引入了一个新的数据结构 listpack，它是对 ziplist 结构的改进，在存储空间上会更加节省，而且结构上也比 ziplist 要精简。它的整体形式和 ziplist 还是比较接近的，如果你认真阅读了 ziplist 的内部结构分析，那么 listpack 也是比较容易理解的。

struct listpack<T> {
    int32 total_bytes; // 占用的总字节数
    int16 size; // 元素个数
    T[] entries; // 紧凑排列的元素列表
    int8 end; // 同 zlend 一样，恒为 0xFF
}

首先这个 listpack 跟 ziplist 的结构几乎一摸一样，只是少了一个zltail_offset字段。ziplist 通过这个字段来定位出最后一个元素的位置，用于逆序遍历。不过 listpack 可以通过其它方式来定位出最后一个元素的位置，所以zltail_offset字段就省掉了。

struct lpentry {
    int<var> encoding;
    optional byte[] content;
    int<var> length;
}

元素的结构和 ziplist 的元素结构也很类似，都是包含三个字段。不同的是长度字段放在了元素的尾部，而且存储的不是上一个元素的长度，是当前元素的长度。正是因为长度放在了尾部，所以可以省去了zltail_offset字段来标记最后一个元素的位置，这个位置可以通过total_bytes字段和最后一个元素的长度字段计算出来。

长度字段使用 varint 进行编码，不同于 skiplist 元素长度的编码为 1 个字节或者 5 个字节，listpack 元素长度的编码可以是 1、2、3、4、5 个字节。同 UTF8 编码一样，它通过字节的最高为是否为 1 来决定编码的长度。

同样，Redis 为了让 listpack 元素支持很多类型，它对 encoding 字段也进行了较为复杂的设计。

0xxxxxxx 表示非负小整数，可以表示0~127。
10xxxxxx 表示小字符串，长度范围是0~63，content字段为字符串的内容。
110xxxxx yyyyyyyy 表示有符号整数，范围是-2048~2047。
1110xxxx yyyyyyyy 表示中等长度的字符串，长度范围是0~4095，content字段为字符串的内容。
11110000 aaaaaaaa bbbbbbbb cccccccc dddddddd 表示大字符串，四个字节表示长度，content字段为字符串内容。
11110001 aaaaaaaa bbbbbbbb 表示 2 字节有符号整数。
11110010 aaaaaaaa bbbbbbbb cccccccc 表示 3 字节有符号整数。
11110011 aaaaaaaa bbbbbbbb cccccccc dddddddd 表示 4 字节有符号整数。
11110011 aaaaaaaa ... hhhhhhhh 表示 8 字节有符号整数。
11111111 表示 listpack 的结束符号，也就是0xFF。

级联更新

listpack 的设计彻底消灭了 ziplist 存在的级联更新行为，元素与元素之间完全独立，不会因为一个元素的长度变长就导致后续的元素内容会受到影响。

取代 ziplist

listpack 的设计的目的是用来取代 ziplist，不过当下还没有做好替换 ziplist 的准备，因为有很多兼容性的问题需要考虑，ziplist 在 Redis 数据结构中使用太广泛了，替换起来复杂度会非常之高。它目前只使用在了新增加的 Stream 数据结构中。

思考

为什么 listpack 比 ziplist 更加优秀？

删除

5月前

length对解析内容没有影响，content的长度是凭借encoding解析出来的，length的作用，是为了反向遍历，这么理解对吗？

删除

5月前

“长度字段使用 varint 进行编码，不同于 skiplist 元素长度的编码为 1 个字节或者 5 个字节”，这里应该是ziplist吧。

删除

3年前

为什么 listpack 比 ziplist 更加优秀？
1.无级联更新影响。首先消除了ziplist中级联更新的影响，每个元素相互独立，没有去记录对方的信息
2.简单的反向遍历方式。listpack列表通过其他方式实现了反向遍历，但需要依赖于元素的特性。而ziplist需要一直维护tail的偏移量
3.占用空间少。listpack的基础结构的占用空间比ziplist小（少了4byte，ziplist为11byte）