Redis7 底层数据结构解析
当我们使用SET user:1001 Alice或HSET product:123 name Phone price 999时Redis 内部究竟发生了什么数据是如何被存储、查找和修改的为什么 Redis 能如此之快答案就藏在其精心设计的底层数据结构之中。Redis 并非简单地为每种数据类型String, Hash, List 等绑定一种固定的数据结构而是采用了一种自适应、多态的策略。它会根据数据的规模、类型和内容动态选择最合适的内部编码encoding以在内存占用和 CPU 性能之间取得最佳平衡。本文将带你深入 Redis 7 的底层世界逐一解析其核心数据类型的内部实现。一、统一的对象模型redisObject在 Redis 内部所有的值value都被封装在一个名为redisObject的结构体中c编辑1structredisObject{2unsigned type:4;// 对象的上层类型 (string, list, hash...)3unsigned encoding:4;// 对象的底层编码方式4int refcount;// 引用计数5void*ptr;// 指向底层数据结构的指针6};type字段决定了我们看到的数据类型如string,hash。encoding字段则揭示了其真正的底层存储格式如embstr,hashtable,quicklist。ptr指针指向实际存储数据的内存区域。正是这种设计使得 Redis 能够为同一种上层类型提供多种底层实现。二、String 类型的三种面孔String 是最基础的类型但其底层却有三种不同的编码**int**当字符串内容是一个可以表示为long类型的整数时Redis 会直接将数值存储在ptr指针中利用了指针的低几位来区分省去了额外的内存分配。**embstr(Embedded String)**对于长度小于等于44 字节的短字符串Redis 会将redisObject和其底层的 SDSSimple Dynamic String分配在同一块连续的内存中。这减少了内存分配次数并提高了缓存局部性读取速度更快。**raw**对于长度大于 44 字节的长字符串redisObject和 SDS 会分开分配内存ptr指向 SDS 结构。SDS (简单动态字符串)是 Redis 自己实现的字符串结构它通过记录字符串长度 (len) 避免了 C 字符串遍历计算长度的 O(N) 开销并且是二进制安全的。三、Hash, List, Set, ZSet 的底层演进告别 ziplist拥抱 listpack这是 Redis 7 相比 Redis 6 最重大的变化。过去广泛使用的ziplist压缩列表因其连锁更新问题一个节点的扩容可能引发后续所有节点的连锁调整而被性能更优、结构更稳定的listpack所取代。Hash (哈希)小对象当 Hash 中的键值对数量较少默认 512且每个值的长度较短默认 64字节时底层使用listpack存储。listpack将键和值紧凑地排列在一起非常节省内存。大对象一旦超出阈值Redis 会将其转换为 **hashtable**哈希表以保证 O(1) 的查询性能。注意这个转换是单向的一旦升级为 hashtable就不会再降级回 listpack。List (列表)小列表对于元素较少的列表底层直接使用 **listpack**。大列表对于元素较多的列表Redis 使用 **quicklist。quicklist本质上是一个双向链表但它的每个节点quicklistNode不再指向单个元素而是指向一个 listpack**。这种设计结合了链表的灵活性O(1) 头尾插入/删除和listpack的内存紧凑性是工程上的完美折中。Set (集合)整数集合如果 Set 中的所有元素都是整数且数量不多默认 512则使用 **intset**整数集合存储这是一个有序的整数数组支持二分查找。普通集合对于包含字符串或数量较多的集合则使用hashtable来保证 O(1) 的查找、插入和删除性能。ZSet (有序集合)小有序集当元素数量较少默认 128且成员值较短默认 64字节时使用listpack存储。成员和分数score会被打包在一起。大有序集超出阈值后会转换为 **skiplist**跳跃表hashtable的组合。skiplist用于维护元素的有序性支持 O(log N) 的范围查询而hashtable则用于提供 O(1) 的单点查询通过 member 查 score。四、总结Redis 7 底层数据结构全景图表格上层数据类型Redis 7 底层编码 (encoding)Stringint,embstr,rawHashlistpack,hashtableListlistpack,quicklist(内含listpack)Setintset,listpack,hashtableZSetlistpack,skiplist(hashtablefor dict)核心思想小而美大而强。对于小规模数据优先选择内存紧凑的线性结构如listpack,intset一旦数据规模增长到影响性能的临界点便果断切换到为大规模数据优化的复杂结构如hashtable,skiplist。理解这些底层原理不仅能帮助我们在面试中脱颖而出更能指导我们在实际项目中做出更明智的数据建模决策从而充分发挥 Redis 的极致性能。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2433767.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!