数据结构 - 关于 Redis 字符串小于 39 字节的疑惑

【字号: 日期:2022-08-31浏览:36作者:雯心

问题描述

REDIS_ENCODING_EMBSTR_SIZE_LIMIT set to 39.

比如:

redis 127.0.0.1:2050> set massage 'hello_world'OKredis 127.0.0.1:2050> object encoding massage'raw'

为什么这段字符串小于 39 编码却是 raw?另外,小于 39 字节 embstr 编码,大于 39 raw 编码的缘由是什么?

问题解答

回答1:

这个和redis的版本有关系。查看redis-3.0和最新的版本的object.c文件,可以发现在创建StringObject的时候,会和REIDS_ENCODING_EMBSTR_SIZE_LIMIT比较,这个的默认值是39。查看一下redis-2.8版本的源码,并没有发现比较,而是直接创建了。所以我猜测这个embstr编码是3.0以上版本才出现的。

至于为什么是39,这个讲起来就比较复杂了,我就慢点说。embstr是一块连续的内存区域,由redisObject和sdshdr组成。其中redisObject占16个字节,当buf内的字符串长度是39时,sdshdr的大小为8+39+1=48,那一个字节是’0’。加起来刚好64。是不是发现了什么?

typedef struct redisObject { unsigned type:4; unsigned encoding:4; unsigned lru:REDIS_LRU_BITS; /* lru time (relative to server.lruclock) */ int refcount; void *ptr;} robj;struct sdshdr { unsigned int len; unsigned int free; char buf[];};

从2.4版本开始,redis开始使用jemalloc内存分配器。这个比glibc的malloc要好不少,还省内存。在这里可以简单理解,jemalloc会分配8,16,32,64等字节的内存。embstr最小为16+8+8+1=33,所以最小分配64字节。当字符数小于39时,都会分配64字节。这个默认39就是这样来的。

相关文章: