在之前的文章我们介绍过,Redis服务器在启动之初,会初始化RedisServer的实例,在这个实例中存在很多重要的属性结构,同理本篇博客中介绍的数据库实现原理也会和其中的某些属性相关,我们继续看一下吧。
1.服务器和客户端实现的数据库
Redis服务器在启动时,会根据redis.conf文件的中databases xx
这个配置决定创建多少个数据库(默认配置是16),启动后默认使用的0号数据库,当然可以使用select dbnum
这个命令来切换。需要注意的是在redis集群模式下,只有0号数据库可以用,是无法切换到其他库的。
Redis服务器会将所有的数据库都保存在服务器状态的redisServer的db数组中,数组的每一项都代表了一个数据库,用redisDb结构来表示。首先看一下redisServer.db的源码:
struct redisServer {
...
// 代表数据库的数组
redisDb *db;
// 这个记录的配置文件中数据库的数量
int dbnum;
...
}
我们通过客户端向Redis写入的任何数据都会记录到这个db数组中,根据前面描述,我们知道可以通过select命令切换到另一个目标数据库,但是客户端是怎么记录的它当前操作的哪个数据库呢?我们继续看一下源码:
typedef struct client {
...
// 指针指向当前客户端正在操作的数据库
redisDb *db; /* Pointer to currently SELECTed DB. */
...
} client;
看,在client客户端状态中,有一个db指针,指向了server.db数组中的某一项,代表了当前客户端正在操作的数据库。所以通过切换client.db的指针,调整客户端操作的数据库,这就是select命令的实现原理。
2.数据库字典的实现
Redis是支持key-value键值对存储的,这其实是通过dict结构来实现的,在前面讲到的内容中,服务器和客户端都指向了一个redisDb的结构,在这个db结构中,就包含存储了键值对的字典结构,首先看一下源码:
typedef struct redisDb {
...
// 这个存放的就是键值对
dict *dict; /* The keyspace for this DB */
// 这个存放的是键值对的过期时间,下面一节会说到
dict *expires; /* Timeout of keys with a timeout set */
...
} redisDb;
dict这个指针就指向了存储键值对的字典结构,key是字符串robj类型,value可以是任何的robj类型。当我们分别新增、删除、更新或者查询的时候,其实就是根据输入的key在这个字典上做curd的操作。我们在Redis写入两个键值对,图示如下:
除了对数据库键值对的curd操作,基于整个数据操作的一些命令也是在这个dict上面实现的,比如清空所有键值对的flushdb,或者exists、del、dbsize命令等。在执行命令前后,redis还会执行一些其他操作,比如检查是否超出最大内存,更新lru时间,记录慢查询日志,或者向monitor客户端发送命令等等,这就是redis数据字典的实现原理。
3.键值对的生命周期管理
这里说的生命周期,其实就是指键值对的过期时间。通常我们使用expire key
这个命令设置键的过期时间,但其实Redis是有四个命令支持设置过期时间的:
expire key seconds
将key的生命周期设置为second秒;pexpire key milliseconds
将key的生命周期设置为milliseconds毫秒;expireat key timestamp
将key的过期时间设置在timestamp这个秒的时间戳过期;pexpireat key timestamp
将key的过期时间设置在timestamp这个毫秒的时间戳过期;
值得说明的是,虽然有这么多命令支持设置过期时间,但是最终经过转换都是指向pexpireat
这一个命令来实现。现在的问题是,这么多键值对的过期时间,在redis服务端是怎么保存和维护的呢,我们继续往下看。
前面在看redisDb源码的时候,有一个expires属性,我们再把源码拿过来看一下:
typedef struct redisDb {
...
// 这个存放的是键的过期时间
dict *expires; /* Timeout of keys with a timeout set */
...
} redisDb;
这就很清晰了,通过expires这个指针,指向了一个dict结构,字典中记录的就是所有键值对的过期时间。其中,key是键值对的键,value是long类型的毫秒精度的unix时间戳,即过期的时间点。值得注意的是,保存键值对的dict字典和保存过期时间的expires字典,key指针都指向相同的一个键字符串对象,所以在内存空间上是不会存在浪费的。
除此之外,跟过期时间操作相关的两个命令,当然也是基于expires这个字典来实现的:
ttl
返回键值对的剩余时间persist
删除键值对的过期时间
4.过期键的管理策略
既然有过期时间,那么键值对过期之后,是不是立即被删除了呢?答案肯定不是,redis通过惰性删除和定期删除两种策略实现对过期键的管理:
- 惰性删除策略:当程序访问到某个键值对的时候,会对过期时间检查,如果过期就删除,否则不处理。
- 定期删除策略:基于serverCron时间事件函数,从一定数量的数据库中取出一定数量的随机键进行检查,并删除其中过期的键值对。
使用这两种过期键管理策略可以最大程度上在合理使用CPU时间和避免浪费内存空间之间取得平衡。
5.持久化对过期键的处理
- rdb 持久化
- save或者bgsave会检查键的过期时间,已过期的键不会保存到的持久化的rdb文件中。
- 服务器启动载入rdb文件时,如果是主服务器,过期键会被忽略加载;如果是从服务器,不论是否过期,都会被加载。
- aof 持久化
- 写入aof文件时,key是会写入的,过期之后,通过追加del命令,才会显示的删除此过期键。
- bgrewriteaof 重写时会检查键的过期时间,已过期的键不会写入新的aof文件中。
- 服务器启动载入aof文件时,过期键也会被忽略,不会被加载。
6.主从复制对过期键的处理
主从复制,为了保证数据的一致性,通常由主服务器执行更新的操作,然后将命令发送给从服务器。在3.2版本之前,由于惰性删除策略的存在,主服务器遇到对过期键的访问,会删除此键值对,并给客户端返回null值,但是从服务器由于不能执行删除操作,即便是此键已过期,也会返回对应的value值,出现数据不一致导致的脏读问题。
在3.2版本之后,这个问题得到了修改,从服务器会判断当前键是否过期,如果已过期并且是从服务器的话,也会返回null值。