Part19-Multi-Version Concurrency Control
其实说到底 MVCC不仅是一种并发控制协议,更是一个系统构建(数据组织的方法)。
简介
writer 不会 block readers,reader 也不会 block writers。只读事务可以读到一个consistent的snapshot,而不需要获得锁。使用ts 来决定事务的可持续数据库快照以及对数据的可见性。
支持time-travel 查询。
MVCC independent from control protocols
Txn 进入的时候看 TS 再哪个begin 和 end 之间,当有新版本的时候 旧版本数据的end即做出修改的事务的开始时间戳。
如果txn abort 修改时间戳的动作也要abort
MVCC Design Decisions
主要包括:使用什么并发协议、如何维护不同的数据版本、如何清理老数据、如何维护索引。
Concurrency Control Protocol
有哪些并发控制协议呢?Timestamp Ordering、OCC、2PL。
Version Storage
决定tuple可见性。创建一个version chain,维护internal pointer字段,index指向头。
主要方案有:
-
append-only storage:
-
可以选择排序 oldest to newest,或者newest to oldest。
-
-
Time-travel storage:有一个master version table,里面保存的始终是tuple最新版本,旧版本数据被迁移到一个分离的table space。
- Delta Storage,记录对前一个版本的修改
GC
第一种:tuple-level,background vacuuming vs. cooperative cleaning。
background vacuuming:后台线程定期对表扫描进行清理,清理掉。
cooperator cleaning:当线程查询的时候遇到了旧版数据,并且知道这些数据其他人也不会使用,就清理掉。
第二种:txn-level,需要维护事务的read/write set。
Index:主键索引指向的永远是version chain的头节点,需要更新version chain维护index。