MySQL多版本并发控制机制(MVCC)源码浅析
副标题[/!--empirenews.page--]
技术沙龙 | 邀您于8月25日与国美/AWS/转转三位专家共同探讨小程序电商实战
前言 作为一个数据库爱好者,自己动手写过简单的SQL解析器以及存储引擎,但感觉还是不够过瘾。<<事务处理-概念与技术>>诚然讲的非常透彻,但只能提纲挈领,不能让你玩转某个真正的数据库。感谢cmake,能够让我在mac上用xcode去debug MySQL,从而能去领略它的各种实现细节。 笔者一直对数据库的隔离性很好奇,此篇博客就是我debug MySQL过程中的偶有所得。 (注:本文的MySQL采用的是MySQL-5.6.35版本) MVCC(多版本并发控制机制) 隔离性也可以被称作并发控制、可串行化等。谈到并发控制首先想到的就是锁,MySQL通过使用两阶段锁的方式实现了更新的可串行化,同时为了加速查询性能,采用了MVCC(Multi Version Concurrency Control)的机制,使得不用锁也可以获取一致性的版本。 Repeatable Read MySQL的通过MVCC以及(Next-Key Lock)实现了可重复读(Repeatable Read),其思想(MVCC)就是记录数据的版本变迁,通过精巧的选择不同数据的版本从而能够对用户呈现一致的结果。如下图所示: 上图中,(A=50|B=50)的初始版本为1。 1.事务t1在select A时候看到的版本为1,即A=50 2.事务t2对A和B的修改将版本升级为2,即A=0,B=100 3.事务t1再此select B的时候看到的版本还是1, 即B=50 这样就隔离了版本的影响,A+B始终为100。 Read Commit 而如果不通过版本控制机制,而是读到最近提交的结果的话,则隔离级别是read commit,如下图所示: 在这种情况下,就需要使用锁机制(例如select for update)将此A,B记录锁住,从而获得正确的一致结果,如下图所示: MVCC的优势 当我们要对一些数据做一些只读操作来检查一致性,例如检查账务是否对齐的操作时候,并不希望加上对性能损耗很大的锁。这时候MVCC的一致性版本就有很大的优势了。 MVCC(实现机制) 本节就开始谈谈MVCC的实现机制,注意MVCC仅仅在纯select时有效(不包括select for update,lock in share mode等加锁操作,以及updateinsert等)。 select运行栈 首先我们追踪一下一条普通的查询sql在mysql源码中的运行过程,sql为(select * from test); 其运行栈为: 由于mysql默认隔离级别是repeatable_read(RR),所以read_record重载为 rr_sequential(当前我们并不关心select通过index扫描出row之后再通过condition过滤的过程)。继续追踪: 让我们看下该函数内部:
read_view的创建过程 我们先关注一致性视图的创建过程,我们先看下read_view结构: 然后通过debug,发现创建read_view结构也是在上述的rr_sequential中操作的,继续跟踪调用栈: 我们看下row_search_for_mysql里的一个分支:
上面的注释就是select for update(in share model)不会走MVCC的原因。让我们进一步分析trx_assign_read_view函数: (编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |