前言
MySQL是啥?我一直以为MySQL是数据库,直到我最近看了很多关于MySQL的文章、专栏以及书籍后,我对MySQL的才有了更加深刻的体会。
原来MySQL并不是数据库,又或者说,我认为“MySQL是数据库这种想法”是片面的。其实MySQL是一个大的系统,并不只是数据库那么简单。反正我也说不清MySQL是什么,这个东西一两句话很难说的清,即使我用一两句话说得清,我相信你也不一定听得懂,这种东西只可意会不可言传。我刚刚不是说了MySQL是一个系统嘛,我脑子里的系统架构是这样的,你看看能不能看得懂:
我看了好多文章,他们都用了很多自己的方式去讲述MySQL的架构,比如讲解一条语句在MySQL的执行过程。其实这是一个很好的想法,但是事实上,他们也没讲明白这个问题,或者说讲不出我想要的那种效果。感觉这些文章要么讲的太粗略,要么没讲到本质。
所以我想写这么一篇文章,把一条语句在MySQL的执行过程这个问题给讲好,通过讲这么个问题,将我脑里的MySQL全景图描绘出来,顺便梳理一下我的近期所学和收获。
连接器
这相当于MySQL架构的入口了。客户端想要拿到MySQL系统中数据库的数据,就必须先经过这个连接器与MySQL系统建立连接。建立连接的过程采用了三次握手技术。
分析器
这个没啥好讲的。反正就是一条sql语句进来,分析器会通过词法分析算法和语法分析算法来判断这条sql语句想干嘛,然后把这条语句翻译给优化器听。
优化器
分析器已经将sql语句翻译给优化器听了。优化器会看看这条语句有没有索引,有的话就会分析一下到底选择走哪个索引(或者多表关联语句的话,决定执行的先后顺序)。把索引选出来之后,将索引交给执行器。
执行器
执行器的执行十分依赖存储引擎。执行器拿到索引时,会调用存储引擎接口,让存储引擎接口帮它做事。存储引擎有很多种,InnoDB、MyISAM、Memory。我们这里就将InnoDB这种。
InnoDB存储引擎会怎么做呢?它会通过优化器选择的索引(或者说优化器选择的索引B+树)来找到想要访问的数据的所在位置。这里特别注意,索引和目录很像,你看书是通过目录来找到你想看的文章的所在页,这里的索引就是目录,想要访问的数据就是想要看的文章,数据所在位置就是书的页码。事实上,我们都知道B+树中叶子节点会存放一些东西,我之前以为叶子节点存放的是数据,后来我发现我理解错了,叶子节点存放的是指针,指针指向数据。数据其实根本不存在于索引树中,而是存在于数据页中。
扯远了,回到刚才说的,当存储引擎找到你想找的数据的所在位置时,存储引擎会看看这个数据在不在buffer pool中,如果不在就先将这个数据所在的数据页以及这个数据页的相邻数据页都加载到buffer pool中,然后将这个数据交给执行器执行。执行器执行完这个数据后(比如更新这个数据),存储引擎就将这个更新后的数据放回到buffer pool中,然后通过两阶段提交,这条数据就更新完了。
而且,当涉及到对磁盘和buffer pool的读写时,会涉及到 MySQL中锁这个知识。
小结
这就是MySQL一条语句的执行过程。当然,我还没对这个过程做深入的分析,只是简单的讲了一下这个过程。加粗的地方就是应该深入分析的地方,我在后续也会写对应的文章进行讲解。
理解了这个过程,对于MySQL的基本架构也就差不多掌握了。当对MySQL有一个基本的认识的时候,之前对很多东西的困惑现在就明白了。而且MySQL的架构可以当做一条主线,通过MySQL这个架构,将MySQL的知识都串联起来,这样不知不觉就形成了自己的MySQL全景图了。