大家好。我们在日常开发过程中肯定都或多或少的用到过事务,而且在面试时,数据库的事务也是必问内容之一。今天我们就来说说mysql的事务。
为了方便我们下面内容的讲解,我们也先建立一个讲事务必用的表–account表,并在表中插入两条数据。
CREATE TABLE account (
id INT NOT NULL AUTO_INCREMENT COMMENT '自增id',
name VARCHAR(100) COMMENT '客户名称',
balance INT COMMENT '余额',
PRIMARY KEY (id)
) Engine=InnoDB CHARSET=utf8;
在某个特定的时刻,两个奥特曼在银行所拥有的资产是一个特定的值,这些特定的值也可以被描述为账户在这个特定的时刻现实世界的一个状态。假如这时迪迦要跟艾斯借10块钱,那么对于数据库来说就是相当于执行了下面这两条sql:
UPDATE account SET balance = balance - 10 WHERE id = 1;
UPDATE account SET balance = balance + 10 WHERE id = 2;
我们知道,在对某个页面进行读写访问时,都会先把这个页面加载到Buffer Pool中,之后如果修改了某个页面,也不会立即把修改同步到磁盘,而只是把这个修改了的页面加到Buffer Pool的flush链表中,在之后的某个时间点才会刷新到磁盘。如果在将修改过的页刷新到磁盘之前或者在刷新磁盘的过程中系统崩溃了那数据岂不是就出问题了。那么我们应该怎么避免这种情况的发生呢,这就要用事务了。
一、数据库的四大原则
1. 原子性(Atomicity)
现实世界中转账操作是一个不可分割的操作,也就是说要么压根儿就没转,要么转账成功,不能存在中间的状态,也就是转了一半的这种情况。数据库把这种要么全做,要么全不做的规则称之为原子性。
但是在现实世界中的一个不可分割的操作却可能对应着数据库世界若干条不同的操作,数据库中的一条操作也可能被分解成若干个步骤(比如先修改缓存页,之后再刷新到磁盘等),最要命的是在任何一个可能的时间都可能发生意想不到的错误而使操作执行不下去。为了保证在数据库世界中某些操作的原子性,数据库会保证如果在执行操作的过程中发生了错误,就把已经做了的操作恢复成没执行之前的样子。
2. 隔离性(Isolation)
现实世界中的两次状态转换应该是互不影响的,比如说艾斯向迪迦同时进行的两次金额为5元的转账。那么最后艾斯的账户里肯定会少10元,迪迦的账户里肯定多了10元。但是到对应的数据库世界中,事情又变的复杂了一些。为了简化问题,我们粗略的假设艾斯向迪迦转账5元的过程是由下边几个步骤组成的:
步骤一:读取艾斯账户的余额到变量A中,这一步简写为read(A)。
步骤二:将艾斯账户的余额减去转账金额,这一步简写为A = A - 5。
步骤三:将艾斯账户修改过的余额写到磁盘里,这一步简写为write(A)。
步骤四:读取迪迦账户的余额到变量B,这一步简写为read(B) 。
步骤五:将迪迦账户的余额加上转账金额,这一步简写为B = B + 5。
步骤六:将迪迦账户修改过的余额写到磁盘里,这一步骤简写为write(B)。
我们将艾斯向迪迦同时进行的两次转账操作分别称为T1和T2,在现实世界中T1和T2是应该没有关系的,可以先执行完T1,再执行T2,或者先执行完T2,再执行T1,对应的数据库操作就像这样:
但是真实的数据库中T1和T2的操作可能交替执行,比如这样:
如果按照上图中的执行顺序来进行两次转账的话,最终艾斯的账户里还剩6元钱,相当于只扣了5元钱,但是迪迦的账户里却成了12元钱,相当于多了10元钱。 所以对于现实世界中状态转换对应的某些数据库操作来说,不仅要保证这些操作以原子性的方式执行完成,而且要保证其它的状态转换不会影响到本次状态转换,这个规则被称之为隔离性。
3. 一致性(Consistency)
我们生活的这个世界存在着形形色色的约束,比如身份证号不能重复,高考的分数只能在 0~750之间,人民币面值最大只能是100等等, 只有符合这些约束的数据才是有效的。数据库世界只是现实世界的一个映射,现实世界中存在的约束也要在数据库世界中有所体现。如果数据库中的数据全部符合现实世界中的约束(all defined rules),我们说这些数据就是一致的,或者说符合一致性的。
如何保证数据库中数据的一致性呢?这其实靠两方面的努力:
1. 数据库本身能为我们保证一部分一致性需求(就是数据库自身可以保证一部分现实世界的约束永远有效)。
我们知道MySQL 数据库可以为表建立主键、唯一索引、外键、声明某个列为NOT NULL来拒绝 NULL 值的插入。比如说当我们对某个列建立唯一索引时,如果插入某条记录时该列的值重复了,那么MySQL就会报错并 且拒绝插入。除了这些我们已经非常熟悉的保证一致性的功能,MySQL还支持CHECK语法来自定义约束,比如:
CREATE TABLE account (
id INT NOT NULL AUTO_INCREMENT COMMENT '自增id',
name VARCHAR(100) COMMENT '客户名称',
balance INT COMMENT '余额',
PRIMARY KEY (id),
CHECK (balance >= 0)
);
上述例子中的CHECK语句本意是想规定balance 列不能存储小于0的数字,对应的现实世界的意思就是银行账户余额不能小于0。但是MySQL仅仅支持CHECK语法,但实际上并没有用,也就是说即使我们使用上述带有CHECK子句的建表语句来创建account表,在后续插入或更新记录时,MySQL也不会去检查CHECK子句中的约束是否成立。虽然CHECK 子句对一致性检查没什么用,但是我们还是可以通过定义触发器的方式来自定义一些约束条件以保证数据库中数据的一致性。
注意:其它的一些数据库,比如SQL Server或者Oracle支持的CHECK语法是有实实在在的作用的,每次进行插入或更新记录之前都会检查一下数据是否符合CHECK子句中指定的约束条件是否成立,如果不成立的话就会拒绝插入或更新。
2. 更多的一致性需求需要靠写业务代码的程序员自己保证。
为建立现实世界和数据库世界的对应关系,理论上应该把现实世界中的所有约束都反应到数据库世界中,但是在更改数据库数据时进行一致性检查是一个极为耗费性能的工作。现实生活中复杂的一致性需求比比皆是,而由于性能问题把一致性需求交给数据库去解决这是不现实的,所以就需要业务端程序员来保证数据的一致性。比如编写业务的程序员在业务代码里判断一下,当某个操作会将balance列的值更新为小于0的值时,就不执行该操作。
我们前边唠叨的原子性和隔离性都会对一致性产生影响,比如我们现实世界中转账操作完成后,有一个一致性需求就是参与转账的账户的总的余额是不变的。如果数据库不遵循原子性要求,也就是转了一半就不转 了,那最后就是不符合一致性需求的;类似的,如果数据库不遵循隔离性要求,最终也就不符合一致性需求了。所以说,数据库某些操作的原子性和隔离性都是保证一致性的一种手段,在操作执行完成后保证符合所有既定的约束则是一种结果。
那满足原子性和隔离性的操作一定就满足一致性么?那倒也不一定,比如说艾斯要转账20元给迪迦,虽然满足原子性和隔离性,但转账完成了之后艾斯的账户的余额就成负的了,这显然是不满足一致性的。那不满足原子性和隔离性的操作就一定不满足一致性么?这也不一定,只要最后的结果符合所有现实世界中的约束,那么就是符合一致性的。
4. 持久性(Durability)
当现实世界的一个状态转换完成后,这个转换的结果将永久的保留,这个规则被称为持久性。持久性是非常重要的,当把现实世界的状态转换映射到数据库世界时,持久性意味着该转换对应的数据库操作所修改的数据都应该在磁盘上保留下来,不论之后发生了什么事故,本次转换造成的影响都不应该被丢失掉。
二、 事务的概念
为了方便记忆,我们把原子性(Atomicity )、 隔离性( Isolation )、 一致性( Consistency )和持久性( Durability )这四个词对应的英文单词首字母提取出来就是A、I、C、D,稍微变换一下顺序可以组成一个完整的英文单词:ACID 。以后提到ACID这个词儿,我们就应该想到原子性、一致性、隔离性、持久性这几个规则。
数据库把需要保证原子性、隔离性、一致性和持久性的一个或多个数据库操作称之为一个事务(英文名是:transaction)。我们现在知道事务是一个抽象的概念,它其实对应着一个或多个数据库操作,数据库根据这些操作所执行的不同阶段把事务大致上划分成了这么几个状态:
活动的(active): 事务对应的数据库操作正在执行过程中时,我们就说该事务处在活动的状态。
部分提交的(partially committed): 当事务中的最后一个操作执行完成,但由于操作都在内存中执行,所造成的影响并没有刷新到磁盘时,我们就说该事务处在部分提交的状态。
失败的(failed):当事务处在活动的或者部分提交的状态时,可能遇到了某些错误(数据库自身的错误、操作系统错误或者直接断电等)而无法继续执行,或者人为的停止当前事务的执行,我们就说该事务处在失败的状态。
中止的(aborted): 如果事务执行了半截而变为失败的状态,比如我们前边唠叨的艾斯向迪迦转账的事务,当艾斯账户的钱被扣除,但是迪迦账户的钱没有增加时遇到了错误,从而当前事务处在了失败的状态,那么就需要把已经修改的艾斯账户余额调整为未转账之前的金额,换句话说,就是要撤销失败事务对当前数据库造成的影响。我们把这个撤销的过程称之为回滚。当回滚操作执行完毕时,也就是数据库恢复到了执行事务之前的状态,我们就说该事务处在了中止的状态。
提交的(committed): 当一个处在部分提交的状态的事务将修改过的数据都同步到磁盘上之后,我们就可以说该事务处在了提交的状态。
随着事务对应的数据库操作执行到不同阶段,事务的状态也在不断变化,一个基本的状态转换图如下所示:
从图中大家也可以看出了,只有当事务处于提交的或者中止的状态时,一个事务的生命周期才算是结束了。对于已经提交的事务来说,该事务对数据库所做的修改将永久生效,对于处于中止状态的事务,该事务对数据库所做的所有修改都会被回滚到没执行该事务之前的状态。
三、 MySQL中事务的语法
1. 开启事务
我们可以使用下边两种语句之一来开启一个事务:
BEGIN [WORK]
BEGIN语句代表开启一个事务,后边的单词WORK可有可无。
开启事务后,就可以继续写若干条语句,这些语句都属于刚刚开启的这个事务。
mysql> BEGIN;
Query OK, 0 rows affected (0.00 sec)
mysql> 加入事务的语句...
START TRANSACTION: START TRANSACTION语句和BEGIN语句有着相同的功效,都标志着开启一个事务,比如:
mysql> START TRANSACTION;
Query OK, 0 rows affected (0.00 sec)
mysql> 加入事务的语句...
不过相对于BEGIN语句来说,START TRANSACTION语句可以在后边跟随几个修饰符 ,如下所示:
READ ONLY: 标识当前事务是一个只读事务,也就是属于该事务的数据库操作只能读取数据,而不能修改数据。
READ WRITE: 标识当前事务是一个读写事务,也就是属于该事务的数据库操作既可以读取数据,也可以修改数据。
WITH CONSISTENT SNAPSHOT: 启动一致性读。
比如我们想开启一个只读事务的话,直接把READ ONLY这个修饰符加在 START TRANSACTION语句后边就好,比如这样:
START TRANSACTION READ ONLY;
如果我们想在START TRANSACTION后边跟随多个修饰符的话,可以使用逗号将修饰符分开,比如开启一个只读事务和一致性读:
START TRANSACTION READ ONLY, WITH CONSISTENT SNAPSHOT;
注意:READ ONLY和READ WRITE是用来设置所谓的事务访问模式 的,就是以只读还是读写的方式来访问数据库中的数据,一个事务的访问模式不能同时既设置为只读的也设置为读写的,所以我们不能同时把READ ONLY和READ WRITE放到START TRANSACTION语句后边。
另外,如果我们不显式指定事务的访问模式,那么该事务的访问模式就是读写模式。
2. 提交事务
开启事务之后就可以继续写需要放到该事务中的语句了,当最后一条语句写完了之后,我们就可以提交该事务了,提交的语句也很简单:
COMMIT [WORK];
COMMIT语句就代表提交一个事务,后边的 WORK 可有可无。
比如我们上边说艾斯给迪迦转10元钱其实对应 MySQL 中的两条语句,我们就可以把这两条语句放到一个事务中,完整的过程就是这样:
3. 手动中止事务
如果我们写了几条语句之后发现上边的某条语句写错了,我们可以手动的使用下边这个语句来将数据库恢复到事务执行之前的样子:
ROLLBACK [WORK];
ROLLBACK 语句就代表中止并回滚一个事务,后边的 WORK 可有可无类似的。
比如我们在写艾斯给迪迦转账10元钱对应的MySQL 语句时,先给艾斯扣了10元,然后一时大意只给迪迦账户上增加了1元,此时就可以使用 ROLLBACK 语句进行回滚,完整的过程就是这样:
注意:ROLLBACK语句是我们程序员手动的去回滚事务时才去使用的,如果事务在执行过程中遇到了某些错误而无法继续执行的话,事务自身会自动的回滚。
4. 支持事务的存储引擎
MySQL中并不是所有存储引擎都支持事务的功能,目前只有InnoDB 和NDB存储引擎支持,如果某个事务中包含了修改使用不支持事务的存储引擎的表,那么对该使用不支持事务的存储引擎的表所做的修改将无法进行回滚。比方说我们有两个表,tbl1使用支持事务的存储引擎InnoDB,tbl2使用不 支持事务的存储引擎MyISAM ,它们的建表语句如下所示:
CREATE TABLE tbl1 (
i int
) engine=InnoDB;
CREATE TABLE tbl2 (
i int
) ENGINE=MyISAM;
我们看看先开启一个事务,写一条插入语句后再回滚该事务,tbl1和tbl2的表现有什么不同:
可以看到,对于使用支持事务的存储引擎的tbl1表来说,我们在插入一条记录再回滚后,tbl1就恢复到没有插 入记录时的状态了。再看看tbl2表的表现:
可以看到,虽然我们使用了ROLLBACK 语句来回滚事务,但是插入的那条记录还是留在了tbl2表中。
5. 自动提交
MySQL 中有一个系统变量 autocommit :
可以看到它的默认值为ON,也就是说默认情况下,如果我们不显式的使用START TRANSACTION或者BEGIN语句开启一个事务,那么每一条语句都算是一个独立的事务,这种特性称之为事务的自动提交。
假如我们在艾斯向迪迦转账10元时不以START TRANSACTION或者 BEGIN 语句显式的开启一个事务,那么下边这两条语句就相当于放到两个独立的事务中去执行:
UPDATE account SET balance = balance - 10 WHERE id = 1;
UPDATE account SET balance = balance + 10 WHERE id = 2;
当然,如果我们想关闭这种自动提交的功能,可以使用下边两种方法:
- 显式的的使用START TRANSACTION或者BEGIN语句开启一个事务。 这样在本次事务提交或者回滚前会暂时关闭掉自动提交的功能。
- 把系统变量autocommit 的值设置为OFF。就像这样:
SET autocommit = OFF;
这样的话,我们写入的多条语句就算是属于同一个事务了,直到我们显式的写出COMMIT语句来把这个事务提交掉,或者显式的写出ROLLBACK语句来把这个事务回滚掉。
6. 隐式提交
当我们使用START TRANSACTION或者BEGIN语句开启了一个事务,或者把系统变量 autocommit 的值设置为OFF时,事务就不会进行自动提交,但是如果我们输入了某些语句之后就会悄悄的提交掉,就像我们输入了COMMIT语句了一样,这种因为某些特殊的语句而导致事务提交的情况称为隐式提交。这些会导致事务隐式提交的语句包括:
- 定义或修改数据库对象的数据定义语言(Data definition language,缩写为:DDL)。
所谓的数据库对象,指的就是数据库、表、视图、存储过程等等这些东西。当我们使用CREATE、 ALTER 、 DROP 等语句去修改这些所谓的数据库对象时,就会隐式的提交前边语句所属于的事务,比如:
BEGIN;
SELECT ... # 事务中的一条语句
UPDATE ... # 事务中的一条语句
... # 事务中的其它语句
CREATE TABLE ... # 此语句会隐式的提交前边语句所属于的事务
- 隐式使用或修改mysql数据库中的表。
当我们使用ALTER USER、CREATE USER、DROP USER 、GRANT 、 RENAME USER 、REVOKE 、SET PASSWORD等语句时也会隐式的提交前边语句所属于的事务。
- 事务控制或关于锁定的语句。
当我们在一个事务还没提交或者回滚时又使用START TRANSACTION或者BEGIN语句开启了另一个事务时,会隐式的提交上一个事务,比如:
BEGIN;
SELECT ... # 事务中的一条语句
UPDATE ... # 事务中的一条语句
... # 事务中的其它语句
BEGIN; # 此语句会隐式的提交前边语句所属于的事务
或者当前的autocommit 系统变量的值为OFF ,我们手动把它调为 ON时,也会隐式的提交前边语句所属的事务。或者使用LOCK TABLES 、 UNLOCK TABLES等关于锁定的语句也会隐式的提交前边语句所属的事务。
- 加载数据的语句。
比如我们使用LOAD DATA语句来批量往数据库中导入数据时,也会隐式的提交前边语句所属的事务。
- 关于MySQL 复制的一些语句。
使用START SLAVE、STOP SLAVE、RESET SLAVE、CHANGE MASTER TO等语句时也会隐式的提交前边语句所属的事务。
- 其它的一些语句。
使用ANALYZE TABLE、CACHE INDEX、CHECK TABLE、FLUSH、 LOAD INDEX INTO CACHE、OPTIMIZE TABLE、REPAIR TABLE、 RESET 等语句也会隐式的提交前边语句所属的事务。
7. 保存点
如果我们开启了一个事务,并且已经敲了很多语句,忽然发现上一条语句有点问题,就只好使用ROLLBACK语句来让数据库状态恢复到事务执行之前的样子,然后一切从头再来。为避免这种情况的发生,mysql数据库提出了一个保存点(英文:savepoint)的概念,就是在事务对应的数据库语句中打几个点,我们在调用ROLLBACK语句时可以指定会滚到哪个点,而不是回到最初的原点。定义保存点的语法如下:
SAVEPOINT 保存点名称;
当我们想回滚到某个保存点时,可以使用下边这个语句:
ROLLBACK [WORK] TO [SAVEPOINT] 保存点名称;
不过如果ROLLBACK语句后边不跟随保存点名称的话,会直接回滚到事务执行之前的状态。如果我们想删除某个保存点,可以使用这个语句:
RELEASE SAVEPOINT 保存点名称;
下边我们还是以艾斯向迪迦转账10元的例子展示一下保存点的用法,在执行完扣除艾斯账户的钱10元的语句之后打一个保存点:
可以看到,我们回滚到扣除艾斯账户的钱10元后打的那个保存点后,艾斯账号还是扣除完10元后的数额。
好了,到这里我们就讲完了,事务其实还有很多内容,今天我们只是浅谈一下,大家有什么想法欢迎留言讨论。也希望大家能给作者点个关注,谢谢大家!最后依旧是请各位老板有钱的捧个人场,没钱的也捧个人场,谢谢各位老板!