MySQL 事务机制深度解析:从 ACID 到底层实现
MySQL 事务机制深度解析从 ACID 到底层实现MySQL 的事务机制主要由InnoDB 存储引擎实现核心围绕ACID 四大特性通过日志系统redo log、undo log、锁机制和MVCC多版本并发控制共同协作完成。以下将系统拆解其实现原理。一、事务的四大特性ACID与底层实现对应关系事务是一组原子性的 SQL 操作要么全部成功要么全部失败。ACID 是事务的核心准则其实现依赖 InnoDB 的不同机制特性含义底层实现机制原子性Atomicity事务是不可分割的最小单元所有操作要么全部提交要么全部回滚undo log回滚日志记录数据修改前的逻辑状态用于回滚时恢复数据一致性Consistency事务执行前后数据从一个合法状态转换到另一个合法状态如约束、索引完整性原子性、隔离性、持久性的共同结果同时依赖数据库约束如主键、外键隔离性Isolation并发事务之间互不干扰执行过程对其他事务透明锁机制行锁、表锁、间隙锁MVCC多版本并发控制持久性Durability事务一旦提交对数据的修改永久生效即使系统崩溃也不丢失redo log重做日志记录数据页的物理修改用于崩溃恢复二、核心日志系统redo log 与 undo log日志是 InnoDB 实现事务的基石redo log 保证持久性undo log 保证原子性二者通过“两阶段提交”协作。1. redo log重做日志作用崩溃恢复当 MySQL 宕机时通过 redo log 恢复未刷盘的缓冲池数据保证事务提交后数据不丢失。WAL 机制Write-Ahead Logging先写日志再刷磁盘减少随机 I/O日志是顺序 I/O。写入时机redo log 的写入分为两个阶段redo log buffer事务执行过程中修改数据先写入内存中的日志缓冲区默认 16MB。刷盘fsync根据innodb_flush_log_at_trx_commit参数策略刷入磁盘0每秒刷盘一次事务提交时不主动刷盘性能最高但宕机丢 1 秒数据。1事务提交时立即刷盘默认保证持久性性能中等。2事务提交时写入操作系统缓存每秒刷盘一次性能较好宕机丢操作系统缓存数据。物理日志格式redo log 是物理日志记录“哪个数据页的哪个偏移量做了什么修改”例如“表空间 ID 为 10页号为 100偏移量 500 处将字节从 0x01 改为 0x02”。2. undo log回滚日志作用事务回滚当事务执行失败或调用ROLLBACK时通过 undo log 恢复数据到修改前的状态保证原子性。MVCC 版本链为多版本并发控制提供历史数据版本实现快照读。写入时机在修改数据之前先将数据的原始状态写入 undo log逻辑日志。例如执行UPDATE t SET nameB WHERE id1前先记录 undo logid1 的 name 原来是 A。逻辑日志格式undo log 是逻辑日志记录“如何撤销当前操作”分为两类insert undo log针对INSERT操作事务提交后可直接删除仅用于回滚。update undo log针对UPDATE/DELETE操作事务提交后需保留用于 MVCC由 purge 线程异步清理。3. redo log 与 undo log 的区别与协作核心区别维度redo logundo log日志类型物理日志数据页修改逻辑日志数据历史状态作用崩溃恢复保证持久性事务回滚 MVCC保证原子性写入时机修改数据后先写 buffer再刷盘修改数据前先写 undo再改数据空间管理循环写入固定大小默认 48MB追加写入存储在回滚段中协作两阶段提交2PC为了保证redo logInnoDB 层与binlogServer 层用于主从复制、归档的一致性事务提交采用两阶段提交Prepare 阶段将redo log刷盘标记事务状态为PREPARED已准备提交。Commit 阶段写入binlog并刷盘Server 层。将redo log标记为COMMITTED事务正式提交。崩溃恢复逻辑若redo log是COMMITTED直接提交事务。若redo log是PREPARED检查binlog是否存在存在则提交不存在则回滚。三、并发控制锁机制与 MVCC隔离性的实现依赖“锁”解决当前读的并发问题依赖“MVCC”解决快照读的并发问题二者结合实现高并发下的数据隔离。1. 锁机制InnoDB 支持表锁和行锁核心是行锁粒度细并发高。行锁的类型共享锁S 锁读锁允许其他事务加 S 锁但不允许加 X 锁SELECT ... LOCK IN SHARE MODE。排他锁X 锁写锁不允许其他事务加任何锁UPDATE/DELETE/INSERT或SELECT ... FOR UPDATE。间隙锁Gap Lock与 Next-Key Lock为了解决幻读同一事务内两次当前读结果不一致InnoDB 在REPEATABLE READRR隔离级别下引入间隙锁锁定索引记录之间的“间隙”不包含记录本身防止其他事务插入新数据。Next-Key Lock行锁 间隙锁锁定“前开后闭区间”如索引值为 1、3、5则锁定区间(-∞,1]、(1,3]、(3,5]、(5,∞)彻底避免幻读。锁的作用场景当前读读取的是最新数据如SELECT ... FOR UPDATE、UPDATE、DELETE需加锁保证并发安全。快照读读取的是历史版本如普通SELECT通过 MVCC 实现无需加锁。2. MVCC多版本并发控制MVCC 通过数据版本链和Read View读视图实现“快照读”让并发事务之间互不干扰提升读性能。核心组件1隐藏字段InnoDB 为每行数据添加 3 个隐藏字段DB_TRX_ID最后一次修改该行的事务 ID6 字节。DB_ROLL_PTR回滚指针7 字节指向 undo log 中的历史版本。DB_ROW_ID隐藏主键6 字节若表无主键则自动生成。2版本链每次修改数据时都会生成一个新版本并通过DB_ROLL_PTR连接到 undo log 中的旧版本形成版本链链表头是最新版本链表尾是最旧版本。例如事务 AID10插入一行数据DB_TRX_ID10DB_ROLL_PTRnull。事务 BID20修改该行生成新版本DB_TRX_ID20DB_ROLL_PTR指向事务 A 的版本undo log。事务 CID30再次修改生成新版本DB_TRX_ID30DB_ROLL_PTR指向事务 B 的版本。3Read View读视图当事务执行快照读普通SELECT时生成一个Read View用于判断版本链中哪个版本对当前事务可见。Read View包含 4 个核心信息m_ids生成 Read View 时活跃的事务 ID 列表未提交的事务。min_trx_idm_ids中的最小事务 ID。max_trx_id生成 Read View 时系统下一个要分配的事务 IDm_ids最大值 1。creator_trx_id当前事务的 ID。4可见性判断规则遍历版本链从最新版本开始依次判断若版本的DB_TRX_ID creator_trx_id是当前事务自己修改的可见。若版本的DB_TRX_ID min_trx_id该版本在生成 Read View 前已提交可见。若版本的DB_TRX_ID max_trx_id该版本在生成 Read View 后才开启不可见。若min_trx_id DB_TRX_ID max_trx_id检查DB_TRX_ID是否在m_ids中若在该版本是活跃事务修改的未提交不可见。若不在该版本已提交可见。若当前版本不可见通过DB_ROLL_PTR找到上一个版本重复判断直到找到可见版本或遍历完版本链。四、事务执行流程一条更新语句的完整旅程以BEGIN; UPDATE t SET nameB WHERE id1; COMMIT;为例拆解事务从开始到提交的完整过程步骤 1开始事务执行BEGIN或START TRANSACTIONInnoDB 为事务分配唯一的事务 IDtrx_id但此时并未真正开始延迟到第一条 SQL 执行。步骤 2读取数据页执行UPDATE时先检查缓冲池Buffer Pool中是否存在id1的数据页若存在直接读取缓冲池中的页。若不存在从磁盘读取数据页到缓冲池产生随机 I/O。步骤 3修改数据页在缓冲池中修改数据页将name从A改为B此时缓冲池中的页变为脏页与磁盘不一致。步骤 4记录 undo log在修改数据前先将原始数据nameA写入 undo log逻辑日志并更新数据行的DB_ROLL_PTR指向该 undo log形成版本链。步骤 5记录 redo log将数据页的物理修改写入redo log buffer内存此时 redo log 记录的是“哪个页的哪个偏移量做了什么修改”。步骤 6提交事务两阶段提交阶段 1Prepare将redo log buffer刷盘根据innodb_flush_log_at_trx_commit参数标记事务状态为PREPARED。阶段 2Commit写入binlogServer 层逻辑日志记录 SQL 语句或行变更并刷盘。将redo log标记为COMMITTED事务正式提交。步骤 7后台刷脏页事务提交后缓冲池中的脏页由后台线程Master Thread、Page Cleaner Thread异步刷入磁盘减少随机 I/O提升性能。回滚流程若事务失败若执行ROLLBACK或事务崩溃读取 undo log根据版本链恢复数据到修改前的状态。记录 redo log回滚操作也需 redo log 保证持久性。释放锁清理 undo loginsert undo log 直接删除update undo log 由 purge 线程异步清理。五、默认隔离级别REPEATABLE READ的实现MySQL 默认隔离级别是REPEATABLE READRR可重复读通过MVCC和Next-Key Lock共同实现解决了不可重复读和幻读问题。1. 解决不可重复读快照读不可重复读同一事务内两次快照读结果不一致其他事务修改了数据。实现方式RR 隔离级别下Read View是在事务第一次执行快照读时生成的而非每次快照读都生成。后续所有快照读都使用同一个Read View因此只能看到生成 Read View 前已提交的事务修改保证了可重复读。2. 解决幻读当前读幻读同一事务内两次当前读结果不一致其他事务插入了新数据。实现方式对于快照读通过 MVCC 版本链只能看到 Read View 生成前的数据新插入的数据不可见因此不会出现幻读。对于当前读如SELECT ... FOR UPDATE、UPDATE通过Next-Key Lock行锁 间隙锁锁定查询范围防止其他事务插入新数据彻底避免幻读。示例RR 隔离级别下的幻读防护假设有表t索引id有值 1、3、5事务 A 执行SELECT * FROM t WHERE id BETWEEN 2 AND 4 FOR UPDATE;当前读。InnoDB 对区间(1,3]和(3,5]加 Next-Key Lock锁定 3 及其前后间隙。事务 B 尝试INSERT INTO t (id) VALUES (2);因间隙(1,3)被锁定插入被阻塞。事务 A 再次执行当前读结果与第一次一致无幻读。总结MySQL 事务机制的核心是原子性undo log 回滚。持久性redo log 崩溃恢复。隔离性MVCC快照读 锁当前读。一致性三者共同保证。其中redo log 与 undo log 是事务的“左膀右臂”MVCC 是高并发的关键而 Next-Key Lock 则彻底解决了 RR 隔离级别下的幻读问题。这套机制既保证了数据安全又实现了高性能并发是 InnoDB 成为主流存储引擎的核心原因。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2453056.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!