MySQL8四大事务隔离级别详解,彻底搞懂脏读、不可重复读、幻读
MySQL8四大事务隔离级别详解彻底搞懂脏读、不可重复读、幻读做后端开发久了我相信大家都碰到过一类特别头疼的线上疑难问题代码逻辑反复核对没有问题单元测试全部通过测试环境稳得一批。可一旦上线生产就随机出现库存莫名超卖、用户余额对账不平、订单数据错乱的问题。很多人排查日志、调试代码、优化SQL折腾一整天完全找不到问题根源最后只能无奈归结为数据库偶发抽风。其实从业这么多年我可以很明确的说绝大多数随机的数据不一致问题根本不是代码bug而是你没吃透 MySQL 事务隔离级别。事务隔离级别算是 MySQL 最基础、但也最容易被轻视的核心知识点。不管是面试必考还是线上问题排查都绕不开它。但大部分开发者都只是死记硬背概念分不清几种隔离级别的实际差异更不知道不同业务该如何选型遇到数据错乱问题完全无从下手。今天我结合自己线上真实踩坑经历抛开枯燥的教科书话术用通俗的大白话、可直接复制运行的SQL案例手把手带大家彻底读懂四大事务隔离级别搞定脏读、不可重复读、幻读这三个高频难题。内容偏向实战落地建议收藏以后面试、线上排查问题都用得上。一、到底什么是事务隔离熟悉数据库的朋友都知道事务拥有经典的 ACID 四大特性原子性、一致性、隔离性、持久性。在这四个特性里隔离性是专门用来解决数据库并发读写问题的关键。我们的线上系统同一时刻会涌入大量请求无数事务同时读写同一张表、同一条数据。如果事务之间没有任何隔离机制所有读写操作互相干扰数据错乱、数据覆盖的问题会遍地都是。简单来讲事务隔离级别就是用来约束并发事务的读写可见规则控制不同事务之间能不能互相读取对方的数据。这里有个大家一定要记住的取舍逻辑隔离级别越高数据一致性越强线上bug越少但数据库并发性能越差反之隔离级别越低并发吞吐越高但数据出错的风险会大幅提升。插图建议通俗易懂示意图——事务隔离级别「性能与安全性取舍关系图」二、并发事务三大数据异常脏读、不可重复读、幻读想要学懂隔离级别首先得搞明白并发场景下的三类数据异常。说白了MySQL 设计四大隔离级别唯一目的就是针对性解决这三个问题。全文案例统一复用下面这张测试表大家可以直接复制语句建表测试跟着实操更容易理解CREATETABLEgoods_stock(idintPRIMARYKEYAUTO_INCREMENT,goods_namevarchar(50)NOTNULLCOMMENT商品名称,stockintNOTNULLDEFAULT0COMMENT库存数量)ENGINEInnoDBDEFAULTCHARSETutf8mb4;-- 插入测试数据INSERTINTOgoods_stock(goods_name,stock)VALUES(夏季短袖,100);1、脏读读取到了无效的作废数据通俗解释一个事务读取到了其他事务尚未提交的数据如果对方后续回滚事务当前读取到的数据就彻底失效变成了毫无意义的脏数据。业务场景举例事务A查询商品库存为100此时事务B修改库存为80但没有提交。事务A读取到了80的库存并执行业务逻辑。后续事务B因为异常回滚库存恢复为100这就直接导致事务A基于错误数据完成业务出现数据错乱。核心特征读取未提交、随时会作废的数据风险最高。2、不可重复读同一事务两次查询结果不一致通俗解释在同一个事务生命周期内两次查询同一条数据期间被其他事务修改并提交导致前后查询结果不一致。业务场景举例事务A开启事务第一次查询库存是100。紧接着事务B扣减库存至90并成功提交。事务A再次查询同一条数据库存变为90。同一个事务内数据变动很容易造成对账、统计类业务出错。核心特征其他事务更新修改已有数据导致当前事务数据不稳定。3、幻读查询范围数据出现“幻觉”通俗解释同一个事务中做范围统计、批量查询时其他事务新增或删除数据导致当前事务前后查询的数据行数不一致就像出现了幻觉。业务场景举例事务A统计全部商品只有1条数据。事务B新增商品并提交事务A再次统计突然多出一条数据。核心特征其他事务新增/删除数据影响当前事务范围查询结果。插图建议三大读异常场景对比图解直观区分三者差异三、MySQL四大事务隔离级别从低到高实战拆解标准SQL规范定义了四种事务隔离级别InnoDB引擎全部兼容。按照隔离度从低到高排序依次是读未提交Read Uncommitted读已提交Read Committed可重复读Repeatable ReadMySQL默认级别串行化Serializable我结合实操案例逐一讲解大家可以清晰看到每一种级别能解决什么问题又会遗留哪些隐患。1、读未提交Read Uncommitted最低级别生产禁用核心特点所有事务可以直接读取其他事务未提交的数据没有任何读取限制。问题情况脏读、不可重复读、幻读三类问题全部存在我们简单实操验证事务A、事务B两个会话统一执行以下语句切换隔离级别并开启事务-- 设置当前会话隔离级别SETSESSIONTRANSACTIONISOLATIONLEVELREADUNCOMMITTED;-- 开启事务STARTTRANSACTION;1. 事务A查询库存结果为1002. 事务B更新库存为50不执行提交操作3. 事务A再次查询直接读取到未提交的库存50脏读现象出现4. 事务B执行回滚数据库库存恢复100。此时事务A拿到的50就是完全无效的脏数据极易引发业务bug。适用场景生产环境基本不会使用仅用于本地测试学习。并发性能极高但数据安全性极差。2、读已提交Read CommittedRC核心特点事务只能读取其他事务已经提交落地的数据读取不到未提交的临时数据。解决问题彻底杜绝脏读遗留问题依旧存在不可重复读、幻读执行以下语句切换隔离级别SETSESSIONTRANSACTIONISOLATIONLEVELREADCOMMITTED;实操下来可以发现事务B修改数据但不提交时事务A的数据不会变化成功规避脏读。但如果事务B修改数据并提交事务A在同一个事务内两次查询结果不一致也就是典型的不可重复读问题。适用场景后台数据统计、资讯展示、非核心页面查询。这类业务允许短暂的数据不一致优先保证接口并发速度。3、可重复读Repeatable ReadRRMySQL默认核心特点同一个事务内第一次查询会生成数据快照整个事务生命周期内都会读取快照数据。外部事务修改、提交数据都不会影响当前事务的查询结果。解决问题脏读、不可重复读全部解决遗留问题依然存在幻读这也是MySQL默认采用该级别的核心原因完美平衡了性能和数据安全性足以覆盖绝大多数线上业务场景。简单来说事务A开启事务后无论外部事务怎么修改提交数据自身查询结果始终保持不变保证了单事务数据稳定。这里很多人都有个疑问RR 既然叫可重复读为什么还会出现幻读这也是很多面试题的陷阱。下面我给大家一套百分百可复现的实战案例彻底讲透这个问题。实战前提两个事务均使用 MySQL 默认隔离级别 可重复读RR两个会话统一执行以下语句-- 会话A、会话B 统一执行SETSESSIONTRANSACTIONISOLATIONLEVELREPEATABLEREAD;STARTTRANSACTION;完整复现步骤1、事务A开启事务查询全部商品数据当前库内仅1条数据-- 事务A执行SELECT*FROMgoods_stock;查询结果仅1条【夏季短袖库存100】事务A生成数据快照固化当前数据状态。2、事务B开启事务新增商品数据并主动提交-- 事务B执行INSERTINTOgoods_stock(goods_name,stock)VALUES(冬季卫衣,200);COMMIT;3、事务A不结束当前事务再次执行全表查询-- 事务A再次执行SELECT*FROMgoods_stock;此时可以看到事务A依旧只能查询到1条旧数据看不到事务B新增的数据。很多人看到这里都会疑惑不是说 RR 存在幻读吗为什么复现不出来这就是网上大部分文章的误区MySQL 的 RR 隔离级别依靠快照机制规避了快照读普通SELECT的幻读但是完全挡不住当前读的幻读问题。我们继续操作真正复现幻读4、事务A持续不提交执行更新操作当前读-- 事务A执行更新UPDATEgoods_stockSETstock0;5、事务A再次执行查询语句SELECT*FROMgoods_stock;此时诡异的业务问题直接复现事务A查询到了2条数据不仅有原本的夏季短袖还多出了刚刚新增的冬季卫衣且两条数据的库存都被更新为0。这就是标准的幻读同一个事务内原本判定库中只有一条商品、准备批量清空库存结果执行更新后突然多出一条数据导致业务逻辑和预期完全不符这也是库存超卖、批量更新遗漏数据的核心元凶。幻读核心总结快照读普通 SELECT 查询RR 级别可以规避幻读当前读UPDATE/INSERT/DELETE/SELECT ... FOR UPDATERR 级别无法规避幻读这也是为什么订单、库存等高并发核心业务偶尔会出现莫名其妙的数据异常。适用场景绝大多数线上核心业务订单、支付、库存、用户数据读写场景基本都用此级别。4、串行化Serializable最高隔离级别核心特点数据库最高的隔离级别直接强制所有事务串行执行。读写操作互相阻塞同一时间仅允许单个事务操作数据表。解决问题脏读、不可重复读、幻读三类异常全部彻底解决缺点并发性能极差极易出现事务阻塞、请求超时系统吞吐量大幅下降适用场景仅用于数据一致性要求极高、并发量低的场景比如金融资金清算、财务对账、核心结算业务。四、四大隔离级别全方位汇总对比我整理了一份汇总对照表清晰罗列每种隔离级别的优缺点与适配场景方便大家快速对比查阅隔离级别脏读不可重复读幻读并发性能适用场景读未提交存在存在存在最高几乎不用读已提交不存在存在存在较高普通展示、统计业务可重复读默认不存在不存在存在中等绝大多数线上核心业务串行化不存在不存在不存在最低金融对账、资金结算五、线上业务如何选型直接抄作业很多开发者知识点背得很熟但落地到项目就不知道该怎么选。这里我结合多年线上运维经验给大家一套可以直接落地的选型标准绝大多数项目直接沿用 MySQL 默认的可重复读 RR兼顾性能和数据安全综合性价比最高适配订单、用户、库存等核心业务。后台报表、数据统计、内容展示选用读已提交 RC轻微的数据不一致不会影响业务还能有效提升接口并发速度。资金、对账、清算、核心交易极致一致性场景可酌情使用串行化优先保障数据绝对准确。生产环境绝对禁止读未提交数据风险极高完全没有使用价值。六、最后总结在我看来事务隔离级别不需要死记硬背核心逻辑特别简单隔离越低并发越强、数据越容易出问题隔离越高数据越稳、接口性能越差。脏读、不可重复读、幻读从来不是数据库bug而是并发读写场景下的正常现象。我们学习隔离级别本质是根据自身业务的一致性要求权衡性能与数据安全规避对应的业务漏洞解决库存超卖、对账异常、数据错乱等线上疑难问题。吃透这篇文章以后再遇到数据库随机数据异常不用再盲目重启服务、束手无策可以精准定位问题根源。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2567896.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!