第 6 次执行后,PostgreSQL 执行计划为何突变?
引言在 PostgreSQL 中预处理语句通常用于提升性能并防止 SQL 注入。但一个不易察觉的行为是查询规划器会在执行达到特定次数后自动改变执行计划。这种变化往往令人困惑——SQL 本身未发生变化执行计划却突然发生切换有时甚至带来明显的性能波动。其根本原因在于规划器对自定义计划与通用计划的选择策略而该策略由参数plan_cache_mode控制。定制计划与通用计划的核心差异预编译语句携带参数执行时优化器会在两种计划模式中抉择自定义计划Custom Plan:基于实际参数值生成执行计划。针对性强但每次执行都需要重新规划。通用计划Generic Plan:在未知参数值的情况下生成一次执行计划并在后续复用从而减少规划开销。plan_cache_mode 默认值为 auto此模式下优化器前 5 次执行均采用定制计划第 6 次执行时会对比前 5 次定制计划的平均代价与通用计划的预估代价若通用计划代价更低或相等则当前会话将永久切换为通用计划。使用 pgbench 进行验证为了观察该行为构造一个具有明显数据倾斜的测试场景### In bash: pgbench -i -s 10 -U postgres postgres ### In psql: ALTER TABLE pgbench_accounts ADD COLUMN flag CHAR(1) NOT NULL DEFAULT Y; UPDATE pgbench_accounts SET flag N WHERE aid 1000; CREATE INDEX idx_accounts_flag ON pgbench_accounts(flag); ANALYZE pgbench_accounts; SELECT flag, count(*) FROM pgbench_accounts GROUP BY flag; flag | count -------------- N | 1000 Y | 999000在切换发生之前分别强制两种模式观察同一 SQL 的执行计划。-- Custom plan: planner sees the literal value Y, looks it up in column -- statistics (MCV frequency ≈ 0.999), and picks Seq Scan for 999,033 rows. SET plan_cache_mode force_custom_plan; PREPARE flag_lookup(char) AS SELECT aid, abalance FROM pgbench_accounts WHERE flag $1; EXPLAIN EXECUTE flag_lookup(Y);QUERY PLAN ------------------------------------------------------------------------- Seq Scan on pgbench_accounts (cost0.00..28910.00 rows999033 width8) Filter: (flag Y::bpchar) -- literal value Y indicates custom planDEALLOCATE flag_lookup; -- Generic plan: the planner has no value to look up. With ndistinct 2 -- (only Y and N exist), it estimates 1/ndistinct 50% selectivity, -- or 500,000 rows. At that estimate, the cheaper path is Index Scan. SET plan_cache_mode force_generic_plan; PREPARE flag_lookup(char) AS SELECT aid, abalance FROM pgbench_accounts WHERE flag $1; EXPLAIN EXECUTE flag_lookup(Y);QUERY PLAN -------------------------------------------------------------------------------------------- Index Scan using idx_accounts_flag on pgbench_accounts (cost0.42..19322.07 rows500000) Index Cond: (flag $1) -- Note the placeholder $1 instead of literal Y/N执行后数据分布为N 对应 1000 行0.1%Y 对应 999000 行99.9%。自动切换行为的触发过程将 plan_cache_mode 恢复为默认的 auto 模式后使用高频取值 Y 对预编译语句连续执行五次。每次执行均生成代价约为 28910 的定制化全表扫描计划。五次执行完成后优化器会对两类计划代价进行对比定制计划平均代价约为 28910通用计划预估代价约为 19322。由于通用计划代价小于等于定制计划平均代价从第六次执行开始优化器将固定选用通用计划。DEALLOCATE flag_lookup; SET plan_cache_mode auto; PREPARE flag_lookup(char) AS SELECT aid, abalance FROM pgbench_accounts WHERE flag $1; -- Executions 1–5: custom plans, each resolving Y literally EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y);五次执行均输出相同计划QUERY PLAN -------------------------------- Seq Scan on pgbench_accounts Filter: (flag Y::bpchar)第六次执行时执行计划发生变化EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); QUERY PLAN -------------------------------------------------------- Index Scan using idx_accounts_flag on pgbench_accounts Index Cond: (flag $1)第六次调用时执行计划由全表扫描切换为索引扫描查询语句与数据均未发生变化。计划中出现的 $1 占位符表明当前已启用通用计划。计划切换后的不可逆性自第六次执行起无论传入何种参数值查询均会沿用已生成的通用索引扫描计划。参数值 N 对应 1000 行数据索引扫描恰好保持高效而参数值 Y 对应 999000 行数据通过索引随机访问接近全表的数据效率远低于顺序扫描。-- 第七次及后续执行无论参数值均使用通用计划 EXPLAIN (COSTS OFF) EXECUTE flag_lookup(Y); EXPLAIN (COSTS OFF) EXECUTE flag_lookup(N);两次执行均输出相同计划QUERY PLAN -------------------------------------------------------- Index Scan using idx_accounts_flag on pgbench_accounts Index Cond: (flag $1)通用计划一旦启用会持续生效直至执行 DEALLOCATE flag_lookup 释放预编译语句或当前会话终止。该机制在高频执行的预编译语句场景中需重点关注在实际业务场景中已对系统可用性产生过显著影响。底层源码逻辑解析切换阈值固定为 5 次的逻辑可在 PostgreSQL 源码src/backend/utils/cache/plancache.c文件的choose_custom_plan函数中找到明确定义static bool choose_custom_plan(CachedPlanSource *plansource) { /* ... settings check for force_custom / force_generic ... */ /* If we havent done 5 custom plans yet, keep doing them */ if (plansource-num_custom_plans 5) return true; /* * Otherwise, compare generic_cost against the average custom_cost. * If the generic plan is cheaper (or equal), we switch! */ if (plansource-generic_cost plansource-total_custom_cost / plansource-num_custom_plans) return false; return true; }实际应用优化建议PostgreSQL 查询优化器的自动计划缓存机制通常可节省 CPU 资源但在数据分布高度倾斜、临时对象频繁变动的场景下第 6 次执行的计划切换可能导致业务性能异常。若预编译语句出现无明确诱因的性能退化可核查执行次数是否超过 5 次或通过设置plan_cache_mode force_custom_plan进行故障排查强制每次执行生成新的定制计划确保优化器基于实际参数选择最优执行策略。原文链接https://richyen.com/postgres/2026/03/30/plan_cache_mode.html作者Richard Yen
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2477467.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!