AWS MSK Kafka min.insync.replicas 配置风险排查与修复实战
RF=3, MinISR=3 看似"写入三副本才算成功,最安全",实则是定时炸弹——任何一个 broker 不可用就全面写入中断。本文记录从 AWS Health 告警发现到零停机修复的完整过程。前言某天巡检 AWS Health Dashboard,收到一条告警:AWS_KAFKA_HIGH_RISK_CONFIG_RF_EQUALS_MINISR One or more topics have a MinISR configuration that can lead to write/read failures and requires your immediate action.第一反应是"RF=3 应该没问题吧",排查后发现min.insync.replicas也设成了 3。这意味着 3 个副本必须全部在线才能写入——而 MSK 安全补丁(两天后就有一次)会逐个重启 broker,期间写入必然中断。本文适合:使用 AWS MSK 或自建 Kafka 的运维/SRE想理解 RF 和 MinISR 关系的后端工程师需要快速排查和修复 Kafka 高可用配置的团队一、RF 和 MinISR 到底是什么关系核心概念
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2522653.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!