Pulsar bundle数目的选择

news2026/5/4 5:36:22

看到今年Pulsar 峰会上挺多人分享负载均衡的内容，这里也整理分享一下相关的内容。

实践中，我们都会

关闭 auto bundle split，保证系统稳定

Pulsar bundle split 是一个比较耗费资源的操作，会造成连接到这个 bundle 上的所有 producer/consumer/reader 连接断开并重连。一般情况下，触发 auto bundle split 的原因是这个 bundle 的压力比较大，需要切分成两个 bundle，将流量分摊到其他 broker，来降低这个 bundle 的压力。

当触发 auto bundle split 时 broker 负载比较高，关闭这个 bundle 上的 producer/consumer/reader，连接就会变慢，并且 bundle split 的耗时也挺长，就很容易造成 client 端（producer/consumer/reader）连接超时而失败，触发 client 端自动重连，造成 Pulsar/Pulsar client 不稳定。

对于生产环境，我们的建议是：预先为每个 namespace 分配好 bundle 数，并关闭 auto bundle split 功能。如果在运行过程中发现某个 bundle 压力过大，可以在流量低峰期进行手动 bundle split，降低对 client 端的影响。

关于预先分配的 bundle 数量不宜太大，bundle 数太多会给 ZooKeeper 造成比较大的压力，因为每一个 bundle 都要定期向 ZooKeeper 汇报自身的统计数据。

bundle数目的选择--单个分区topic包含的所有分区研究

不推荐开启bundle拆分的功能，也就是创建namespace的时候就要确定bundle的数目。那么该如何确定bundle的数目呢？

根据一致性hash算法，显然bundles数目越多越有利于负载均衡，但是bundles数目太大，也会有不好的一面。

pulsar在实现负载均衡算法的时候，会搜集性能指标，如msg/sec、avg latency之类的，这些是以bundle level来统计的，如果bundle数目过多，则会增大计算metrics的开销，而且这些metrics存储在ZK metadata store上，也会增大存储和network io开销。

因此，不能太多bundles，那有没有一个规则来指导设置bundles数目呢？

分析：

·提高性能方面：pulsar设计分区topic是为了让同一个topic下的不同分区分别由不同broker服务，这样一个客户端同时由多个bundle来服务，从而提高单个topic的吞吐量，但是如果多个分区被分配到同一个bundle，那么这几个分区就只能由同一个broker来服务，也就没法达到预期的效果。

·负载均衡方面：提高bundles数目，显然是可以提高负载均衡的效果的，但是设置到多高的值才能说是收益大于成本呢？单个分区topic，如果使用round-robin的路由模式，则该topic下的每个分区的流量是均匀的，则如果该topic每个分区都分配到不同的bundle，再由一个理想的shedding算法使得这些bundle均匀地分配到brokers上，则brokers的负载就能达到理想的负载均衡状态。可见，bundles数目设置的上限值应该是大概率使得不同分区分配到不同bundle，再往高了取其实就没有收益了，而且一般也没必要取到这个上限值。

即，我们目标是想尽量让不同分区分进不同的bundle里，对应概率模型：把k个球随机均匀放进m个桶里（pulsar中的分配不是随机的，是对通过hash来分配的，这里做近似）

则k个球都放进不同的桶的概率为