消息中间件故障排除 · 系列目录
叙事框架:业务现象 → 中间件表现 → 根因排查 总计 32 篇,已发布 1 篇,31 篇待完善
RocketMQ 发送端
- ✅ RocketMQ 消息发送 system busy / broker busy 根因分析
- ⏳ 一行代码导致 RocketMQ 大量消息发送失败
- ⏳ 困扰半年的 RocketMQ timeout exception 破解实录
- ⏳ 生产环境 autoCreateTopicEnable=true 引发的灾难
- ⏳ RocketMQ 主题扩分片后消息路由混乱排查
RocketMQ 消费端
- ⏳ RocketMQ 消息堆积了怎么办?从消费者源码到 OS 层排查
- ⏳ 顺序消费队列变更导致消息乱序分析
- ⏳ 消息消费重试机制引发的重复消费问题
- ⏳ RocketMQ 消费进度丢失排查
- ⏳ 消费端遇到瓶颈的生产级排查思路
RocketMQ 集群 / HA
- ⏳ RocketMQ 主从切换引发的消息丢失分析
- ⏳ DLedger 多副本 Leader 选举失败排查
- ⏳ RocketMQ NameServer 宕机影响范围分析
- ⏳ 你部署的 RocketMQ 集群真的是高可用吗?
RocketMQ 存储 / 性能
- ⏳ RocketMQ CommitLog 文件损坏恢复
- ⏳ 刷盘机制导致的写入性能瓶颈分析
- ⏳ 消息文件清除机制引发的磁盘空间问题
- ⏳ 读写锁在 RocketMQ 中的性能瓶颈排查
- ⏳ RocketMQ 压测后性能提高 30% 的调优过程
Kafka 发送端
- ⏳ KafkaProducer Sender 线程异常退出排查
- ⏳ Kafka 消息发送瓶颈诊断:从哪下手?
- ⏳ 双十一期间 Kafka 丢消息根因分析
Kafka 消费端
- ⏳ Kafka 消费者不消费了?Rebalance 全流程定位
- ⏳ Kafka 重平衡风暴导致消费组卡死
- ⏳ ISR 频繁伸缩引发性能急剧下降
- ⏳ Kafka 顺序消费吞吐量下降优化实战
Kafka 集群 / 存储
- ⏳ Kafka 高水位 HW 推进不动:Leader 选举后脑裂
- ⏳ Kafka 磁盘写满:日志保留策略配置陷阱
- ⏳ Kafka 网络连接数打满排查
Kafka 运维 / 架构
- ⏳ Kafka 消费组运维:一个参数没配好集群崩了
- ⏳ Kafka 主题分区扩展引发的数据分布不均
- ⏳ Kafka 时间轮算法:心跳机制导致的性能异常
最后更新:2026-06