<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>Kafka on 黄文卓 | DevOps Engineer</title><link>https://socake.github.io/tags/kafka/</link><description>Recent content in Kafka on 黄文卓 | DevOps Engineer</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>17691281867@163.com (Wenzhuo Huang)</managingEditor><webMaster>17691281867@163.com (Wenzhuo Huang)</webMaster><copyright>© 2026 Wenzhuo Huang</copyright><lastBuildDate>Thu, 30 Apr 2026 13:30:00 +0800</lastBuildDate><atom:link href="https://socake.github.io/tags/kafka/index.xml" rel="self" type="application/rss+xml"/><item><title>Playbook：AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁</title><link>https://socake.github.io/playbook/msk-serverless-to-provisioned/</link><pubDate>Thu, 30 Apr 2026 13:30:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/playbook/msk-serverless-to-provisioned/</guid><description>MSK Serverless 看似按用量付费，实际上有一个常被忽视的最低消费层级：每个集群每月固定 $540 起、每个活跃消费者 IAM principal 还要按小时另收。对于流量长期 &amp;laquo; 1MB/s 的非生产环境，月费可以是同等吞吐 Provisioned 集群的 5-7 倍。本文记录将 4 个非生产环境从 MSK Serverless 迁回 Provisioned（kafka.t3.small × 2）的完整流程：成本计算脚本、aws kafka create-cluster 完整 JSON、IRSA 三 role 拆分、Java/Go/Python 三栈客户端配置、双集群双写五阶段切换、Schema Registry 导出导入、回滚脚本，以及踩过的多 IRSA、sarama、broker 数不可缩、Schema Registry 漏迁五个坑。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/playbook/msk-serverless-to-provisioned/featured.jpg"/></item><item><title>Playbook：新建子环境的隔离 checklist——一次 ID 撞车污染 10 万条数据的事故复盘</title><link>https://socake.github.io/playbook/multi-environment-isolation-checklist/</link><pubDate>Thu, 30 Apr 2026 11:30:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/playbook/multi-environment-isolation-checklist/</guid><description>一个共用 RabbitMQ broker、共用 Aurora cluster、自增 id 都从 1 起步的新子环境上线 24 天，向已有环境的老用户项目里灌入了约 10 万条不属于他们的消息。本文复盘事故根因（4 件套同时成立才会爆雷），对比三种隔离方案的成本与风险，给出推荐架构（独立中间件 + 共享集群 + ID 起点错开），并把 7 条强制 checklist 沉淀为新子环境上线门槛，附完整可执行的 aws cli / kubectl / SQL / Go 中间件代码。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/playbook/multi-environment-isolation-checklist/featured.jpg"/></item><item><title>多云中间件横向速查与跨环境隔离实战</title><link>https://socake.github.io/posts/multi-cloud-middleware-and-isolation/</link><pubDate>Sat, 18 Apr 2026 13:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/multi-cloud-middleware-and-isolation/</guid><description>做多云运维最容易的事就是把 AWS 那套思维原样搬到阿里云，然后在某次故障里发现选型完全错位。本文整理了一份 AWS↔阿里云中间件横向对照表，附上跨环境隔离强制 checklist 和高频运维命令速查，是我自己工作中反复回查的一份速记。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/multi-cloud-middleware-and-isolation/featured.jpg"/></item><item><title>Kafka 运维实战：消息堆积排查、分区再平衡与监控体系</title><link>https://socake.github.io/posts/kafka-ops-practice/</link><pubDate>Mon, 07 Apr 2025 11:37:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/kafka-ops-practice/</guid><description>系统梳理 Kafka 运维核心技能：消费者延迟监控告警、消息堆积根因分析、分区扩容规划、Rebalance 风暴处理，以及 KEDA 基于 lag 自动扩缩的配置实践。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/kafka-ops-practice/featured.jpg"/></item><item><title>Zookeeper 运维实战：集群部署、调优与故障排查</title><link>https://socake.github.io/posts/zookeeper-ops-practice/</link><pubDate>Wed, 05 Mar 2025 11:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/zookeeper-ops-practice/</guid><description>系统梳理 Zookeeper 生产运维核心技能：ZNode 类型与 Watcher 机制、ZAB 选举算法、3/5 节点集群部署配置、JVM 与 zoo.cfg 调优、四字命令实战诊断、常见故障处理，以及与 Kafka KRaft 模式的关系和云原生场景下的定位。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/zookeeper-ops-practice/featured.jpg"/></item></channel></rss>