跳过正文

中间件

Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

·3870 字·19 分钟
MSK Serverless 看似按用量付费,实际上有一个常被忽视的最低消费层级:每个集群每月固定 $540 起、每个活跃消费者 IAM principal 还要按小时另收。对于流量长期 « 1MB/s 的非生产环境,月费可以是同等吞吐 Provisioned 集群的 5-7 倍。本文记录将 4 个非生产环境从 MSK Serverless 迁回 Provisioned(kafka.t3.small × 2)的完整流程:成本计算脚本、aws kafka create-cluster 完整 JSON、IRSA 三 role 拆分、Java/Go/Python 三栈客户端配置、双集群双写五阶段切换、Schema Registry 导出导入、回滚脚本,以及踩过的多 IRSA、sarama、broker 数不可缩、Schema Registry 漏迁五个坑。
Nacos 一文通:从零基础到生产精通的配置中心与服务发现实战

Nacos 一文通:从零基础到生产精通的配置中心与服务发现实战

·1624 字·8 分钟
Nacos 同时承担配置中心和服务注册发现两个核心职责,是 Spring Cloud Alibaba 生态的基石。本文系统梳理 Nacos 的数据模型、一致性协议、长轮询推送机制、临时实例健康检查、生产集群部署、多语言 SDK 接入、灰度发布、权限控制、常见故障排查(配置不生效/密码漂移/集群脑裂)以及云原生时代的定位,适合从入门到生产运维的完整参考。
RabbitMQ 运维实战:集群部署、消费者可靠性与监控体系

RabbitMQ 运维实战:集群部署、消费者可靠性与监控体系

·1852 字·9 分钟
系统梳理 RabbitMQ 运维核心技能:Quorum Queue 集群部署与镜像队列对比、生产配置调优、消费者 prefetch 与死信队列配置、基于 Management API 和 rabbitmq_exporter 的监控体系,以及消息堆积、脑裂等常见故障的处理方案。
Zookeeper 运维实战:集群部署、调优与故障排查

Zookeeper 运维实战:集群部署、调优与故障排查

·2381 字·12 分钟
系统梳理 Zookeeper 生产运维核心技能:ZNode 类型与 Watcher 机制、ZAB 选举算法、3/5 节点集群部署配置、JVM 与 zoo.cfg 调优、四字命令实战诊断、常见故障处理,以及与 Kafka KRaft 模式的关系和云原生场景下的定位。