跳过正文

Aurora

Playbook:AWS Aurora 公网入口收紧的渐进路径——从 0.0.0.0/0 到零信任

Playbook:AWS Aurora 公网入口收紧的渐进路径——从 0.0.0.0/0 到零信任

·4126 字·20 分钟
很多团队的生产 Aurora 长期挂着 0.0.0.0/0 全协议规则,加上几条来源不明的 IP 白名单。直接删规则会立刻打断跨 Region 服务和开发者本地调试,于是收紧工作年复一年被推迟。本文给出一条工程化路径:先用 Flow Logs + Athena + CloudTrail 摸清依赖,把跨 Region 业务切到 VPC Peering + Route53 Private Hosted Zone,再用 SSM Port Forwarding 替代开发者直连,最后原子切换 SG 并清理长尾白名单。每一步都给可直接执行的脚本和 IAM Policy。覆盖 4 个真实踩到的坑。
Playbook:新建子环境的隔离 checklist——一次 ID 撞车污染 10 万条数据的事故复盘

Playbook:新建子环境的隔离 checklist——一次 ID 撞车污染 10 万条数据的事故复盘

·4626 字·22 分钟
一个共用 RabbitMQ broker、共用 Aurora cluster、自增 id 都从 1 起步的新子环境上线 24 天,向已有环境的老用户项目里灌入了约 10 万条不属于他们的消息。本文复盘事故根因(4 件套同时成立才会爆雷),对比三种隔离方案的成本与风险,给出推荐架构(独立中间件 + 共享集群 + ID 起点错开),并把 7 条强制 checklist 沉淀为新子环境上线门槛,附完整可执行的 aws cli / kubectl / SQL / Go 中间件代码。
多云中间件横向速查与跨环境隔离实战

多云中间件横向速查与跨环境隔离实战

·1781 字·9 分钟
做多云运维最容易的事就是把 AWS 那套思维原样搬到阿里云,然后在某次故障里发现选型完全错位。本文整理了一份 AWS↔阿里云中间件横向对照表,附上跨环境隔离强制 checklist 和高频运维命令速查,是我自己工作中反复回查的一份速记。