跳过正文

AWS

Playbook:AWS Aurora 公网入口收紧的渐进路径——从 0.0.0.0/0 到零信任

Playbook:AWS Aurora 公网入口收紧的渐进路径——从 0.0.0.0/0 到零信任

·4126 字·20 分钟
很多团队的生产 Aurora 长期挂着 0.0.0.0/0 全协议规则,加上几条来源不明的 IP 白名单。直接删规则会立刻打断跨 Region 服务和开发者本地调试,于是收紧工作年复一年被推迟。本文给出一条工程化路径:先用 Flow Logs + Athena + CloudTrail 摸清依赖,把跨 Region 业务切到 VPC Peering + Route53 Private Hosted Zone,再用 SSM Port Forwarding 替代开发者直连,最后原子切换 SG 并清理长尾白名单。每一步都给可直接执行的脚本和 IAM Policy。覆盖 4 个真实踩到的坑。
Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

·3870 字·19 分钟
MSK Serverless 看似按用量付费,实际上有一个常被忽视的最低消费层级:每个集群每月固定 $540 起、每个活跃消费者 IAM principal 还要按小时另收。对于流量长期 « 1MB/s 的非生产环境,月费可以是同等吞吐 Provisioned 集群的 5-7 倍。本文记录将 4 个非生产环境从 MSK Serverless 迁回 Provisioned(kafka.t3.small × 2)的完整流程:成本计算脚本、aws kafka create-cluster 完整 JSON、IRSA 三 role 拆分、Java/Go/Python 三栈客户端配置、双集群双写五阶段切换、Schema Registry 导出导入、回滚脚本,以及踩过的多 IRSA、sarama、broker 数不可缩、Schema Registry 漏迁五个坑。
多云中间件横向速查与跨环境隔离实战

多云中间件横向速查与跨环境隔离实战

·1781 字·9 分钟
做多云运维最容易的事就是把 AWS 那套思维原样搬到阿里云,然后在某次故障里发现选型完全错位。本文整理了一份 AWS↔阿里云中间件横向对照表,附上跨环境隔离强制 checklist 和高频运维命令速查,是我自己工作中反复回查的一份速记。

云原生存储方案选型:EFS/EBS/OSS 实践

·855 字·5 分钟
系统梳理 AWS EBS、EFS、S3 在 Kubernetes 中的使用方式,覆盖 StorageClass 配置、动态供给、性能测试与数据备份策略,附阿里云 NAS/OSS 对比。

AWS IAM 权限管理实践

·795 字·4 分钟
从 IAM 核心概念到 IRSA/GitHub Actions OIDC 联合身份,再到权限边界与 SCP,系统梳理 AWS IAM 在生产环境的最佳实践。

AWS EKS 实战指南

·877 字·5 分钟
覆盖 EKS 核心架构、eksctl/aws cli 常用操作、IRSA 原理与配置、VPC CNI 网络限制、升级流程及常见故障排查。

Karpenter 弹性节点管理实战

·1734 字·9 分钟
Karpenter 替代 Cluster Autoscaler 的完整实践:NodePool 约束配置、EC2NodeClass 实例选型、consolidation 节点整合降本、Spot 实例容错,以及多套集群配置的组织方式。
AWS EKS 生产实践:网络、安全与多集群管理

AWS EKS 生产实践:网络、安全与多集群管理

·792 字·4 分钟
管理多套 EKS 集群两年下来,踩了不少坑。本文系统整理网络选型、IAM 权限、节点管理、集群升级、安全加固和成本控制这六个核心话题,每个话题都有具体配置示例和实际遇到的问题。