Kubernetes cgroup v2 迁移实践2026-04-12·1682 字·8 分钟K8s 1.25+ 默认启用 cgroup v2,MemoryQoS 和 PSI 等新特性只在 v2 支持。本文给出完整的节点迁移操作流程和常见问题解决方案。
从 Ingress 迁移到 Gateway API:完整实操指南2026-04-12·1429 字·7 分钟Gateway API 是 Kubernetes 官方下一代流量入口标准,解决了 Ingress 注解泛滥、跨实现不可移植等历史遗留问题。本文带你从零完成生产迁移。
Kubernetes v1.33 新特性深度解读:GA 特性全览与升级指南2026-04-12·1222 字·6 分钟Kubernetes v1.33 带来了多项重量级 GA 特性,本文深入解读 In-Place Pod Vertical Scaling、原生 Sidecar Containers、Pod Scheduling Readiness、KMS v2 加密等核心变更,并提供实际可用的配置示例和生产升级建议。
故障排查实录:Terway CRD IPAM IP 泄漏导致 Pod 无法调度2026-04-07·1002 字·5 分钟一次真实的连锁故障:节点磁盘告警 → Pod 被驱逐 → Terway IPAM IP 未正常回收 → 节点 ENI IP 耗尽 → 新 Pod 无法调度。排查链路、根因分析与修复方案完整记录。
云原生存储方案选型:EFS/EBS/OSS 实践2025-12-09·855 字·5 分钟系统梳理 AWS EBS、EFS、S3 在 Kubernetes 中的使用方式,覆盖 StorageClass 配置、动态供给、性能测试与数据备份策略,附阿里云 NAS/OSS 对比。
AWS IAM 权限管理实践2025-12-09·795 字·4 分钟从 IAM 核心概念到 IRSA/GitHub Actions OIDC 联合身份,再到权限边界与 SCP,系统梳理 AWS IAM 在生产环境的最佳实践。
AWS EKS 实战指南2025-12-09·877 字·5 分钟覆盖 EKS 核心架构、eksctl/aws cli 常用操作、IRSA 原理与配置、VPC CNI 网络限制、升级流程及常见故障排查。
Kubernetes 集群升级实践2025-12-09·1554 字·8 分钟K8s 集群升级全流程:从版本兼容性检查、etcd 备份、EKS 托管升级命令,到节点蓝绿替换、PDB 配置、pluto 工具检测废弃 API,再到常见升级问题处理。
Kubernetes 故障排查 SOP2025-12-09·1491 字·7 分钟从现象到根因的 K8s 故障排查全流程:Pod 异常状态、Node NotReady、Service 不通、存储挂载失败等场景的系统化排查方法。
Kubernetes 安全加固实践2025-12-09·1561 字·8 分钟K8s 安全加固从 Pod 到集群:SecurityContext 配置、网络策略隔离、Secret 安全管理、镜像漏洞扫描、RBAC 最小权限原则的落地实践。