跳过正文

EKS

Playbook:K8s 成本优化实战——Karpenter + 弹性占位 + 精细 NodePool 的组合拳

Playbook:K8s 成本优化实战——Karpenter + 弹性占位 + 精细 NodePool 的组合拳

·3782 字·18 分钟
Karpenter 不是开箱即用的省钱按钮。把它跑出真实收益,需要先做 NodePool 按 workload 分层,再处理 sandbox/gpu 这类不被 K8s 识别的工作负载,最后用 placeholder 占位 Pod 弥合「扩容慢但缩容快」的体验缺口。本文给出可直接 kubectl apply 的完整 yaml 与可 chmod +x 直接跑的脚本,覆盖安装、四类 NodePool、弹性占位、S3 Gateway Endpoint、MQ 降级、监控与告警。

AWS EKS 实战指南

·877 字·5 分钟
覆盖 EKS 核心架构、eksctl/aws cli 常用操作、IRSA 原理与配置、VPC CNI 网络限制、升级流程及常见故障排查。

Kubernetes 集群升级实践

·1554 字·8 分钟
K8s 集群升级全流程:从版本兼容性检查、etcd 备份、EKS 托管升级命令,到节点蓝绿替换、PDB 配置、pluto 工具检测废弃 API,再到常见升级问题处理。
AWS EKS 生产实践:网络、安全与多集群管理

AWS EKS 生产实践:网络、安全与多集群管理

·792 字·4 分钟
管理多套 EKS 集群两年下来,踩了不少坑。本文系统整理网络选型、IAM 权限、节点管理、集群升级、安全加固和成本控制这六个核心话题,每个话题都有具体配置示例和实际遇到的问题。
Kubernetes 集群升级策略:零停机升级的完整实践指南

Kubernetes 集群升级策略:零停机升级的完整实践指南

·855 字·5 分钟
K8s 集群升级听起来简单,实际操作中坑很多:API 弃用导致的 Helm 失败、Admission Webhook 拦截升级流量、PDB 配置不当导致服务中断。这篇文章从真实的升级经验出发,给出一套可复用的零停机升级方案。