跳过正文

成本优化

Playbook:K8s 成本优化实战——Karpenter + 弹性占位 + 精细 NodePool 的组合拳

Playbook:K8s 成本优化实战——Karpenter + 弹性占位 + 精细 NodePool 的组合拳

·3782 字·18 分钟
Karpenter 不是开箱即用的省钱按钮。把它跑出真实收益,需要先做 NodePool 按 workload 分层,再处理 sandbox/gpu 这类不被 K8s 识别的工作负载,最后用 placeholder 占位 Pod 弥合「扩容慢但缩容快」的体验缺口。本文给出可直接 kubectl apply 的完整 yaml 与可 chmod +x 直接跑的脚本,覆盖安装、四类 NodePool、弹性占位、S3 Gateway Endpoint、MQ 降级、监控与告警。
Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

Playbook:AWS MSK Serverless 迁回 Provisioned——什么时候、为什么、怎么迁

·3870 字·19 分钟
MSK Serverless 看似按用量付费,实际上有一个常被忽视的最低消费层级:每个集群每月固定 $540 起、每个活跃消费者 IAM principal 还要按小时另收。对于流量长期 « 1MB/s 的非生产环境,月费可以是同等吞吐 Provisioned 集群的 5-7 倍。本文记录将 4 个非生产环境从 MSK Serverless 迁回 Provisioned(kafka.t3.small × 2)的完整流程:成本计算脚本、aws kafka create-cluster 完整 JSON、IRSA 三 role 拆分、Java/Go/Python 三栈客户端配置、双集群双写五阶段切换、Schema Registry 导出导入、回滚脚本,以及踩过的多 IRSA、sarama、broker 数不可缩、Schema Registry 漏迁五个坑。
OpenCost 实战:Kubernetes 成本可见性与多团队费用分摊

OpenCost 实战:Kubernetes 成本可见性与多团队费用分摊

·1780 字·9 分钟
Kubernetes 成本不透明是 FinOps 落地的最大障碍。本文通过 OpenCost 构建完整的成本可见性体系,涵盖部署集成、云厂商价格接入、按团队分摊、Grafana 看板、超预算告警和自动周报推送,提供可直接复用的配置。
FinOps 实践:Kubernetes 成本治理体系建设

FinOps 实践:Kubernetes 成本治理体系建设

·1316 字·7 分钟
一套完整的 Kubernetes FinOps 落地路径:如何识别僵尸资源、配置成本分摊模型、利用 Karpenter 降低节点成本,以及如何将月账单从 $50k 压到 $30k。

Karpenter 弹性节点管理实战

·1734 字·9 分钟
Karpenter 替代 Cluster Autoscaler 的完整实践:NodePool 约束配置、EC2NodeClass 实例选型、consolidation 节点整合降本、Spot 实例容错,以及多套集群配置的组织方式。
Kubernetes 成本优化实战:系统性降本的四条路径

Kubernetes 成本优化实战:系统性降本的四条路径

·1066 字·6 分钟
真实的降本案例:从发现成本异常到分析根因,通过 Karpenter 节点弹性伸缩、资源请求规格治理、大机型收敛等手段,系统性降低 AWS EC2 成本。包含具体配置和执行思路。
Karpenter 深度解析:下一代 K8s 节点自动扩缩

Karpenter 深度解析:下一代 K8s 节点自动扩缩

·842 字·4 分钟
从 Cluster Autoscaler 迁移到 Karpenter 之后,集群扩容速度和节点利用率都有明显提升。本文详细拆解 Karpenter 的核心机制、关键配置项,以及在多套生产集群运行中踩过的坑。
Descheduler 深度实战:Kubernetes 自动再平衡的正确打开方式

Descheduler 深度实战:Kubernetes 自动再平衡的正确打开方式

·1507 字·8 分钟
kube-scheduler 只在 Pod 创建那一刻做决策,之后集群状态变了它就不管了。几个月下来,你的集群会变成 hot node + cold node 混杂、同一个 Deployment 的 Pod 全挤在一个 node、failure-domain 完全失衡。Descheduler 就是把调度决策后置、周期性重新评估的那只手。