跳过正文

Kubernetes

ExternalDNS 多云 DNS 同步实战:从 Route53 到 Cloudflare 再到阿里云 DNS

ExternalDNS 多云 DNS 同步实战:从 Route53 到 Cloudflare 再到阿里云 DNS

·1206 字·6 分钟
手工在 Cloudflare 控制台点 DNS 记录这件事,随着集群和业务增长最终必然崩溃。ExternalDNS 就是把 Kubernetes 资源当 source-of-truth、DNS provider 当执行器的一个 controller。但真要用好,你得理解 txtOwnerId、policy、provider 各自的限制以及跨集群共享 zone 的几个坑。
cert-manager 生产级实战:从 Let's Encrypt 到企业内网 PKI 的完整路线

cert-manager 生产级实战:从 Let's Encrypt 到企业内网 PKI 的完整路线

·1569 字·8 分钟
cert-manager 几乎是每个 Kubernetes 集群的标配,但真正跑到生产的团队都会遇到:Let’s Encrypt 限流被打爆、通配符证书续期失败、内部服务想要私有 CA、Istio / Gateway API 的证书怎么发。这篇把一年里我在 5 个集群上做 cert-manager 运维踩过的坑写成一份实操手册。
KEDA 事件驱动弹性伸缩实战:从 HPA 的尽头到真正按业务信号扩缩

KEDA 事件驱动弹性伸缩实战:从 HPA 的尽头到真正按业务信号扩缩

·1559 字·8 分钟
HPA 只能看 CPU/内存,但生产环境真正的扩缩信号往往是 Kafka lag、RabbitMQ 队列深度、Prometheus 自定义指标、甚至 cron。本文把 KEDA 的架构、核心 CRD、常见 scaler 的坑和运维动作写成一份资深工程师的备忘录,不讲理论,只讲什么样的配置能在凌晨 3 点把你从告警里救出来。
Kubernetes 资源管理实战——QoS、ResourceQuota、VPA 体系化实践

Kubernetes 资源管理实战——QoS、ResourceQuota、VPA 体系化实践

·739 字·4 分钟
我在生产中见过太多因为资源配置不当导致的事故:不设 limits 的服务把节点内存吃光导致 OOM 驱逐、requests 设得过高导致 Pod 调度不上去、HPA 配置错误导致扩缩失灵。这篇文章把 K8s 资源管理体系从头到尾捋一遍,让你建立完整的资源治理思路。
Kubernetes 网络深度解析——CNI、kube-proxy、NetworkPolicy 完全指南

Kubernetes 网络深度解析——CNI、kube-proxy、NetworkPolicy 完全指南

·962 字·5 分钟
K8s 网络是很多工程师的知识盲区,平时不出问题就忽略,一出问题就完全不知道从哪下手。我在多次生产网络故障的排查中,深刻理解了 K8s 网络的每一层。这篇文章从 Pod 网络模型讲到 NetworkPolicy 实战,帮你建立完整的 K8s 网络知识体系。