Terragrunt 规模化 Terraform 工程化:从 DRY 到 Stacks2026-02-14·1459 字·7 分钟Terraform 写到 10 个 state 以上就开始痛苦:重复的 provider 配置、散落的变量、无法跨 state 引用、run-all 时的依赖混乱。Terragrunt 是 Terraform 的 wrapper,解决的就是’大规模’这个字——本文讲清楚它怎么用。
Pulumi vs Terraform vs OpenTofu:2026 年 IaC 选型深度对比2026-02-09·1473 字·7 分钟2023 年之后 IaC 世界变了:HashiCorp 把 Terraform 改成 BSL,Linux Foundation 接管了 OpenTofu。Pulumi 依然在代码式 IaC 的路上坚持。团队选型时面对的不是 Terraform 一家独大,而是三条技术路线的真实对比。本文试图给出一个不偏不倚的答案。
OpenTofu 实战:开源 Terraform 管理 AWS 和阿里云基础设施2025-06-18·1106 字·6 分钟Terraform 改协议了,OpenTofu 是开源的替代。本文介绍 OpenTofu 核心概念,并给出创建 AWS EKS 和阿里云 ACK 的完整配置示例,以及 State 管理、Module 复用和 Atlantis GitOps 集成方案。
Cluster API 实战:用声明式的方式管理 Kubernetes 集群的生命周期2025-04-05·1629 字·8 分钟用 Terraform 建集群是起手式,但集群一旦多起来 Terraform 的代码量和状态管理开始爆炸。Cluster API 把’集群’本身做成了 Kubernetes CRD——你在 Management Cluster 里 kubectl apply 一个 Cluster 对象,就能得到一个新集群。这是 Kubernetes 治理 Kubernetes 的一种优雅解法。
KubeVirt 生产实战:在 Kubernetes 上跑虚拟机的完整路线2025-03-29·1682 字·8 分钟Broadcom 吃掉 VMware 之后,VMware 替代方案成了所有基础设施团队的议题。KubeVirt 1.8 已经是个相当成熟的选择,能在 Kubernetes 里跑真正的 VM——不是轻量容器、不是 microVM,是完整的 Windows/Linux VM。这是一年多的实战笔记。
Consul 服务注册与发现:从入门到生产级健康检查2025-02-18·1023 字·5 分钟微服务时代,动态 IP 和服务健康状态管理是绕不过去的问题。Consul 提供了一套完整的服务发现解决方案,本文从实操角度梳理其核心用法和生产踩坑。