跳过正文

DevOps

Playbook:CI/CD 流水线模板化——3 个标准模板覆盖 80% 服务的端到端实战

Playbook:CI/CD 流水线模板化——3 个标准模板覆盖 80% 服务的端到端实战

·5048 字·24 分钟
在 80+ 条流水线的体量下,每条服务自己拷一份 yaml 是工程债:字段命名漂移、改一次通知模板要改 80 处、新人不知道照哪条抄。本文把方案从「思路」推进到「拿来即用」:每个标准模板给完整 YAML(含 anchors / 变量组绑定 / 审批节点)、对应 GitHub Actions reusable workflow、Jenkins shared library;附 create-pipeline.sh 端到端脚本、变量组管理 API 调用、模板回归测试 dry-run;7 个云效官方文档不写的硬约束(schedule 不工作 / step envs 失效 / stage 间永远线性渲染等)每个含完整修复 + 通用结论。
Playbook:每个 PR 一个独立环境——X-env header 路由 + 三层清理保障(深度版)

Playbook:每个 PR 一个独立环境——X-env header 路由 + 三层清理保障(深度版)

·4425 字·21 分钟
QA 共享环境是并行开发的最大瓶颈。本 Playbook 给出一套已经在多个业务服务上线、跑通端到端真实代码改动验证的 PR 隔离方案:feature 分支推送即触发 deploy.py 在独立 namespace 拉起 PR Pod,入口域名继续用 QA 域名,HTTPRoute 按 X-env header 把流量切到对应 PR Pod,关闭 PR + 24h cron + 容量水位三层清理避免泄漏。本版(v2 深度版)相对 v1 重点强化了可执行性:所有 yaml 是完整 manifest(含 namespace / RBAC / Secret),所有脚本都能 chmod +x 直接跑,每步含前置 / 执行 / 验证 / 回滚四件套,配 5 个完整踩坑修复 + 2 张 mermaid 图。
Playbook:中等规模公司的完整 DevOps 流程——从代码提交到生产部署的全链路设计

Playbook:中等规模公司的完整 DevOps 流程——从代码提交到生产部署的全链路设计

·3992 字·19 分钟
中等规模公司的 DevOps 体系最常见的两个症状:工具碎片化(GitLab + Jenkins + 手工 kubectl)和阶段衔接断裂(PR 慢、合并后部署延迟、监控滞后)。本文不讲入门概念,给一份真实可落地的全流程蓝图:开发者本机 → Git 提交 → 云效 / GitHub Actions CI(含 Schema Check 双 Stage)→ ECR/ACR → GitOps 仓库自动更新镜像 tag → ArgoCD 自动 sync → K8s 多集群部署 → Prometheus + Loki + 钉钉告警。每个环节标注用什么工具具体到版本号,关键集成点(ApplicationSet / Kustomize overlay / deploy.py)给完整可执行配置,配三个真实坑(GitOps 闭环缺口、deploy.py path-mode 切换混乱、多 ArgoCD 凭据路由),并给出 DORA 风格的 before/after 对比与采集脚本。可以把这篇当成整个 Playbook 系列的目录页。
Argo Workflows 工作流实战:批处理与 ML Pipeline

Argo Workflows 工作流实战:批处理与 ML Pipeline

·2301 字·11 分钟
Argo Workflows 是 Kubernetes 原生的工作流引擎,适合批处理和 ML Pipeline 场景。本文涵盖与 Airflow/Temporal 的选型对比、核心资源模型、三个完整实战(DAG 数据处理、ML 训练 Pipeline、定时备份)、资源管控(Semaphore/Node Selector)、Argo Events 事件驱动触发,以及 Prometheus 监控和常见问题处理。
GitHub Copilot 工程化使用:不只是代码补全

GitHub Copilot 工程化使用:不只是代码补全

·488 字·3 分钟
GitHub Copilot不只是Tab补全。Copilot Chat的/fix /explain /tests命令、workspace上下文、Copilot for CLI、在Terraform/Dockerfile/K8s YAML中的实际用法,以及提高补全命中率的技巧。

Helm 使用指南:从入门到生产实践

·1312 字·7 分钟
Helm 从入门到生产实践:Chart 结构、values 覆盖、模板语法、–atomic/–wait 等生产参数,以及常用 Chart 安装示例。
Backstage 开发者门户实战:构建内部开发者平台

Backstage 开发者门户实战:构建内部开发者平台

·2146 字·11 分钟
当团队规模超过 50 人,服务数量超过 100 个,「配置漂移」和「信息孤岛」就成了真实痛点。Backstage 是解决这个问题的平台工程利器。本文从部署到定制,完整拆解如何用 Backstage 构建真正能用起来的内部开发者平台。