<?xml version="1.0" encoding="utf-8" standalone="yes"?><rss version="2.0" xmlns:atom="http://www.w3.org/2005/Atom"><channel><title>DevOps on 黄文卓 | DevOps Engineer</title><link>https://socake.github.io/tags/devops/</link><description>Recent content in DevOps on 黄文卓 | DevOps Engineer</description><generator>Hugo -- gohugo.io</generator><language>zh-CN</language><managingEditor>17691281867@163.com (Wenzhuo Huang)</managingEditor><webMaster>17691281867@163.com (Wenzhuo Huang)</webMaster><copyright>© 2026 Wenzhuo Huang</copyright><lastBuildDate>Thu, 30 Apr 2026 12:00:00 +0800</lastBuildDate><atom:link href="https://socake.github.io/tags/devops/index.xml" rel="self" type="application/rss+xml"/><item><title>Playbook：CI/CD 流水线模板化——3 个标准模板覆盖 80% 服务的端到端实战</title><link>https://socake.github.io/playbook/cicd-pipeline-templating/</link><pubDate>Thu, 30 Apr 2026 12:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/playbook/cicd-pipeline-templating/</guid><description>在 80+ 条流水线的体量下，每条服务自己拷一份 yaml 是工程债：字段命名漂移、改一次通知模板要改 80 处、新人不知道照哪条抄。本文把方案从「思路」推进到「拿来即用」：每个标准模板给完整 YAML（含 anchors / 变量组绑定 / 审批节点）、对应 GitHub Actions reusable workflow、Jenkins shared library；附 create-pipeline.sh 端到端脚本、变量组管理 API 调用、模板回归测试 dry-run；7 个云效官方文档不写的硬约束（schedule 不工作 / step envs 失效 / stage 间永远线性渲染等）每个含完整修复 + 通用结论。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/playbook/cicd-pipeline-templating/featured.jpg"/></item><item><title>Playbook：每个 PR 一个独立环境——X-env header 路由 + 三层清理保障（深度版）</title><link>https://socake.github.io/playbook/per-pr-isolated-environment/</link><pubDate>Thu, 30 Apr 2026 11:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/playbook/per-pr-isolated-environment/</guid><description>QA 共享环境是并行开发的最大瓶颈。本 Playbook 给出一套已经在多个业务服务上线、跑通端到端真实代码改动验证的 PR 隔离方案：feature 分支推送即触发 deploy.py 在独立 namespace 拉起 PR Pod，入口域名继续用 QA 域名，HTTPRoute 按 X-env header 把流量切到对应 PR Pod，关闭 PR + 24h cron + 容量水位三层清理避免泄漏。本版（v2 深度版）相对 v1 重点强化了可执行性：所有 yaml 是完整 manifest（含 namespace / RBAC / Secret），所有脚本都能 chmod +x 直接跑，每步含前置 / 执行 / 验证 / 回滚四件套，配 5 个完整踩坑修复 + 2 张 mermaid 图。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/playbook/per-pr-isolated-environment/featured.jpg"/></item><item><title>Playbook：中等规模公司的完整 DevOps 流程——从代码提交到生产部署的全链路设计</title><link>https://socake.github.io/playbook/end-to-end-devops-pipeline/</link><pubDate>Thu, 30 Apr 2026 10:30:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/playbook/end-to-end-devops-pipeline/</guid><description>中等规模公司的 DevOps 体系最常见的两个症状：工具碎片化（GitLab + Jenkins + 手工 kubectl）和阶段衔接断裂（PR 慢、合并后部署延迟、监控滞后）。本文不讲入门概念，给一份真实可落地的全流程蓝图：开发者本机 → Git 提交 → 云效 / GitHub Actions CI（含 Schema Check 双 Stage）→ ECR/ACR → GitOps 仓库自动更新镜像 tag → ArgoCD 自动 sync → K8s 多集群部署 → Prometheus + Loki + 钉钉告警。每个环节标注用什么工具具体到版本号，关键集成点（ApplicationSet / Kustomize overlay / deploy.py）给完整可执行配置，配三个真实坑（GitOps 闭环缺口、deploy.py path-mode 切换混乱、多 ArgoCD 凭据路由），并给出 DORA 风格的 before/after 对比与采集脚本。可以把这篇当成整个 Playbook 系列的目录页。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/playbook/end-to-end-devops-pipeline/featured.jpg"/></item><item><title>Argo Workflows 工作流实战：批处理与 ML Pipeline</title><link>https://socake.github.io/posts/argo-workflows-practice/</link><pubDate>Sun, 12 Apr 2026 11:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/argo-workflows-practice/</guid><description>Argo Workflows 是 Kubernetes 原生的工作流引擎，适合批处理和 ML Pipeline 场景。本文涵盖与 Airflow/Temporal 的选型对比、核心资源模型、三个完整实战（DAG 数据处理、ML 训练 Pipeline、定时备份）、资源管控（Semaphore/Node Selector）、Argo Events 事件驱动触发，以及 Prometheus 监控和常见问题处理。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/argo-workflows-practice/featured.jpg"/></item><item><title>GitHub Copilot 工程化使用：不只是代码补全</title><link>https://socake.github.io/posts/github-copilot-engineering/</link><pubDate>Sat, 28 Mar 2026 12:51:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/github-copilot-engineering/</guid><description>GitHub Copilot不只是Tab补全。Copilot Chat的/fix /explain /tests命令、workspace上下文、Copilot for CLI、在Terraform/Dockerfile/K8s YAML中的实际用法，以及提高补全命中率的技巧。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/github-copilot-engineering/featured.jpg"/></item><item><title>高级运维/DevOps 工程师面试题精选：系统设计与深度考察</title><link>https://socake.github.io/posts/devops-senior-interview/</link><pubDate>Thu, 11 Dec 2025 12:51:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/devops-senior-interview/</guid><description>高级运维面试考什么？本文整理 5 道系统设计题和 10 道深度技术题，每题给出答题框架。从监控体系设计到 K8s 调度器原理，从生产事故复盘到新技术引入决策，帮你建立完整的回答思路。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/devops-senior-interview/featured.jpg"/></item><item><title>Helm 使用指南：从入门到生产实践</title><link>https://socake.github.io/docs/kubernetes/helm%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/</link><pubDate>Tue, 09 Dec 2025 11:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/docs/kubernetes/helm%E4%BD%BF%E7%94%A8%E6%8C%87%E5%8D%97/</guid><description>Helm 从入门到生产实践：Chart 结构、values 覆盖、模板语法、&amp;ndash;atomic/&amp;ndash;wait 等生产参数，以及常用 Chart 安装示例。</description></item><item><title>DevOps/运维工程师面试题精选：K8s、Linux、网络高频考点</title><link>https://socake.github.io/posts/devops-interview-questions/</link><pubDate>Sun, 07 Dec 2025 13:07:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/devops-interview-questions/</guid><description>基于真实面试经验整理的运维/DevOps 面试题，覆盖 K8s 调度、故障排查、Linux 内核、网络协议等方向，附「面试官真正想考的点」，帮你把答案说到位。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/devops-interview-questions/featured.jpg"/></item><item><title>基础设施即代码：Terraform 入门与实践</title><link>https://socake.github.io/posts/%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD%E5%8D%B3%E4%BB%A3%E7%A0%81/</link><pubDate>Sun, 30 Nov 2025 09:44:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD%E5%8D%B3%E4%BB%A3%E7%A0%81/</guid><description>从 IaC 解决的本质问题出发，系统介绍 Terraform 的核心概念和工作流，重点覆盖 State 管理、模块化最佳实践，以及常见陷阱。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/%E5%9F%BA%E7%A1%80%E8%AE%BE%E6%96%BD%E5%8D%B3%E4%BB%A3%E7%A0%81/featured.jpg"/></item><item><title>Backstage 开发者门户实战：构建内部开发者平台</title><link>https://socake.github.io/posts/backstage-developer-portal/</link><pubDate>Fri, 12 Sep 2025 10:00:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/backstage-developer-portal/</guid><description>当团队规模超过 50 人，服务数量超过 100 个，「配置漂移」和「信息孤岛」就成了真实痛点。Backstage 是解决这个问题的平台工程利器。本文从部署到定制，完整拆解如何用 Backstage 构建真正能用起来的内部开发者平台。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/backstage-developer-portal/featured.jpg"/></item><item><title>云原生转型实践：从传统运维到 K8s 的迁移经验</title><link>https://socake.github.io/posts/%E4%BA%91%E5%8E%9F%E7%94%9F%E8%BD%AC%E5%9E%8B%E7%BB%8F%E9%AA%8C/</link><pubDate>Thu, 14 Aug 2025 12:56:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/%E4%BA%91%E5%8E%9F%E7%94%9F%E8%BD%AC%E5%9E%8B%E7%BB%8F%E9%AA%8C/</guid><description>这是一篇个人经验向的文章，记录了从传统虚拟机运维转向 Kubernetes 的全过程：为什么要迁移、迁移中踩了哪些坑、团队如何度过学习曲线，以及回头看哪些事情当时做对了。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/%E4%BA%91%E5%8E%9F%E7%94%9F%E8%BD%AC%E5%9E%8B%E7%BB%8F%E9%AA%8C/featured.jpg"/></item><item><title>平台工程实践：构建 Internal Developer Platform</title><link>https://socake.github.io/posts/platform-engineering-practice/</link><pubDate>Sun, 10 Aug 2025 09:44:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/platform-engineering-practice/</guid><description>平台工程不是给 DevOps 换个名字，而是把基础设施能力产品化——让开发者像用 SaaS 一样消费平台能力。这篇文章记录我们团队从 0 到 MVP 的六个月实践，包括 Backstage 落地、黄金路径设计、以及用 DORA 指标验证平台价值。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/platform-engineering-practice/featured.jpg"/></item><item><title>DORA 指标与平台工程效能度量：用数据驱动 DevOps 改进</title><link>https://socake.github.io/posts/dora-metrics-platform-engineering/</link><pubDate>Sat, 12 Jul 2025 12:27:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/dora-metrics-platform-engineering/</guid><description>DORA 四个指标不是考核工具，是诊断工具。从 CI/CD 流水线和 Incident 系统采集数据，找到部署频率低、前置时间长的真实原因，然后用平台工程手段系统性改进。本文给出采集方案、Grafana 看板设计和常见误用陷阱。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/dora-metrics-platform-engineering/featured.jpg"/></item><item><title>OpenTofu 实战：开源 Terraform 管理 AWS 和阿里云基础设施</title><link>https://socake.github.io/posts/opentofu-terraform-practice/</link><pubDate>Wed, 18 Jun 2025 11:01:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/opentofu-terraform-practice/</guid><description>Terraform 改协议了，OpenTofu 是开源的替代。本文介绍 OpenTofu 核心概念，并给出创建 AWS EKS 和阿里云 ACK 的完整配置示例，以及 State 管理、Module 复用和 Atlantis GitOps 集成方案。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/opentofu-terraform-practice/featured.jpg"/></item><item><title>Helm 工程化实践：从 Chart 设计到多环境管理</title><link>https://socake.github.io/posts/helm-engineering-practice/</link><pubDate>Sat, 14 Jun 2025 10:20:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/helm-engineering-practice/</guid><description>基于生产踩坑经验，系统梳理 Helm Chart 结构设计、_helpers.tpl 复用技巧、多环境 values 管理策略、私有 Harbor 仓库推送流程，以及 &amp;ndash;atomic 升级与回滚的正确姿势。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/helm-engineering-practice/featured.jpg"/></item><item><title>GitOps 落地实战：ArgoCD + Kustomize 多环境管理</title><link>https://socake.github.io/posts/gitops-argocd/</link><pubDate>Tue, 03 Jun 2025 09:17:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/gitops-argocd/</guid><description>GitOps 不只是「把配置放 Git 里」，真正落地需要解决 overlay 结构设计、ApplicationSet 管理多集群、image updater 自动化，以及 sync wave、resource hook 这些细节。这篇文章记录我们团队从传统 CI/CD 迁移到 GitOps 的实际过程。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/gitops-argocd/featured.jpg"/></item><item><title>业务上云实战：传统应用容器化迁移的踩坑与经验</title><link>https://socake.github.io/posts/kubernetes-migration-practice/</link><pubDate>Mon, 19 May 2025 12:36:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/kubernetes-migration-practice/</guid><description>把一批跑在虚拟机上的 Java 应用迁移到 Kubernetes，踩过的坑比想象中多。本文记录整个迁移过程的关键决策和教训。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/kubernetes-migration-practice/featured.jpg"/></item><item><title>从 Nginx Ingress 迁移到 Traefik：为什么换，怎么换</title><link>https://socake.github.io/posts/traefik-vs-nginx-ingress/</link><pubDate>Sun, 27 Apr 2025 12:56:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/traefik-vs-nginx-ingress/</guid><description>从实际痛点出发，讲清楚 Traefik 和 Nginx Ingress 的本质区别，给出可直接参考的迁移路径和配置示例。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/traefik-vs-nginx-ingress/featured.jpg"/></item><item><title>Harbor 镜像仓库生产运维：高可用、安全扫描与 CI/CD 集成</title><link>https://socake.github.io/posts/harbor-registry-ops/</link><pubDate>Tue, 18 Feb 2025 09:30:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/harbor-registry-ops/</guid><description>从 Harbor 架构原理出发，系统梳理生产环境中高可用部署方案、镜像安全扫描策略、跨区域复制配置、权限体系设计，以及与 Jenkins/GitLab CI 的集成实践，附故障排查手册与 Prometheus 监控配置。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/harbor-registry-ops/featured.jpg"/></item><item><title>Ansible 批量运维自动化：从临时命令到 Role 工程化</title><link>https://socake.github.io/posts/ansible-ops-automation/</link><pubDate>Wed, 12 Feb 2025 12:06:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/ansible-ops-automation/</guid><description>Ansible 无 Agent、SSH 推送、幂等性三大特性让它成为 Linux 批量运维的利器。本文从入门用法到 Role 工程化实践，梳理了日常运维中高频场景的完整操作思路和踩坑经验。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/ansible-ops-automation/featured.jpg"/></item><item><title>CI/CD 流水线设计：从代码提交到自动部署的工程化实践</title><link>https://socake.github.io/posts/cicd-pipeline-design/</link><pubDate>Sun, 09 Feb 2025 09:17:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/cicd-pipeline-design/</guid><description>一条好的 CI/CD 流水线不只是「能跑」，而是快、可靠、边界清晰。本文从构建缓存到 GitOps 分工，从多分支策略到故障排查，整理了在实际项目中反复用到的工程化实践。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/cicd-pipeline-design/featured.jpg"/></item><item><title>GitLab CI/CD + Kubernetes：从代码提交到生产部署全流程</title><link>https://socake.github.io/posts/gitlab-ci-kubernetes/</link><pubDate>Sat, 01 Feb 2025 11:01:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/gitlab-ci-kubernetes/</guid><description>从 GitLab Runner 的 Kubernetes executor 配置，到 kaniko 替代 DinD 的镜像构建方案，再到通过更新 GitOps 仓库完成生产部署——记录一套在真实 AWS EKS 环境跑通的 CI/CD 全流程。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/gitlab-ci-kubernetes/featured.jpg"/></item><item><title>Jenkins + Kubernetes：动态 Agent 构建与流水线最佳实践</title><link>https://socake.github.io/posts/jenkins-kubernetes-cicd/</link><pubDate>Sun, 26 Jan 2025 13:03:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/jenkins-kubernetes-cicd/</guid><description>静态 Jenkins Slave 的资源浪费和配置混乱问题，在 Kubernetes 动态 Pod Agent 模式下得到根本解决。本文记录在真实生产环境中把 Jenkins 迁移到 K8s 的完整过程。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/jenkins-kubernetes-cicd/featured.jpg"/></item><item><title>Kubernetes YAML 工程化：常用资源模板与生产最佳实践</title><link>https://socake.github.io/posts/kubernetes-yaml-patterns/</link><pubDate>Sun, 19 Jan 2025 09:56:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/kubernetes-yaml-patterns/</guid><description>写好 Kubernetes YAML 不只是语法问题，更多是工程经验的沉淀。本文梳理了生产环境中常见的 YAML 反模式，并给出各类资源的完整可用模板。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/kubernetes-yaml-patterns/featured.jpg"/></item><item><title>运维工程师的技术成长：从执行者到架构者的路径规划</title><link>https://socake.github.io/posts/devops-career-growth/</link><pubDate>Sun, 22 Dec 2024 09:52:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/devops-career-growth/</guid><description>运维工程师的成长不是工具的堆砌，而是认知层次的跃迁。这篇文章记录了我对这条路的观察和思考——哪些时机会让人真正进阶，哪些惯性思维会让人原地踏步。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/devops-career-growth/featured.jpg"/></item><item><title>Python 自动化运维：从脚本到完整工具的工程化实践</title><link>https://socake.github.io/posts/python-devops-automation/</link><pubDate>Tue, 12 Nov 2024 11:01:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/python-devops-automation/</guid><description>系统梳理 Python 运维自动化的工程化方法：boto3 操作 AWS 资源、Kubernetes Python SDK 使用、Click/Typer CLI 框架选型、数据库批量运维脚本、钉钉 Webhook 集成，以及类型注解与错误处理的实践经验。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/python-devops-automation/featured.jpg"/></item><item><title>Git 工作流实战：分支策略与团队协作规范</title><link>https://socake.github.io/posts/git-workflow-practice/</link><pubDate>Thu, 10 Oct 2024 11:01:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/git-workflow-practice/</guid><description>Git 用了五年，最大的感悟是：工作流问题本质上是团队协作问题，不是工具问题。本文对比 Git Flow / GitHub Flow / Trunk-Based 三种策略，覆盖分支命名、Commit Message、rebase 哲学、大型重构分支处理、冲突解决等高频话题。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/git-workflow-practice/featured.jpg"/></item><item><title>Docker Compose 本地开发工作流：多服务环境搭建最佳实践</title><link>https://socake.github.io/posts/docker-compose-dev-workflow/</link><pubDate>Fri, 27 Sep 2024 12:36:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/docker-compose-dev-workflow/</guid><description>用 Docker Compose 搭建包含数据库、缓存、消息队列的完整本地环境，配合 healthcheck 确保启动顺序、bind mount 实现热更新，还有 override 模式分离开发和生产配置。这篇文章覆盖所有关键细节和常见踩坑。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/docker-compose-dev-workflow/featured.jpg"/></item><item><title>Docker 最佳实践：从 Dockerfile 到生产部署</title><link>https://socake.github.io/posts/docker-best-practices/</link><pubDate>Sat, 21 Sep 2024 09:56:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/docker-best-practices/</guid><description>多阶段构建、.dockerignore 遗漏、非 root 运行、构建缓存优化，以及 entrypoint/cmd 信号处理这些在生产中实际踩过的问题，用具体的 Dockerfile 示例逐一拆解。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/docker-best-practices/featured.jpg"/></item><item><title>Linux 系统管理精要——DevOps 工程师必知的系统层知识</title><link>https://socake.github.io/posts/linux-system-admin-devops/</link><pubDate>Mon, 16 Sep 2024 13:36:00 +0800</pubDate><author>17691281867@163.com (Wenzhuo Huang)</author><guid>https://socake.github.io/posts/linux-system-admin-devops/</guid><description>做了多年 DevOps，我越来越觉得 Linux 系统层的知识是一切排障的基础。当 Kubernetes Pod 莫名被杀、Java 服务突然无响应、磁盘 IO 飙高导致整机卡顿——最终都要落到系统层来定位。这篇文章把我在生产中最常用的系统管理技能系统梳理一遍。</description><media:content xmlns:media="http://search.yahoo.com/mrss/" url="https://socake.github.io/posts/linux-system-admin-devops/featured.jpg"/></item></channel></rss>