CI/CD 流水线设计:从代码提交到自动部署的工程化实践2025-02-09·671 字·4 分钟一条好的 CI/CD 流水线不只是「能跑」,而是快、可靠、边界清晰。本文从构建缓存到 GitOps 分工,从多分支策略到故障排查,整理了在实际项目中反复用到的工程化实践。
GitLab CI/CD + Kubernetes:从代码提交到生产部署全流程2025-02-01·1044 字·5 分钟从 GitLab Runner 的 Kubernetes executor 配置,到 kaniko 替代 DinD 的镜像构建方案,再到通过更新 GitOps 仓库完成生产部署——记录一套在真实 AWS EKS 环境跑通的 CI/CD 全流程。
Jenkins + Kubernetes:动态 Agent 构建与流水线最佳实践2025-01-26·1280 字·7 分钟静态 Jenkins Slave 的资源浪费和配置混乱问题,在 Kubernetes 动态 Pod Agent 模式下得到根本解决。本文记录在真实生产环境中把 Jenkins 迁移到 K8s 的完整过程。
Kubernetes YAML 工程化:常用资源模板与生产最佳实践2025-01-19·951 字·5 分钟写好 Kubernetes YAML 不只是语法问题,更多是工程经验的沉淀。本文梳理了生产环境中常见的 YAML 反模式,并给出各类资源的完整可用模板。
运维工程师的技术成长:从执行者到架构者的路径规划2024-12-22·413 字·2 分钟运维工程师的成长不是工具的堆砌,而是认知层次的跃迁。这篇文章记录了我对这条路的观察和思考——哪些时机会让人真正进阶,哪些惯性思维会让人原地踏步。
Python 自动化运维:从脚本到完整工具的工程化实践2024-11-12·1559 字·8 分钟系统梳理 Python 运维自动化的工程化方法:boto3 操作 AWS 资源、Kubernetes Python SDK 使用、Click/Typer CLI 框架选型、数据库批量运维脚本、钉钉 Webhook 集成,以及类型注解与错误处理的实践经验。
Git 工作流实战:分支策略与团队协作规范2024-10-10·1009 字·5 分钟Git 用了五年,最大的感悟是:工作流问题本质上是团队协作问题,不是工具问题。本文对比 Git Flow / GitHub Flow / Trunk-Based 三种策略,覆盖分支命名、Commit Message、rebase 哲学、大型重构分支处理、冲突解决等高频话题。
Docker Compose 本地开发工作流:多服务环境搭建最佳实践2024-09-27·737 字·4 分钟用 Docker Compose 搭建包含数据库、缓存、消息队列的完整本地环境,配合 healthcheck 确保启动顺序、bind mount 实现热更新,还有 override 模式分离开发和生产配置。这篇文章覆盖所有关键细节和常见踩坑。
Docker 最佳实践:从 Dockerfile 到生产部署2024-09-21·731 字·4 分钟多阶段构建、.dockerignore 遗漏、非 root 运行、构建缓存优化,以及 entrypoint/cmd 信号处理这些在生产中实际踩过的问题,用具体的 Dockerfile 示例逐一拆解。
Linux 系统管理精要——DevOps 工程师必知的系统层知识2024-09-16·926 字·5 分钟做了多年 DevOps,我越来越觉得 Linux 系统层的知识是一切排障的基础。当 Kubernetes Pod 莫名被杀、Java 服务突然无响应、磁盘 IO 飙高导致整机卡顿——最终都要落到系统层来定位。这篇文章把我在生产中最常用的系统管理技能系统梳理一遍。