Linux

DevOps/运维工程师面试题精选:K8s、Linux、网络高频考点
·1287 字·7 分钟
基于真实面试经验整理的运维/DevOps 面试题,覆盖 K8s 调度、故障排查、Linux 内核、网络协议等方向,附「面试官真正想考的点」,帮你把答案说到位。

TCP/IP 网络排障:抓包与连接问题诊断
·1238 字·6 分钟
网络问题排查的核心是「眼见为实」,没有抓包的排障都是猜测。本文系统梳理了 tcpdump 的实战用法、TCP 连接状态机分析、conntrack 追踪,以及 Kubernetes 中 NodePort/LoadBalancer 的典型网络故障定位方法。

Nginx 运维完全指南:反向代理、负载均衡、HTTPS 与限流
·1102 字·6 分钟
Nginx 知道怎么装,但真的会用吗?本文从配置结构说起,完整覆盖反向代理、负载均衡策略、Let’s Encrypt 证书、限流配置、日志分析和性能调优,附常见 502/SSL 故障排查。

Shell 脚本实战:Bash 自动化运维从入门到工程化
·1697 字·8 分钟
Shell 脚本是 SRE 的第一生产力工具。本文从语法精要出发,覆盖批量操作、日志轮转、健康检查等常用运维模式,再到 getopts、trap 信号处理和脚本工程化思路,最后总结引号地狱、变量作用域等经典踩坑。

Linux 系统管理精要——DevOps 工程师必知的系统层知识
·926 字·5 分钟
做了多年 DevOps,我越来越觉得 Linux 系统层的知识是一切排障的基础。当 Kubernetes Pod 莫名被杀、Java 服务突然无响应、磁盘 IO 飙高导致整机卡顿——最终都要落到系统层来定位。这篇文章把我在生产中最常用的系统管理技能系统梳理一遍。

Linux 性能调优实战:CPU、内存、IO 瓶颈的系统排查方法
·906 字·5 分钟
从工具链选择到实战排查,梳理 Linux 性能调优的完整方法论:CPU 上下文切换与软中断分析、OOM 日志解读、IO 调度器选择、TCP TIME_WAIT 处理,以及容器环境下 cgroup 限制的特殊影响。
