跳过正文

运维

Go 错误处理最佳实践

·1830 字·9 分钟
在运维工具中正确处理错误:错误包装与解包、可重试判断、统一错误输出格式、带上下文的错误信息,避免常见的错误处理反模式

Go 标准库速查:运维工程师常用

·1761 字·9 分钟
不查文档快速写出对的代码——整理了运维场景最常用的 Go 标准库用法,每节都是可直接复制的代码片段

kubectl 命令速查手册

·2472 字·12 分钟
kubectl 实用命令手册,按场景分类整理,涵盖资源查看、Pod调试、日志查看、滚动更新、扩缩容、强制删除等高频操作。

Shell 脚本运维速查手册

·2585 字·13 分钟
Shell 运维速查手册,包含文本处理(awk/sed/grep)、进程排查、网络诊断、批量操作模板,以及实用的脚本编写规范。
如何设计一个好的告警体系

如何设计一个好的告警体系

·570 字·3 分钟
从真实的告警噪音泛滥经历出发,分享如何用 SLI/SLO 重新设计告警体系,包括告警分级、规则设计原则、路由策略和复盘机制。