Kubernetes cgroup v2 迁移实践2026-04-12·1682 字·8 分钟K8s 1.25+ 默认启用 cgroup v2,MemoryQoS 和 PSI 等新特性只在 v2 支持。本文给出完整的节点迁移操作流程和常见问题解决方案。
bpftrace 实战:线上问题排查的瑞士军刀2026-04-12·1804 字·9 分钟strace 太重、perf 太原始、BCC 工具集要装一堆依赖——bpftrace 是这三者之间的平衡点。本文用四个真实场景讲清楚 bpftrace 的工作方式,帮你把它变成日常排查工具。
ClickHouse 生产运维实战:集群部署、副本分片、性能调优与故障排查2026-03-15·4233 字·20 分钟ClickHouse 高吞吐 OLAP 能力背后有一套独特的运维范式:ReplicatedMergeTree、ZooKeeper/Keeper、分布式表、物化视图、TTL、MergeTree 家族选型。本文按生产落地路径,从集群规划、副本分片、写入优化、查询调优、物化视图到慢查询排查,配套可直接复用的 SQL 与运维脚本。
Linux 性能调优实战:CPU、内存、IO 瓶颈的系统排查方法2024-09-08·906 字·5 分钟从工具链选择到实战排查,梳理 Linux 性能调优的完整方法论:CPU 上下文切换与软中断分析、OOM 日志解读、IO 调度器选择、TCP TIME_WAIT 处理,以及容器环境下 cgroup 限制的特殊影响。