跳过正文

Prometheus

OpenCost 实战:Kubernetes 成本可见性与多团队费用分摊

OpenCost 实战:Kubernetes 成本可见性与多团队费用分摊

·1780 字·9 分钟
Kubernetes 成本不透明是 FinOps 落地的最大障碍。本文通过 OpenCost 构建完整的成本可见性体系,涵盖部署集成、云厂商价格接入、按团队分摊、Grafana 看板、超预算告警和自动周报推送,提供可直接复用的配置。
USE Method:系统性能分析方法论

USE Method:系统性能分析方法论

·1442 字·7 分钟
随机尝试是性能排查的大敌。USE Method 用一个三维框架(使用率/饱和度/错误)把所有系统资源纳入统一分析体系,本文从原理到实战全面解析这套方法论,并提供 K8s 环境下的 PromQL 映射和工具链速查表。
告警带图实战:Grafana Render + 钉钉推送趋势图

告警带图实战:Grafana Render + 钉钉推送趋势图

·1160 字·6 分钟
收到告警只有一行数字,还要登录 Grafana 才能看趋势图——这是告警体验最大的痛点之一。本文介绍如何将 Grafana Image Renderer 与 Alertmanager Webhook 结合,实现告警消息自动附带趋势图的完整方案。

Prometheus + Grafana + Loki 可观测性体系建设

·1780 字·9 分钟
记录在多套 K8s 集群上建立统一可观测性平台的实践经验,包含 Prometheus 采集配置、告警规则设计、Grafana Dashboard 组织方式,以及跨集群日志聚合的 Loki 部署方案。
k6 压测实战:从脚本编写到性能分析

k6 压测实战:从脚本编写到性能分析

·1091 字·6 分钟
压测不是跑一个脚本看能不能撑住,而是通过有设计的负载模型暴露系统瓶颈。本文记录了我用 k6 做生产级性能测试的完整实践:脚本设计、阈值配置、与 Grafana 集成,以及几个典型性能问题的定位过程。