gRPC 微服务实践:协议、负载均衡与 Kubernetes 集成2026-04-12·1612 字·8 分钟从协议原理到 Kubernetes 生产落地,系统梳理 gRPC 微服务的核心实践:Protobuf 向后兼容设计、拦截器链(日志/限流/OTel)、长连接负载不均问题(headless Service + round_robin vs Envoy L7)、健康检查 Probe 配置、以及 grpc-gateway REST 共存方案。
OpenTelemetry 落地实践:统一采集 Traces、Metrics、Logs2025-07-20·794 字·4 分钟从为什么选 OpenTelemetry 讲起,给出 DaemonSet + Gateway 的 Collector 部署架构、关键配置和实际踩坑记录。
Grafana Tempo 大规模分布式追踪实战:从 OTel 接入到 TraceQL 调优2025-07-16·1563 字·8 分钟Tempo 是目前最便宜的分布式追踪后端。本文把架构、接入、TraceQL、tail sampling、成本优化、事故案例都串起来,供团队直接抄作业。
可观测性三支柱实战:Metrics/Logs/Traces 联动2025-07-14·1110 字·6 分钟监控告诉你系统挂了,可观测性告诉你为什么挂。本文从三支柱的核心差异出发,讲透 Prometheus+Loki+Tempo 的联动排障流程,覆盖 OpenTelemetry 采集标准、Exemplar 原理与配置,以及可观测性建设的优先级策略。
分布式链路追踪实战:Jaeger 与 Tempo 选型对比2025-07-10·2304 字·11 分钟系统梳理 Jaeger 与 Tempo 的架构差异与适用场景,结合 OpenTelemetry SDK 插桩、TraceQL 查询、采样策略和 Traces/Metrics/Logs 关联,给出可落地的生产实战方案。