Linux 火焰图实战:从采集到定位问题2026-04-12·1745 字·9 分钟CPU 飙高、响应慢、内存泄漏——这三类问题用火焰图都能快速定位。本文从怎么读火焰图开始,讲到 perf、async-profiler、py-spy 各自的适用场景,最后用一个真实的 Go 服务案例走完完整排查流程。
AutoGen 多 Agent 协作实战:从 Group Chat 到生产落地2026-04-06·1664 字·8 分钟AutoGen 把多 Agent 协作从玩具推向生产。本文讲清它的核心抽象 (Conversable Agent / Group Chat / 工具调用),以及从 demo 到生产要处理的那些事。
Ray Serve 模型部署实战:Deployment、DAG 编排与弹性伸缩2026-03-29·1772 字·9 分钟Ray Serve 是被很多团队忽视的模型服务框架。它在复杂 DAG、异构资源、弹性伸缩上的表现远超单纯的 FastAPI。本文讲清它的核心抽象和生产落地。
Python 系统与文件操作实战2025-12-09·1540 字·8 分钟深入讲解 Python 系统操作,含 subprocess 进程管理、psutil 系统监控,以及一个完整的生产级日志清理脚本
Python 操作 Kubernetes:kubernetes-client 实战2025-12-09·2156 字·11 分钟系统介绍 Python kubernetes-client 的核心用法,从集群认证到资源操作,最终构建一个完整的 K8s 巡检脚本
阿里云 SDK 运维自动化:ECS/ACK/RDS 资源管理与巡检脚本2025-12-04·1220 字·6 分钟用阿里云 Python SDK 实现 ECS 实例查询与监控、ACK 节点状态检查、RDS 慢查询巡检,整合成 HTML 格式巡检报告自动推送钉钉。
Milvus 向量数据库实战:从部署到生产应用2025-11-06·895 字·5 分钟覆盖向量数据库选型对比(Milvus/Qdrant/Weaviate/pgvector)、Milvus Standalone与Cluster部署、Collection Schema设计、HNSW/IVF_FLAT索引调优、混合搜索实战,以及生产环境常见问题处理。