AutoGen 多 Agent 协作实战:从 Group Chat 到生产落地2026-04-06·1664 字·8 分钟AutoGen 把多 Agent 协作从玩具推向生产。本文讲清它的核心抽象 (Conversable Agent / Group Chat / 工具调用),以及从 demo 到生产要处理的那些事。
LiteLLM 网关实战:多模型统一接入、限流、成本追踪与故障切换2026-04-02·1611 字·8 分钟LiteLLM 是 LLM 多模型接入的事实标准。本文讲清它的 Proxy 模式部署、Model Config、Virtual Key、Router Fallback、成本追踪和踩坑实录。
Unsloth 高效微调实战:单卡 QLoRA 的极致性能与内部原理2026-03-22·1493 字·8 分钟Unsloth 用手写 Triton kernel 把单卡 LoRA 微调速度和显存压到极致。本文讲清 Unsloth 的原理、和 LLaMA Factory/TRL 的组合用法,以及真实使用的坑。
LLaMA Factory 微调工具链实战:从数据准备到 LoRA 合并的全流程2026-03-18·1605 字·8 分钟LLaMA Factory 把大模型微调的很多 trick 工程化了。本文按一个完整项目的节奏讲:数据、SFT、LoRA、DPO、合并、评估和常见坑。