↓ 跳过正文

微调

Unsloth 高效微调实战：单卡 QLoRA 的极致性能与内部原理

Unsloth 高效微调实战：单卡 QLoRA 的极致性能与内部原理

2026-03-22·1493 字·8 分钟

Unsloth 用手写 Triton kernel 把单卡 LoRA 微调速度和显存压到极致。本文讲清 Unsloth 的原理、和 LLaMA Factory/TRL 的组合用法，以及真实使用的坑。

LLaMA Factory 微调工具链实战：从数据准备到 LoRA 合并的全流程

LLaMA Factory 微调工具链实战：从数据准备到 LoRA 合并的全流程

2026-03-18·1605 字·8 分钟

LLaMA Factory 把大模型微调的很多 trick 工程化了。本文按一个完整项目的节奏讲：数据、SFT、LoRA、DPO、合并、评估和常见坑。

LLM 微调入门：LoRA 让大模型适配私有场景

LLM 微调入门：LoRA 让大模型适配私有场景

2026-01-14·767 字·4 分钟

什么时候该微调、什么时候该用提示工程？本文给出决策框架，然后用Unsloth+QLoRA实战微调Qwen2.5-7B，覆盖数据格式、训练监控、权重合并、部署到vLLM测试，以及10个真实踩坑记录。