QLoRA on 黄文卓 | DevOps Engineer

QLoRA on 黄文卓 | DevOps Engineerhttps://socake.github.io/tags/qlora/Recent content in QLoRA on 黄文卓 | DevOps EngineerHugo -- gohugo.iozh-CN17691281867@163.com (Wenzhuo Huang)17691281867@163.com (Wenzhuo Huang)© 2026 Wenzhuo HuangSun, 22 Mar 2026 09:15:00 +0800Unsloth 高效微调实战：单卡 QLoRA 的极致性能与内部原理https://socake.github.io/posts/unsloth-efficient-finetuning/Sun, 22 Mar 2026 09:15:00 +080017691281867@163.com (Wenzhuo Huang)https://socake.github.io/posts/unsloth-efficient-finetuning/Unsloth 用手写 Triton kernel 把单卡 LoRA 微调速度和显存压到极致。本文讲清 Unsloth 的原理、和 LLaMA Factory/TRL 的组合用法，以及真实使用的坑。LLM 微调入门：LoRA 让大模型适配私有场景https://socake.github.io/posts/llm-finetuning-lora-practice/Wed, 14 Jan 2026 09:56:00 +080017691281867@163.com (Wenzhuo Huang)https://socake.github.io/posts/llm-finetuning-lora-practice/什么时候该微调、什么时候该用提示工程？本文给出决策框架，然后用Unsloth+QLoRA实战微调Qwen2.5-7B，覆盖数据格式、训练监控、权重合并、部署到vLLM测试，以及10个真实踩坑记录。