跳过正文

微调

LLM 微调入门:LoRA 让大模型适配私有场景

LLM 微调入门:LoRA 让大模型适配私有场景

·767 字·4 分钟
什么时候该微调、什么时候该用提示工程?本文给出决策框架,然后用Unsloth+QLoRA实战微调Qwen2.5-7B,覆盖数据格式、训练监控、权重合并、部署到vLLM测试,以及10个真实踩坑记录。