Fine-tuning、RAG、Prompt:定制 LLM 的三条路怎么选
想让大模型更懂你的领域?先搞清这三种方式的成本和适用场景。
让 LLM “更懂你”有三种手段,成本和效果差很多,常被搞混。
| 方式 | 改的是 | 成本 | 适合 |
|---|---|---|---|
| Prompt | 当次输入 | 极低 | 调输出风格/格式,绝大多数需求 |
| RAG | 外挂知识 | 中 | 注入私有/最新知识,要可追溯 |
| Fine-tuning | 模型权重 | 高 | 固定风格/格式、特定任务范式 |
先 Prompt → 不够再 RAG → 再不够才 Fine-tune。 90% 的需求 Prompt + RAG 就解决了。
- “我想让模型学我的文档” → 你要的多半是 RAG,不是微调。微调不擅长记事实,擅长学模式/风格。
- “微调能让它更聪明” → 不能。微调改的是行为倾向,不是推理能力;要更强就换更大的基座模型。
输出格式高度固定(如特定 JSON schema)、需要稳定的语气人设、或要把大模型的能力蒸馏到小模型降本——这些场景微调才划算。