RAG 三种范式总结
对比 Naive / Agentic / Advanced 三种 RAG 范式,理清演进逻辑、适用场景与选择方法。
一、对比总览
| Naive RAG | Agentic RAG | Advanced RAG | |
|---|---|---|---|
| 核心 | 检索 → 拼 prompt → 生成 | 检索作为工具,LLM 决策 | 三段式优化检索质量 |
| 检索时机 | 每次必检索 | LLM 判断要不要检索 | 每次必检索(但优化) |
| 检索词 | 用户原话 | LLM 自定 | LLM 改写多份 |
| 检索方式 | 单路向量 | 单路向量 | 多路(向量+关键词) |
| 检索结果 | 拼 prompt context | ToolMessage | 拼prompt(rerank后) |
| 优化手段 | 无 | 智能判断 | query改写 + rerank |
| 架构 | 流程硬编码 | ReAct Agent | 优化流水线 |
| 复杂度 | 低 | 中 | 高 |
| 精度 | 一般 | 取决于LLM | 高 |
| 延迟 | 低 | 中 | 高 |
| 适用 | 简单QA | 问题多样 | 生产级 |
二、演进逻辑
三种范式是递进关系,每个解决前一个的问题:
Naive RAG: 每次必检索 + 用户原话 + 无优化
↓ 问题: 不该检索时也检索(浪费); 检索词差; 无精度优化
Agentic RAG: LLM 判断要不要检索 + LLM 自定 query
↓ 解决: 智能判断(不无脑检索)
↓ 未解决: 检索质量仍靠单次向量检索
Advanced RAG: query改写 + 多路检索 + rerank
↓ 解决: 检索质量系统优化
- Naive → Agentic:解决"该不该检索"的智能判断问题
- Agentic → Advanced:解决"检索得好不好"的质量问题
两个方向正交:Agentic 关注"何时检索",Advanced 关注"检索多准"。
三、三者关系(不是互斥)
三种范式可以组合,不是三选一:
Agentic + Advanced: LLM 判断要不要检索 + 检索时用改写/rerank 优化
实际生产系统常常是组合体:
- 用 Agentic 思路让 LLM 决定何时检索
- 检索时用 Advanced 的 rerank 提精度
四、怎么选
按场景选:
| 场景 | 推荐 |
|---|---|
| 简单 QA,问题明确,文档少 | Naive RAG |
| 问题多样,有的不需要检索,要多工具 | Agentic RAG |
| 生产级,追求准确率,文档量大 | Advanced RAG(或 Agentic + Advanced 组合) |
| 想要 Agent 风格的智能交互 | Agentic RAG |
| 对延迟敏感 | Naive RAG(最简单最快) |
五、按需取舍
不必全套上 Advanced。实际项目常按需选优化:
| 优化 | 收益 | 成本 |
|---|---|---|
| 只加 rerank | 精度提升明显 | 多一个模型,延迟增加 |
| 只加 query 改写 | 召回更全 | 多次 LLM 调用 |
| 只加混合检索 | 精确词匹配改善 | 多维护一套关键词索引 |
| 全套 | 最优 | 最复杂最慢 |
通常 rerank 是性价比最高的优化——只加一个模型,精度提升明显。
六、关键认知清单
- 三种范式递进:Naive(基础)→ Agentic(智能判断)→ Advanced(质量优化)。
- 两个正交方向:Agentic 解决"何时检索",Advanced 解决"检索多准"。
- 不是互斥:Agentic + Advanced 可组合。
- Naive RAG 是底子:所有范式都建立在"检索→拼prompt→生成"基础上。
- Agentic 把检索工具化:LLM 决定何时调、用什么 query,结果走 ToolMessage。
- Advanced 三段式:检索前改写、检索中多路、检索后 rerank。
- rerank 性价比最高:只加一个模型,精度提升明显。
- 按需取舍:不必全套 Advanced,按场景选优化组合。
- 复杂度递增:Naive 低、Agentic 中、Advanced 高,延迟和成本也递增。
- 选型看场景:简单用 Naive,智能用 Agentic,精准用 Advanced。
附:三种范式详解
- Naive RAG —— 基础流程:切片 → embedding → 检索 → 拼 prompt
- Agentic RAG —— 检索作为工具:ReAct + function calling
- Advanced RAG —— 质量优化:query 改写 + 多路检索 + rerank
配合 RAG 综合笔记 阅读效果更佳。
评论区