02-3 · RAG 与实时检索 grounding
一句话:先检索再作答,把答案锚定在可核验来源上——这是绕过知识截止、也是你被引用的通道。
是什么
- RAG(检索增强生成):作答前先检索相关文档,把内容塞进上下文,模型据此生成并引用。
- Grounding(接地):把答案锚定到具体来源以降幻觉;2026 已成验证标配(部分平台可精确到段落/单元格)。
- 实时检索:让新内容与长尾也能被引,弥补 02-1-LLM基础-训练推理与知识截止 的截止局限。
怎么运作(机制)
- 召回候选 → 选用片段 → 合成答案 → 标注引用(即管线 ②→⑤,见 02-2-答案生成管线总览)。
- 你的内容必须先进入**“可被检索到的候选集”**,才谈得上被 grounding 引用。
对可见性意味着什么(So What)
- 入场券 = 被收录 + 可爬 + 语义匹配:
- 可爬/收录 → C1-可爬性与爬虫准入 / P2-1-AI爬虫准入排查
- 语义匹配 → B3-语义匹配与查询扇出契合 / P1-4-主题集群与fan-out覆盖
- 这解释了为何”爬不到=隐形”是一票否决。
常见误解
- ❌“RAG = 一定准确” → grounding 降幻觉但不消除,模型仍可能误读/误引。
- ❌“被检索到 = 一定被引” → 还要过排序与抽取两关。
相关
- 上游:02-1-LLM基础-训练推理与知识截止;脊柱:02-2-答案生成管线总览
- 平台实现差异(Bing/Google/Brave 等)→ 03-0-平台横向对比矩阵