02-3 · RAG 与实时检索 grounding

一句话:先检索再作答,把答案锚定在可核验来源上——这是绕过知识截止、也是你被引用的通道。

是什么

  • RAG(检索增强生成):作答前先检索相关文档,把内容塞进上下文,模型据此生成并引用
  • Grounding(接地):把答案锚定到具体来源以降幻觉;2026 已成验证标配(部分平台可精确到段落/单元格)。
  • 实时检索:让新内容与长尾也能被引,弥补 02-1-LLM基础-训练推理与知识截止 的截止局限。

怎么运作(机制)

  • 召回候选 → 选用片段 → 合成答案 → 标注引用(即管线 ②→⑤,见 02-2-答案生成管线总览)。
  • 你的内容必须先进入**“可被检索到的候选集”**,才谈得上被 grounding 引用。

对可见性意味着什么(So What)

常见误解

  • ❌“RAG = 一定准确” → grounding 降幻觉但不消除,模型仍可能误读/误引。
  • ❌“被检索到 = 一定被引” → 还要过排序与抽取两关。

相关