02-1 · LLM 基础:训练 / 推理 / 知识截止

一句话:模型参数里是训练时的统计记忆,不是实时数据库——所以引擎才需要检索,而检索正是你能影响答案的入口。

是什么

  • LLM:在海量文本上训练的”下一个 token 预测”模型;它学到的是语言与世界的统计模式,而非可查询的事实库。
  • 训练(training):调权重,昂贵、周期性、离线完成。
  • 推理(inference):用学好的权重逐 token 生成,每次对话发生。
  • 知识截止(knowledge cutoff):纯参数知识停在训练截止日;之后的事件/长尾事实容易过时或被编造(幻觉)

怎么运作(机制)

  • 纯靠参数作答 = “凭记忆答” → 对新鲜/细节问题不可靠。
  • 现代答案引擎因此叠加检索层(见 02-3-RAG与实时检索grounding)把”当下网页”喂给模型。

对可见性意味着什么(So What)

  • 正因有截止 + 幻觉风险,引擎要外接检索——被检索接入 = 你能影响答案
  • 你优化的主战场是检索/引用层,而非”挤进训练语料”。

常见误解

  • ❌“被模型训练过就会被引用” → 现代被引主要由检索层决定;训练知识更多是背景常识。
  • ❌“模型知道一切” → 截止日后与长尾,它常常不知道或编造

相关