AEO 知识库

❯

02 AI搜索引擎工作原理

❯

02 1 LLM基础训练推理与知识截止

02-1-LLM基础-训练推理与知识截止

2026年6月01日3分钟阅读

aeo-geo
机制
llm基础

02-1 · LLM 基础：训练 / 推理 / 知识截止

一句话：模型参数里是训练时的统计记忆，不是实时数据库——所以引擎才需要检索，而检索正是你能影响答案的入口。

是什么

LLM：在海量文本上训练的”下一个 token 预测”模型；它学到的是语言与世界的统计模式，而非可查询的事实库。
训练（training）：调权重，昂贵、周期性、离线完成。
推理（inference）：用学好的权重逐 token 生成，每次对话发生。
知识截止（knowledge cutoff）：纯参数知识停在训练截止日；之后的事件/长尾事实容易过时或被编造（幻觉）。

怎么运作（机制）

纯靠参数作答 = “凭记忆答” → 对新鲜/细节问题不可靠。
现代答案引擎因此叠加检索层（见 02-3-RAG与实时检索grounding）把”当下网页”喂给模型。

对可见性意味着什么（So What）

正因有截止 + 幻觉风险，引擎要外接检索——被检索接入 = 你能影响答案。
你优化的主战场是检索/引用层，而非”挤进训练语料”。

常见误解

❌“被模型训练过就会被引用” → 现代被引主要由检索层决定；训练知识更多是背景常识。
❌“模型知道一切” → 截止日后与长尾，它常常不知道或编造。

相关

下一步：02-2-答案生成管线总览 · 02-3-RAG与实时检索grounding
入门概念 → 01-基础认知与核心概念

关系图谱

02-1 · LLM 基础：训练 / 推理 / 知识截止
是什么
怎么运作（机制）
对可见性意味着什么（So What）
常见误解
相关

反向链接

02-2-答案生成管线总览
02-3-RAG与实时检索grounding
02-AI搜索引擎工作原理
A1-实体识别与知识图谱
C1-可爬性与爬虫准入
C2-结构化数据Schema
P2-2-Schema部署与校验

Created with Quartz v4.5.2 © 2026