A1 · 实体识别与知识图谱（Entity Recognition）

一句话：模型能否把”你的品牌/组织/人”识别为知识图谱里一个有唯一标识、属性清晰、不被同名混淆的实体。这是 A 簇（权威）的地基——实体不清，提及/背书/EEAT 全都无处可挂。机制 → 02-2-答案生成管线总览（③排序 / ⑤归属）　怎么做 → P3-1-实体建设与知识图谱收录　证据 → 13-2-研究与数据源索引　相邻信号 → A2-品牌提及·A4-第三方共识源与提及来源鸿沟·C2-结构化数据Schema

🎯 TL;DR（30 秒）

问题	一句话答案
是什么	引擎把”你”消歧并关联到知识图谱里正确的实体节点（Google KG / Wikidata / 模型内部表示）
多重要	常被列为权重最高的单一信号之一（~20%·方向性）；Google AIO 尤其依托自家 KG
怎么算”强”	模型认得你 × 属性说得准 × 不与同名实体混淆 × 多源一致
去哪做	诊断在本页；建实体/拿 KG 席位的打法 → P3-1-实体建设与知识图谱收录

只记一条：实体识别是 A 簇的地基。模型连”你是谁”都没确立，A2 的提及、A3 的 EEAT、A4 的第三方背书都无处归集——再多曝光也喂不到一个明确实体上。

🧠 为什么是”地基信号”（原理层）

它是 A 簇其余信号的挂载点：A2-品牌提及的提及、A3-EEAT与作者权威的权威、A4-第三方共识源与提及来源鸿沟的背书，都必须归集到一个被识别的实体上才生效。实体模糊 → 这些信号要么落空、要么被记到错的实体头上（同名公司、同名人）。
模型需要”事物”而非”字符串”：生成式引擎在内部把世界组织成实体 + 关系（知识图谱式表示）。被识别为实体后，模型才”理解”你是什么类目、和谁有关系、为何在该领域相关 → 相关查询里更易被召回 / 联想 / 推荐。
作用在哪一关：主要喂养 02-2-答案生成管线总览的 ③排序（够不够明确、相关、权威）与 ⑤合成/归属（答案里能不能把内容正确归属给你这个实体）。注意它不直接解决②召回（爬不到仍是一票否决 → C1-可爬性与爬虫准入）。
与提及的因果次序：实体识别是因、品牌提及是果与燃料——先有可识别实体，提及才有处可积累；但持续提及又反过来巩固/维持实体认知（见下方二阶误区）。两者咬合，不是先后清单。

🔢 三个”你”别混（最常见的概念混淆）

概念	是什么	引擎怎么处理	风险
字符串 String（你的名字）	一串字符	字面匹配	同名即混淆（多个”Apple”）
关键词 Keyword	检索词	词频 / 相关性	命中词 ≠ 认得你这个主体
实体 Entity（本页 A1）	KG 里有唯一标识的”事物”，带类型与属性	消歧 → 关联到正确节点	一旦确立，提及/权威有处可挂

关键：SEO 优化”关键词/字符串”，GEO 要先确立”实体”。Google 那句 things, not strings 正是此意——这是 A1 与关键词思维的分水岭。

📊 证据与量级（标级 · 只链不抄）

发现	量级	级别 · 去哪溯源
实体识别被列为权重最高的单一因素之一	≈ 20%（方向性）	C · 厂商自报，按平台浮动 → 04-可见性影响因素与排名信号·13-2-研究与数据源索引
Wikidata / 维基百科收录	确立实体身份的最强杠杆之一	B/C · 多源共识 → P3-1-实体建设与知识图谱收录
缺乏实体确立 → AI “不知道你是谁”	定性 · 普遍	B · 多源观察 → A2-品牌提及

⚠️ ~20% 为厂商方向性数据，按平台浮动，别做精确加权；最硬的因果证据（Princeton/CMU）见 10-1-受控实验与有效性证据。口径与级别统一回 13-2-研究与数据源索引。

🔬 诊断：我的实体被认得吗？

本页只做诊断（判断信号强弱）；判出”弱”后去 P3-1-实体建设与知识图谱收录补。

自检清单

搜你的品牌，Google 右侧出**知识面板（Knowledge Panel）**吗？信息准不准？
Wikidata / 维基百科有你的条目吗？类型、行业、关系、关键属性正确且一致吗？
直接问模型”X 是什么公司 / X 是谁”——答得对不对、是不是我（没张冠李戴到同名实体）？
全网/各平台对你的实体认知一致吗（定位漂移？改名/合并历史造成的分裂？）→ 关联 A2-品牌提及的”一致性”。
官网有 Organization / Person schema + sameAs 把各处档案串成同一实体吗？→ 打法在 C2-结构化数据Schema·P3-1-实体建设与知识图谱收录。

实测 prompt（快速体检）

在 ChatGPT / Perplexity / Google AIO 各问：
1. "<我的品牌> 是什么公司？做什么的？"   → 认得我吗？属性对吗？有没有跟同名的搞混？
2. "<我的品牌> 和 <竞品> 有什么关系？"   → 它把我放对类目/关系网里了吗？
→ 答错 / 答的是别家 / 只字面重复 = 实体识别弱，A2/A3/A4 再使劲也难归集。

⚙️ 平台适配

Google AIO / AI Mode（→ 03-2-Google-AIO与AI-Mode）：最直接——直接调用自家 Knowledge Graph；拿下 KG 席位收益最大。
Gemini（→ 03-4-Gemini）：与 Google 实体体系同源，借力 KG，实体清晰者占优。
ChatGPT（→ 03-1-ChatGPT）：靠训练语料 + 检索形成实体认知，Wikipedia/Wikidata 等高权威语料对其内部表示影响大。
Perplexity（→ 03-3-Perplexity）：实时检索为主，实体清晰助③排序进候选；但最终被引仍要可爬、可抽。
通用：实体识别是跨平台普遍刚需的底层信号，分平台浮动 → 03-0-平台横向对比矩阵。

❌ 误区 & ⚠️ 二阶误区

常见误区

❌ “有官网/有品牌词排名 = 有实体” → 不等于。官网是字符串载体，实体要在 KG/语料里被消歧确立。
❌ “优化关键词就行” → 那是 SEO 反射；GEO 要让模型把你当**“事物”**（things not strings）。

⚠️ 二阶误区（懂了”实体很重要”之后最容易犯）

❌ “进了 Wikipedia/Wikidata 就万事大吉” → 收录是起点不是终点；条目不准/过时/被同名污染反而固化错误认知，需持续维护。
❌ “实体识别是一次性技术活（建好 schema / 拿到面板就完事）” → 它靠 A2-品牌提及的持续提及 + C2-结构化数据Schema 的结构信号 + A4-第三方共识源与提及来源鸿沟的第三方一致共同长期维持；停更会被稀释/漂移。
❌ “实体 = 品牌知名度” → 知名度是提及量（A2）；实体识别是身份的清晰与正确。小众但实体极清晰者，照样被准确召回。

🧩 与相邻页的边界

本页（A1）= 诊断：这个信号是什么 / 为何是地基 / 怎么判强弱。
怎么做（拿 KG 席位、schema+sameAs、NAP 一致、建权威档案）→ P3-1-实体建设与知识图谱收录；其中结构化数据那条线 → C2-结构化数据Schema。
同簇上层信号：实体确立后，往上叠 A2-品牌提及（提及量）·A3-EEAT与作者权威（可信/谁写）·A4-第三方共识源与提及来源鸿沟（谁背书）。
机制（为何实体影响答案）→ 02-2-答案生成管线总览（③/⑤）·02-1-LLM基础-训练推理与知识截止；衡量 → 07-1-指标体系-SoM与SoV；术语定义 → 13-1-术语表Glossary；数字溯源 → 13-2-研究与数据源索引。
纪律：本页只诊断、不教操作、不抄数字；数字一律标级 + 回链。

📌 关于本页（“成熟”级 · 复用叶子信号/诊断页范式）：本页是 A2-品牌提及所立 叶子信号/诊断页范式的第一次复用（非新范式）——同一模板：是什么 + 为什么重要（证据标级）+ 易混辨析 + 诊断自检 + 平台适配 + 二阶误区 + 边界，严守”诊断归我、打法归 06、机制归 02、数字归 13-2”。A1 在 A 簇里的特殊定位是地基：先有可识别实体，A2/A3/A4 才有处可挂。04 其余因素页（A3/A4·B1–4·C1–3）加深时，照 A2/A1 这套模板即可。

AEO 知识库

探索

A1-实体识别与知识图谱

A1 · 实体识别与知识图谱（Entity Recognition）

🎯 TL;DR（30 秒）

🧠 为什么是”地基信号”（原理层）

🔢 三个”你”别混（最常见的概念混淆）

📊 证据与量级（标级 · 只链不抄）

🔬 诊断：我的实体被认得吗？

⚙️ 平台适配

❌ 误区 & ⚠️ 二阶误区

🧩 与相邻页的边界

相关

关系图谱

目录

反向链接