B2 · 信息密度（Information Density / Citation Bait）

一句话：抽得出之后，值不值得被选作引用——靠单位篇幅的命名实体 + 统计数据 + 引述，而非关键词密度。这是 B 簇的可引层：命中(B3) → 可答(B1) → 可引(B2) → 保鲜(B4)。机制 → 02-6-引用vs提及·02-2-答案生成管线总览（③排序 / ⑤引用）　怎么做 → P1-2-信息密度与引用诱饵·P1-3-原创研究与专有数据　证据 → 13-2-研究与数据源索引　相邻信号 → B1-可答性与答案优先格式·A3-EEAT与作者权威

🎯 TL;DR（30 秒）

问题	一句话答案
是什么	单位篇幅的事实含量：命名实体 + 统计数 + 直接引语 + 权威引用
多重要	决定内容值不值得被引；信息密度是比关键词密度更强的信号
怎么算”强”	每段有具体数字/实体/出处 × 有别人没有的原创数据 × 可原样摘出的金句
去哪做	诊断在本页；引用诱饵 → P1-2-信息密度与引用诱饵；造独家数据 → P1-3-原创研究与专有数据

只记一条：模型要有理由引你、而非十个雷同替代品。富含数据与引述的内容”更值得被引”——这就是 GEO 区别于旧式 SEO 的核心写作转向。

🧠 为什么是”可引层”（原理层）

它是 B 簇的第三道关：B3-语义匹配与查询扇出契合让你被命中、B1-可答性与答案优先格式让你被抽出，B2 决定抽出来的这段值不值得被选进答案。命中、抽出，却空洞无物，照样落选。
引用诱饵（citation bait）：统计数字 + 直接引语 + 权威引用是引擎”忍不住引用”的诱饵——给模型一个具体可验证的事实，它才有理由把出处给你。
信息密度 > 关键词密度：引擎看的是单位篇幅塞了多少可引事实，不是关键词出现几次。堆词无效，堆可验证事实才有效。
原创/专有数据 = 最稀缺诱饵：别处没有的数据/结论让你成为引擎唯一可引的源头，是最难被复制的护城河 → P1-3-原创研究与专有数据。
作用在哪一关：主要喂养 02-2-答案生成管线总览的 ③排序（值得引的加权）与 ⑤引用（被列为出处）。但数据必须可信可核验才转化得成——与 A3-EEAT与作者权威咬合，编造数字会反噬。

🔢 信息密度 ≠ 内容长度 ≠ 关键词密度（最常见的概念混淆）

概念	衡量什么	优化逻辑	最容易错
关键词密度	关键词出现频次	旧 SEO：堆词命中	已过时/反噬
内容长度	字数多少	”越长越全”？	长 ≠ 有料，注水反而稀释密度
信息密度	每段命名实体 + 统计数 + 引述	GEO：单位篇幅事实含量	真正决定”值不值得被引”

关键：引擎要的是单位篇幅的可验证事实，不是字数、更不是关键词频次。注水越多，密度越低，越不值得引。

📊 证据与量级（标级 · 只链不抄）

发现	量级	级别 · 去哪溯源
引用统计/数据/引述 → ↑ AI 可见性	约 +30–40%（相对）	A · Princeton GEO（学术）→ 10-1-受控实验与有效性证据·13-2-研究与数据源索引
信息密度 > 关键词密度	定性·强	B · GEO 共识 → 13-2-研究与数据源索引
原创研究/专有数据/专家评论 = 强引用诱因	方向性	B/C · 行业实践 → P1-3-原创研究与专有数据
信息密度的可操作定义	命名实体 + 统计数 / 每段	B · 行业操作化 → P1-2-信息密度与引用诱饵

⚠️ ~30–40% 是 Princeton GEO 的相对提升（“加统计/引用/引述”这类 GEO 写法 vs 不加），按查询/品类浮动，别当固定收益或精确加权。口径统一回 13-2-研究与数据源索引。

🔬 诊断：我的信息密度够不够、够不够”值得引”？

本页只做诊断（判断信号强弱）；判出”弱”后去 P1-2-信息密度与引用诱饵·P1-3-原创研究与专有数据补。

自检清单

每段是否有具体数字/实体/出处，还是泛泛而谈？
关键结论旁有没有带来源 + 年份的数据？
有没有别人没有的原创数据/基准/框架（最稀缺诱饵）？
有没有可被原样摘出的断言金句（短、明确、自带数据）？
通读一遍，有多少句是没有信息增量的水词/形容词？

实测 prompt（快速体检）

在 ChatGPT / Perplexity：
1. 问一个数据型/比较型问题 → 它引用了谁的具体数字？是你还是第三方？
2. 把你某段贴进去问"这段有哪些可引用的事实？" → 它能摘出几条？
→ 摘不出具体事实 = 信息密度低，需加引用诱饵（P1-2）/造独家数据（P1-3）。

⚙️ 平台适配

数据型/比较型查询：全平台尤为受益——带数字/出处的段落最易被列为来源。
Perplexity / Google AI Overviews（→ 03-3-Perplexity·03-2-Google-AIO与AI-Mode）：显式引用，可核验数据 + 明确出处直接利好被引。
通用：原创数据是跨平台最难被复制的护城河，长期复利最强 → 03-0-平台横向对比矩阵。

❌ 误区 & ⚠️ 二阶误区

常见误区

❌ “堆形容词就够”（“业界领先""效果显著”）→ 引擎无可引之物。
❌ “关键词密度高 = 优化好” → 已过时；信息密度才是更强信号。

⚠️ 二阶误区（懂了”要高信息密度”之后最容易犯）

❌ “写得越长越有料” → 长 ≠ 密；注水稀释密度，反而更难被引 → P1-2-信息密度与引用诱饵的”删水”。
❌ “编个数字凑密度” → 编造/夸大损害 EEAT 且易被交叉核验打脸 → A3-EEAT与作者权威·10-3-反面教材与失效模式。
❌ “只发图表就够” → 引擎抽文字不抽图，图旁要配一句话文字结论 → P1-3-原创研究与专有数据。
❌ “~30–40% 是固定收益” → Princeton GEO 是相对量级、按查询/品类浮动，当方向别当公式 → 01-5-常见误区与认知陷阱。

🧩 与相邻页的边界

本页（B2）= 诊断：这个信号是什么 / 为何是可引层 / 强弱怎么判。
怎么做（三件套诱饵、具体替代笼统、可引金句、删水、标出处）→ P1-2-信息密度与引用诱饵；造独家数据/定义新指标/年度报告那条线 → P1-3-原创研究与专有数据。
同簇上下游：上游 B3-语义匹配与查询扇出契合（命中）·B1-可答性与答案优先格式（抽得出）→ 本页 B2（值得引）→ 下游 B4-新鲜度与时效（保持被引）。
跨簇：数据要可信可核验才转化 → A3-EEAT与作者权威；原创数据放大传播 → P3-2-品牌提及与数字PR。
机制：值得引/被选为出处 → 02-6-引用vs提及；漏斗定位 → 02-2-答案生成管线总览（③/⑤）；衡量 → 07-1-指标体系-SoM与SoV；术语 → 13-1-术语表Glossary；数字溯源 → 13-2-研究与数据源索引。
纪律：本页只诊断、不教操作、不抄数字；数字一律标级 + 回链。

📌 关于本页（“成熟”级 · 复用叶子信号/诊断页范式）：本页是 A2-品牌提及所立 叶子信号/诊断页范式的第六次复用（继 A1/A3/A4/B3/B1 之后）——同一模板：是什么 + 为什么重要（证据标级）+ 易混辨析 + 诊断自检 + 平台适配 + 二阶误区 + 边界。B2 在 B 簇里的定位是可引层：命中（B3）→ 可答（B1）→ 可引（B2） → 保鲜（B4）；它是”信息密度 > 关键词密度”这一 GEO 核心转向的落点，团队照着就能自查”为什么抽出来了却不被选作引用”。

AEO 知识库

探索

B2-信息密度

B2 · 信息密度（Information Density / Citation Bait）

🎯 TL;DR（30 秒）

🧠 为什么是”可引层”（原理层）

🔢 信息密度 ≠ 内容长度 ≠ 关键词密度（最常见的概念混淆）

📊 证据与量级（标级 · 只链不抄）

🔬 诊断：我的信息密度够不够、够不够”值得引”？

⚙️ 平台适配

❌ 误区 & ⚠️ 二阶误区

🧩 与相邻页的边界

相关

关系图谱

目录

反向链接