B2 · 信息密度(Information Density / Citation Bait)
一句话:抽得出之后,值不值得被选作引用——靠单位篇幅的命名实体 + 统计数据 + 引述,而非关键词密度。这是 B 簇的可引层:命中(B3) → 可答(B1) → 可引(B2) → 保鲜(B4)。 机制 → 02-6-引用vs提及·02-2-答案生成管线总览(③排序 / ⑤引用) 怎么做 → P1-2-信息密度与引用诱饵·P1-3-原创研究与专有数据 证据 → 13-2-研究与数据源索引 相邻信号 → B1-可答性与答案优先格式·A3-EEAT与作者权威
🎯 TL;DR(30 秒)
| 问题 | 一句话答案 |
|---|---|
| 是什么 | 单位篇幅的事实含量:命名实体 + 统计数 + 直接引语 + 权威引用 |
| 多重要 | 决定内容值不值得被引;信息密度是比关键词密度更强的信号 |
| 怎么算”强” | 每段有具体数字/实体/出处 × 有别人没有的原创数据 × 可原样摘出的金句 |
| 去哪做 | 诊断在本页;引用诱饵 → P1-2-信息密度与引用诱饵;造独家数据 → P1-3-原创研究与专有数据 |
只记一条:模型要有理由引你、而非十个雷同替代品。富含数据与引述的内容”更值得被引”——这就是 GEO 区别于旧式 SEO 的核心写作转向。
🧠 为什么是”可引层”(原理层)
- 它是 B 簇的第三道关:B3-语义匹配与查询扇出契合 让你被命中、B1-可答性与答案优先格式 让你被抽出,B2 决定抽出来的这段值不值得被选进答案。命中、抽出,却空洞无物,照样落选。
- 引用诱饵(citation bait):统计数字 + 直接引语 + 权威引用是引擎”忍不住引用”的诱饵——给模型一个具体可验证的事实,它才有理由把出处给你。
- 信息密度 > 关键词密度:引擎看的是单位篇幅塞了多少可引事实,不是关键词出现几次。堆词无效,堆可验证事实才有效。
- 原创/专有数据 = 最稀缺诱饵:别处没有的数据/结论让你成为引擎唯一可引的源头,是最难被复制的护城河 → P1-3-原创研究与专有数据。
- 作用在哪一关:主要喂养 02-2-答案生成管线总览 的 ③排序(值得引的加权)与 ⑤引用(被列为出处)。但数据必须可信可核验才转化得成——与 A3-EEAT与作者权威 咬合,编造数字会反噬。
🔢 信息密度 ≠ 内容长度 ≠ 关键词密度(最常见的概念混淆)
| 概念 | 衡量什么 | 优化逻辑 | 最容易错 |
|---|---|---|---|
| 关键词密度 | 关键词出现频次 | 旧 SEO:堆词命中 | 已过时/反噬 |
| 内容长度 | 字数多少 | ”越长越全”? | 长 ≠ 有料,注水反而稀释密度 |
| 信息密度 | 每段命名实体 + 统计数 + 引述 | GEO:单位篇幅事实含量 | 真正决定”值不值得被引” |
关键:引擎要的是单位篇幅的可验证事实,不是字数、更不是关键词频次。注水越多,密度越低,越不值得引。
📊 证据与量级(标级 · 只链不抄)
| 发现 | 量级 | 级别 · 去哪溯源 |
|---|---|---|
| 引用统计/数据/引述 → ↑ AI 可见性 | 约 +30–40%(相对) | A · Princeton GEO(学术)→ 10-1-受控实验与有效性证据·13-2-研究与数据源索引 |
| 信息密度 > 关键词密度 | 定性·强 | B · GEO 共识 → 13-2-研究与数据源索引 |
| 原创研究/专有数据/专家评论 = 强引用诱因 | 方向性 | B/C · 行业实践 → P1-3-原创研究与专有数据 |
| 信息密度的可操作定义 | 命名实体 + 统计数 / 每段 | B · 行业操作化 → P1-2-信息密度与引用诱饵 |
⚠️
~30–40%是 Princeton GEO 的相对提升(“加统计/引用/引述”这类 GEO 写法 vs 不加),按查询/品类浮动,别当固定收益或精确加权。口径统一回 13-2-研究与数据源索引。
🔬 诊断:我的信息密度够不够、够不够”值得引”?
本页只做诊断(判断信号强弱);判出”弱”后去 P1-2-信息密度与引用诱饵·P1-3-原创研究与专有数据 补。
自检清单
- 每段是否有具体数字/实体/出处,还是泛泛而谈?
- 关键结论旁有没有带来源 + 年份的数据?
- 有没有别人没有的原创数据/基准/框架(最稀缺诱饵)?
- 有没有可被原样摘出的断言金句(短、明确、自带数据)?
- 通读一遍,有多少句是没有信息增量的水词/形容词?
实测 prompt(快速体检)
在 ChatGPT / Perplexity:
1. 问一个数据型/比较型问题 → 它引用了谁的具体数字?是你还是第三方?
2. 把你某段贴进去问"这段有哪些可引用的事实?" → 它能摘出几条?
→ 摘不出具体事实 = 信息密度低,需加引用诱饵(P1-2)/造独家数据(P1-3)。
⚙️ 平台适配
- 数据型/比较型查询:全平台尤为受益——带数字/出处的段落最易被列为来源。
- Perplexity / Google AI Overviews(→ 03-3-Perplexity·03-2-Google-AIO与AI-Mode):显式引用,可核验数据 + 明确出处直接利好被引。
- 通用:原创数据是跨平台最难被复制的护城河,长期复利最强 → 03-0-平台横向对比矩阵。
❌ 误区 & ⚠️ 二阶误区
常见误区
- ❌ “堆形容词就够”(“业界领先""效果显著”)→ 引擎无可引之物。
- ❌ “关键词密度高 = 优化好” → 已过时;信息密度才是更强信号。
⚠️ 二阶误区(懂了”要高信息密度”之后最容易犯)
- ❌ “写得越长越有料” → 长 ≠ 密;注水稀释密度,反而更难被引 → P1-2-信息密度与引用诱饵 的”删水”。
- ❌ “编个数字凑密度” → 编造/夸大损害 EEAT 且易被交叉核验打脸 → A3-EEAT与作者权威·10-3-反面教材与失效模式。
- ❌ “只发图表就够” → 引擎抽文字不抽图,图旁要配一句话文字结论 → P1-3-原创研究与专有数据。
- ❌ “~30–40% 是固定收益” → Princeton GEO 是相对量级、按查询/品类浮动,当方向别当公式 → 01-5-常见误区与认知陷阱。
🧩 与相邻页的边界
- 本页(B2)= 诊断:这个信号是什么 / 为何是可引层 / 强弱怎么判。
- 怎么做(三件套诱饵、具体替代笼统、可引金句、删水、标出处)→ P1-2-信息密度与引用诱饵;造独家数据/定义新指标/年度报告那条线 → P1-3-原创研究与专有数据。
- 同簇上下游:上游 B3-语义匹配与查询扇出契合(命中)·B1-可答性与答案优先格式(抽得出)→ 本页 B2(值得引)→ 下游 B4-新鲜度与时效(保持被引)。
- 跨簇:数据要可信可核验才转化 → A3-EEAT与作者权威;原创数据放大传播 → P3-2-品牌提及与数字PR。
- 机制:值得引/被选为出处 → 02-6-引用vs提及;漏斗定位 → 02-2-答案生成管线总览(③/⑤);衡量 → 07-1-指标体系-SoM与SoV;术语 → 13-1-术语表Glossary;数字溯源 → 13-2-研究与数据源索引。
- 纪律:本页只诊断、不教操作、不抄数字;数字一律标级 + 回链。
📌 关于本页(“成熟”级 · 复用叶子信号/诊断页范式):本页是 A2-品牌提及 所立 叶子信号/诊断页范式的第六次复用(继 A1/A3/A4/B3/B1 之后)——同一模板:是什么 + 为什么重要(证据标级)+ 易混辨析 + 诊断自检 + 平台适配 + 二阶误区 + 边界。B2 在 B 簇里的定位是可引层:命中(B3)→ 可答(B1)→ 可引(B2) → 保鲜(B4);它是”信息密度 > 关键词密度”这一 GEO 核心转向的落点,团队照着就能自查”为什么抽出来了却不被选作引用”。
相关
- 同簇:B1-可答性与答案优先格式 · B3-语义匹配与查询扇出契合 · B4-新鲜度与时效 · 簇索引 B-内容与语义信号
- 打法 / 放大:P1-2-信息密度与引用诱饵 · P1-3-原创研究与专有数据 · P3-2-品牌提及与数字PR
- 机制 / 衡量 / 术语:02-6-引用vs提及 · 02-2-答案生成管线总览 · 07-1-指标体系-SoM与SoV · 13-1-术语表Glossary
- 证据 / 平台:10-1-受控实验与有效性证据 · 10-3-反面教材与失效模式 · 13-2-研究与数据源索引 · A3-EEAT与作者权威 · 03-3-Perplexity · 03-0-平台横向对比矩阵 · 01-5-常见误区与认知陷阱