10-1 · 受控实验与有效性证据(A 级)
一句话:这些是被实验证明有效的做法,比厂商案例硬。核心一句话——加统计/引用/原话 > 玩格式技巧。 数字详细溯源见 13-2-研究与数据源索引;学术脉络见 01-4-学术起源-GEO论文与AEO脉络。
🎓 主源:Princeton GEO(KDD 2024)
- 规模:9 种策略 × 10,000 查询 × 8 领域,跑在模拟 Bing Chat 的系统上;自带 GEO-bench 基准。
- 效果排序(被引可见度提升):
| 策略 | 效果 | 性质 |
|---|---|---|
| Statistics Addition 加统计 | +30–40% | 加实质内容 |
| Quotation Addition 加原话引用 | +30–40%(观点/辩论题尤强) | 加实质内容 |
| Cite Sources 引权威来源 | +30–40%;低排名页(rank-5) +115.1% | 加实质内容 |
| Fluency / Easy-to-Understand 提升流畅易读 | +15–30% | 改表达 |
| Keyword Stuffing 关键词堆砌 | ≈无效/负面 | 旧 SEO 惯性 |
- 两条关键结论:① 领域依赖——不同赛道最优策略不同,别套同一份;② 组合 > 单用,尤其 Statistics + Fluency 叠加效果最大。
- 落地映射 → 06-执行与优化方法论:加统计/引用即 P1-2-信息密度与引用诱饵、原创数据即 P1-3-原创研究与专有数据。
🔁 复现与延伸(A 级旁证)
- Perplexity 真实实验:同套加引用/统计/原话,实测最高 +37%(vs 基准 40%,方向一致)。
- 2026-03 日本三校研究:首次**单独隔离”结构层”**做受控实验——仅靠结构变化,引用率在 6 个生成引擎上一致变动 ±17.3%(结构本身就有独立作用)。
- Reboot 受控实验:成功让 ChatGPT/Perplexity 点名目标对象,且在无痕窗口 + 未登录下仍成立——排除”账号关联”干扰,证明可被刻意影响。
🧪 怎么自己做实验(把 A 级方法搬进项目)
- 选一组目标查询 + 设基线引用率 → 05-2-受众意图与查询池构建。
- 单变量改一类内容(先试”加统计/原话”),其余不动。
- 隔 2–4 周复测,剥离平台基线增长,记录有效/无效 → 07-4-报告与实验设计。
💡 一句话提炼
- 实质 > 信号:最严谨研究支持的是”加统计/引用/原话”,不是堆 schema/格式技巧。
- 一手 > 二手:你自己的原创数据 > 引用别人的统计——first-party 是 AI 引用的最高价值内容。
相关
- 约定/分级 → 10-0-案例库约定与证据分级;真实案例 → 10-2-成功案例卡
- 落地战术 → P1-2-信息密度与引用诱饵 · P1-3-原创研究与专有数据;实验设计 → 07-4-报告与实验设计