10-1 · 受控实验与有效性证据（A 级）

一句话：这些是被实验证明有效的做法，比厂商案例硬。核心一句话——加统计/引用/原话 > 玩格式技巧。数字详细溯源见 13-2-研究与数据源索引；学术脉络见 01-4-学术起源-GEO论文与AEO脉络。

🎓 主源：Princeton GEO（KDD 2024）

规模：9 种策略 × 10,000 查询 × 8 领域，跑在模拟 Bing Chat 的系统上；自带 GEO-bench 基准。
效果排序（被引可见度提升）：

策略	效果	性质
Statistics Addition 加统计	+30–40%	加实质内容
Quotation Addition 加原话引用	+30–40%（观点/辩论题尤强）	加实质内容
Cite Sources 引权威来源	+30–40%；低排名页(rank-5) +115.1%	加实质内容
Fluency / Easy-to-Understand 提升流畅易读	+15–30%	改表达
Keyword Stuffing 关键词堆砌	≈无效/负面	旧 SEO 惯性

两条关键结论：① 领域依赖——不同赛道最优策略不同，别套同一份；② 组合 > 单用，尤其 Statistics + Fluency 叠加效果最大。
落地映射 → 06-执行与优化方法论：加统计/引用即 P1-2-信息密度与引用诱饵、原创数据即 P1-3-原创研究与专有数据。

🔁 复现与延伸（A 级旁证）

Perplexity 真实实验：同套加引用/统计/原话，实测最高 +37%（vs 基准 40%，方向一致）。
2026-03 日本三校研究：首次**单独隔离”结构层”**做受控实验——仅靠结构变化，引用率在 6 个生成引擎上一致变动 ±17.3%（结构本身就有独立作用）。
Reboot 受控实验：成功让 ChatGPT/Perplexity 点名目标对象，且在无痕窗口 + 未登录下仍成立——排除”账号关联”干扰，证明可被刻意影响。

🧪 怎么自己做实验（把 A 级方法搬进项目）

选一组目标查询 + 设基线引用率 → 05-2-受众意图与查询池构建。
单变量改一类内容（先试”加统计/原话”），其余不动。
隔 2–4 周复测，剥离平台基线增长，记录有效/无效 → 07-4-报告与实验设计。

💡 一句话提炼

实质 > 信号：最严谨研究支持的是”加统计/引用/原话”，不是堆 schema/格式技巧。
一手 > 二手：你自己的原创数据 > 引用别人的统计——first-party 是 AI 引用的最高价值内容。

相关

约定/分级 → 10-0-案例库约定与证据分级；真实案例 → 10-2-成功案例卡
落地战术 → P1-2-信息密度与引用诱饵 · P1-3-原创研究与专有数据；实验设计 → 07-4-报告与实验设计