03-1 · ChatGPT(含搜索模式)
一句话:进不了 Bing 索引 = 搜索模式不可见;放行 OAI-SearchBot 才有被引资格。
检索与引用机制
- 双源:搜索模式主要走 Bing 索引(RAG) + 自有 OAI-SearchBot 补充索引。
- query fan-out:把原始问题扩展成子问题,各自检索候选页再择优引用。
- 选择依据:结构质量 + 权威信号 + 新鲜度;偏好前 150–300 字直给答案的页面。
源偏好(爱引谁)
- 权威域:Wikipedia、政府、.edu、主流大刊;商业查询偏成熟品牌/出版商。
- 偏爱直接、断言式表达;厌恶营销废话、稀薄/重复内容。
- 自成生态:80% 被引 URL 不在 Google 前 100(Ahrefs 2025-08)。
爬虫与准入(关键易错点)
- ⚠️ GPTBot ≠ 引用:GPTBot 仅训练;引用资格由 OAI-SearchBot 控。
- 想”退出训练但保留被引” → 封 GPTBot、放行 OAI-SearchBot + ChatGPT-User。
- Bing 收录是地板:不在 Bing 索引,搜索模式无法引用(即便 Google 排名很好)。
- OAI-SearchBot 不保证执行 JS → 客户端渲染内容可能隐形(见 P2-3-服务端渲染与可提取性)。
差异化优化要点
- 进 Bing:提交 Bing Webmaster sitemap、用 IndexNow 触发抓取。→ P2-1-AI爬虫准入排查
- 强实体:成熟品牌/权威更易被选 → P3-1-实体建设与知识图谱收录 / P3-2-品牌提及与数字PR。
- answer-first:前 150–300 字直给结论 → P1-1-answer-first写作与可抽取结构。
- fan-out 覆盖子问题 → P1-4-主题集群与fan-out覆盖。
关键数据(2026 · 方向性)
- SearchGPT 引用 87%+ 命中 Bing 自然结果前列(Seer Interactive)。
- 每答引用 3–5 个源(少于 Perplexity 的 5–10)。
- 对新鲜度不如 Perplexity 激进;常青查询乐引旧权威页。
- 截至 2026 无付费位,引用为自然结果。
自检 / 实测
- 站点是否已被 Bing 收录(Bing Webmaster 查)?
- robots.txt 是否放行 OAI-SearchBot / ChatGPT-User?
- 目标问题在 ChatGPT 搜索实测,是否被引、引的是谁?
相关
- 横向对比 → 03-0-平台横向对比矩阵;机制 → 02-AI搜索引擎工作原理
- 对照:03-5-Microsoft-Copilot(同走 Bing)