当用户问 ChatGPT 一个问题时,它会从数十亿网页中选择少数几个来源进行引用。如何让你的网站成为被选中的那一个?这篇指南给你答案。
ChatGPT 如何选择引用来源
ChatGPT 的搜索功能(Browse with Bing / 直接搜索)在生成回答时,会经历以下决策过程:
- 查询分解:将用户的问题分解为多个搜索查询
- 来源检索:通过搜索引擎获取候选网页
- 内容评估:评估每个来源的相关性、权威性和内容质量
- 信息提取:从高质量来源中提取关键信息
- 答案合成:综合多个来源生成回答,并标注引用
在「内容评估」阶段,ChatGPT 会优先选择以下类型的来源:
- 包含明确事实和数据的页面
- 来自权威域名的内容
- 结构清晰、易于提取信息的页面
- 最近更新的内容
- 与查询高度相关的专题页面
优化内容结构
内容结构是影响 AI 引用的最直接因素。以下是优化建议:
使用清晰的标题层级
每个 H2 标题应该是一个独立的知识点,H3 用于细分。AI 会根据标题来定位和提取信息。
提供「可引用片段」
在内容中包含简洁、明确的定义和结论。例如:
- ❌ 「SEO 是一个很复杂的领域,涉及很多方面...」
- ✅ 「SEO(搜索引擎优化)是通过优化网站内容和技术架构,提升网站在搜索引擎自然搜索结果中排名的过程。」
第二种写法更容易被 AI 直接引用,因为它提供了一个完整、准确的定义。
使用列表和表格
结构化的信息(列表、表格、步骤)比纯文本段落更容易被 AI 提取和引用。当你需要列举多个要点时,使用有序或无序列表。
在开头提供摘要
在文章开头用 1-2 句话概括核心观点。AI 在快速扫描内容时,开头的信息权重最高。
建立权威信号
ChatGPT 在选择引用来源时,会考虑网站的整体权威性:
域名权威
- 高质量外链数量和质量
- 域名年龄和历史
- 品牌知名度和搜索量
内容权威
- 作者的专业背景和公开资料
- 引用的来源质量
- 原创数据和研究
- 内容的深度和全面性
技术信任
- HTTPS 加密
- 完善的 Schema Markup
- 良好的 Core Web Vitals
- 清晰的网站架构
技术层面优化
确保 ChatGPT 能够正确访问和理解你的内容:
允许 AI 爬虫访问
在 robots.txt 中确保没有屏蔽 ChatGPT 的爬虫:
User-agent: ChatGPT-User
Allow: /
User-agent: GPTBot
Allow: /部署 llms.txt
创建 llms.txt 文件,帮助 ChatGPT 快速了解你的网站结构和核心内容。
实施 Schema Markup
至少实施 Organization、Article 和 BreadcrumbList Schema,帮助 AI 准确理解你的内容元信息。
确保服务端渲染
ChatGPT 的爬虫不执行 JavaScript。如果你的内容依赖客户端渲染,ChatGPT 可能看不到任何内容。
可引用性检查清单
对照以下清单检查你的内容:
- ☐ 文章开头有 1-2 句话的核心摘要
- ☐ 每个 H2 下有明确的知识点
- ☐ 包含具体的数据和事实
- ☐ 有清晰的定义和结论
- ☐ 使用列表和表格组织信息
- ☐ 作者信息完整且可验证
- ☐ 引用了权威来源
- ☐ 内容在最近 6 个月内更新过
- ☐ robots.txt 允许 AI 爬虫访问
- ☐ 已部署 llms.txt
- ☐ Schema Markup 完整
- ☐ 页面加载速度在 3 秒内
如何衡量效果
衡量 ChatGPT 引用效果的方法:
- 手动测试:定期在 ChatGPT 中搜索你的核心关键词,观察是否被引用
- 流量监控:在 Google Analytics 中监控来自
chatgpt.com的 referral 流量 - 服务器日志:分析 ChatGPT-User 爬虫的访问频率和页面
- 品牌监控:使用工具监控你的品牌在 AI 回答中的出现频率