
AI 就绪网站检查清单:为 AI 代理优化的 21 个步骤
一份实用检查清单,让您的网站对 ChatGPT、Claude、Perplexity 及所有 AI 代理可读、可发现、可操作。
AI 就绪网站检查清单
AI 代理在您网站流量中的占比正在不断增长。ChatGPT、Claude、Perplexity、购物助手和研究机器人每天访问数百万个页面——但大多数网站并不是为它们而构建的。
本检查清单涵盖 21 个可以立即实施的具体步骤,按照四个关键维度组织:可发现性、可读性、可信赖性和可操作性。
可发现性:AI 代理能找到您吗?
如果代理无法发现您的内容,其他一切都毫无意义。
1. 在 robots.txt 中允许 AI 爬虫
检查您的 robots.txt 是否屏蔽了 AI 爬虫。许多网站无意中屏蔽了 GPTBot、ClaudeBot 或 PerplexityBot 等 user agent。
User-agent: *
Allow: /
2. 添加 sitemap.xml
网站地图帮助代理发现您的所有页面,而无需逐个链接爬取。确保它在您的 robots.txt 中被引用,并包含所有重要页面。
3. 添加 llms.txt 文件
llms.txt 标准告诉 AI 代理您的网站提供什么以及如何访问。可以把它理解为 LLM 版的 robots.txt——一个站点级别的指引文件。参阅我们的llms.txt创建指南。
4. 添加结构化数据 (JSON-LD)
JSON-LD 格式的 Schema.org 标记帮助代理理解您页面的主题,而无需解析 HTML。至少包含 @type、name、description 以及与您内容类型相关的属性。
5. 添加 Open Graph 标签
Open Graph 标签(og:title、og:description、og:type、og:image)不仅被社交平台使用,AI 代理也用它们来预览和分类内容。
6. 为表单添加 WebMCP 属性
WebMCP 是一项 W3C 标准,允许你将表单声明为 AI 代理的工具。在 <form> 元素上添加 toolname 和 tooldescription 属性,让代理可以直接发现和使用它们——无需屏幕抓取。参阅我们的 WebMCP 指南。
可读性:AI 代理能理解您吗?
大多数网页超过 90% 是冗余代码。代理需要干净、结构化的内容。
7. 使用语义化 HTML
<main>、<article>、<section> 和 <aside> 等标签告诉代理真正的内容在哪里。没有它们,代理看到的只是一堆杂乱无章的 <div> 元素。
8. 添加一个描述性的 H1 标题
H1 是代理用来理解页面主题的首要信号。只使用一个,并确保它具有描述性——不要用"欢迎"或"首页"。
9. 使用有意义的标题
标题(<h2>、<h3>)应概括章节内容。代理使用它们进行智能浏览——在不阅读全部内容的情况下理解页面结构。避免使用"更多信息"等笼统标题。
10. 为图片添加 alt 文本
没有 alt 文本,图片对 AI 代理来说是不可见的。有了 alt 文本,代理就能理解您的视觉内容并在回答中引用。
11. 使用描述性链接文本
将笼统的链接文本("点击这里"、"阅读更多"、"了解更多")替换为描述性标签。代理使用链接文本来决定是否值得跟踪该链接。
12. 不要依赖 JavaScript 来呈现内容
AI 代理和爬虫无法执行 JavaScript。如果您的内容依赖客户端渲染(没有 SSR 的 React、Vue、Angular SPA),那么对所有 AI 代理来说它都是不可见的。请使用 SSR 或静态生成。
13. 减少 HTML 冗余
删除不必要的内联样式、空元素和非语义化标记。HTML 中的噪音越少,代理体验到的信噪比就越好。
可信赖性:AI 代理能信任您吗?
信任信号帮助代理验证准确性并决定是否引用您的页面。
14. 添加 meta description
Meta description 是代理在不阅读完整页面时使用的快速摘要。保持在 160 个字符以内,具体且准确。
15. 设置 canonical URL
<link rel="canonical"> 可以防止代理索引您内容的重复版本。如果您有 URL 参数、分页或打印版本,这一点尤为重要。
16. 声明语言
<html> 上的 lang 属性告诉代理您的内容使用什么语言。简单但经常被遗漏——而它直接影响理解效果。
<html lang="zh">
17. 保持内容新鲜
代理会关注日期。在结构化数据中包含 datePublished 和 dateModified。过时的内容会失去可信度。
18. 使用 ETag 或 Last-Modified 响应头
这些响应头让代理无需重新下载即可检查内容是否发生变化。高效的缓存表明网站维护良好。
可操作性:AI 代理能与您交互吗?
代理网络的未来是交易化的。如果代理找不到您的操作入口,您就会错失转化机会。
19. 在内容中定义清晰的 CTA
您的"立即购买"、"订阅"、"预约演示"按钮应该在 HTML 内容中清晰可见,而不仅仅是视觉上的样式化。代理通过文本和 HTML 结构来识别操作,而不是 CSS。
20. 使用带上下文的语义链接
链接应具有描述性文本,说明它们将导向何处。不要用"点击这里查看价格",而要用"查看价格方案"。这帮助代理有目的地浏览您的网站。
21. 将主要内容放在最前面
代理会扫描前几百个字符来决定页面是否相关。如果它们在真正内容之前只找到导航或冗余代码,可能会直接跳过您的页面。将 H1 和主要内容尽可能放在 HTML 的最前面。
超越检查清单:MAKO 层级
以上所有内容都是在现有 HTML 格式下让您的网站对 AI 代理更友好。但存在一个上限——即使完美优化的 HTML 仍然会发送比实际需要多 15-20 倍的 tokens。
下一个层级是通过 content negotiation 在 HTML 之外提供结构化的 AI 原生内容。这正是 MAKO 协议所实现的:相同的 URL,相同的服务器,但当 AI 代理访问时,它收到的是带元数据的优化 markdown,而不是原始 HTML。
结果:减少约 94% 的 tokens,代理可以执行的声明式操作,以及可以有目的地跟踪的语义链接。
衡量您的现状
本检查清单中的每一项都对应 MAKO Score 中的一个具体检查项——这是一个免费审计工具,从四个维度(可发现性、可读性、可信赖性、可操作性)衡量您的网站,并给出 0 到 100 的评分。
大多数未经优化的网站得分在 30-40 之间。使用本检查清单,您可以达到 60+。使用 MAKO,可达 90+。