M
MAKO
返回博客
AI 就绪网站检查清单:为 AI 代理优化的 21 个步骤
·作者:Juan Isidoro·1 分钟阅读

AI 就绪网站检查清单:为 AI 代理优化的 21 个步骤

一份实用检查清单,让您的网站对 ChatGPT、Claude、Perplexity 及所有 AI 代理可读、可发现、可操作。

checklistseoai-agents

AI 就绪网站检查清单

AI 代理在您网站流量中的占比正在不断增长。ChatGPT、Claude、Perplexity、购物助手和研究机器人每天访问数百万个页面——但大多数网站并不是为它们而构建的。

本检查清单涵盖 21 个可以立即实施的具体步骤,按照四个关键维度组织:可发现性可读性可信赖性可操作性

可发现性:AI 代理能找到您吗?

如果代理无法发现您的内容,其他一切都毫无意义。

1. 在 robots.txt 中允许 AI 爬虫

检查您的 robots.txt 是否屏蔽了 AI 爬虫。许多网站无意中屏蔽了 GPTBotClaudeBotPerplexityBot 等 user agent。

User-agent: *
Allow: /

2. 添加 sitemap.xml

网站地图帮助代理发现您的所有页面,而无需逐个链接爬取。确保它在您的 robots.txt 中被引用,并包含所有重要页面。

3. 添加 llms.txt 文件

llms.txt 标准告诉 AI 代理您的网站提供什么以及如何访问。可以把它理解为 LLM 版的 robots.txt——一个站点级别的指引文件。参阅我们的llms.txt创建指南

4. 添加结构化数据 (JSON-LD)

JSON-LD 格式的 Schema.org 标记帮助代理理解您页面的主题,而无需解析 HTML。至少包含 @typenamedescription 以及与您内容类型相关的属性。

5. 添加 Open Graph 标签

Open Graph 标签(og:titleog:descriptionog:typeog:image)不仅被社交平台使用,AI 代理也用它们来预览和分类内容。

6. 为表单添加 WebMCP 属性

WebMCP 是一项 W3C 标准,允许你将表单声明为 AI 代理的工具。在 <form> 元素上添加 toolnametooldescription 属性,让代理可以直接发现和使用它们——无需屏幕抓取。参阅我们的 WebMCP 指南

可读性:AI 代理能理解您吗?

大多数网页超过 90% 是冗余代码。代理需要干净、结构化的内容。

7. 使用语义化 HTML

<main><article><section><aside> 等标签告诉代理真正的内容在哪里。没有它们,代理看到的只是一堆杂乱无章的 <div> 元素。

8. 添加一个描述性的 H1 标题

H1 是代理用来理解页面主题的首要信号。只使用一个,并确保它具有描述性——不要用"欢迎"或"首页"。

9. 使用有意义的标题

标题(<h2><h3>)应概括章节内容。代理使用它们进行智能浏览——在不阅读全部内容的情况下理解页面结构。避免使用"更多信息"等笼统标题。

10. 为图片添加 alt 文本

没有 alt 文本,图片对 AI 代理来说是不可见的。有了 alt 文本,代理就能理解您的视觉内容并在回答中引用。

11. 使用描述性链接文本

将笼统的链接文本("点击这里"、"阅读更多"、"了解更多")替换为描述性标签。代理使用链接文本来决定是否值得跟踪该链接。

12. 不要依赖 JavaScript 来呈现内容

AI 代理和爬虫无法执行 JavaScript。如果您的内容依赖客户端渲染(没有 SSR 的 React、Vue、Angular SPA),那么对所有 AI 代理来说它都是不可见的。请使用 SSR 或静态生成。

13. 减少 HTML 冗余

删除不必要的内联样式、空元素和非语义化标记。HTML 中的噪音越少,代理体验到的信噪比就越好。

可信赖性:AI 代理能信任您吗?

信任信号帮助代理验证准确性并决定是否引用您的页面。

14. 添加 meta description

Meta description 是代理在不阅读完整页面时使用的快速摘要。保持在 160 个字符以内,具体且准确。

15. 设置 canonical URL

<link rel="canonical"> 可以防止代理索引您内容的重复版本。如果您有 URL 参数、分页或打印版本,这一点尤为重要。

16. 声明语言

<html> 上的 lang 属性告诉代理您的内容使用什么语言。简单但经常被遗漏——而它直接影响理解效果。

<html lang="zh">

17. 保持内容新鲜

代理会关注日期。在结构化数据中包含 datePublisheddateModified。过时的内容会失去可信度。

18. 使用 ETag 或 Last-Modified 响应头

这些响应头让代理无需重新下载即可检查内容是否发生变化。高效的缓存表明网站维护良好。

可操作性:AI 代理能与您交互吗?

代理网络的未来是交易化的。如果代理找不到您的操作入口,您就会错失转化机会。

19. 在内容中定义清晰的 CTA

您的"立即购买"、"订阅"、"预约演示"按钮应该在 HTML 内容中清晰可见,而不仅仅是视觉上的样式化。代理通过文本和 HTML 结构来识别操作,而不是 CSS。

20. 使用带上下文的语义链接

链接应具有描述性文本,说明它们将导向何处。不要用"点击这里查看价格",而要用"查看价格方案"。这帮助代理有目的地浏览您的网站。

21. 将主要内容放在最前面

代理会扫描前几百个字符来决定页面是否相关。如果它们在真正内容之前只找到导航或冗余代码,可能会直接跳过您的页面。将 H1 和主要内容尽可能放在 HTML 的最前面。

超越检查清单:MAKO 层级

以上所有内容都是在现有 HTML 格式下让您的网站对 AI 代理更友好。但存在一个上限——即使完美优化的 HTML 仍然会发送比实际需要多 15-20 倍的 tokens

下一个层级是通过 content negotiation 在 HTML 之外提供结构化的 AI 原生内容。这正是 MAKO 协议所实现的:相同的 URL,相同的服务器,但当 AI 代理访问时,它收到的是带元数据的优化 markdown,而不是原始 HTML。

结果:减少约 94% 的 tokens,代理可以执行的声明式操作,以及可以有目的地跟踪的语义链接。

衡量您的现状

本检查清单中的每一项都对应 MAKO Score 中的一个具体检查项——这是一个免费审计工具,从四个维度(可发现性、可读性、可信赖性、可操作性)衡量您的网站,并给出 0 到 100 的评分。

大多数未经优化的网站得分在 30-40 之间。使用本检查清单,您可以达到 60+。使用 MAKO,可达 90+。

立即检查您的 AI Score