机器人
Antora可以生成一个robots.txt文件来控制站点爬虫可以访问的路径。
robots键
robots键是可选的。它在playbook中的站点键下配置。其可接受的值为:
-
allow
-
允许所有用户代理访问发布站点中的所有路径。
-
disallow
-
禁止所有用户代理访问发布站点中的所有路径。
- 自定义多行字符串
-
非空的、用户指定的字符串,用作生成的robots.txt文件的内容。
示例1. antora-playbook.yml
site:
title: 站点标题
url: https://example.org
robots: disallow
Antora将在站点根目录生成robots.txt文件。
robots键取决于同级的url键。如果url键未分配值,即使robots设置为可接受的值,Antora也不会生成robots.txt文件。
分配允许或禁止给robots
假设url和robots键定义如下:
示例2. antora-playbook.yml
site:
title: 演示文档站点
url: https://demo.antora.org
robots: allow
这将生成一个允许用户代理访问站点所有路径的robots.txt文件。
生成的robots.txt
User-agent: * Allow: /
同样,如果url和robots键定义如下:
示例3. antora-playbook.yml
site:
title: 演示文档站点
url: https://demo.antora.org
robots: disallow
这将生成一个禁止访问所有路径的robots.txt文件。
生成的robots.txt
User-agent: * Disallow: /