robots.txt文件怎么写？最详细的robots.txt写法大全

编辑：云南网络营销师时间：2022-07-30 点击：

相信很多学习SEO的朋友都会接触到robots协议文件，对于robots协议文件，很多SEO新手都处于懵逼状态，那么什么是robots协议文件呢?这个文件的格式和写法又是怎样的呢？如何创建robots文件呢？相信一系列的问题一直困扰着大家，今天小编就来给大家分享一下详细的robots.txt写法大全。

一.什么是robots文件？

robots文件类似与和搜索引擎之间的一个协议，网站能通过该协议文件告诉搜索引擎蜘蛛哪些地方可以抓取，哪些地方不能被索引，站长们通常会把网站不重要的地方禁止搜索引擎抓取，达到一个集权的目的。

二.robots.txt怎么写？

格式例子：
User-agent: *

Disallow:

User-agent: *：这里的*代表的所有的搜索引擎种类，*是一个通配符，也可以是具体的搜索引擎蜘蛛，如Baiduspider 百度蜘蛛。

2.Allow:是代表允许指令，就算不写指令，搜索引擎也是默认抓取，因此允许指令的作用没其他指令大。

3.Disallow:该指令代表禁止指令，按网站路径或者某一特性进行限制抓取，一般后面会加上禁止访问页面的路径，作用很大。

下面通过写作例子来给大家详细讲解，方便大家理解。

例1.禁止搜索引擎访问网站的所有内容

格式例子：
User-agent: *

Disallow: /

其中“/”代表网站的根目录，该意思就是禁止搜索引擎抓取网站根目录下的所有内容。

例2.允许搜索引擎访问网站的所有内容

格式例子：
User-agent: *

Allow: /

允许搜索引擎抓取网站所有内容，可以不用写robots文件，或者创建一个空的robots文件，搜索引擎默认抓取。

例3.仅禁止百度蜘蛛（Baiduspider）访问网站

格式例子：
User-agent: Baiduspider

Disallow: /

如果要禁止某一特定的搜索引擎访问网站，就需要在第一排指令填写该搜索引擎蜘蛛名称，而第二排禁止指令进行禁止访问，这个例子主要是限制百度蜘蛛访问网站，而其他搜索引擎则不受限制。

例4.仅允许百度蜘蛛（Baiduspider）访问网站

格式例子：
User-agent: Baiduspider

Allow: /

User-agent: *

Disallow: /

第一段的指令是允许百度蜘蛛访问网站，第二段的指令是禁止所有搜索引擎访问网站，而指令也分优先级，因此要把允许指令写在前面，禁止指令写在后面。

例5.仅允许百度蜘蛛（Baiduspider）和谷歌（Googlebot）访问网站

格式例子：
User-agent: Baiduspider

Allow: /

User-agent: Googlebot

Allow: /

User-agent: *

Disallow: /

和例4没什么不同，只是多加了一个优先指令而已。

例6.禁止所有搜索引擎蜘蛛（spider）访问指定目录

格式例子：
User-agent: *

Disallow: /XXXXXX/

Disallow: /YYYYYY/

这个例子比较特殊，而且涉及的知识点比较多，很多朋友就是没有注意到这些细节，导致一下屏蔽掉了整个网站，这个例子主要屏蔽/XXXXXX/和/YYYYYY/目录，搜索引擎就不会继续访问这两个目录。同时需要注意的是每一个目录都需要一个特殊的指令，必须分开声明，千万不要写成“Disallow: /XXXXXX/ /YYYYYY/”。