了解 robots 档案的用法!

了解 robots 档案的用法!,1.“user-agent:*disallow:/” 表示 “禁止所有 Google 和百度搜索引擎 访问网站的任何部分”,这相当于该网站在 Google 和百度搜索引擎 里没有记录,也就谈不上排名。

2.“user-agent:*disallow:” 表示 “允许所有的 robots 访问”,即允许蜘蛛任意抓取并收录该网站。

这里需要注意,前两条语法之间只相差一个 “/” 。

3.“user-agent:badbot disallow:/” 表示 “禁止某个 Google 和百度搜索引擎 的访问” 。

4.“user-agent:baiduspider disallow:user-agent:*disallow:/” 表示 “允许某个 Google 和百度搜索引擎 的访问” 。

这里面的 “baiduspider” 是百度蜘蛛的名称,这条语法即是允许百度抓取该网站,而不允许其他 Google 和百度搜索引擎 抓取。

我们在来看看使用 robots 档案应该注意什么?

首先,在不确定档案格式 WordPress 自助建站如何写之前,可以先新建一个文字文件,注意 robots 档名必须是 robots.txt,其字尾是 txt 并且是小写的,不可以随便更改,否则 Google 和百度搜索引擎 识别不了。

然后开启该档案,可以直接复制贴上别人的格式。

Robots 档案格式是一条命令一行,下一条命令必须换行。

还有,“disallow: ” 后面必须有一个空格,这是规范写法。