了解 robots 档案的用法!

了解 robots 档案的用法!,1.「user-agent:*disallow:/」 表示 「禁止所有 Google 和百度搜索引擎 访问网站的任何部分」,这相当于该网站在 Google 和百度搜索引擎 里没有记录,也就谈不上排名。

2.「user-agent:*disallow:」 表示 「允许所有的 robots 访问」,即允许蜘蛛任意抓取并收录该网站。

这里需要注意,前两条语法之间只相差一个 「/」 。

3.「user-agent:badbot disallow:/」 表示 「禁止某个 Google 和百度搜索引擎 的访问」 。

4.「user-agent:baiduspider disallow:user-agent:*disallow:/」 表示 「允许某个 Google 和百度搜索引擎 的访问」 。

这里面的 「baiduspider」 是百度蜘蛛的名称,这条语法即是允许百度抓取该网站,而不允许其他 Google 和百度搜索引擎 抓取。

我们在来看看使用 robots 档案应该注意什么?

首先,在不确定档案格式 WordPress 自助建站如何写之前,可以先新建一个文字文件,注意 robots 档名必须是 robots.txt,其字尾是 txt 并且是小写的,不可以随便更改,否则 Google 和百度搜索引擎 识别不了。

然后开启该档案,可以直接复制贴上别人的格式。

Robots 档案格式是一条命令一行,下一条命令必须换行。

还有,「disallow: 」 后面必须有一个空格,这是规范写法。