robots 檔案使用技巧

robots 檔案是一種機器人檔案,就是我們給 Google 和百度搜索引擎 蜘蛛看的一種檔案,Google 和百度搜索引擎 的蜘蛛在爬行我們網站的時候一把都會先爬行我們的 robots 檔案,然後根據 robots 檔案的要求,進行對我們網站的爬行。

那麼我們在寫 robots 檔案的時候應該注意哪些技巧呢。

一般網站中不需要蜘蛛抓取的檔案有:後台管理檔案、程序指令碼、附件、資料庫檔案、編碼檔案、樣式表檔案、模板檔案、導航圖片和背景圖片等等。

這個時候我們就可以通過以下的方法來設定 robots 檔案。

User-agent: *
  Disallow: /admin/ 後台管理檔案
  Disallow: /require/程序檔案
  Disallow: /attachment/ 附件
  Disallow: /images/ 圖片
  Disallow: /data/資料庫檔案
  Disallow: /template/ 模板檔案
  Disallow: /css/ 樣式表檔案
  Disallow: /lang/ 編碼檔案
  Disallow: /script/指令碼檔案
  Disallow: /js/js 檔案, 如果您想讓您的哪一個檔案不被 Google 和百度搜索引擎 抓取的話,那麼您就要按照以上的方法來設定您的 robots 檔案。

如果您的 WordPress 網站是動態網頁,並且這些動態頁面都做了靜態的版本,為了更好的 WordPress 讓蜘蛛抓取。

那麼您需要在 robots.txt 檔案里設定避免動態網頁被蜘蛛索引,這樣就能保證這些頁面不被 Google 和百度搜索引擎 重複的抓取了。

以上就是 WordPress SaaS 網路推廣整理的一些 robots 檔案的使用方法,robots 檔案的使用方法還有很多,在後續的文章中我們還會有更多的說明。