robots.txt 使用範例教學

robots.txt 檔中基本會用的幾個參數分別如下：

User-agent：定義下述規則對哪些搜尋引擎生效，即是對象。
Disallow：指定哪些目錄或檔案類型不想被檢索，需指名路徑，否則將會被忽略。
Allow ：指定哪些目錄或檔案類型可能被檢索，需指名路徑，否則將會被忽略。
Sitemap：指定網站內的sitemap檔案放置位置，需使用絕對路徑。

以下是幾種常見及可能使用到的方式：

一、基本應用
1.允許所有搜尋引擎檢索所有內容(通常建議使用)
User-agent: *
Disallow:

2.拒絕所有搜尋引擎檢索所有內容(正式環境請避免使用)
User-agent: *
Disallow: /

3.拒絕所有搜尋引擎檢索/members/底下所有內容。
User-agent: *
Disallow: /members/

4.拒絕Google搜圖的爬蟲檢索/images/底下所有內容。
User-agent: Googlebot-image
Disallow:/images/

二、進階應用
[萬用字元]拒絕所有搜尋引擎檢索網站內png為副檔名的圖檔。
User-agent: *
Disallow: *.png$

[萬用字元]拒絕Bing搜尋引擎檢索網站內/wp-admin目錄底下所有內容及網站內開頭為test的所有檔名。
User-agent: bingbot
Disallow: /wp-admin/
Disallow: ^test*

Robots.txt測試方式
如果要驗證自己的網站有無Robots.txt，最簡單的方式是直接在網站根目錄下輸入robotx.txt做測試，檢驗是否存在。
例：https://www.apple.com/robots.txt

而若不知道目前robots.txt語法是否正確，也可以借助Google Search Console工具來做測試。

沒有留言:

張貼留言

訂閱：意見 (Atom)

學堂師資介紹

★林葳秦老師-經歷：

經濟部工業局人培案-
AI課程系列-【企業級 Linux 數據資料分析師】指定講師
BI課程系列-【大數據分析與商業智慧】指定講師
聖極五術研究協會-【做自己生命的數據分析師】指定學術講師
清華大學-自強基金會 AI 資料科學家人材養成班-Hadoop講師
中國文化大學-資訊科技認證訓練中心-職訓講師。
銘傳大學產業暨推廣處資訊講師
東海大學推廣教育部 AI課程系列-Python 數據分析講師。

NTC.im-Python 數據資料分析師入門班講師
現任中華聖極五術研究協會-常務理事暨學術講師
靜宜大學-資料科學暨大數據分析應用學系講師
嘉南藥理大學-資訊管理系-開放源碼課程講師
曾任龍華科技大學-文化創意與數位媒體設計系講師。
土芭樂數位學堂-執行長暨講師。

曾任英商傳述公司市場行銷部網站管理主任。
曾任英商傳述公司資訊部 Web Application 程式設計師。
iPresentation 影音站台中心網站管理者。

曾任警政署 SQL Server 指定講師。
曾任中美通電腦顧問公司-系統整合部專案經理。
曾任微軟知識管理課程授課顧問。

曾任北區職訓局人才培訓案講師。

曾任花旗銀行辦公室文書課程指定講師。
曾任巨匠電腦中區專任講師。
曾任巨匠電腦彰化分校兒童電腦暑期夏令營老師。
曾任博士兒兒童電腦資優班老師。
曾任台中市文心國小中高年級電腦課程老師。
曾任台中市潭子國小社團活動電腦課程老師。
土芭樂數位新思路(toBala.Net)站長；
成立土芭樂數位學堂及TW練功坊。

★林宗賢老師-經歷：
靜宜大學-SQLite/SQL Server 應用課程助理教授

中華郵政總局網路作業系統講師

曾任中研院專案工程師

★楊世宏老師-經歷：

光研智能-物聯網大數據分析與應用

AI人工智慧與邊緣運算工程師

文化大學推廣部-金象盃數據分析入門訓練講師

robots.txt 使用範例教學

沒有留言:

張貼留言

學堂師資介紹

快加入「土芭樂」好友行列

土芭樂網誌清單

文章標籤

發表過的舊文章

推薦閱讀

授權模式

歡迎加入土芭樂的好友行列

推播廣告

Recent Posts

推播廣告

robots.txt 使用範例教學

沒有留言:

張貼留言

學堂師資介紹

快加入「土芭樂」好友行列

土芭樂網誌清單

文章標籤

發表過的舊文章

推薦閱讀

授權模式

歡迎訂閱

歡迎加入土芭樂的好友行列

推播廣告

Recent Posts

推播廣告