一個網站如果”/robots.txt”不存在或者為空文件,那么說明此網站對于所有的搜索引擎robot,該網站都是開放的。
從京東和淘寶的robots.txt文件協議來看,robots.txt文件要講究語法的.
三個語法
1、User-agent ——用于描述搜索引擎robot的名字,定義搜索引擎類型。
2、Disallow ——不希望被訪問的一組URL,定義禁止抓取收錄地址。
3、Allow——希望被訪問的一組UR。
a、 * 匹配0或多個任意字符。
b、 $ 結束符。
首先寫User-agent:
A、U必須大寫,后面的小寫,緊接著冒號 ——這里還要注意一點:輸入法必須調成英文狀態,都是英文狀態下的)
B、空一格再定義搜索引擎類型。比如定義百度蜘蛛
再寫
Disallow ——不希望被訪問的一組URL,定義禁止抓取收錄地址,或 Allow——希望被訪問的一組UR。
Disallow: /(空一格,一撇)
Allow: /(空一格,一撇)
舉例:
1. 禁止所有搜索引擎訪問網站的任何部分
User-agent: *
Disallow: /
2. 僅禁止Baiduspider訪問您的網站
User-agent: Baiduspider
Disallow: /
3.禁止Google索引你的網站。
User-agent: Googlebot
Disallow: /
4.除了百度以外,其他一切搜索引擎禁止索引你的網站。
User-agent: Baiduspider
Allow: /
User-agent: *
Disallow: /
5. 禁止所有搜索引擎訪問install這個目錄以及install這個目錄下的所有文件
User-agent: *
Disallow: /install
6.禁止百度搜索引擎訪問admin目錄;允許訪問images目錄。
User-agent: Baiduspider
Disallow: /admin
Allow: /images
7.禁止百度搜索引擎訪問網站所有.jpg的圖片
User-agent: Baiduspider
Disallow: /*.jpg$
8.禁止百度搜索引擎訪問網站所有的圖片
User-agent: Baiduspider
Disallow: /*.jpg$
Disallow: /*.png$
Disallow: /*.gif$
9.禁止所有搜索引擎訪問admin目錄下所有php文件;允許訪問asp文件。
User-agent: *
Disallow: /admin/*.php$
Allow: /admin/*.asp$
10.禁止所有搜索引擎索引網站中所有的動態路徑。
User-agent: *
Disallow: /*?*
重點區分以下兩種:
a、禁止搜索引擎訪問faq目錄下的所有文件
User-agent: *
Disallow: /faq/
例1:http://www.binweb.cn/faq/1.html 不能訪問
例2:http://www.binweb.cn/faq1.html 能訪問
b、禁止搜索引擎訪問以faq開頭的所有文件
User-agent: *
Disallow: /faq
例1:http://www.binweb.cn/faq/1.html 不能訪問
例2:http://www.binweb.cn/faq1.html 不能訪問
長沙科聯環保科技有限公司
長沙科聯環保科技有限公司坐落于國家級長沙經濟技術開發區,星沙工業園、我們以“科技創新,聯合共...南京尚上防腐木
南京尚上防腐木是一家專業致力于加工、制作、銷售戶外景觀防腐木,并為客戶設計安裝一站式服務的現...長沙昱霆機電有限公司
長沙昱霆機電有限公司是長沙空壓機_長沙空壓機保養_湖南空壓機維修_長沙空壓機機頭維修-長沙昱...湖南省土地學會,湖南土地學會,湖南土地學會官網
湖南省土地學會是全省土地科技工作者自愿組成,并依法登記的學術性、非盈利性、公益性的法人社會團...湖南為美環保技術有限公司,醫療污水凈化機組...
湖南為美環保技術有限公司應“綠水青山就是金山銀山”之勢而生,秉持“為民環保,美麗干凈”理想信...長沙租車公司-長沙鑫晨租車
長沙鑫晨租車(長沙租車網)于2008年,已精工細作多年。現以成為長沙地區較早的租車公司之一。...聯系方式
地址:湖南省長沙市天心區韶山南路248號南園503室
電話:13637482004 0731-88571521
網址:http://m.testtao.net/
郵箱:123@123007.com
微信咨詢
掃一掃進移動端