经纬科技
 
   
    百度排名优化资料
 
·经纬科技收录:网
·经纬科技收录:牛
·关于百度的城市地
·Albert:透
·新站怎样才不容易
·百度、谷歌搜索引
·经纬科技浅析:百
·难道百度也有沙盒
·经纬科技浅析:S
·经纬科技浅析:百
·经纬科技浅析:百
·经纬科技转:我的
·网络牛人:每天从
·9月后百度收录新
·经纬科技建议如何
·百度日本域名之拍
·百度开始重视网络
·百度获网络新闻牌
·有问题百度一下,
·百度的seo技术
·百度制造:外链标
·百度与站长-使百
·百度与百代“新双
·评论:百度被逼踏
·需求不代表有市场
·百度可能已获新闻
·百度初胜国内首起
·解读百度的收录和
·解读百度的收录和
·解读百度的收录和
   
  百度排名优化资料
如果你真的想屏蔽baiduspider,可尝试以下方法
         本文针对virushuo无助的留言http://blog.donews.com/concorde/archive/2006/01/30/711847.aspx,原帖:http://blog.donews.com/virushuo/archive/2006/02/05/715379.aspx

从最初的反百度改成了现在的Ban百度,站长对待百度的态度就像BIDU的走势,好像现在屏蔽baiduspider已经成为一种时尚,难道这玩意也跟着纳斯达克变?

首先我自己不会屏蔽baiduspider,也不大相信baiduspider会故意忽略robots.txt,但如果你真的想屏蔽 baiduspider,可尝试以下方法:

1. 上传一个robots.txt到根目录,内容为:

User-agent: baiduspider
Disallow: /

一个搜索引擎爬虫工作前首先应该访问/robots.txt制定排除列表,baiduspider还无法高级到故意忽略某些网站的robots.txt,不知道baiduspider怎么折腾才能让robots.txt失效。

2. 如果仅仅因为服务器吃不消,不防按照http://www.baidu.com/search/spider.htm的指示写信给百度。估计很多人试过得不到回复(Google基本都是2个工作日内回复)。

3. 如果还没有办法,可尝试.htaccess屏蔽,上传一个.htaccess文件到根目录,内容为:

SetEnvIfNoCase User-Agent "^baiduspider" ban_bot
deny from env=ban_bot

还可以扩大这个列表,屏蔽那些Email提取爬虫、网站克隆爬虫等(小偷一般不守法,但总比自己什么都不做强):

SetEnvIfNoCase User-Agent "^baiduspider" ban_bot
SetEnvIfNoCase User-Agent "^HTTrack" ban_bot
SetEnvIfNoCase User-Agent "^EmailCollector" ban_bot
SetEnvIfNoCase User-Agent "^EmailWolf" ban_bot
SetEnvIfNoCase User-Agent "^ExtractorPro" ban_bot
SetEnvIfNoCase User-Agent "^Offline" ban_bot
SetEnvIfNoCase User-Agent "^WebCopier" ban_bot
SetEnvIfNoCase User-Agent "^Webdupe" ban_bot
SetEnvIfNoCase User-Agent "^WebZIP" ban_bot
SetEnvIfNoCase User-Agent "^Web Downloader" ban_bot
SetEnvIfNoCase User-Agent "^WebAuto" ban_bot
SetEnvIfNoCase User-Agent "^WebCapture" ban_bot
SetEnvIfNoCase User-Agent "^WebMirror" ban_bot
SetEnvIfNoCase User-Agent "^WebStripper" ban_bot

deny from env=ban_bot

.htaccess要用文本方式上传,有些Apache配置比较怪异,防止引起冲突建议上传后立刻看看是否影响普通用户的访问。如果浏览正常,再用FlashGet模拟baiduspider测试这个.htaccess是否工作,方法是:

FlashGet->工具->选项->协议,把HTTP用户代理改成用户自定义:baiduspider;然后用FlashGet下载该网站任意页面,在FlashGet的下载日志里得到HTTP/1.1 403 Forbidden则成功:
google排名(转)