经常听到开发者问,百度蜘蛛是什么?最近百度蜘蛛来的太频繁服务器抓爆了,最近百度蜘蛛都不来了怎么办,还有很多站点想得到百度蜘蛛的IP段,想把IP加入白名单,但IP不固定,这些百度方面并未透露相关信息。
那么如何才能识别正确的百度蜘蛛呢?来来来,只需简单两步,教你正确识别百度蜘蛛。
1、检查UA,如果UA错误,你可以直接判断百度没有搜索的蜘蛛。当前已发布的UA是:
移动UA:Mozilla/5.0 (Linux;u;Android 4.2.2;zh-cn;) AppleWebKit/534.46 (KHTML,likeGecko) Version/5.1 Mobile Safari/10600.6.3 (compatible; Baiduspider/2.0;+http://www.Baidu / Search / Spider.html)
PCUA: Mozilla / 5.0 (compatible; whiteheaded spider / 2.0; + http: / / www.Baidu / Search / Spider.html)
新增渲染UA:
移动UA:Mozilla/5.0 (iPhone; CPU iPhone OS 9_1 likeMac OS X) AppleWebKit/601.1.46 (KHTML, like Gecko) Version/9.0 Mobile/13B143Safari/601.1 (compatible; Baiduspider-render/2.0; +http://www.baidu.com/search/spider.html)
PC UA: Mozilla5.0(compatible; baiduspider-render 2.0; + http://www. 51education.net).baidu.com/search/spider.html)
2、反查IP
站长可以通过DNS反查询IP的方式判断蜘蛛是否来自百度搜索引擎。所以这些系统平台验证方法都不同,linux/windows/mac os三种平台下的验证方法分别如下:
1、在 linux 平台下,您可以使用 host ip 命令反解 ip 来判断是否来自 Baiduspider 的抓取。看返回结果,Baiduspider 的 hostname以.baidu.com 或 *.baidu.jp 的格式命名非 *.baidu.com 或 *.一个球员 jp 是个冒牌货。
2、在windows平台或者IBMOS/2平台下,您可以使用nslookupip命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入nslookupxxx.xxx.xxx.xxx(IP地址)可以解析Ip,以确定抓取是否来自白蜘蛛,即白蜘蛛的主机名到Baidu.baidu.jp 的格式命名非 *.baidu.com 或 *.一个球员 jp 是个冒牌货。
3、在mac os平台下,您可以使用dig 命令反解ip来判断是否来自Baiduspider的抓取。打开命令处理器输入digxxx.xxx.xxx(IP地址)可以解析ip以确定是否从Baiduspider获取,Baiduspider的主机名变为*。Baidu.baidu.jp 的格式命名非 *.baidu.com 或 *.一个球员 jp 是个冒牌货。