我们可以通过读取HTTP_USER_AGENT来判断请求,从而做到屏蔽页面抓取。

国内一些蜘蛛的UA:

$spiders = array(
'Googlebot',
'Baiduspider',
"Sogou web spider",
"360Spider",
"YisouSpider",
"Sosospider",
"YoudaoBot",
'Yahoo! Slurp',
'EasouSpider',
'bingbot'
);

模板兔给出大致的代码供参考: