服务器反爬虫攻略:Apache/Nginx/PHP禁止某些User Agent抓取网站
发布时间:2019-02-14 08:07:18 所属栏目:外闻 来源:bcoder
导读:一、Apache ①、通过修改 .htaccess 文件 修改网站目录下的.htaccess,添加如下代码即可(2 种代码任选): 可用代码 (1): RewriteEngineOn RewriteCond%{HTTP_USER_AGENT}(^$|FeedDemon|IndyLibrary|AlexaToolbar|AskTbFXTV|AhrefsBot|CrawlDaddy|CoolpadW
PHP
四、测试效果 如果是 vps,那非常简单,使用 curl -A 模拟抓取即可,比如: 模拟宜搜蜘蛛抓取: Shell
模拟 UA 为空的抓取: Shell
模拟百度蜘蛛的抓取: Shell
(编辑:晋中站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |
站长推荐
热点阅读