联系我们
简单又实用的WordPress网站制作教学
当前位置:网站首页 > WordPress教程 > 正文

WordPress网站阻止特定机器人和爬虫访问的方法

作者:98wpeu发布时间:2026-03-19分类:WordPress教程浏览:5


导读:前面分享过查看WordPress搜索机器人日志的方法,然后从日志里面看了一些垃圾搜索机器人天天没命的抓取网站,还带不来流量也没有什么收录,就是抓着好玩,例如YandexBot、Do...

前面分享过查看WordPress搜索机器人日志的方法,然后从日志里面看了一些垃圾搜索机器人天天没命的抓取网站,还带不来流量也没有什么收录,就是抓着好玩,例如YandexBot、DotBot、BLEXBot

所以,既然没用,就不要占用我服务器带宽跟资源了,屏蔽掉这些没用的垃圾蜘蛛吧。

使用robots.txt文件

robots.txt文件做过网站的人应该都听说过,所以这里就不给你科普它的作用了。

直接插入下面这些内容保存,就可以了。

User-agent: YandexBot
Disallow: /

User-agent: DotBot
Disallow: /

User-agent: BLEXBot
Disallow: /

使用User Agent Blocker插件

User Agent Blocker这款插件通过修改.htaccess文件来阻止你不想要来你网站抓取的蜘蛛和爬虫。

因为是直接修改的.htaccess文件,所以对于那些不遵循robots协议的蜘蛛和爬虫来说就更加有效。

插件下载地址:

下载地址

nginx配置屏蔽方法

上面的插件是修改.htaccess文件,所以只适合apache为网站环境的网站,像建站笔记使用的是nginx,那么就可以通过下面这个方法来屏蔽。

这个方法是github上分享的,原文地址:https://github.com/mariusv/nginx-badbot-blocker

在Installation段介绍了详细的使用方法。

简单说就是在自己虚拟主机的nginx配置文件里面引入下面两个配置文件

include nginx-badbot-blocker/blacklist.conf;
include nginx-badbot-blocker/blockips.conf;

然后重启nginx服务就可以了。

使用安全插件屏蔽

之前推荐过给WordPress装一个防火墙吧!试试 Wordfence

直接在Wordfence的防火墙设置里面,也可以禁止特定爬虫抓取,还可以设置抓取频率,当爬虫频率过高的时候会自动阻止它。

相关文章:垃圾蜘蛛AhrefsBot封禁方法 附AhrefsBot爬虫IP列表

[+] 本文是全系列中第8 / 19篇:WordPress安全

标签:爬虫机器方法网站


WordPress教程排行
最近发表
网站分类
标签列表