联系我们
简单又实用的WordPress网站制作教学
当前位置:网站首页 > WordPress插件 > 正文

Block Common Crawl via robots.txt 最好的WordPress常用插件下载 博客插件模块

作者:98wpeu发布时间:2023-08-23分类:WordPress插件浏览:120


导读:通过robots.txt描述阻止通用抓取这个插件向WordPress自动创建的虚拟robots.txt文件添加行,如果该文件在服务器上不存在,则阻止通用抓取机器人(CCBot...

通过robots.txt描述阻止通用抓取这个插件向WordPress自动创建的虚拟robots . txt文件添加行,如果该文件在服务器上不存在,则阻止通用抓取机器人(CCBot ),该机器人用于训练人工智能算法,如ChatGPT(在3.5版本中,它占训练数据组合的60%)抓取网站。这里是关于普通爬行机器人(CCBot)的信息。

请注意这个插件到底是做什么的:如果你激活这个插件,它会在robots.txt文件中添加一些行,告诉普通的抓取机器人不要抓取和索引这个网站的某些部分。

如果你知道你在做什么,请激活这个插件。

我能用这个插件做什么?这个插件向WordPress自动创建的virtual robots.txt文件添加了必要的行,以阻止通用爬行机器人(CCBot)用于训练ChatGPT等人工智能算法爬行网站。

这个插件是基于什么想法?我们的插件在发布抓取网站的OpenAI ChatGPT插件后阻止OpenAI ChatGTP bot。

robots.txt文件是什么?robots.txt文件是一个纯文本文件,位于一个域(或子域)的根文件夹中,它告诉网络爬虫(如Googlebot)应该访问和索引网站的哪些部分。

搜索引擎爬虫访问页面时首先查看的是robots.txt文件,它控制搜索引擎爬虫如何查看网页并与之交互。

系统要求7.4或更高版本。我们需要7.4或更高版本,因为我们相信每个人都应该运行现代的PHP版本。当发布这个插件时,WordPress推荐PHP 7.4或更高版本。我们建议8.0或更高版本,因为7.4自2022年11月28日以来没有安全更新。

如何用你的语言得到这个插件!第一版有英语和西班牙语版本。在–languages–文件夹中,我们包含了翻译该插件所需的文件。

如果你喜欢你的语言插件,并且你擅长翻译,请使用本地WordPress翻译功能。

刚开始翻译插件?首先通读翻译手册,然后在翻译WordPress上选择你的语言环境,最后进入这个插件的翻译页面进行翻译。

进一步阅读您可以访问西班牙语的插件描述:Block Common Crawl bot(CCBot via robots . txt en espa & ntilde;ol。

如需更多信息,请发电子邮件给我们。

截屏

插件添加到WordPress创建的virtual robots.txt文件中的行。安装首先你必须把插件上传到/ wp-content/plugins/文件夹。然后在插件面板中激活插件。没有设置。FAQ你为什么做这个插件?我们创建这个插件是为了能够添加一些行来阻止普通爬行机器人(CCBot)通过robots.txt访问网站,而不必上传robots.txt文件。

Block Common Crawl bog via robots . txt对数据库有改动吗?不。该插件不会将任何选项或设置写入数据库。

我怎样才能知道这个插件是否适合我?安装并激活。查看域根目录下robots.txt文件的内容。

如何通过robots.txt移除Block Common Crawl bog?你可以在你的插件管理部分简单地激活、停用或删除它。没有选项存储在数据库中,所以你也可以通过FTP删除它,一切都将被删除。

如果服务器上有物理robots.txt文件会怎么样?这个插件对WordPress自动生成的虚拟robots.txt文件进行修改,但不能与物理robots.txt文件一起使用。为了使用这个插件,你需要从你的服务器上删除物理机器人. txt文件。在使用此插件之前,请通过FTP或服务器面板删除robots.txt文件。我们在激活时检查这一点(并且只在激活时)。如果我们找到一个物理robots.txt文件,插件将无法被激活,直到该文件被删除。请记住,我们只在插件激活时检查它,激活后我们不再检查它;因此,如果你上传一个robots.txt文件到域的根目录,一旦插件被激活,插件将不会有任何影响,但你不会收到警告。

如果WordPress安装在子目录中会怎么样?WordPress必须安装在web服务器的顶层目录中。请注意,robots.txt必须位于web服务器的顶层目录中。如果WordPress安装在子目录中,这个插件将不会生效,因为WordPress在子目录中生成的robots.txt文件将被机器人忽略。请注意,我们不检查这一点。你可以在这里阅读更多关于robots.txt标准的内容robotstxt.org:如何创建/robots.txt文件以及把它放在哪里。

有任何已知的不兼容性吗?请不要在WordPress MultiSite上使用它,因为它还没有经过测试。

该插件具有与Virtual Robots.txt和Better Robots.txt相似的功能。SEO助推器插件;两者都与我们的插件不兼容,因为它们删除了所有虚拟的WordPress robots.txt内容,并创建了自己的内容。我们的插件创建的指令不会添加到这些插件生成的robots.txt文件中,因为它们不使用WordPress的标准功能来添加信息。

这个插件可以和我们的插件一起使用来阻止OpenAI ChatGTP bot。

这个插件在robots.txt文件中添加了哪些行?用户代理:ccbotdallow:/

对服务器有什么要求吗?是的。该插件需要PHP 7.4或更高版本,我们建议使用PHP 7.4或更高版本。这个插件已经用PHP 7.4测试过了。当发布这个插件时,WordPress推荐PHP 7.4或更高版本。

你自己有没有通过robots.txt使用Block Common Crawl (CCBot)?我们当然知道。这就是我们创建它的原因。

评论此插件没有评论。

标签:机器人TXTCrawlCommon


WordPress插件排行
最近发表
网站分类
标签列表