建议收藏,这份 robots.txt 可以屏蔽垃圾蜘蛛流量

Mr.zhuMr.zhu2025-08-20 17:31:08来源:优站库 (www.uzkoo.com)阅读:144

曾经有段时间,我的网站每天都在消耗巨大的流量,然而一查日志,发现都是一些垃圾蜘蛛。

这些垃圾蜘蛛除了消耗服务器资源不对给我们带来任何好处,最好直接屏蔽。

我写了一份 robots.txt 来屏蔽常见的垃圾指数,分享给大家,建议收藏。


User-agent: AhrefsBot
Disallow: /
User-agent: MJ12bot
Disallow: /
User-agent: DotBot
Disallow: /
User-agent: SemrushBot
Disallow: /
User-agent: ZoominfoBot
Disallow: /
User-agent: BLEXBot
Disallow: /
User-agent: aiHitBot
Disallow: /
User-agent: Mail.RU_Bot
Disallow: /
User-agent: XoviBot
Disallow: /
User-agent: MauiBot
Disallow: /

这份 robots.txt 规则能屏蔽哪些爬虫?

User-agent所属公司/项目主要用途被禁止的原因
AhrefsBot
Ahrefs
用于收集网页数据以进行SEO分析和反向链接检查。
可能消耗大量服务器资源,影响网站性能。
MJ12bot
Majestic-12
爬取网页以建立链接索引,支持Majestic搜索引擎的链接分析功能。
高频爬取可能导致服务器负载过高。
DotBot
DotNetDotCom.org
为SEO工具提供数据支持,收集网页信息。
爬取行为可能过于频繁,影响正常访问。
SemrushBot
Semrush
收集数据以支持SEO竞争分析、关键词研究等营销工具。
大量爬取可能导致资源占用过高。
ZoominfoBot
ZoomInfo
收集企业联系信息和公开数据,用于商业数据库。
可能抓取非公开信息或导致隐私问题。
BLEXBot
Content ad
爬取网页内容以生成广告或内容推荐。
可能抓取敏感内容或消耗过多带宽。
aiHitBot
aiHit
为aiHit公司收集企业数据,用于商业数据库。
爬取频率高或目标数据可能涉及隐私。
Mail.RU_Bot
Mail.RU (俄罗斯邮件服务)
为Mail.ru搜索引擎索引内容。
可能因爬取策略激进被网站屏蔽。
XoviBot
Xovi (SEO工具)
支持Xovi的SEO分析工具,爬取网页数据。
高频请求可能干扰正常服务。

完整规则如下(建议直接复制使用):

如何应用这份规则?

  1. 登录服务器,找到网站根目录。
  2. 创建或修改 robots.txt,粘贴上述规则。

你还建议屏蔽哪些呢?欢迎给我留言!

猜你想看

职场小人的9个特征,发现了赶紧远离!
灵活就业人员为何参保意愿不高?专家解读
为什么推荐你要“跑二休一”?
上班背这个包,时尚、能容、还好看,巴适得板
“以房养老”骗局三步走,通过这三个方向可甄别
如果没有时间,跑步质量怎么保证?
电动车旧电池到底值多少钱?回收旧电池都去哪了?行业人士告诉你
吃葡萄干之前,真的需要洗吗?新疆果农:一招教会你正确吃法
《逆水寒手游》天火伏雷江湖技能获取攻略
经常偏头痛怎么办?学会这4个方法有效缓解
王者荣耀:单排玩家上分学会这几要点,告别痛苦!
人参怎么判断年份,这些点你要了解
怎样和刚认识的女孩子微信聊天?撩女生的最佳策略与实用技巧
关于乐观向上的名言
真正成功的人,是善于“利用”别人的人
摩托车加尾箱会被扣分吗?是否需要报备
同样挂D档,为何有些车松刹车就走,有些车要踩油门,告诉你原因
新手上高速,会面临什么处罚
为什么有的人开车油耗高很多?主要是因为这个几个坏习惯引起的
秒懂!二手车过户流程全攻略

推荐站点