禁止百度搜索引擎收录的终极解决方案

579 字
3 分钟
禁止百度搜索引擎收录的终极解决方案

说明: 虽然建设网站的目的大部分是为了优化搜索引擎排名,实现互联网营销,但特殊情况下,仍会遇到“不希望搜索引擎收录”的需求,例如因为一些原因做了一个内容与主站几乎相同的二级站,但因为内容高度相似,百度关键词排名一部分给了二级站,影响了主站点的排名,这个时候就有这个必要斩断百度的收录。这里给出一个能有效禁止百度等搜索引擎收录的解决方案。

搜索引擎.png
搜索引擎.png

一、Robots.txt只能禁止抓取,无法禁止收录

很多人认为在robots.txt中禁止百度蜘蛛爬取就等于禁止收录,这是严重的误解。

robots-txt-defined.png
robots-txt-defined.png

robots.txt文件可以告诉搜索引擎哪些目录和文件可以抓取,哪些不可以。经过实践发现,即使禁止搜索引擎抓取根目录,robots文件也并不能实现禁止百度等搜索引擎收录。

如果一个网站的外链较多,基本上无法通过正常手段禁止百度收录,淘宝便是一个典型的案例(淘宝的robots.txt设置为禁止抓取根目录,但首页依然被收录)。关于robots.txt的作用、文件格式、使用方法,可参考>>百度站长平台的说明

二、通过Nginx判断user_agent禁止百度等搜索引擎访问,实现禁止收录

既然不能直接禁止抓取,那就干脆禁止百度蜘蛛等搜索引擎访问,思路是:判断user_agent,如果是百度蜘蛛、谷歌机器人等搜索引擎的user_agent,就返回403或者404,这样百度等搜索引擎就会认为这个网站无法打开或者不存在,自然也就不会收录了。

其实之前也写过类似的文章《Apache/Nginx/PHP 屏蔽垃圾 UA 爬虫的方法》可以参考一下

这里Nginx的配置代码如下:

if ($http_user_agent ~* "qihoobot|Baiduspider|Googlebot|Googlebot-Mobile|Googlebot-Image|Mediapartners-Google|Adsbot-Google|Feedfetcher-Google|Yahoo! Slurp|Yahoo! Slurp China|YoudaoBot|Sosospider|Sogou spider|Sogou web spider|MSNBot|ia_archiver|Tomato Bot")
{
return 403;
}

通过curl模拟搜索引擎抓取,测试以上代码有效,并在多次项目实践中验证了此方法的可行性,实现了彻底禁止百度收录!

支持与分享

如果这篇文章对你有帮助,欢迎分享给更多人或赞助支持!

赞助
禁止百度搜索引擎收录的终极解决方案
https://blog.moewah.com/posts/2351/
作者
MoeWah
发布于
2019-07-17
许可协议
CC BY-NC-SA 4.0
相关文章 智能推荐
1
SEO 域名迁移前期准备有哪些?「少输便是赢」的完整攻略
增长与SEO 域名迁移是不对称赌注,上行有限下行无限。本文从决策判断、准备清单、URL映射、重定向配置到迁移后监控,给出完整框架。准备阶段占90%工作量,迁移当天应该无聊才对。
2
网站排名没掉,流量没了:零点击搜索与 AI Overviews 的生存策略
增长与SEO 排名正常但流量下滑?58.5%的搜索以零点击结束,AI Overviews 让点击率下降58%。本文教你诊断零点击问题、被 AI 引用的 CITABLE 框架,以及从流量导向转向品牌曝光的新 SEO 策略。
3
Google Search Central Live 2026:AI 时代 SEO 的五个认知更新
增长与SEO 2026 年 4 月 Google 多伦多 Search Central Live 透露的 SEO 认知修正:索引门槛提高而非降低、AIO 阻止机制真相、Trends API 一致缩放、Markdown 转换无 SEO 价值等关键更新
4
Google SEO 优化 2026:从架构到外链的 11 个检查点
增长与SEO 从海外 SEO 实战案例拆解出的完整检查清单,涵盖技术架构迁移、URL清理、索引控制、锚文本优化、内容审计等11个核心环节。适合初学者对照排查,避开常见坑点。
5
Google 即将彻底弃用 FAQ Schema,你的FAQ内容怎么处理?
增长与SEO FAQ Schema 两次被 Google 弃用,根源是 schema.org 类型不够精准。社区提案 FAQSection 和 answer 属性能否解决问题?现有 FAQ 内容该怎么处理?
随机文章 随机推荐

评论区

Profile Image of the Author
MoeWah
Hello, I'm MoeWah.
专题文章
分类
站点统计
文章
198
分类
9
标签
434
总字数
373,761
运行时长
0
最后活动
0 天前

目录