通过限制蜘蛛抓取页面数量来提升搜索引擎优化效果
发布时间:2021-05-12 | 发布者: 东东工作室 | 浏览次数: 次如果网站使用虚拟空间,那么就会有一些流量限制,如果大部分流量都被蜘蛛占据,那么我们就需要花一些额外的钱来购买流量。那么,如果一个网站上的大量流量被蜘蛛爬行所浪费,有什么技巧和方法可以在不影响搜索引擎优化效果的情况下限制搜索引擎优化效果呢?优帮云seo顾问认为我们可以采取以下方式:
1、找出假蜘蛛和护盾IP。通过对网站日志的分析,我们可以知道,很多所谓的百度蜘蛛或谷歌蜘蛛其实都是假的。我们可以分析这些假蜘蛛的IP来屏蔽它们,这样不仅可以节省流量,还可以降低网站被收集的风险。具体操作需要检查ip是否是真正的蜘蛛,操作方法是:点击左下角的start-run-cmd-enter命令即可看到结果。如果是真的,搜索蜘蛛有一个蜘蛛标记,但假蜘蛛没有标记。
2、屏蔽无效蜘蛛或搜索蜘蛛对搜索引擎优化的影响很小。比如我们知道google蜘蛛是一个非常大的抓取量,但是对于很多行业来说,google的流量很低,seo的效果不好,所以我们可以屏蔽google蜘蛛的抓取并节省很多流量,比如说网站屏蔽了抓取量。谷歌蜘蛛。除了谷歌,还有一些蜘蛛,如谷歌搜索、必应蜘蛛等。这些流量很低,或者几乎没有蜘蛛能真正躲开。
3、使用robots.txt限制无效或重复页面的爬网。有些页面可能以前就存在,但现在不存在,或者存在动态和静态URL。由于数据库中存在反向链接或此类链接,蜘蛛仍会不时地抓取它们。我们可以找到返回404页的url并将其屏蔽,从而改进抓取,屏蔽也减少了对流量的浪费。
限制蜘蛛抓取页面数量
4、限制页面爬行的内容,提高爬行的效率和速度,减少爬行的流量。对于任何页面,都有许多无效的噪声区域,例如网站登录、注册部分、底部版权信息、一些有用的链接导航等,或者一些模板上的蜘蛛无法识别的显示模块,我们可以使用这些模板添加nofollow标签。
5、外部链接或CDN加速,以改善蜘蛛抓取,减少服务器响应和流量浪费。目前的网站大多使用大量的图片、视频等多媒体来显示,但这些图片缺乏更多的下载流量。如果我们对图片使用外部调用,那么我们可以节省大量蜘蛛爬行流量。目前,更好的方法是把图片放到其他服务器上或上传到一些磁盘上。
6、使用站长工具限制或改进蜘蛛抓取,或限制蜘蛛抓取的时间。目前,百度站长平台和谷歌站长平台都有站长抓取工具,可以用来限制蜘蛛抓取的时间和数量,我们可以根据需要合理部署,达到较好的效果。
当然,在实践中,我们也可以根据自己的实际需要来解决这个问题,比如对于一些抓取量过大的栏目,在站点地图中设置一个较低的抓取频率,如果一些重要的内容没有被很好地包含进来,可以增加外部或内部的链来提高抓取的效率等等。该方法已经失效,可以根据具体情况进行改进。为了减少抓取和提高抓取效率,需要对更新期间的设置进行合理化。
转载请标注:东东工作室——通过限制蜘蛛抓取页面数量来提升搜索引擎优化效果