|
Post by account_disabled on Dec 26, 2023 2:11:11 GMT -7
对于服务器来说,爬行 JavaScript 代码需要回收所有资源,而且漫长而乏味,这实际上是对爬行预算的浪费…… 重复的内容。如果您的网站包含内部重复内容,您的抓取预算将自行消耗,因为机器人会多次传递相同的内容...就像常见问 WhatsApp 号码数据 题解答等低质量内容不必要地消耗抓取预算一样... 移动优先。将专用于移动设备的 Googlebot 与专用于桌面设备的 Googlebot 进行比较非常重要。比以往任何时候都更重要的是一个口号:以移动为先! 按设备访问 不存在的站点地图或即使网站发生更改但尚未更新的站点地图也可能是导致 Google 抓取速度减慢的原因。 为什么要关心抓取预算? 对于一些网站管理员和 SEO 专家来说,抓取预算不值得长期关注。对于其他人来说,这个元素需要特别注意。那么,它到底是什么? 鉴于互联网上存在的页面数量巨大,爬虫被迫向每个网站授予先前定义的(尤其是不可扩展的)探索资源。是的,每个人都能找到适合自己的东西!您是否希望您的网站(更具体地说是您的战略页面)被快速索引?因此请记住优化您的抓取预算。 要了解优化抓取预算的有益效果,技术很简单:比较优化前与优化后抓取的新页面数量。 网址抓取谷歌 每天我的网站上有多少个网址被抓取? 要准确了解 Google 抓取的 URL 数量,分析日志文件是最简单的方法,并且有充分的理由:它可以让您知道您网站的哪些图像返回给搜索引擎。通过这种分析,可以收集诸如所爬行的网站的页面、类别和部分、爬行频率以及在这些不同页面上收到的信息等信息。 通常情况下,著名的搜索控制台还会为您提供有关网站抓取的非常重要的信息。 抓取统计数据 资料下载 您是否喜欢一一研究您的页面的抓取?Search Console 中的网址检查器将是您最好的朋友!相关页面上的工具的反馈将为您提供需要改进的领域的概述。 如何优化您的抓取预算? 考虑到本文前面所述的所有元素,有几种技术相结合可以显着提高您的爬网预算。从SEO优化的角度来看,重要的是要考虑如何节省抓取预算这个宝贵的资源。 识别不必要地消耗抓取预算的页面 几乎在每个网站上,许多页面都被不需要的机器人抓取。这种浪费的抓取预算也会影响网站的 SEO 性能。 通过Search Console,您可以查看已抓取但未编入索引的页面数量。该数据提供了抓取预算的初步概述,该预算可用于其他更重要和战略性的页面。但真正感谢日志分析 ,您将能够准确地了解浪费的爬行预算量。该技术包括将爬网页面数与网站上的页面总数进行比较,以确定: 网站被抓取的百分比是多少? 哪些 SEO 战略页面未被抓取? 哪些页面不必要地消耗抓取预算? 预算爬行尖叫青蛙 来源: 尖叫青蛙 将 Googlebot 引导至战略页面 如果您网站的树结构首先必须为用户设计,那么忽视爬虫的行为和期望将是一个错误。
|
|