设计出品
扫描关注网站建设微信号

扫一扫微信二维码

GoogleBot即将通过HTTP/2进行抓取

新乡云优化2020-09-20行业动态
GoogleBot即将通过HTTP/2进行抓取
Google宣布它将很快开始通过HTTP/2抓取某些网站。HTTP/2是下一代HTTP,是互联网主要用于传输数据的协议。它需要较少的开放连接,因此在爬网网页时可以在服务器上更高效。
Google表示,此更改或您的网站支持通过HTTP/2进行爬网均无排名优势。
什么是HTTP/2?HTTP/2是万维网使用的HTTP网络协议的主要修订版。它源自Google最初开发的早期SPDY实验协议。HTTP/2由Internet工程任务组的HTTP工作组开发。
Google的IlyaGrigorik写道:“HTTP/2通过允许我们撤消先前在应用程序中完成的许多HTTP/1.1解决方法,并解决传输中的这些问题,将使我们的应用程序更快,更简单,更强大(这是罕见的组合)。层本身。更好的是,它也为优化我们的应用程序和提高性能提供了许多全新的机会。”
效率更高。HTTP/2(或简称为h2)更加高效,这就是Google采取这些步骤的原因。谷歌表示:“我们期望这一变化将使爬网在服务器资源使用方面更加有效。借助h2,Googlebot可以打开与服务器的单个TCP连接,并可以在服务器上并行高效地传输多个文件,而无需多个连接。打开的连接越少,服务器和Googlebot进行爬网所花费的资源就越少。”
从2020年11月开始。谷歌表示,此过程将从2020年11月的“少数站点”开始,然后逐步增加对越来越多站点的支持。谷歌表示,这只会在“可能会受益于最初支持的功能(例如请求多路复用)的网站”最初完成。
如果我的网站不支持HTTP/2怎么办?谷歌说,那很好。Google写道:“如果您的服务器仍仅使用HTTP/1.1,那也很好。”谷歌表示:“通过该协议进行爬网没有明显的缺点。爬行将在质量和数量方面保持不变。”
没有排名优势。不不不。HTTP/2没有排名优势。谷歌表示,如果谷歌使用HTTP/1.1或HTTP/2进行爬网,则没有直接的排名优势。
有什么好处。正如我们上面提到的,爬网效率是有好处的。Google说,这是三大优势:
复用和并发性:更少的TCP连接打开意味着更少的资源花费。
标头压缩:大幅减少HTTP标头大小将节省资源。
服务器推送:此功能尚未启用。它仍处于评估阶段。这对于渲染可能是有益的,但是目前我们还没有什么要说的。
我的网站是否支持HTTP/2。Cloudflare可能有一篇博客文章,分享了如何检查站点支持。或者,您可以要求您的房东和/或开发人员为您检查。
选择加入或退出。无法选择加入,这是自动的,您不能强迫Google通过HTTP/2进行抓取。但谷歌表示,您现在可以选择退出。要退出,请让您的服务器在Googlebot尝试通过h2抓取您的网站时响应421HTTP状态代码。谷歌说,如果目前还不可行,您可以向谷歌机器人团队发送消息。
你知道吗Google表示,当切换到HTTP/2抓取时,它可能会在GoogleSearchConsole中向您显示一条消息。谷歌写道:“当某个网站符合爬网条件,在SearchConsole中注册的该站点的所有者将收到一条消息,表明某些爬网流量可能会超过爬网时间。”谷歌还表示,“您也可以在服务器日志中检入”。
我们为什么在乎。对于较大的网站,提高抓取效率有助于托管预算。了解GoogleBot如何随着时间的推移进行适应和改进也很重要。
2015年,我们发表了一篇名为《为什么每个人都应该转向HTTP/2的文章》,其中解释了更多好处。
文章关键词