设计出品
扫描关注网站建设微信号

扫一扫微信二维码

有效索引

新乡云优化2019-11-03经验之谈
2.8.l有效索引
面对如此巨大数量的网页,任何一个常规关键词都可能匹配出几万、几十万甚至上亿的网页。
但是大部分用户一般都只浏览搜索结果的前三页,这样搜索引擎就没有必要响应每次搜索时都对全部的索引文件进行检索,只需要对
一个适当数量范围内的索引文件进行检索就可以了。
并且搜索引擎一般不会把检索到的所有相关网页都呈现给用户,而只是呈现1000个左右的结果,比如,百度最多呈现760个结果,Google最多呈现1000个结果。
所以搜索引擎只要建立一个能够满足大众搜索请求的小范围网页索引集合也就是有效索引就可以了。稍微有过SEO经验的朋友应该就有这种经验:一个新网站的网页,搜索网页的URL发现百度是收录的,但是搜索网页包含网站品牌词的Title却搜索不到。
对于老网站来说这是降权的现象,对于新网站来说就是这个新网页的权重比较低,并没有参与排名计算。
例如在百度中搜索,笔者原创并发布在个人博客上的一篇文章的URL,如图2-22所示,百度已经收录了。
但是直接搜索该页面的Title时,在百度搜索结果中却找不到这个页面,并且为了使得这个搜索词和网页建立唯一的对应关系,搜索词为网页的Title而不只是文章标题,如图2-23所示。
理论上全互联网只有笔者博客上的这个网页符合搜索请求,百度既然已经索引,那么就应该在搜索结果第一的位置呈现出来,但是百度并没有这么做。
图2-22百度搜索URL
图2-22百度搜索URL
图2-23百度搜索网页Title
图2-23百度搜索网页Title
如果百度是在已索引的全部文件中进行检索,肯定就会把这个网页呈现出来了(权重正常的网站都可以)。
搜索Title时,百度并没有呈现出这个网页,代表这个网页并没有在百度的有效索引库中。
出现这种情况一般是两种原因:该网页的权重太低,或者该网站已被降权。
有很多网站的首页都是这种情况,直接搜索域名是有收录的,如果只是搜索目标关键词却没有排名,那可能是算法微调或更新,但是如果搜索儿乎是独一无二的Title都找不到网站,那就要小心了,可能是被降权了,或者是降权的前兆。这个例子就体现出了搜索引擎拥有“有效索引”的模块,但是搜索引擎内部可能不叫有效索引,可能是叫“一级索引数据”“初始子集”之类的名字。
从这里也可以看出搜索引擎的“有效索引”应该是和网页权重挂钩的,有效索引库中是权重正常参与搜索排名的网页,其他低权重的网页可能就被列入了“无效索引”中,以备他用。当然在真实的大型搜索引擎中的索引库级别肯定不会只有“有效”和“无效”索引库两个级别,而是有一个多级别并伴随很复杂算法的索引系统。另外,也有可能搜索引擎并没有对索引进行明确分类,而是搜索用户只需要一小部分网页,搜索引擎只需要从整个索引库中抽取按照重要程度排序后比较靠前的一些网页来进行检索、排序和呈现就可以了,也就是说有些网页没有参与到排序并不是一定被归为“无效索引”,而只是暂时权重不是很高,两者还是有本质区别的。
在SEO工作中,提升网站和网页的权重是一个很重要的工作,并且提升网站的有效收录也是一个很重要的工作方向,这里的“有效收录”指的是在搜索引擎中不仅仅搜索内容标题和网页Title有排名,搜索网页所涉及的关键词也会有相关排名,并且可以带来搜索流量的网页。
文章关键词