设计出品
扫描关注网站建设微信号

扫一扫微信二维码

锚文本:数据驱动指南(研究了384,614个网页)

新乡云优化2019-11-18行业动态
锚文本:数据驱动指南(研究了384,614个网页)
每个人都知道链接是至关重要的排名因素。但是链接锚文本呢?
这就是Google的John Mueller所说的:
大多数链接的锚文本确实提供了一些额外的上下文。至少他们应该,对?
—??约翰(@JohnMu)2017年11月23日
他似乎暗示着Google使用锚文本来帮助理解链接的上下文,因此,这可能是“排名因素”。这并不令人感到意外-Google的原始专利声明他们使用锚文本来影响排名。(稍后会更多!)
这是 约翰的另一条推文,他重申了锚文本的重要性:
是的,但是锚文本(和图像替代文本)在很大程度上帮助我们理解上下文,因此,如果可以避免的话,我也不会遗漏。
—??约翰(@JohnMu)2017年5月15日
问题是:您应该使用哪种锚文本?如果要在搜索引擎中排名,是否应限制使用特定类型的锚文本?您是否应该完全操纵锚文本?
在本指南中,我们将通过研究384,614个网页的反向链接的锚点文本来揭示发现的内容。但是首先,请确保我们了解基本知识。
什么是锚文字?
锚文本是指用于将一个网页链接到另一个网页的可点击词。
锚文本示例
示例:  在此句子中,蓝色词  是锚文本。
定位文字的类型
假设有人决定链接到我们的反向链接检查器。
该页面的主要目标关键字是“反向链接检查器”,根据Ahrefs的关键字资源管理器,每月全球搜索量为80K。
通过Ahrefs的关键字资源管理器
但是,并非每个人都会以相同的方式链接到此页面。以下是他们可能使用的一些锚文本变体:
完全匹配:锚文本是我们要为其排名的确切关键字或短语。
Ahrefs的Backlink Checker  是我最喜欢的SEO工具之一。
词组匹配:锚文本包含我们要排名的关键字词组。
Ahrefs的Backlink Checker  是我最喜欢的SEO工具之一。
部分匹配:锚文本具有查询中的所有单词,但不包含确切的短语。
Ahrefs的Checker de la Backlink  是我最喜欢的SEO工具之一。
品牌:  锚文字是我们品牌的名称:
Ahrefs的Backlink Checker是我最喜欢的SEO工具之一。
裸URL:锚文本是原始的“裸” URL(即,将在浏览器中显示):
Ahrefs的Backlink Checker(https://ahrefs.com/backlink-checker/)是我最喜欢的SEO工具之一。
随机:锚文本是一个不明确的通用短语,不包含我们的目标关键字(例如,“单击此处”,“本网站”,“本文”等)
Ahrefs的Backlink Checker是我最喜欢的SEO工具之一。单击此处  亲自尝试!
图片链接:  锚文本是图片的替代文本(根据Google)。
<a href=”https://ahrefs.com/backlink-checker”>
<img src=”/backlink-checker.png” alt=”Backlink Checker”/>
</a>
例如,如果我们 在Ahrefs的Site Explorer中检查“  锚定”报告中 的反向链接检查器,则可以看到上面提到的许多锚定文本类型。  
站点浏览器>输入URL >锚点
锚点反向链接检查器
现在,让我们看一下锚文本的混杂可能如何影响我们的排名。
锚文本如何影响搜索引擎排名
Google使用外部锚文本来帮助您了解页面的内容以及页面排名。我们怎么知道呢?
这是 Google算法所基于的原始论文的摘录:
Google采用了多种技术来提高搜索质量,包括页面排名,锚文本和邻近信息。
因此,如果我链接到本文中以“狗饼干”作为锚文本的页面,这将向Google指示链接的页面可能与狗饼干有关。
如果其他人也做同样的事情,那么这将增加Google的信心,即该页面可能会被归类为“狗饼干”。毕竟,两个或多个不相关网站通过相同链接链接到同一网页的可能性是多少?如果网页与狗饼干无关,则锚定文本吗?我会说很苗条。
希望您开始明白为什么锚文本作为排名因素才有意义。
但是,当然,SEO中的任何事情都没有那么简单。
早期的Google(过度)依赖锚文本
在Google的原始算法中,锚文本的权重很高。
Google创始人Sergey Brin和Larry Page在其1998年的论文中解释了:
链接的文本在我们的搜索引擎中以特殊的方式处理。大多数搜索引擎将链接的文本与链接所在的页面相关联。此外,我们将其与链接指向的页面相关联。这具有几个优点。首先,锚通常提供比网页本身更准确的网页描述。
使用锚文本还可以让Google确定无法使用典型的页面信号的媒体格式主题。
其次,对于无法被基于文本的搜索引擎索引的文档,例如图像,程序和数据库,可能存在锚点。这样就可以返回尚未实际爬网的网页。
逻辑是合理的,结果令人印象深刻,尤其是与当时的竞争相比-创始人本身并没有注意到这一事实。
虽然完整的用户评估不在本文讨论范围之内,但我们在Google上的经验表明,与大多数商用搜索引擎相比,它产生的搜索结果要好于主要的商业搜索引擎。
但是Google很快发现锚文本非常容易被操纵。
要对查询网页进行排名,人们只需要指向其目标关键字作为锚点的多个链接即可。
关键字丰富的锚文本链接比竞争对手= WIN更多。
这引出了一些有趣的“ Google Bombing”示例,其中 SEO通过将锚文本链接指向不相关的页面并对其进行排名,来展示与Google进行游戏的难易程度。
乔治·布什(George Bush)在“惨败”一词中名列第一,这要归功于成功的“ Google炸弹”。
显然,情况必须改变。
Google反对操纵锚文本
2012年4月,Google推出了他们现在臭名昭著的Penguin算法的第一版。
锚文本是企鹅的主要目标之一。
有些网站的完全匹配锚文本链接过于激进,因此其排名在一夜之间就消失了。但是,据Google称,它仅影响了3.1%的搜索查询。
但是事情并没有止步于此……
Google继续通过随后的企鹅更新与操纵性锚文本垃圾邮件作斗争。
现在,大多数SEO似乎建议少量使用完全匹配的锚文本-通常在?1%到5%之间。
另一个SEO博客中推荐的完全匹配锚文本%的示例。
那真相是什么?您应该将精确匹配的锚点保持在最低限度吗?您是否应该完全避免完全匹配的定位符?短语匹配和其他类型的锚如何处理?您应该如何使用它们?
为了找出答案,我们进行了两项研究。
研究1:锚文本对19,840个关键字的影响
为了研究锚文本类型和排名之间的相关性,我们查看了19,840个关键字的前20个搜索结果。
这意味着我们 总共分析了384,614个网页!
边注。你们中有些人可能已经注意到19,840 * 20!= 384,614,而实际上是396,800。这是因为几个网址对我们研究的多个关键字的排名不高。
所有这些关键字:
有2K-5K每月搜索量(随机选择!);
由2-4个英语单词组成;
不包含特殊字符(例如,!#@);
是非数字的(例如,电话号码之类的关键字被过滤掉了)
此外,我们仅选择前10个搜索结果具有相似的URL Rating  (UR)值的关键字。这样做的目的是“隔离”锚文本变量。
让我用一个简单的例子来解释。
假设“最佳蛋白质粉”的前10个搜索结果如下:
精确的锚点匹配百分比:100%。UR分数: 60
精确的锚点匹配百分比:90%。UR分数: 55
精确的锚点匹配百分比:80%。UR分数:50
精确的锚点匹配百分比:70%。UR分数:45
精确的锚点匹配百分比:60%。UR分数:40
精确的锚点匹配百分比:50%。UR分数:35
精确的锚点匹配百分比:40%。UR分数:30
精确的锚点匹配百分比:30%。UR分数:25
精确的锚点匹配百分比:20%。UR分数:20
精确的锚点匹配百分比:10%。UR分数:15
您可以看到完全匹配锚文本的百分比与排名相关。由此可以推断出完全匹配率会影响排名。
但是,这具有误导性,因为UR也存在相关性。
因此,反向链接(或内部链接)的数量和质量也可能是这种相关性的一部分。
另一方面,如果结果看起来像这样……
精确的锚点匹配百分比:100%。UR分数: 30
精确的锚点匹配百分比:90%。UR分数:25
精确的锚点匹配百分比:80%。UR分数:32
精确的锚点匹配百分比:70%。UR分数:33
精确的锚点匹配百分比:60%。UR分数:28
精确的锚点匹配百分比:50%。UR分数:31
精确的锚点匹配百分比:40%。UR分数:31
精确的锚点匹配百分比:30%。UR分数:27
精确的锚点匹配百分比:20%。UR分数:36
精确的锚点匹配百分比:10%。UR分数:29
…则由反向链接(或内部链接)引起的任何潜在关联的可能性要低得多。
说得通?
好。让我们看一下结果。
精确匹配锚点的影响
首先,我们查看了每个排名位置的完全匹配锚定反向链接的平均百分比和中值百分比,该百分比是根据指向URL的反向链接的总数计算得出的。
锚文本图像1a
看来这里有很明显的相关性,对吗?没那么快。
似乎显示出相关性的蓝线是平均值。这是属于每个位置的点的“偏向”表示,因为极值会轻易使平均值偏斜。
我失去了你吗?
想象一下,我们有以下位置#1的页面示例:
第1页:  0%精确匹配锚点;
第2页:  0%精确匹配锚点;
第3页:  0%精确匹配锚点;
第4页:  0%精确匹配锚点;
第5页:  100%精确匹配的定位符;
该样本的平均精确匹配锚点= 20%。
您会看到这并不能很好地代表整个样本-一个值极大地扭曲了平均值。这就是为什么我们还将中间值添加到图形(橙色线)的原因。您可以看到每个排名位置的中位数为零。
这是我们的数据科学家Loveme Felicilda所说的:
我想说平均值不是 表示相关性的好方法。这就是为什么我还要显示中位数。所有位置的中位数均为零这一事实意味着,有很多页面没有完全匹配的反向链接。如果我们的中位数显示与平均值相同的“模式”,那么我们将具有很强的相关性。因此,如果要显示相关性,则应在图形上绘制所有点并添加一条最佳拟合线。
Loveme Felicilda
Loveme Felicilda, 数据科学家Ahrefs
这正是我们所做的:
锚文本图像1b
现在您可以看到真正的相关性很弱。
为了补充这一点,下面是相关性的直方图。x轴显示存储桶的相关性值,y轴显示属于每个存储桶的SERP /关键字的数量。
锚文本图像1c
一般而言,图形越呈钟形和对称,则相关度与中间值(在这种情况下为零)越接近。如果它向右倾斜,则它的正相关性更高。如果它向左倾斜,则它呈负相关。
您可以看到,在这种情况下,它稍微向右倾斜-表示弱的正相关。
有多弱?这是Spearman相关性的结果:
Spearman相关系数(平均值):  0.1436 
Spearman相关系数(平均值):  0.1869
结果:完全匹配锚定链接的百分比与排名之间的相关性相对较弱。均值和中位数都表明了这一点。
边注。 我们将Spearman相关系数的中值包括在内,因为某些利基(例如发薪日贷款)的锚文本非常重,可能会使平均值失真。
但是为什么呢?
如果Google使用锚文本作为排名因素-或至少如约翰·穆勒(John Mueller)所说的那样了解页面的上下文—那么应该不会有更大的相关性?
不必要。John从未说过他们在算法中给予锚文本多少重量。
此外, 我希望透明化 数据中存在潜在的,不可避免的缺陷。我会尽快介绍。
首先,让我们看一下其他锚文本类型的数字…
词组匹配锚的影响
概括地说,短语匹配锚是包含目标查询的锚。
例如,如果关键字是“ SEO工具”,则“最佳SEO工具”或“我最喜欢的SEO工具”都将是词组匹配锚。让我们看看这些如何堆叠。
锚文本图像2a
这里有两点突出:
平均值的“相关性”类似于精确匹配。
词组匹配锚的平均百分比略高于完全匹配。
但是同样,为了查看“真实”相关性,我们需要查看一些不同的图:
锚文本图像2b
锚文本图像2c
所以这一次,相关性甚至比完全匹配锚点低。
Spearman相关(平均值):  0.1057 
Spearman相关(中位数):  0.1393
结果:词组匹配锚的百分比与排名之间的相关性很弱。
部分匹配锚的影响
部分匹配锚是那些包含查询中所有单词但不完全是短语的锚。
例如,如果关键字是“ SEO工具”,则“ SEO最佳工具”或“我最喜欢的SEO技巧是由Ahrefs使用此工具”都是短语匹配锚。
让我们看看这些如何堆叠。
锚文本图像3a
平均值似乎再次具有类似的相关性,中位数仍在零附近趋于平坦。
此外,与完全匹配和词组匹配百分比相比,部分匹配关键字的平均百分比非常高。
这是有道理的,因为部分匹配同时包含了完全匹配关键字和词组匹配关键字。
这是两个图,它们显示了更好的相关性表示:
这里的相关几乎与词组匹配相关相同:
Spearman相关系数(平均值):  0.1076 
Spearman相关系数(平均值):  0.1393
结果:相关性非常弱。
随机锚点的影响
随机锚是包含非特定或通用短语的锚。它们不包含target关键字(或其任何元素)。
如果关键字是“ SEO工具”,则“单击此处”或“本文”都是随机锚。
让我们看看这些如何堆叠。
锚文本图像4a
您会注意到的第一件事是,与我们研究的其他类型的锚文本相比,随机锚的平均百分比非常高。这是有道理的,因为除了一些非常具体的锚点之外,随机锚点几乎还包含了所有其他锚点。
您还会注意到,平均值似乎表明排名与随机锚点的百分比之间存在某种相关性(尽管较弱)。
我认为这是为什么查看平均值不是一个好主意的最好例子。
让我们来看一些更可靠的图来判断真正的相关性。
锚文本图像4b
锚文本图像4c
您可以看到,该直方图似乎既没有左右倾斜,也没有左右倾斜。这意味着相关性趋向于中间值零。
这是Spearman相关性:
Spearman相关系数(平均值):  0.0161 
Spearman相关系数(平均值):  0.0130
结果:实际上没有相关性。
那并不奇怪。
研究2:周围的链接文字影响了16,000页
如果您熟悉Ahrefs Site Explorer中的“ 反向链接”  报告,那么您将知道我们同时显示链接的锚文本和周围的链接文本。
通过Ahrefs的站点浏览器
为什么如此重要?
2004年,Google申请了一项  名为“基于参考上下文的排名” 的专利。
这是该专利的有趣摘录:
[…]链接周围的数据,链接左侧或链接右侧的数据或与链接关联的锚文本可用于确定与链接关联的上下文。
换句话说,如果实际的锚文本恰好是随机的且与链接页面无关,则Google可能会查看周围的链接文本以帮助了解该页面的内容。
您可以看到上面的屏幕快照所示的示例如何工作。锚文本是随机/通用的,但是周围的链接文本提供了一些上下文。
考虑到这一点,我们认为研究排名与周围链接文本中关键字的出现之间是否存在任何相关性将是一件有趣的事情。
所以这是我们所做的:
我们从研究#1中提取了相同的关键字集,但只包含带有随机锚的页面,即没有任何精确/短语/部分/等的页面。锚定链接。
剩下27,156个网页。
为了最大程度地减少偏差,我们将样本进一步减少到16,000页,每个位置为800页(1-20)。这是为了确保任何相关性都基于每个排名位置的相同页面数。
让我们看看我们发现了什么。
完全匹配关键字对周围链接文本的影响
假设我们的目标关键字是“ SEO工具”。
这是一个在周围的链接文本中带有完全匹配关键字的链接的示例:
Ahrefs的Backlink Checker是我最喜欢的 SEO工具。
现在让我们看一下结果。
锚文本图像5a
锚文本图像5b
您可以看到这里实际上没有相关性。
Spearman相关(平均值):  0.0640
结果:在周围的链接文本中使用完全匹配关键字似乎对排名没有显着影响。
部分匹配关键字对周围链接文本的影响
这次,我们研究了目标关键字中所有词语的出现与排名(即部分匹配)之间的相关性。
例如,如果我们的关键字是“ SEO工具”,则此链接将落入桶中:
Ahrefs的Backlink Checker是我最喜欢  的SEO工具。
说得通?
结果如下:
锚文本图像6a
锚文本图像6b
Spearman相关(平均值):  0.0205
结果:排名与周围链接文本中来自查询的所有单词的出现之间的相关性几乎为零。
目标查询中的1个以上单词对周围链接文本的影响
最后,我们研究了排名和周围链接文本中来自目标查询的至少一个词的出现之间的相关性。
例如,如果我们的关键字是“ SEO工具”,那么所有这些链接都将落入此存储桶中:
Ahrefs的Backlink Checker是我最喜欢的  营销工具。
Ahrefs的Backlink Checker是我最喜欢的SEO反向链接检查 方法。
Ahrefs的Backlink Checker是我最喜欢  的SEO工具。
Ahrefs的Backlink Checker是我最喜欢的 SEO工具。
您会看到它也包含完全匹配,词组匹配和部分匹配。
结果如下:
锚文本图像7a
锚文本图像7b
有趣的是,在周围的链接文本中,来自目标查询的至少一个单词的链接的平均百分比非常高,对于所有排名位置都为20%到25%。
仍然需要注意的是,中位数为零,这意味着我们研究的大多数页面都没有链接到目标文本中来自目标查询的一个或多个单词。
至于与排名的相关性:
Spearman相关性(平均值):?  0.0701
结果:轻微的负相关,但是它非常接近零,因此实际上没有任何相关。
为什么这两项研究都可能存在缺陷
没有一项学习是完美的,我们的学习也不例外。让我解释一下原因。
假设我们想知道我们的查找电子邮件地址指南中有多少个具有完全匹配锚点的反向链接。
这听起来很简单……除非您考虑该帖子的排名超过7K +关键字!
关键字排名查找电子邮件地址
那么,我们应将7205个关键字中的哪一个作为完全匹配词组进行研究?
我知道您在想什么:这里的主要目标关键字显然是“查找电子邮件地址”,因此,我们当然应该研究使用该短语作为锚文本的反向链接的数量,对吗?
这是一个合理的假设,但是有两个问题:
首先,虽然由于我们知道  主要的目标关键字而可以轻松地在此页面上执行此操作,但应该如何针对384,614个网页大规模地执行相同的操作?我们不能,而且也没有,因为无法确定某些网页所针对的主要关键字。
快速 提示
在Ahrefs关键字资源管理器中,我们在SERP概述中显示目标关键字的排名前10位的页面,以及一堆SEO指标,包括“顶部关键字”。
Ahrefs关键字资源管理器中的SERP概述。
“热门关键字”是占该页面最自然访问量的关键字。
那么,为什么不使用此度量标准来克服锚文本研究中的第一个问题呢?
答案:因为“ Top关键字”仅显示哪个关键字恰巧将最自然的访问量发送到页面,而并非总是作者打算为其排名的关键字。
此外,我认为可以说很多锚定链接(尤其是精确匹配的链接)是“链接操纵”的结果,即SEO以目标关键字为锚点构建链接,目的是提高该页面的排名。所述关键字的搜索引擎。
将这两件事放在一起,您会明白为什么使用“ Top关键字”不能解决我们的问题。
其次,我们的384,614个网页样本来自于19,840个关键字的前20个排名页面。但是,所有这些关键字都符合一组初始条件,其中一个条件是每月搜索量在2,000到5,000之间。仅该标准就肯定会排除某些页面的主要目标关键字。实际上,“查找电子邮件地址”就是这种情况,在美国每月搜索量为5500 。
现在,在您假设我用来说明这一点的页面是一个离群值并且大多数页面的关键字排名没有那么多之前,请看一下以下内容:
关键字的平均排名也为00 2
我们研究了  300万个随机搜索查询,发现平均而言,排名前10位的页面还对400到1300个其他查询进行了排名。
因此,显然,这是我们的研究没有考虑到的大规模事件。
这使我整齐地进入了您可能一直在等待的部分……
您是否应该在2019年与特定锚点建立链接?
假设有一种神奇的方式可以知道所研究的每个页面的主要目标关键字,这会有所改变吗?这是不可能说的,但即使是正确的问题也要问吗?
我不相信这是事实,而且我也不认为旨在构建关键字丰富的锚点是2019年的一项好策略。
以下是三个原因:
1)主题>关键字
这是一个有趣的事实:
平均而言,在Ahrefs博客上的所有帖子中,只有22%(??)的访问量来自主要目标关键字。
因此,即使我们的研究没有缺陷,并且我们发现使用完全匹配锚,例如,有13%的时间是对目标关键字进行排名的秘诀(这并不是很清楚),然后在逻辑上,专注于建立关键字丰富的链接仍然不是您的重点。
那是因为集中精力改善单个关键字的排名显然是疏忽大意-这只会负责发送该页面总点击量的一小部分。
但是为什么会这样呢?为什么我们的页面(以及其他页面)看不到来自主要目标关键字的总流量的更高百分比?
让我解释…
Google对自然语言查询的理解可以说比以往任何时候都更好。维基百科表示,部分原因在于 ,2013年推出了Hummingbird,它“更加注重自然语言查询,考虑了上下文和单个关键字的含义” 。
因此,按其目标关键字排名的网页也倾向于按一堆长尾  变体进行排名,当这些长尾变体组合在一起时,通常会导致该网页的绝大多数流量。
举一个例子,这是我们通过Ahrefs Site Explorer查找电子邮件的指南中的全部美国自然访问量:
我们访问页面
这是来自目标关键字的自然流量:
1,076 / 6,200 = 约占目标关键字总点击量的17%。
因此,使这个完整的圆圈:
完全匹配锚点只能按定义定位到一个关键字,在2019年,对一个关键字进行排名不是SEO的全部内容,也不是您的主要目标。
推荐阅读: 如何为SEO进行关键字研究-Ahrefs指南
话虽如此,你们中的某些人可能已经发现这种说法可能存在缺陷。或更准确地说:一个反论点。
它是这样的:
如果 通过建立以“ x”  作为锚文本的链接来使Google确信您的页面约为 x,而Hummingbird将x  与y和z关联,则不会建立富含关键字的链接,从而间接增加了Google对您的页面提供服务的信心不仅是x的相关结果,而且是y,z和其他任何相关查询的相关结果,因此是否有可能提高整体排名和访问量?
这可能  是真的,但它肯定是实现这一结果,尤其是后一个企鹅风险和不必要的困难的方法。
进行页面上的SEO  并针对与主题相关的关键字(即,不仅x,而且 y  和z)进行优化也要容易得多。
2)风险
与关键字丰富的锚点建立链接是有风险的。
是的,我的意思是建立  链接...
我想我们都知道,很少有人会使用确切的target关键字作为锚点自然地链接到您的页面。这使我想到了一个相关的观点:
如果不诉诸 使用PBN等低质量的黑帽策略,就很难建立这样的链接,我们不主张这样做。
3)弱相关
除了潜在的缺陷外,我们的研究结果表明锚文本在2019年排名中起着微不足道的作用。
最后的想法
定位文字是一个复杂的主题。该行业中的许多人继续发誓要使用高于平均水平的精确匹配锚,而其他人(如我本人)倾向于认为这些事情最好放在安全的一边。
甚至有人分析目标关键字当前排名最高的页面的锚文本比率,并根据发现结果使用自己的锚文本比率。
文章关键词