设计出品
扫描关注网站建设微信号

扫一扫微信二维码

规范标签:面向初学者的简单指南

新乡云优化2019-11-12洛阳SEO
规范标签:面向初学者的简单指南
想要了解什么是规范标签,以及如何使用它们来避免可怕的重复内容问题?
规范标签并不是什么新鲜事物。自2009年以来,它们就一直存在-十年来最好的部分。
Google,Microsoft和Yahoo联合创建了它们。他们的目的?为网站所有者提供一种快速轻松地解决重复内容问题的方法。
做他们的工作?是的,完美……但是只有当您知道如何使用它们时!
在本指南中,您将学习:
多么规范的标签
规范标签看起来像什么
为什么规范标签对SEO很重要
如何实施规范标签
如何避免常见的规范化错误
如何查找和修复规范化问题
什么是规范标签?
规范标记是一段HTML代码,该代码定义了重复,近重复和相似页面的主要版本。换句话说,如果在不同的URL下可以使用相同或相似的内容,则可以使用规范标签指定哪个版本是主要版本,因此应该对其进行索引。
规范标签图片01
规范标签是什么样的?
规范标签使用简单且一致的语法,并放置在网页的<head>部分中:
<link rel="canonical" href="https://example.com/sample-page/" />
以下是该代码各部分用简单的英语表示的意思:
link rel =“ canonical”:  此标记中的链接是此页面的主(标准)版本。
href =“ https://example.com/sample-page/”:  可以在此URL上找到规范版本。
为什么规范标签对SEO很重要?
Google不喜欢重复的内容。这使他们更难以选择:
要对页面的哪个版本进行索引(它们只会索引一个!)
要为相关查询排名的页面版本。
他们是应该在一页上合并“链接资产”,还是在多个版本之间进行拆分。
重复的内容过多也会影响您的“抓取预算”。这意味着Google可能会浪费时间来抓取同一页面的多个版本,而不是在您的网站上发现其他重要内容。
规范标签图像02
关于抓取预算的真相
当然,如果可能的话,强迫Google浪费时间来搜寻重复的内容。但是,Google指出,对于大多数网站而言,这不是问题。
如果倾向于在发布的同一天对新页面进行爬网,则爬网预算不是网站管理员需要关注的事情。同样,如果站点的URL少于几千个,则大多数时候将可以有效地对其进行爬网。
规范标签解决了所有这些问题。他们可以让您告诉Google他们应该对页面的哪个版本进行索引和排名,以及在何处合并任何“链接资产”。
无法指定规范的URL,Google会自行处理。
如果您未指定规范的URL,我们将确定我们认为是最佳版本或URL的版本。
像这样依靠Google并不是一个好主意。他们可能会选择您确实不希望规范的页面版本。
重要 提示
Google 声明  他们通常会尊重您设置的规范网址,但并非总是如此。
请注意,即使您明确指定规范页面,Google也会由于各种原因(例如性能或内容)而选择其他规范页面。
使用规范标签的最佳做法将有助于减轻Google看到不受欢迎的网页规范的风险。
但是我没有重复的内容,对吗?
由于您可能没有多次发布相同的帖子和页面,因此很容易假设您的网站没有重复的内容。
但是搜索引擎会爬网URL,而不是网页。
这意味着他们将example.com/product  和 example.com/product?color=red  视为唯一页面,即使它们是具有相同或相似内容的同一网页。
这些称为参数化URL,它们是重复内容的常见原因,尤其是在 带有多面/过滤导航的电子商务网站上。
例如,Brown Bag Clothing  销售衬衫。这是其主要类别页面的URL:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html
如果仅过滤XL衬衫,则会向URL添加一个参数:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size = XL
如果然后还仅过滤蓝色衬衫,则添加另一个参数:
https://www.bbclothing.co.uk/en-gb/clothing/shirts.html?Size = XL & color = Blue
这些都是Google眼中所有单独的页面,即使内容仅略有不同。
但是,不仅仅是电子商务网站成为复制内容的受害者。
以下是适用于所有类型网站的重复内容的其他一些常见原因:
具有用于搜索参数的参数化URL  (例如,example.com?q= search- term)
具有用于会话ID的参数化URL(例如,https://example.com?sessionid = 3)
具有单独的页面可打印版本  (例如example.com/page  和example.com/print/page)
具有不同类别下的帖子的唯一URL  (例如,example.com / services / SEO /  和example.com/ specials / SEO /)
具有适用于不同设备类型的页面  (例如example.com  和m.example.com)
有AMP  和页面的非AMP版本  (例如,example.com/page  和amp.example /页)
在非www / www和非https / https变体  (例如https://example.com  和http://www.example.com)上提供相同的内容
在这些情况下,正确使用规范标签至关重要。
此外,跨域重复内容的问题也是一个事情。如果您要联合发布内容(例如,如果报纸希望在其网站上原样重新发布您的内容),则应要求他们放置与原始内容的规范链接。
这样做可以从该出版物获得引荐流量,同时减轻Google对错误URL排名的风险。
边注。一些站点可能拒绝添加规范链接。在这种情况下,是否要冒险就取决于您。如果您这样做,则值得关注联合页面,以确保其不超过原始页面。
规范标签实施的基础
规范很容易实现。稍后我们将讨论四种不同的方法。但是,无论您选择哪种方法,都应始终记住五个黄金法则。
规则1:使用绝对网址
谷歌的约翰·穆勒(John Mueller)指出,最佳做法是不要在rel =“ canonical” link元素中使用相对路径。
您可以使用任何一种,但是我建议您使用绝对URL,以确保它们被正确解释。
—约翰·??(@JohnMu)2018年10月24日
因此,您应该使用以下结构:
<link rel =“ canonical” href =““ https://example.com/sample-page/ ” />
与此相对:
<link rel =“ canonical” href =“ / sample-page / ” />
规则2:使用小写网址
由于Google可能将大写和小写URL视为两个不同的URL,因此您首先要确保在服务器上强制  使用小写URL,然后将小写URL用于规范标记。
规则3:使用正确的域版本(HTTPS和HTTP)
如果切换到SSL,请确保您没有在规范标记中声明任何非SSL(即HTTP)URL。从理论上讲,这样做可能会导致混淆和意外结果。如果您使用的是安全域,请确保使用以下版本的URL:
<link rel =“ canonical” href =“ https://://example.com/sample-page/” />
相对于:
<link rel =“ canonical” href =“ http://://example.com/sample-page/” />
边注。如果您不使用HTTPS,则相反。
规则4:使用自引用规范标签
谷歌的约翰·穆勒(John Mueller)说,虽然不是强制性的,但建议使用自引用规范标记。
我建议[使用自引用规范],因为它确实使我们可以清楚地知道要建立索引的页面,或建立索引后的URL应该是什么。
即使您只有一页,有时也会有不同的URL变体来拉动该页面。例如,最后带有参数,也许带有大写小写或www和非www。所有这些事情都可以通过相关的规范标签进行清理。
约翰·穆勒
 Google网站管理员趋势分析师John Mueller
如果您不确定自我引用规范的工作原理,它基本上是页面上指向自身的规范标记。例如,如果URL是https://example.com/sample-page,  则该页面上的自引用规范将是:
<link rel =“ canonical” href =“ https://example.com/sample-page” />
大多数现代流行的CMS '会自动添加自引用URL,但是如果使用自定义CMS,则需要让开发人员对此进行硬编码。
规则5:每页使用一个规范标签
如果页面上有多个规范标签,则Google将忽略这两个规范标签。
在多次声明rel = canonical的情况下,Google可能会忽略所有rel = canonical提示。
如何实施规范
有四种方法可以指定规范的URL:
HTML标记(rel = canonical)
HTTP头
网站地图
301重新导向*
有关每种方法的优缺点,请参阅Google的官方文档。
1.使用rel =“ canonical” HTML标签设置规范
使用rel = canonical标签是指定规范URL的最简单,最明显的方法。
只需将以下代码添加到任何重复页面的<head>部分:
<link rel =“ canonical” href =“ https://example.com/canonical-page/” />
假设您有一个销售T恤衫的电子商务网站。您希望https://yourstore.com/tshirts/black-tshirts/  作为规范URL,即使该页面的内容可以通过其他URL访问(例如https://yourstore.com/offers/black-tshirts/)
只需将以下规范标签添加到任何重复的页面:
<link rel =“ canonical” href =““ https://yourstore.com/tshirts/black-tshirts/” />
请注意,如果您使用的是CMS,则无需弄乱页面的代码。有一种更简单的方法。
在WordPress中设置规范标签:
安装Yoast SEO,  并且将自动添加自引用规范标签。要设置自定义规范,请在每个帖子或页面上使用“高级”部分。
典型的酵母
在Shopify中设置规范标签:
Shopify默认为产品和博客帖子添加自引用规范URL。要设置自定义规范URL,您需要直接编辑模板(.liquid)文件。
该线程  具有有关如何执行此操作的一些信息。
在Squarespace中设置规范标签:
默认情况下,Squarespace还会添加自引用URL。但是,与Shopify一样,如果要添加自定义规范URL,则需要直接编辑代码。
2.在HTTP标头中设置规范
对于PDF之类的文档,由于没有页面<head>部分,因此无法在页面标题中放置规范标签。在这种情况下,您将需要使用HTTP标头设置规范。
想象一下,我们创建了此博客文章的PDF版本并将其托管在我们的博客子文件夹(ahrefs.com/blog/*)中。
这是该文件的HTTP标头的样子:
HTTP / 1.1 200 OK
内容类型:应用程序/ pdf
链接:<http://ahrefs.com/blog/canonical-tags/>; rel =“ canonical”
推荐阅读:如何将规范标签添加到HTTP标头 
3.在站点地图中设置规范
Google 声明  非规范页面不应  包含在站点地图中。仅应列出规范的URL。这是因为Google会将站点地图中列出的页面视为建议的规范。
但是,他们并不总是选择站点地图中的URL作为规范。
我们不保证会认为站点地图URL是规范的,但它是为大型网站定义规范的一种简单方法,而站点地图是一种有用的方法,可以告诉Google您认为哪个页面对您的站点最重要。
4.通过301重定向设置规范
当您要将流量从重复的URL转移到规范版本时,请使用301重定向。
假设您可以通过以下URL访问您的页面:
example.com
example.com/index.php
example.com/home/
选择一个URL作为规范,然后将其他URL重定向到该规范。
对于网站的安全HTTPS / HTTP和www / non-www版本,应该执行相同的操作。选择一个规范版本,然后将其他版本重定向到该版本。
例如,ahrefs.com的规范版本 是HTTPS非www URL(https://ahrefs.com)。以下所有URL均重定向到该地址:
http://ahrefs.com/
http://www.ahrefs.com/
https://www.ahrefs.com/
阅读我们有关实施301重定向的完整指南。
避免常见的规范化错误
规范化是一个有点复杂的话题。因此,对于如何正确规范化存在很多误解和误解。
这是人们在尝试规范化时的一些常见错误:
错误1:通过robots.txt 阻止规范化的网址
阻止一个URL中的robots.txt阻止谷歌对其进行抓取,这意味着他们无法看到页面上的任何规范的标签。反过来,这阻止了他们将任何“链接资产”从非规范转移到规范。
错误2:将规范化的网址设置为“ noindex”
切勿混合使用noindex和rel = canonical。他们是矛盾的指示。
正如约翰·穆勒(John Mueller)在此处指出的那样,Google通常会将规范标签的优先级高于“ noindex”标签。但这仍然是不好的做法。如果要noindex并规范化URL,请使用301重定向。否则,请使用rel = canonical。
错误3:为规范化的网址设置4XX HTTP状态代码
为规范化的URL设置4XX HTTP状态代码与使用'noindex'标签具有相同的效果:Google将无法看到规范化标签并将“链接资产”转移到规范化版本。
错误4:将所有分页页面规范化为根页面
分页页面不能规范化为系列中的第一个分页页面。相反,应在所有分页页面上使用自引用规范。
为什么?就像Google的John Mueller 在Reddit上所说的那样,使用rel = canonical是不正确的。
要避免的主要事情是,因为这篇文章是关于规范化的,因此请使用指向页面1的页面2上的rel = canonical。页面2不等于页面1,因此类似的rel = canonical将是不正确的。
约翰·穆勒
约翰·米勒, 网站站长趋势分析师约翰·穆勒
您还应该使用rel = prev / next标签进行分页。这些不再由Google使用,但Bing仍在使用它们。
错误5:不对hreflang使用规范标签
Hreflang标记  用于指定网页的语言和地理区域。
Google 指出  ,使用hreflang时,您应“以相同的语言指定规范页面,如果不存在相同语言的规范,则应指定最佳的替代语言。”
如何在您的网站上查找和修复规范化问题
规范化很容易出错,因此定期审核您的网站是否存在与规范标记相关的问题并尽快予以解决是值得的。
为此,您可以使用Ahrefs的Site Audit工具。
网站审核会在您的网站上抓取100多个SEO问题,包括那些与规范标签有关的问题。
以下是Site Audit可能发现的十二个与规范标签相关的问题,以及如何解决这些问题:
1.规范指向4XX
当将一个或多个页面规范化为4XX URL时,将触发此警告。
为什么这是一个问题
搜索引擎不会索引4XX页,因为它们无法正常工作。结果,他们将忽略指向此类页面的所有规范标签,并且通常最终会为该页面的错误(非规范)版本建立索引。
怎么修
查看受影响的页面,并将无效的(4XX)规范链接替换为要索引的工作页面(200)的链接。
2.规范指向5XX
当将一个或多个页面规范化为5XX URL时,将触发此警告。
为什么这是一个问题
5XX HTTP状态代码指示服务器问题,这导致无法访问规范页面。Google不太可能将无法访问的页面编入索引,因此可能会忽略规范。
怎么修
将所有错误的规范URL替换为有效URL。如果指定的规范看起来正确,请检查服务器配置错误。请注意,如果在您的站点因维护而停机或站点服务器超载时发生了爬网,则这可能是一个临时问题。
3.规范点重定向
当将一个或多个页面规范化为重定向的URL时,将触发此警告。
为什么这是一个问题
规范人员应始终指向页面的最权威版本。重定向URL并非如此。结果,搜索引擎可能会误解或忽略规范。
怎么修
将规范链接替换为指向该页面最权威版本的直接链接(即返回200 HTTP状态代码且不重定向的页面)。
4.重复的页面没有规范
当存在一个或多个未指定规范版本的重复页面或非常相似的页面时,将触发此警告。
为什么这是一个问题
由于未指定规范,因此Google会尝试找出最合适的版本以显示在搜索结果中。这可能不是您要索引的版本。
怎么修
查看重复项组。选择一个应该在搜索结果中建立索引的规范版本。将其指定为所有重复项的规范版本(并将自引用规范标签添加到规范版本)。
5. Hreflang为非规范
当一个或多个页面的hreflang批注中指定非规范URL时,将触发此警告。
为什么这是一个问题
hreflang标记中的链接应始终  指向规范页面。从hreflang注释链接到页面的非规范版本可能会使搜索引擎感到困惑和误导。
怎么修
将受影响页面的hreflang注释中的链接替换为其规范。
6.规范网址没有传入的内部链接
当一个或多个指定的规范URL没有内部传入链接时,将触发此警告。
为什么这是一个问题
没有内部链接的规范URL不能被网站访问者访问。在网站的某个位置,它们被定向到该页面的非规范版本。
怎么修
用指向规范的直接链接替换所有指向规范化页面的内部链接。
7.网站地图中的非规范页面
当站点地图中列出一个或多个非规范页面时,将触发此警告。
为什么这是一个问题
Google声明您不应在站点地图中包含非规范网址。原因是,他们将站点地图中的页面视为建议的规范。您只应列出要在站点地图中建立索引的页面。
怎么修
从您的站点地图中删除非规范网址。
8.将非规范页面指定为规范页面
当一个或多个页面指定规范URL时也会触发此警告,该URL也被规范化为其他页面。这将创建一个“规范链”,其中将页面A规范化为页面B,然后将其规范化为页面C。
规范标签图像03
为什么这是一个问题
规范链可能会混淆和误导搜索引擎。结果,他们可能会误解或忽略指定的规范。
怎么修
将受影响页面的规范标签中的非规范链接替换为指向规范页面的直接链接。例如,如果将页面A规范化为页面B,然后将其规范化为页面C,则将页面A上的规范链接替换为页面C的链接。
9.打开图URL不符合规范
当指定的规范与一个或多个页面上的“打开图” URL不匹配时,将触发此警告。
为什么这是一个问题
如果“打开图URL ”与规范不匹配,则页面的非规范版本将在社交网络上共享。
怎么修
更换Open Graph的URL与规范受影响的网页的URL。确保两个URL相同。
边注。 Open Graph标记内的URL必须是绝对的,并且必须使用http://或https://协议,就像规范中的情况一样。
10.从HTTPS到HTTP的规范
当一个或多个安全(HTTPS)页面将非安全(HTTP)版本指定为规范版本时,将触发此警告。
为什么这是一个问题
HTTPS是排名因素,因此在可能的情况下将页面的安全版本指定为规范是有意义的。
怎么修
将HTTP页面重定向到等效的HTTPS。如果那不可能,请添加一个rel =“ canonical”链接,该链接从页面的HTTP版本到HTTPS链接。
边注。Google还将实施HSTS  列为潜在的解决方案。
11.从HTTP到HTTPS的规范
当一个或多个非安全(HTTP)页面将安全(HTTPS)版本指定为规范版本时,将触发此警告。
为什么这是一个问题
HTTPS优先于HTTP。具有页面的HTTP版本,然后将HTTPS版本指定为规范是不合理的。
边注。 这可能不会引起很大的问题,但如果可能的话,仍然值得修复。
怎么修
实现从HTTP到HTTPS的301重定向。您还应该用直接指向HTTPS版本的链接替换到页面HTTP版本的所有内部链接。
12.非规范页面收到自然流量
当一个或多个非规范页面出现在搜索结果中并获得自然搜索流量(这不应该发生)时,将触发此警告。
为什么这是一个问题
您的规范标签设置不正确,或者Google选择了忽略指定的规范。
怎么修
检查在所有报告的页面上是否正确设置了rel = canonical标签。如果这不是问题,请使用Google Search Console中的“ URL检查”工具来查看他们是否将指定的规范URL视为规范URL。如果不匹配,请调查为什么会这样。
最后的想法
规范的标签是不说  复杂。一开始他们很难使您头脑清醒。
请记住,规范标签不是指令,而是搜索引擎的信号。换句话说,他们可能选择与您声明的规范不同的规范。
您可以使用 Google Search Console中的URL Inspection工具来查看用户声明的和Google选择的规范。
文章关键词