设计出品
扫描关注网站建设微信号

扫一扫微信二维码

如何创建XML站点地图(并将其提交给Google)

新乡云优化2019-11-12行业动态
如何创建XML站点地图(并将其提交给Google)
正如在没有地图的情况下很难找到新的目的地一样,对于Google而言,有时在没有站点地图的情况下很难找到您网站上的所有页面。
幸运的是,创建XML站点地图并将其提交给Google既快捷又容易。
下面,我们逐步介绍如何执行此操作。
但首先,让我们介绍一些基本知识。
(已经知道基本知识了吗?单击可直接跳转至创建站点地图。)
什么是站点地图?
站点地图是一个XML文件,列出了您网站上的所有重要内容。您要在搜索引擎中显示的任何页面或文件都应在站点地图中。
有趣的事实
Sitemaps列出的网址不能超过50,000个,并且网址大小不能超过50mb。如果您的站点地图超过一个或多个这些数字,那么您将需要创建多个。
这是什么一个XML网站地图是什么样子?
XML网站地图是为搜索引擎而不是人类制作的。如果您以前从未看过它们,它们可能看起来有些令人生畏。
<?xml版本=“ 1.0”编码=“ UTF-8”?>
<urlset xmlns =“ http://www.sitemaps.org/schemas/sitemap/0.9”>
<url>
<loc> https://ahrefs.com/ </ loc>
<lastmod> 2019-08-21T16:12:20 + 03:00 </ lastmod>
</ url>
<url>
<loc> https://ahrefs.com.com/blog/ </ loc>
<lastmod> 2019-07-31T07:56:12 + 03:00 </ lastmod>
</ url>
</ urlset>
让我们分解一下。
XML声明
<?xml版本=“ 1.0”编码=“ UTF-8”?>
这告诉搜索引擎他们正在读取XML文件。它还说明了使用的XML版本和字符编码。对于站点地图,版本应  为1.0,编码必须  为UTF -8。
网址集
<urlset xmlns =“ http://www.sitemaps.org/schemas/sitemap/0.9”>
这是站点地图中所有URL的容器。它还告诉搜寻器使用了哪种协议标准。大多数站点地图都指定了Sitemap 0.90标准,Google,Yahoo!和Microsoft等公司都支持该标准。
网址
<url>
<loc> https://ahrefs.com/ </ loc>
<lastmod> 2019-08-21T16:12:20 + 03:00 </ lastmod>
</ url>
这是每个URL的父标记。您必须在嵌套 标记中指定URL的位置<loc>。至关重要的是,这些必须是绝对的而非相对的规范URL。
尽管这是这里唯一需要的标记,但是有一些可选属性:
<lastmod>:指定上次修改文件的日期。该 格式必须为W3C日期时间格式。例如,如果您在2019年9月25日更新了帖子,则该属性将显示为2019-09-25。您还可以包括时间,但这是可选的。
<priority>:指定URL相对于网站上所有其他URL 的优先级。值的范围是0.0到1.0。更高更重要。
<changefreq>:指定页面更改的频率。它的工作是让搜索引擎了解他们可能希望重新抓取URL的频率。有效值始终是,每小时,每天,每周,每月,每年和从不。
这些可选的标签都不是那个  重要的搜索引擎优化。
对于  <lastmod>,Google的Gary Ilyes 指出  ,在大多数情况下,他们会忽略它,因为“网站管理员在确保准确性方面做得很糟糕。”由于大多数站点地图生成器都将其设置为所有页面的当前日期,而不是文件的上次修改日期,很容易明白原因。
对于   <priority>,谷歌表示  他们忽略了这个标签,因为它只是一个“杂音袋”。
对于   <changefreq>,约翰·穆勒( John Mueller)说:  “优先级和变更频率在Sitemaps中实际上不再扮演那么重要的角色。”
为什么需要站点地图?
Google通过爬网发现新内容。爬网页面时,他们会同时注意页面上的内部和外部链接。如果发现的URL不在其搜索索引中,则他们可以解析其内容并在适当的地方对其进行索引。
但是Google无法以这种方式找到所有内容。如果未从其他已知页面链接到某个网页,则他们将找不到该网页。
这是站点地图的来源。
站点地图告诉Google(和其他搜索引擎)在哪里可以找到您网站上最重要的页面,以便它们可以对其进行爬网和编制索引。
这很重要,因为搜索引擎必须先将内容编入索引才能对您的内容进行排名。
如何创建站点地图
一些CMS会为您生成一个站点地图。当您在网站中添加或删除页面和帖子时,这些信息会自动更新。如果您的CMS不这样做,那么通常会有一个可用的插件。
在WordPress中创建站点地图
即使WordPress 支持34.5%的网站,它也不会为您生成站点地图。要创建一个,您需要使用 Yoast SEO之类的插件。
要安装Yoast SEO,请登录到WordPress仪表板。
转到插件>添加新内容。
添加新的插件wordpress 3
搜索“ Yoast SEO”。
在第一个结果上点击“立即安装”,然后点击“激活”。
酵母seo搜索3
转到SEO >常规>功能。确保“ XML网站地图”切换开关处于打开状态。
xml网站地图yoast 3
现在,您应该在yourdomain.com/sitemap.xml或yourdomain.com/sitemap_index.xml上看到站点地图(或站点地图索引)。
ahrefs网站地图3
边注。 如果您的WordPress安装位于子文件夹或子域中,则您的站点地图位于该路径下。例如,可以通过ahrefs.com/blog/sitemap_index.xml访问我们博客的站点地图。
小费
如果您要专门从站点地图中包含或排除某些类型的内容(标签页面,类别页面等),请转到“搜索外观”设置。
类别页面不包括酵母3
您也可以从编辑器的“高级”元框中排除单个帖子或页面。
yoast noindex发布3
重要提示。仅从站点地图中排除您不想显示在搜索结果中的页面。
在我们的WordPress SEO指南中了解更多信息。
在Wix中创建站点地图
Wix会自动为您创建一个站点地图。您可以在yourwixsite.com/sitemap.xml上找到它。
不幸的是,您对站点地图中包含或不包含的页面没有太多控制。如果要排除某个页面,请转到该页面的“ SEO(Google)”设置标签,然后关闭“在搜索结果中显示此页面”。
wix noindex 3
请注意,这还会在页面上添加noindex元标记,从而将其排除在搜索结果之外。
边注。 如果您可以在Wix中规范化URL,则不会将其从站点地图中删除。虽然这可能不会影响大多数用户,但是请注意,将规范化页面包含在站点地图中并不是最佳做法,它可能会向Google发送混合信号。
在Squarespace中创建站点地图
Squarespace还会自动为您创建一个站点地图。通常,您可以找到yoursquarespacesite.com/sitemap.xml。
尽管可以在“ SEO ”标签中从搜索引擎中排除(无索引)页面,但是无法在Squarespace中手动编辑站点地图。
seo方形空间3
这也会将该页面从您的站点地图中排除。
在Shopify中创建站点地图
Shopify会自动为您生成一个站点地图。在yourstore.com/sitemap.xml上找到它。
不幸的是,在Shopify中没有简单的方法无法对页面进行索引。您必须直接在.liquid文件中编辑代码。
创建不带CMS的站点地图
如果您认为网站上的页面少于300页,请安装免费版本的Screaming Frog。
安装完成后,进入“ 模式”>“蜘蛛”。
将您的主页URL粘贴到标有“输入蜘蛛的URL ”的框中。
点击“开始”。
尖叫青蛙Sitemap 3
边注。 确保使用 主页的规范(主)版本。如果您不这样做,Screaming Frog将只抓取一个URL。
搜寻完成后,请查看右下角。
它会说像这样:
SF总刮擦3
如果数字是499或更低,请转到Sitemaps> XML sitemap。
由于Google对<lastmod>,<changefreq>和不太关注<priority>,因此建议您将它们从站点地图文件中排除。
尖叫青蛙的站点地图设置3
点击“下一步”并将站点地图保存到您的计算机。做完了
如果数字显示“ 500之500”,则导出站点地图毫无意义。为什么?因为这意味着您在爬网站点上的所有页面之前已经达到爬网限制。结果,导出的站点地图可能会丢失数百个页面,这使其变得毫无用处。
解决此问题的一种方法是搜索免费的站点地图创建者。有很多。
不幸的是,大多数都不可靠。
我们测试了一些最受欢迎的生成器,发现相当多的生成器包括非规范的URL,无索引的页面和重定向。这是不好的SEO做法。
发电机 包括规范化的URL? 包括没有索引的URL? 包括重定向?
xml-sitemaps.com 是的? 不? 不?
web-site-map.com 是的? 不? 不?
xmlsitemapgenerator.org 是的? 不? 不?
smallseotools.com/xml-sitemap-generator 是的? 是的? 是的?
freesitemapgenerator.com 是的? 是的? 是的?
duplichecker.com/xml-sitemap-generator.php 是的? 是的? 是的?
xsitemap.com 是的? 是的? 是的?
那么解决方案是什么?
如果Screaming Frog无法抓取您的整个网站,请使用Ahrefs Site Audit来抓取您的网站。
边注。 验证您的网站以加快抓取速度。就是这样。
搜寻完成后,请转到数据资源管理器并添加这些过滤器。
现场审核自定义设置3
点击导出  > 当前表视图。
打开CSV文件,然后将URL列中的所有URL复制并粘贴到此工具中。
点击“添加到队列”,然后点击“将队列导出为sitemap.xml”。
此文件是您完成的站点地图。
如何向Google提交站点地图
首先,您需要知道站点地图在哪里。
如果您使用的是插件,则URL可能是domain.com/sitemap.xml。
如果您手动执行此操作,则将站点地图命名为sitemap.xml之类的,然后上传到网站的根文件夹。然后,您应该能够通过domain.com/sitemap.xml访问站点地图。
边注。 您可以为站点地图选择任何名称,但是最好坚持使用sitemap.xml。如果您有多个站点地图,则可以使用简单的命名方案,例如sitemap_1.xml,sitemap_2.xml。
转到Google搜索控制台>站点地图>粘贴到站点地图位置>点击“提交”
站点地图搜索控制台3
而已。做完了
小费
将站点地图URL添加到robots.txt文件中也是一种好习惯。
您可以在Web服务器的根目录中找到此文件。要添加您的站点地图,请打开文件并粘贴以下行:
站点地图:https://www.yourdomain.com/sitemap.xml
您需要将示例网址替换为站点地图的位置。
如果您有多个站点地图,只需添加多行。
站点地图:https://www.asos.com/sitemap_1.xml
站点地图:https://www.asos.com/sitemap_2.xml
修复影响您站点地图的常见网站错误
Google Search Console会告诉您有关站点地图的大多数技术错误。
例如,以下警告提示robots.txt阻止了我们提交的网址之一:
提交的网址已被漫游器阻止3
您可以在此处了解有关这些问题以及如何解决它们的更多信息。
就是说,有些问题Google不会告诉您。
以下是一些较常见的方法,以及如何查找和修复它们。
网站地图中无用的低质量页面
现在,站点地图中的每个页面都应该是可索引的并且是规范的。
不幸的是,这并不意味着所有这些页面都是高质量的。如果您有很多内容,那么一些低质量的页面可能会将其纳入您的站点地图。
例如,看一下电子商务网站上的以下两个页面:
电子商务2 7
电子商务2 6
它们都不对搜索者有价值,但是它们仍然在该网站的站点地图中,并且Google都对这两个页面进行了索引。
索引接近重复2 3
索引接近重复1 3
要查找这些页面,请转到站点审核>内部页面>内容质量
查找没有规范的重复页面和几乎重复页面的群集。这些是橙色方块。单击一个以查看组中的所有页面。
近重复现场审核3
检查页面,看看它们是否有任何价值。
您网站上的网页质量不佳是很糟糕的,原因有以下三个:
他们浪费了爬行预算。让Google浪费时间和资源来搜寻无用的低质量页面不是理想的选择。他们可能会花时间来抓取更重要的内容。 (根据记录,Google 指出  ,抓取预算“不是大多数发布商都需要担心的事情。”)
他们从更重要的页面“窃取”链接权限。 页面的权限与其排名之间 存在明显的关联。 指向低质量页面的内部链接仅用于稀释可能流向更重要页面的权限。(有趣的是,当我们从Ahrefs博客中删除近1/3的帖子时,我们看到了点击量的增加,而不是减少。)
它们导致不良的用户体验。 登陆这些页面的访问者没有任何价值。访问者点击它们很烦人,如果他们觉得您的网站质量低下而被忽视,他们最终可能会反弹。
总而言之,最好的做法是从您的网站以及随后的站点地图中删除低质量的内容。如果执行此操作,还应该记住删除指向这些页面的任何内部链接。失败的话,您将一个问题(低质量页面)换成另一个问题(链接断开)。
除了重复和几乎重复之外,您还可以查找内容稀少的页面。
只需检查“站点审核”中的“内容质量”报告,以查看带有“低字数”警告的页面。
低字数页面3
意外从您的站点地图中排除的页面
如果您使用上述推荐的任何方法来创建站点地图,则将不包含带有noindex或规范标签(非自我引用)的页面。
这是好事。您不应在站点地图中包含规范化的URL或未索引的页面。
就是说,如果您的网站上有恶意的noindex标记,则页面可能会被意外排除。
要检查错误,请转到站点审核中的“内部页面”报告,然后单击“无索引页面”警告。这显示所有未索引的页面。
Noindex页面3
其中大多数可能会故意没有索引,但是值得略过列表以进行仔细检查。通常,流氓noindex标记很容易发现,因为它们会出现在网站的整个子区域中。
如果您看到任何不应被未编入索引的页面,请从该页面中删除流氓noindex标记并将其添加到您的站点地图中。如果您使用的是CMS或插件,则应该自动进行。
专业 提示
也值得检查流氓规范和重定向。为此,请转到数据资源管理器并添加以下过滤器:
流氓教规3
流氓重定向3
删除所有恶意流氓并重定向,然后将受影响的页面添加到您的站点地图中。
常见问题
以下是一些有关站点地图的常见问题解答。如果您有本节中未回答的问题,请告诉我们,我们将添加它。
您是否需要AMP页面的站点地图?
不。
@ Kfowler325不需要AMP页面的站点地图— rel = amphtml链接对我们来说足够了。—??约翰(@JohnMu)2016年10月13日
如何为电子商务网站创建站点地图?
您可以按照与任何网站相同的方式为电子商务网站创建站点地图。就是说,值得检查电子商务站点上的重复页面和几乎重复页面,因为多面导航带来的乐趣使得这些页面经常在网络中大规模滑动。
最后的想法
创建站点地图并不是火箭科学,特别是如果您使用的插件可以为您完成繁重的工作。从头开始创建一个也不难-只需爬网您的网站并格式化生成的URL列表即可。
也就是说,请务必记住Google不必索引站点地图中的页面。站点地图与排名无关。
如果您正在寻找在排名较高的谷歌,读这个。
文章关键词