如何修复“您的站点地图似乎是 HTML 页面”错误

已发表: 2022-08-28

站点地图由专门为搜索引擎机器人和爬虫创建的页面组成。 它旨在更好地了解网站和页面索引。 换句话说,它是一个结构化的页面列表,供搜索引擎机器人在您的网站上抓取和索引。

使用站点地图,您可以向搜索引擎推广您的内容,并帮助他们更快地索引内容。 这也是帮助搜索引擎机器人了解您网站的结构,并知道要抓取哪些页面、它们的关系,甚至是最后一次更新的有用方法。

如果我们遇到站点地图问题,例如“您的站点地图似乎是 HTML 页面”错误,该怎么办?

是时候了解 Google Search Console 以及如何使用它了。

  • 什么是谷歌搜索控制台?
  • Google Search Console 可接受的格式
  • 错误原因
  • HTML 和 XML 的区别
  • 错误的解决方案
  • 正确使用站点地图的建议

什么是谷歌搜索控制台?

Google Search Console 是 Google 为网站所有者提供的免费工具。 使用此工具,您可以轻松分析您的网站在 Google 搜索中的表现。 您还可以访问许多主题的重要数据,例如反向链接和网站流量。

简而言之,您可以查看您的网站是否运行良好,这有助于更成功地改进 SEO。

除此之外,还可以使用 Google Search Console 检测您网站上的错误。 因此,您可以使用 Google Analytics、Google Trends 和 Google Ads 以集成方式解决和纠正技术问题。

Google Search Console 可接受的格式

请记住,并非所有链接都适合您作为站点地图提交到 Google Search Console。 唯一可接受的格式是:

  1. XML
  2. RSS、mRSS 和 Atom 1.0
  3. 文本文件

有关更多详细信息,请参阅我们关于如何将您的网站提交给搜索引擎的文章。

错误原因

您收到“您的站点地图似乎是 HTML 页面”错误的原因来自这些格式。 您的站点地图应为 XML 格式,因为 Google 不接受 HTML 格式。 举个例子:

https://wpblogx.com/sitemap_index.xml

如果您将 HTML 文件作为站点地图上传,则会发生此错误。

ppwp-your-sitemap-appears-to-be-an-html-page-error

在发现处理错误的解决方案和建议之前,让我们先浏览一下 HTML 和 XML 之间的差异。

HTML 和 XML 的区别

XML(可扩展标记语言)

XML 是指一种在许多方面与 HTML 相似的标记语言。 最显着的特点是 XML 更关心数据本身。 它对于接收、传输和传输数据等情况很有用。

XML 中使用的标签不像 HTML 中那样预定义。 即XML文件的结构完全由用户创建。

ppwp-xml-文件-示例

供您参考,我们发布了有关如何在 WordPress 中创建 XML 站点地图的详细指南。 一探究竟。

HTML(超文本标记语言)

另一方面,HTML 更多的是关于数据如何呈现为图像。 它承担设计用户将在页面上看到的界面的任务。 它可能是数据的颜色、字体的确定和字体大小。 此外,它还允许多媒体工具(视频、图片等)发挥作用。

ppwp-html-文件-示例

让我们看一下下面的摘要,以便更好地理解。

主要区别:

  1. HTML 是一种文档类型,用于格式化文档中的标题、不同的字体、列表、图形和图像。 XML 定义、描述和在不同环境之间发送数据。 换句话说,它是对具有数据定义功能的 HTML 的补充。
  2. XML 是一种类似于 HTML 的标记语言; 但是,它描述的是数据,而不是像 HTML 那样显示数据。 它支持组织之间的数据交换。
  3. HTML 允许通过将单词放在标签之间来使其变为粗体或斜体,而 XML 提供了用于标记结构化数据的框架。

使用方面的区别:

  1. 在 XML 中工作时,标签区分大小写。
  2. 在 XML 中创建的标签应该以整齐的顺序关闭,而不是随机关闭。
  3. 在 XML 中,空格字符在注释行中定义。

错误的解决方案

要为您的 WordPress 网站构建符合 Google Search Console 的 XML 站点,您可以使用站点地图插件。 我们强烈建议安装 Yoast SEO 或 Rank Math。 这些插件会自动创建站点地图,您只需将站点地图添加到 Google Search Console。

站点地图 URL 必须从 Swift Performance 插件中排除。 您可以按照以下步骤防止站点地图 URL 被缓存。 对 W3Total Cache、WPRocket 和其他缓存插件应用相同的方法。 步骤可能因工具而异。

将文件/sitemap_index.xml上传到 Google Search Console 后,您可能会在下图中看到错误。

ppwp-提交的站点地图-谷歌搜索-控制台

如果单击错误,将显示详细说明。

  1. 打开网站管理面板,然后转到工具> Swift Performance并单击设置选项卡。

ppwp-工具-swift-性能

2. 将您的站点地图链接粘贴到如下字段中: /sitemap_index.xml 。 然后单击保存更改按钮。 因此,这有助于您从缓存中排除站点地图 URL。

ppwp-站点地图索引

3. 单击Reset Warmup Table以确认在表中所做的更改。

ppwp-重置-预热表

4. 选择仪表板>清除所有缓存按钮。

ppwp-清除所有缓存

5. 清除所有缓存后,是时候尝试重新提交您的网站站点地图了。 转到Google Search Console >站点地图。 上传您的站点地图并提交。

ppwp-google-search-console-add-new-sitemap

现在,您已成功更新站点地图!

ppwp-google-search-console-submitted-sitemap

虽然通过一些额外的信息很容易消除错误,但我们很乐意为您提供一些避免它的建议。

正确使用站点地图的建议

检查错误

首先,检查您的站点地图页面是否有任何奇怪的错误代码。 如果代码清晰,就很容易诊断问题。

插件冲突通常是问题的主要原因。 生成站点地图的插件(如 Yoast)可能是冲突的根源。 缓存插件也可能是导致问题的罪魁祸首。

有时,即使是随机的附加组件也会导致错误。 您可以安装 Health Check and Troubleshoot 插件以识别它们(如果有)。

禁用缓存

缓存站点地图时,有时会导致 Google 将其作为 HTML 页面读取时出现问题,因为您不应该以这种方式缓存 XML 文件。

检查您的站点地图 URL

尽管这似乎是一个简单的建议,但始终值得仔细检查您的站点地图 URL。 检查通过 Google 和任何站点地图插件发布的链接,以确保您提交正确的 URL。

删除额外的站点地图

激活额外的站点地图可能会给您带来问题或混乱。 您不时使用的插件可以生成不同的站点地图。 检查它们并确保禁用任何多余的站点地图功能。

不要再让“您的站点地图看起来像 HTML 页面”错误困扰您了!

“您的站点地图似乎是一个 HTML 页面”错误无论何时弹出都会令人烦恼。 它基本上是格式错误的页面或能够修复的缓存冲突的结果。 您可以通过本文中提到的几个步骤来解决问题。

您已经学会了如何解决问题,是时候优化您的站点地图以提升 SEO。

你是否有类似的问题? 我们是来帮忙的。 请联系我们或在评论部分留言。

或者您可能对 WordPress 中从站点地图中删除页面的 5 种方法感兴趣。