Comment corriger l'erreur "Votre sitemap semble être une page HTML"

Publié: 2022-08-28

Un sitemap se compose de pages créées spécifiquement pour les robots et les robots des moteurs de recherche. Il vise à une meilleure compréhension des sites web et à l'indexation des pages. En d'autres termes, il s'agit d'une liste structurée de pages que les robots des moteurs de recherche peuvent explorer et indexer sur votre site Web.

Avec un sitemap, vous pouvez promouvoir votre contenu auprès des moteurs de recherche et les aider à indexer le contenu plus rapidement. C'est également un moyen utile d'aider les robots des moteurs de recherche à comprendre la structure de votre site Web et à savoir quelles pages explorer, leur relation ou même leur dernière mise à jour.

Que se passe-t-il si nous rencontrons un problème avec le sitemap, par exemple, l'erreur "votre sitemap semble être une page HTML" ?

Il est temps d'en savoir plus sur Google Search Console ainsi que sur son utilisation.

  • Qu'est-ce que la console de recherche Google ?
  • Formats acceptables pour Google Search Console
  • Raison de l'erreur
  • Différences entre HTML et XML
  • Solution pour l'erreur
  • Suggestions pour utiliser correctement un sitemap

Qu'est-ce que la console de recherche Google ?

Google Search Console est un outil gratuit pour les propriétaires de sites de Google. Grâce à cet outil, vous pouvez facilement analyser les performances de votre site dans les recherches Google. Vous pouvez également accéder à des données importantes sur de nombreux sujets, tels que les backlinks et le trafic du site.

En bref, vous pouvez voir si votre site fonctionne bien, ce qui aide à apporter des améliorations SEO beaucoup plus réussies.

En dehors de cela, il est possible de détecter des erreurs sur votre site avec Google Search Console. Ainsi, vous pouvez toucher et corriger les problèmes techniques de manière intégrée avec Google Analytics, Google Trends et Google Ads.

Formats acceptables pour Google Search Console

Gardez à l'esprit que tous les liens ne vous conviennent pas pour être soumis à la console de recherche Google en tant que plan du site. Les seuls formats acceptables sont :

  1. XML
  2. RSS, mRSS et Atom 1.0
  3. Fichier texte

Pour plus de détails, consultez notre article sur la façon de soumettre votre site Web aux moteurs de recherche.

Raison de l'erreur

La raison pour laquelle vous obtenez l'erreur "votre sitemap semble être une page HTML" est dérivée de ces formats. Votre sitemap doit être au format XML car Google ne l'accepte pas au format HTML. Prends pour exemple:

https://wpblogx.com/sitemap_index.xml

Si vous téléchargez un fichier HTML en tant que sitemap, cette erreur se produira.

ppwp-votre-sitemap-semble-être-une-erreur-de-page-html

Passons en revue les différences entre HTML et XML avant de découvrir la solution et les suggestions pour traiter l'erreur.

Différences entre HTML et XML

XML (langage de balisage extensible)

XML fait référence à un langage de balisage similaire à HTML à bien des égards. La caractéristique la plus distinctive est que XML se préoccupe davantage des données elles-mêmes. Cela peut être utile dans des situations telles que la réception, le transport et la transmission de données.

Les balises utilisées en XML ne sont pas prédéfinies comme en HTML. C'est-à-dire que la structure du fichier XML est entièrement créée par l'utilisateur.

ppwp-xml-file-example

Pour votre information, nous avons publié un guide détaillé sur la façon de créer un sitemap XML dans WordPress. Vérifiez-le.

HTML (langage de balisage hypertexte)

HTML, d'autre part, concerne davantage la façon dont les données se présentent sous forme d'image. Il entreprend la tâche de concevoir l'interface que les utilisateurs verront sur la page. Il peut s'agir de la couleur des données, de la détermination des polices et de la taille de la police. De plus, il permet le fonctionnement d'outils multimédias (vidéo, images, etc.).

ppwp-html-file-example

Jetons un coup d'œil au résumé ci-dessous pour une meilleure compréhension.

Principales différences :

  1. HTML est l'un des types de documents, utilisé pour formater les titres, les différentes polices, les listes, les chiffres et les images dans les documents. XML définit, décrit et envoie des données entre différents environnements. En d'autres termes, il s'agit d'un complément au HTML avec ses fonctionnalités de définition des données.
  2. XML est un langage de balisage comme HTML ; cependant, il décrit des données, pas pour afficher des données comme HTML. Il permet l'échange de données entre les organisations.
  3. HTML permet à un mot d'être en gras ou en italique en le plaçant entre des balises, tandis que XML fournit un squelette pour baliser des données structurées.

Différences d'utilisation :

  1. Lorsque vous travaillez en XML, les balises sont sensibles à la casse.
  2. Les balises créées en XML doivent être fermées dans un ordre ordonné, pas au hasard.
  3. En XML, les espaces sont définis dans les lignes de commentaire.

Solution pour l'erreur

Pour créer un site XML conforme à la console de recherche Google pour votre site Web WordPress, vous pouvez utiliser un plugin de sitemap. Nous vous recommandons fortement d'installer Yoast SEO ou Rank Math. Ces plugins créent automatiquement un plan du site, et il vous suffit d'ajouter le plan du site à Google Search Console.

Les URL du sitemap doivent être exclues du plug-in Swift Performance. Vous pouvez suivre les procédures ci-dessous pour empêcher la mise en cache des URL du sitemap. Appliquez la même méthode avec W3Total Cache, WPRocket et d'autres plugins de mise en cache. Les étapes peuvent varier selon l'outil.

Une fois que vous avez téléchargé le fichier /sitemap_index.xml sur Google Search Console, vous pouvez voir l'erreur dans l'image ci-dessous.

ppwp-soumis-sitemap-google-search-console

Si vous cliquez sur l'erreur, la description détaillée s'affichera.

  1. Ouvrez le panneau d'administration du site Web, puis accédez à Outils > Swift Performance et cliquez sur l'onglet Paramètres .

ppwp-tools-swift-performance

2. Collez le lien de votre sitemap dans le champ comme suit : /sitemap_index.xml . Cliquez ensuite sur le bouton Enregistrer les modifications . Par conséquent, cela vous aide à exclure l'URL du sitemap de la mise en cache.

ppwp-sitemap-indexé

3. Cliquez sur Réinitialiser le tableau d'échauffement pour confirmer les modifications apportées au tableau.

ppwp-reset-table de préchauffage

4. Sélectionnez le bouton Tableau de bord > Effacer tous les caches .

ppwp-effacer-tous-les-caches

5. Après avoir vidé tous les caches, il est temps d'essayer de soumettre à nouveau le plan du site de votre site Web. Accédez à Google Search Console > Sitemap . Téléchargez votre sitemap et soumettez-le.

ppwp-google-search-console-ajouter-nouveau-sitemap

Maintenant, vous avez réussi à mettre à jour votre sitemap !

ppwp-google-search-console-submitted-sitemap

Bien qu'il soit facile d'éliminer l'erreur avec quelques informations supplémentaires, nous aimerions vous donner quelques suggestions pour l'éviter.

Suggestions pour utiliser correctement un sitemap

Vérifier les erreurs

Tout d'abord, vérifiez votre page de plan de site pour tout code d'erreur étrange. Si le code est clair, il sera très facile de diagnostiquer le problème.

Les conflits de plugins sont généralement la principale cause du problème. Les plugins comme Yoast qui génèrent des sitemaps peuvent être à l'origine de conflits. Un plugin de mise en cache peut également être à l'origine du problème.

Parfois, même un ajout aléatoire peut entraîner des erreurs. Vous pouvez installer le plugin Health Check and Troubleshoot pour les identifier le cas échéant.

Désactiver la mise en cache

Lorsqu'un sitemap est mis en cache, cela peut parfois causer des problèmes avec Google en le lisant comme une page HTML, car vous ne devriez pas mettre en cache les fichiers XML de cette façon.

Vérifiez l'URL de votre sitemap

Bien que cela semble être une simple suggestion, il vaut toujours la peine de revérifier l'URL de votre sitemap. Vérifiez le lien publié à la fois via Google et les plugins de sitemap pour vous assurer que vous soumettez l'URL correcte.

Supprimer les plans de site supplémentaires

Avoir des sitemaps supplémentaires actifs peut vous causer des problèmes ou de la confusion. Les plugins que vous utilisez de temps en temps peuvent générer différents sitemaps. Vérifiez-les et assurez-vous de désactiver toutes les fonctionnalités de sitemap redondantes.

Ne laissez plus l'erreur « Votre sitemap semble être une page HTML » vous déranger !

L'erreur "votre sitemap semble être une page HTML" est une gêne chaque fois qu'elle apparaît. C'est essentiellement le résultat d'une page malformée ou d'un conflit de mise en cache capable de résoudre. Vous pouvez résoudre le problème en quelques étapes mentionnées dans cet article.

Vous avez appris à résoudre le problème, il est temps d'optimiser votre sitemap pour booster le référencement.

Souffrez-vous de problèmes similaires ? Nous sommes ici pour aider. Veuillez nous contacter ou laisser quelques mots dans la section des commentaires.

Ou vous pourriez être intéressé par 5 façons de supprimer des pages du sitemap dans WordPress.