Pourquoi auriez-vous besoin de l’URL d’un sitemap ? Le sitemap d’un site (ou plan de site) est un fichier intéressant en référencement naturel, car il permet de donner une estimation (parfois exacte) du nombre de pages présentes sur un site web. Maintenant, si vous analysez celui d’un concurrent une fois en Octobre puis une fois en Novembre, vous pouvez alors conduire une gap analysis et identifier les nouveaux contenus et la fréquence de création de nouveaux contenus d’un concurrent .
Vous voulez peut-être le récupérer pour voir si des balises hreflang y ont été intégrées ? Ou encore parce que vous souhaitez déterminer la structure d’un site ? Ou vous cherchez à comprendre pourquoi certaines des pages que vous explorez à travers la Google Search Console remontent avec le message “Aucun sitemap référent détecté ”.
En résumé, il y a trois raisons pour lesquelles vous souhaitez localiser le sitemap d’un site :
Vous voulez identifier la structure d’un site internet et le sitemap offre en général une vue exhaustive de cette structure ; Vous souhaitez identifier les contenus et la fréquence de création de nouveaux contenus d’un concurrent entre deux dates ; Vous conduisez un audit SEO dans lequel vous incluez l’audit du sitemap . Les méthodes pour trouver le sitemap d’un site Tout d’abord, et malheureusement, il n’y a pas de standards aussi normés que pour le fichier robots.txt. De fait, le sitemap d’un site pourrait être publié sur un autre domaine et son nom pourrait ne pas inclure le terme sitemap histoire de se compliquer la vie (et celle de nos concurrents).
En tant qu’agence SEO et consultant , nous avons effectivement rencontré des sitemap étranges qui défiaient la logique.
Bon, voyons ces méthodes.
1. Utiliser le fichier robots.txt C’est la méthode la plus simple selon moi. À l’inverse du sitemap, le fichier robots.txt est toujours positionné au niveau du domaine et le nom du fichier est standardisé. Ainsi, le fichier robots.txt de ce site est :
https://www.wegrowth.io/robots.txt
Parmi les directives présentes dans ce fichier, on retrouve la directive sitemap qui doit être suivie de l’URL vers le fichier du sitemap comme dans l’exemple ci-dessous :
2. Vérifier la Google Search Console Alors cette méthode ne fonctionne que si le site a une propriété Google Search Console active et que vous y avez accès bien évidemment.
Rendez-vous dans la Google Search Console ; Cliquez sur “sitemap” dans l’onglet Indexation de la barre latérale ; Et si un sitemap a été déclaré dans le passé par quelqu’un d’autre, vous le verrez directement. Notez d’ailleurs que vous verrez aussi le type de sitemap ainsi que le nombre de pages découvertes à travers ces sitemaps.
Exemple de sitemap retrouvés dans la Google Search Console. 3. Vérifier Bing Webmaster Tools Vous allez me répondre improbable. Effectivement, il est probable que si le sitemap n’a jamais été déclaré via la Google Search Console, la probabilité qu’il le soit en utilisant Bing est faible.
Néanmoins, c’est une vérification qui se fait en 3 clics, il serait dommage de passer à côté.
Comme pour la Search Console, la méthode est simple :
Se connecter à la Webmaster Tools ; Se rendre dans l’onglet sitemaps dans la barre latérale ; Et si un sitemap a été déclaré dans le passé, vous l’y retrouverez comme ci-dessous. Exemple de sitemap localisé grâce à Bing Webmaster Tools. Si la propriété n’existe pas sur Bing Webmaster Tools, vous pouvez toujours en créer une et la valider via la Google Search Console (laissez-vous guider à l’inscription). Cela permet d’accéder aux données concernant votre site sur le moteur de recherche de Bing.
4. Identifier le CMS du site en question En inspectant le code source d’une page ou en utilisant des extensions de navigateur comme Wappalyzer ou BuiltWith vous pouvez identifier si le site internet a été construit en utilisant un CMS comme Wordpress ou Webflow par exemple.
Les CMS ont le mérite de standardiser l’organisation d’un site, dont la génération d’un sitemap XML avec un emplacement et un nom normé.
Comment trouver le sitemap d’un site utilisant Wordpress Dans le cas de Wordpress, le sitemap a soit été généré nativement par Wordpress soit à travers un plugin comme Yoast ou Rankmath. Si vous avez accès au backend de Wordpress, vous pouvez retrouver l’emplacement de votre sitemap à partir des paramètres ou de ceux du plugin .
Si vous n’avez pas accès, vous pouvez alors utiliser un détecteur de plugins comme WordPress Theme Detector and Plugins Detector pour identifier le plugin car selon celui utilisé, le nom du fichier XML ne sera pas le même.
Le cas échéant, vous trouverez ci-dessous la liste des noms de sitemap les plus utilisés sur Wordpress :
/wp-sitemap.xml ; /sitemap.xml ; /sitemap_index.xml ; /post-sitemap.xml ; /page-sitemap.xml ; /category-sitemap.xml ; /tag-sitemap.xml. Comment trouver le sitemap d’un site utilisant Webflow Si le site est construit en utilisant Webflow, le sitemap sera toujours à l’emplacement root avec le nom sitemap.
https://www.wegrowth.io/sitemap.xml
Comment trouver le sitemap d’un site utilisant Shopify Pour un site utilisant le CMS Shopify, vous trouvez normalement le fichier à l’emplacement /sitemap.xml
.
Comment trouver le sitemap d’un site utilisant Squarespace Même combat dans le cadre de l’utilisation du CMS Squarespace, le sitemap se situe à l’emplacement /sitemap.xml
.
Comment trouver le sitemap d’un site utilisant Wix Wix génère automatiquement votre sitemap à l’emplacement /sitemap.xml
. C’est l’emplacement par défaut.
Les autres chemins d'URL dans Wix pour différents sitemaps sont les suivants :
Nom du sitemap
Type de sitemap
Chemin URL
Index
Principal
/sitemap.xml
Pages
Secondaire
/pages-sitemap.xml
Articles du blog Wix
Secondaire
/blog-posts-sitemap.xml
Catégories du blog Wix
Secondaire
/blog-categories-sitemap.xml
Réservations Wix
Secondaire
/booking-services-sitemap.xml
Pages de données & de routage Wix
Secondaire
/dynamic-{prefix-name}-sitemap.xml
Événements Wix
Secondaire
/event-pages-sitemap.xml
Articles du forum Wix
Secondaire
/forum-posts-sitemap.xml
Catégories du forum Wix
Secondaire
/forum-categories-sitemap.xml
Articles des groupes Wix
Secondaire
/groups-posts-sitemap.xml
Hôtels Wix
Secondaire
/hotels-rooms-sitemap.xml
Profils des membres
Secondaire
/member-profile-sitemap.xml
Programmes en ligne
Secondaire
/online-programs-sitemap.xml
Projets du portfolio Wix
Secondaire
/portfolio-projects-sitemap.xml
Collections du portfolio Wix
Secondaire
/portfolio-collections-sitemap.xml
Pages produits des boutiques Wix
Secondaire
/store-products-sitemap.xml
Wix Multilingue
Index
/xx-xx_sitemap.xml
Wix Multilingue
Type de page
/{page-type}-sitemap.xml
Autres
Sitemap de secours
/other-pages-sitemap.xml
Comment trouver le sitemap d’un site utilisant Joomla Comme pour Shopify ou encore Webflow, les extensions de Joomla généreront un sitemap avec le nom sitemap.xml
.
Comment trouver le sitemap d’un site utilisant Magento Magento qui appartient à Adobe depuis 2018 ne dérogera pas à la règle et aura aussi son sitemap avec le nom sitemap.xml
.
5. Tester différentes combinaisons de nom de sitemap Si les méthodes précédentes n’ont pas fonctionné ou si votre site n’a pas été construit avec un des CMS reconnus ci-dessus, il vous reste la méthode du test aléatoire.
Ajoutez simplement après le domaine les slugs suivants et vérifiez si vous aboutissez à quelque chose ressemblant à un plan de site :
/sitemap.xml ; /sitemap_index.xml ; /sitemap-index.xml ; /sitemap.php ; /sitemap.txt ; /sitemap.xml.gz ; /sitemap/ ; /sitemap/sitemap.xml ; /sitemapindex.xml ; /sitemap/index.xml ; /sitemap1.xml/ 6. Utiliser les opérateurs de recherche de Google En utilisant deux opérateurs de recherche qui sont site: et filetype: , vous pouvez être en mesure de retrouver le sitemap d’un site si et seulement si celui-ci a été indexé par Google .
C’est une méthode qui fonctionne de temps en temps comme avec ce site d’assurances :
Utilisation d'opérateurs de recherche pour retrouver un sitemap XML 7. Utiliser un outil en ligne Il existe des outils en ligne comme le crawler de Ahrefs, de SEMrush ou encore Screaming Frog qui peuvent éventuellement trouver le sitemap d’un domaine si celui-ci est présent.
Il n’y a pas de solutions magiques, ils essaient seulement en utilisant les emplacements les plus connus comme ceux mentionnés à la méthode 5.
Aucun sitemap trouvé ? Que faire ? Dans ce cas ultime, il est fort probable que le site en question n’ait jamais eu de sitemap (ou alors il est situé sur un autre domaine). En soi, le sitemap n’est pas un document obligatoire . Néanmoins, il est vrai que c’est un grand facilitateur pour les moteurs de recherche.
Ainsi, selon la stack de votre site internet, vous pouvez soit trouver un add-on intégrable à votre CMS afin de créer un sitemap , soit créer votre propre sitemap à la main ou programmatiquement selon votre infrastructure.
Partagez votre avis, vos questions, vos recommandations ci-dessous