D’aucun dirait que le sitemap est un élément difficile, alors que pour beaucoup ce n’est qu’une fonctionnalité d’un module de Sitemap dans Wordpress.
Alors il est vrai que si vous utilisez un CMS type Wordpress ou encore Shopify, la génération de sitemap et sa configuration est gérée de manière native ou par des plugins le plus connu étant le plugin Yoast sous Wordpress.
Certes, mais même l’utilisation de ces solutions semi-automatisées ne doit pas vous empêcher de comprendre comment fonctionne un sitemap et surtout comment l’utiliser de la bonne manière à des fins de référencement naturel (SEO).
Mais de quels sitemaps parle-t-on ? Il y a en effet deux types de sitemaps et qui ont leur utilité en SEO :
Sitemap XML ; Sitemap HTML. Sitemap HTML Un sitemap HTML est plus simplement une page web qui inclut des liens vers chacune des pages de votre site. Vous avez bien évidemment la main dessus et vous pouvez l’organiser de la manière que vous souhaitez.
Généralement, vous retrouvez cette page dans le footer des sites web sous le nom de “plan de site”.
Son objectif est de faire en sorte de ramener les pages à un niveau -1. Une pratique qui peut parfois marcher, mais qui peut aussi ne pas marcher. Très honnêtement, pour l’avoir expérimentée à plusieurs reprises, y compris récemment en 2023 et 2024, je n’ai pas vu d'amélioration dans le référencement naturel suite à cela (ce qui ne doit pas vous empêcher d’essayer).
Dans tous les cas, je ne souhaite pas m’attarder sur ce type de sitemap , car ce n’est pas l’objectif de cet article.
Sitemap XML Le sitemap XML est le plus connu et le plus utilisé aujourd’hui. C’est en général celui-ci que nous désignons lorsqu'un professionnel du SEO évoque les sitemaps .
Cet acronyme “XML”, qui signifie Extensible Markup Language (ou langage de balisage extensible en français), est un langage qui fût créé en 1996 et sorti officiellement dans sa version 1.1 en 1998. Il n’a que très peu évolué dans les années qui ont suivi et ce pour différentes raisons.
Mais c’est en tout cas Google qui fera du sitemap en XML un incontournable à partir de 2005, rejoints en 2006 par Yahoo et Microsoft. Un an plus tard, les principaux moteurs de recherche feront en sorte que leur crawlers puissent identifier et découvrir un sitemap dans le fichier robots.txt facilitant un peu leur découverte.
Si vous peinez à trouver le sitemap d'un site web, vous pouvez toujours consulter mon article Comment trouver le sitemap d'un site ?
En général, celui-ci ressemble à ce qu'on voit ci-dessous :
<?xml version="1.0" encoding="UTF-8"?>
< urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:xhtml = "http://www.w3.org/1999/xhtml" >
< url >
< loc >
https://www.wegrowth.io
</ loc >
</ url >
< url >
< loc >
https://www.wegrowth.io/expertises/agence-cro-optimisation-taux-conversion
</ loc >
</ url >
</ urlset >
Les différents types de sitemaps XML en SEO Il faut savoir qu’il y a, au sein des sitemaps XML, 4 types de sitemaps :
Sitemap basique, connu de tous, qui liste l’ensemble des URL d’un site ; Sitemap image, qui n’est utilisé que par Google, et ce afin de faciliter la découverte et l’indexation de vos images ; Sitemap vidéo, utilisé uniquement par Google là aussi, qui permet de préciser plus d’informations au sujet des vidéos présentes sur vos pages web (ex : description, durée, contenu adapté aux enfants ou non, etc.) ; Sitemap d’actualités, toujours spécifique à Google, et qui concerne les sites approuvés Google news ; Index de sitemaps , qui sont des sitemaps qui recensent les autres sitemaps . Pourquoi les sitemaps sont importants en SEO ? L’objectif des sitemaps est de faciliter l’exploration de votre site web par les crawlers en fournissant à ces derniers un inventaire de l’ensemble de vos URL .
En d’autres termes, grâce au sitemap , les moteurs de recherche ont accès à la “carte routière” de votre site web ce qui devrait faciliter l’exploration et éventuellement l’indexation.
A-t-on toujours besoin d’un sitemap ? Comme souvent dans le référencement naturel, la réponse est “ça dépend”.
La philosophie de Google et aussi de Bing est la suivante : si vos pages sont correctement maillées entre elles, vous ne devriez pas avoir besoin d’un sitemap . Bing précise même que de leur point de vue, un sitemap est adéquat lorsque vous avez des pages difficiles à découvrir par l’exploration classique.
Alors, est-ce que c’est vrai ?
Oui. Il faut noter que la plupart des sites web ont moins de 500 pages. Ainsi, si le maillage est correctement fait, il ne devrait y avoir aucun problème d’exploration.
Néanmoins, l’erreur est humaine et les extensions/plugins ne sont pas toujours infaillibles. Qui plus est, j’ai toujours considéré les crawlers comme des fainéants, et donc à qui il faut faciliter la vie.
C’est pour cette raison que peu importe la taille de votre site, je vous invite à créer votre sitemap et à ajouter l’URL vers ce dernier dans votre fichier robots.txt.
Ce qui peut au passage vous permettre de réduire voire de corriger le nombre d’erreurs Page détectée mais non indexée dans votre Google Search Console.
Dans quelle mesure est-il vital d’avoir un sitemap ? Tout d’abord et pour éviter toute ambiguïté par rapport à ce que j’ai dit plus haut : si votre internal linking est mauvais, la présence d’un sitemap ne compensera pas. La présence d’un sitemap ne doit pas vous empêcher de faire la chasse aux pages orphelines ou même de penser à l’optimisation de vos ancres de lien internes .
En revanche, si vous avez un site e-commerce par exemple, avec plus de 10 000 URL, alors le sitemap est plus que conseillé.
Google recommande eux-mêmes la présence d’un sitemap dans au moins une de ces trois situations :
Votre site est volumineux (supérieur à 500 pages) ; Votre site est récent et a très peu de backlinks ; Votre site contient beaucoup de rich media ou s’affiche dans Google Actualités. Personnellement, l'effort pour mettre en place un sitemap est quasiment nul, je vous conseille donc de ne pas tergiverser longtemps et de le mettre en place afin de vous offrir un peu de tranquilité d'esprit.
Comment créer son sitemap ? Vous l’aurez compris, un sitemap c’est avant tout un inventaire des URL de votre site. Son objectif reste de faciliter la découverte et l’exploration de vos contenus par les crawlers .
Et c’est justement pour optimiser le travail de ces derniers, qu’il y a des bonnes pratiques.
Les URL à ne pas inclure dans votre sitemap Il peut paraître évident que certaines URL n’ont pas à figurer dans votre sitemap . Néanmoins, certains sitemaps XML créés à la main ou certaines solutions automatisées mal configurées peuvent engendrer des erreurs. Voici donc une checklist de tout ce qu’il faut exclure de son sitemap :
Les pages en no-index ; Les pages dupliquées ; Les pages canonicalisées vers une autre ; La pagination ; Les pages “archives” ; Les pages redirigées (même si la redirection est temporaire) ; Les pages en 404 ou soft 404 ; Les pages en erreur 500 mais c’est plus rare à identifier en avance puisque ce sont des erreurs serveur très souvent imprévisibles ; Les URL vers des commentaires ; Les URL type “résultats de recherche” si vous avez un moteur de recherche interne ; Les pages type “connexion” ou réinitialisation de mot de passe ; Et plus largement, toutes les pages dont vous n’avez pas besoin d’indexer (ex : des landing pages qui reçoivent du trafic d’ads ). En bref, ne mettez que des URL de contenus que vous souhaitez voir indexés.
Bien évidemment, ce qui est vrai pour des URL de contenus est aussi vraipour des pages de vidéos ou des images.
Maintenant, rentrons en détails sur les éléments qui doivent composer votre plan de site.
Créer un sitemap “classique” Dans le cas d’un sitemap “classique”, c’est à dire qui ne concerne ni les images, ni les vidéos, ni les actualités, vous pouvez construire votre sitemap à l’aide des éléments suivants :
Il faut savoir que votre sitemap peut comporter plusieurs éléments, certains étant obligatoires comme <loc> qui doit être suivie de l’URL et d’autres étant facultatifs comme <priority>. Vous retrouvez le détail ci-dessous
Élément
Obligatoire
Description
<urlset>
Oui
Élément racine du fichier Sitemap. L'intégralité du contenu du fichier (après l'élément <?xml version>
) doit être contenue dans cet élément.
<url>
Oui
Élément parent pour chaque entrée de page dans le Sitemap.
<loc>
Oui
Inclut l'URL complète de la page, incluant le protocole (http
ou https
) et un éventuel slash final (si requis par le serveur). Cette URL doit être inférieure à 2048 caractères. Les caractères spéciaux comme &
doivent être encodés en &
.
<lastmod>
Non
Date de dernière modification du fichier, au format ISO 8601 (par ex. YYYY-MM-DD
ou avec l'heure : YYYY-MM-DDTHH:MM:SS+00:00
). Cet élément est optionnel, mais utile pour informer les robots des mises à jour.
<changefreq>
Non
Fréquence estimée des modifications d'une page. Les valeurs possibles sont : always
, hourly
, daily
, weekly
, monthly
, yearly
, et never
.
- always
: indique un contenu en perpétuel changement.
- never
: pour des pages archivées qui ne seront plus modifiées.
Cet élément est une recommandation pour les crawlers, mais n'influence pas leur fréquence réelle de visite. Non applicable aux éléments <sitemap>
.
<priority>
Non
Priorité relative de l'URL par rapport aux autres pages du site, avec une valeur allant de 0.0 à 1.0 (1.0 étant la plus importante). Par défaut, cette valeur est 0.5. Attention : attribuer une priorité élevée à toutes les pages n'aura pas d'impact sur les résultats de recherche, mais sert simplement à hiérarchiser les pages pour les robots. Non applicable aux éléments <sitemap>
.
Exemple formaté :
<?xml version= '1.0' encoding= 'UTF-8' ?>
< urlset xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"
xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" >
< url >
< loc > https://example.com/ </ loc >
< lastmod > 2006-11-18 </ lastmod >
< changefreq > daily </ changefreq >
< priority > 0.8 </ priority >
</ url >
</ urlset >
Petite précision sur ces éléments : les éléments facultatifs tels que lastmod ou priority sont vraiment informationnels et peuvent être négligés par les crawlers . Ces éléments n’ont pas d’impact sur le référencement naturel en lui-même.
Créer un index de sitemap Je l’avais mentionné plus haut, il est possible d’avoir des index de sitemap XML ou en d’autres termes, des sitemaps de sitemaps comme ci-dessous :
Il existe deux différences par rapport à un sitemap “classique” en terme d’éléments :
<urlset> doit être changé par <sitemapindex> ; <loc> doit être changé par <sitemap>. Vous pouvez aussi y ajouter l’élément facultatif <lastmod>.
Ce qui se traduit en :
<?xml version= "1.0" encoding= "UTF-8" ?>
< sitemapindex xmlns:xsi = "http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation = "http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd"
xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" >
< sitemap >
< loc > https://www.example.com/sitemap1.xml.gz </ loc >
< lastmod > 2014-10-01T18:23:17+00:00 </ lastmod >
</ sitemap >
</ sitemapindex >
La pertinence des index de sitemaps s’établit surtout sur des sites très riches en diversité de média (vidéos, images) et qui comptent plusieurs milliers de contenus.
Créer un sitemap d'images Je distingue deux cas où la création d'un sitemap image est réellement pertinente. La première raison est si une partie non négligeable de votre référencement naturel passe (ou pourrait passer) par la section image des moteurs de recherche. La seconde raison pourrait être si votre site internet se repose sur l'exécution de Javascript pour rendre les images accessibles ce qui compliquerait donc la vie des crawlers (n'hésitez pas à vous référer à mon guide sur le Javascript SEO à ce sujet).
Bien que le sitemap d'images est perçu moins complexe car il y a moins d'éléments surtout depuis la dernière modification des consignes Google à ce sujet en Mai 2022 , il est important de préter attention à la structure de ce sitemap.
Élément
Obligatoire
Description
<urlset>
Oui
idem que pour el sitemap classique
<url>
Oui
idem que pour le sitemap classique
<loc>
Oui
Cela doit inclure l'URL complète de la page qui contient les images qui vont être précisées ci-après. La convention d'écriture de l'URL est la même que pour un sitemap classique.
<image:image>
Oui
C'est la balise parent après laquelle seront contenues les éléments propres à l'image
<image:loc>
Oui
URL de l'image. À noter que si vos images ne sont pas sur le même domaine parce que vous utilisez un CDN (Content Distribution Network) comme c'est le cas sur Webflow, vous devrez valider ce second domaine dans la Google Search Console.
Un exemple vaut parfois mieux qu'une longue explication alors je vous laisse regarder en-dessous :
<?xml version= "1.0" encoding= "UTF-8" ?>
< urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:image = "http://www.google.com/schemas/sitemap-image/1.1" >
< url >
< loc > https://mondomaine.fr/article1.html </ loc >
< image:image >
< image:loc > https://mondomaine.fr/image1.jpg </ image:loc >
</ image:image >
< image:image >
< image:loc > https://mondomaine.fr/image2.jpg </ image:loc >
</ image:image >
</ url >
< url >
< loc > https://mondomaine.fr/article2.html </ loc >
< image:image >
< image:loc > https://mondomaine.fr/photo.jpg </ image:loc >
</ image:image >
</ url >
</ urlset >
Dans l'exemple ci-dessus :
La page /article1.html contient deux images /image1.jpg et /image2.jpg ; La page /article2.html contient une image /photo.jpg ; Et chaque image est accessible directement par son URL. Créer un sitemap d'actualités Si vous êtes enregistré sur Google News comme un éditeur de sites d'actualités, alors vous devriez créer un sitemap dédié à Google Actualités. Les sitemaps d'actualités sont soumis aux mêmes contraintes que les sitemaps "classiques". À la différence que votre sitemap d'actualités ne peut contenir que des URL publiées dans les 48 heures. Au-delà de ces 48 heures, l'URL peut apparaître dans votre sitemap classique mais ne doit plus être présente dans le sitemap d'actualités.
Élément
Obligatoire ?
Description
<urlset>
Oui
Élément racine du sitemap. Il doit contenir tous les articles récents (dernières 48 heures).
<url>
Oui
Encapsule chaque article référencé dans le sitemap.
<loc>
Oui
Indique l’URL complète de l’article, incluant le protocole (https
recommandé).
<news:news>
Oui
Bloc contenant toutes les informations spécifiques à Google Actualités.
<news:publication>
Oui
Regroupe les métadonnées sur la source de l’article.
<news:name>
Oui
Nom exact du site tel qu’il apparaît dans Google Actualités.
<news:language>
Oui
Langue de la publication au format ISO 639-1 (ex : fr
pour le français).
<news:publication_date>
Oui
Date et heure de publication de l’article au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ
).
<news:title>
Oui
Titre exact de l’article. Il doit être fidèle au titre affiché sur la page.
<news:keywords>
Non
Liste de mots-clés associés à l’article, séparés par des virgules. Peu utilisé aujourd’hui.
<news:genres>
Non
Indique la catégorie de l’article (ex : Opinion
, Satire
, Blog
, etc.).
<news:stock_tickers>
Non
Ajoute des codes boursiers associés à l’article pour les sites spécialisés en finance.
Si vous vous référez à l'exemple ci-dessous, vous comprendrez les subtilités entre les sitemaps classiques et les sitemaps d'actualités.
<?xml version= "1.0" encoding= "UTF-8" ?>
< urlset xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9"
xmlns:news = "http://www.google.com/schemas/sitemap-news/0.9" >
< url >
< loc > http://www.example.org/business/article55.html </ loc >
< news:news >
< news:publication >
< news:name > The Example Times </ news:name >
< news:language > en </ news:language >
</ news:publication >
< news:publication_date > 2008-12-23 </ news:publication_date >
< news:title > Companies A, B in Merger Talks </ news:title >
</ news:news >
</ url >
</ urlset >
Créer un sitemap vidéos Un sitemap vidéo permet aux moteurs de recherche, notamment Google, de mieux comprendre le contenu de vos vidéos et d'améliorer leur indexation. Il est indispensable si vous hébergez des vidéos directement sur votre site, sans passer par YouTube ou d’autres plateformes.
Comme pour les autres sitemaps, certaines balises sont obligatoires , d’autres optionnelles , mais toutes jouent un rôle pour optimiser la découverte et l'affichage des vidéos dans les résultats de recherche.
Élément
Obligatoire ?
Description
<urlset>
Oui
Élément racine du sitemap. Il doit contenir toutes les URL des pages où les vidéos sont hébergées.
<url>
Oui
Encapsule chaque page contenant une vidéo référencée dans le sitemap.
<loc>
Oui
URL complète de la page hébergeant la vidéo.
<video:video>
Oui
Bloc contenant toutes les informations spécifiques à la vidéo.
<video:thumbnail_loc>
Oui
URL de l'image miniature (thumbnail) de la vidéo. Google utilise cette image dans les résultats de recherche.
<video:title>
Oui
Titre de la vidéo. Il doit être clair, précis et correspondre au titre affiché sur la page.
<video:description>
Oui
Description détaillée de la vidéo (jusqu'à 2048 caractères), similaire à la description YouTube.
<video:content_loc>
Non
URL du fichier vidéo (MP4, WebM, etc.), si la vidéo est directement hébergée sur votre serveur.
<video:player_loc>
Non
URL du lecteur vidéo embarqué (ex : iframe YouTube ou Vimeo). Obligatoire si <video:content_loc>
n'est pas utilisé.
<video:duration>
Non
Durée de la vidéo en secondes.
<video:publication_date>
Non
Date de publication de la vidéo au format ISO 8601 (YYYY-MM-DDThh:mm:ssZ
).
<video:rating>
Non
Note de la vidéo (de 0.0 à 5.0) si votre site permet les avis utilisateurs.
<video:view_count>
Non
Nombre total de vues de la vidéo.
<video:family_friendly>
Non
Indique si la vidéo est adaptée à tous les publics (yes
ou no
).
<video:category>
Non
Catégorie de la vidéo (ex : Tutoriel, Actualité, Divertissement, etc.).
<video:tag>
Non
Balises associées à la vidéo, séparées par des virgules (comme des hashtags).
<video:restriction>
Non
Spécifie dans quels pays la vidéo est accessible (allow
ou deny
+ codes pays ISO 3166).
Soumettre des sitemaps Une fois que vous avez créé votre sitemap ou vos sitemaps, vous devez les "faire connaître" aux moteurs de recherche. Pour cela, vous avez deux approches qui sont complémentaires :
Faire figurer le lien vers le sitemap dans votre fichier robots.txt ; Soumettre les URLs de vos sitemaps dans les outils d'adminisration des moteurs de recherche. URL du sitemap dans votre fichier robots.txt Sachez que depuis 2007, Bing, Yahoo et Google ont fait en sorte que leurs robots d'exploration puissent identifier la présence d'un sitemap dans le fichier robots.txt.
Soumettre son sitemap à Google Outil incontournable, la Google Search Console vous permet notamment d'y déclarer votre sitemap afin que celui-ci soit plus facilement trouvé et exploré par les robots d'exploration de la firme de Mountain View.
Pour ce faire, rendez-vous dans votre Search Console, puis accéder à la page Sitemaps dans la barre latérale de gauche. Vous arrivez alors sur une interface qui vous permet de soumettre vos sitemaps et aussi de consulter le statut de ceux déjà enregistrés.
Soumettre son sitemap dans le Google Search Console Vous notez ci-dessus que Google a identifié la typologie de sitemaps, la date de première soumission du dit sitemap, la date de dernière lecture et le nombre d'URLs identifié lors de la dernière exploration.
À noter que vous pourrez y voir remonter certaines erreurs telles que "Aucun sitemap référent détecté ".
Soumettre son sitemap à Bing Côté Bing, même combat. L'interface est certes légèrement différente mais le principe est le même. Accèdez à la console Bing Webmaster Tools , puis cliquez sur Sitemaps dans la barre latérale de gauche. Enfin, vous n'avez plus qu'à ajouter l'URL de votre sitemap.
Désolé pour mon interface en anglais, mais vous comprendrez sûrement que le concept est le même et les colonnes correspondent aux mêmes choses que chez Google.
À noter que la soumission de votre sitemap sur la Bing Webmaster Tools n'a pas d'impact sur l'indexation de votre site internet sur ChatGpt Search .
Partagez votre avis, vos questions, vos recommandations ci-dessous