Une stratégie SEO pour un site web comprend de nombreuses astuces à mettre en place. Et si on pense souvent à toute la partie visible du référencement naturel, comme l'usage des mots-clés et du netlinking, certaines astuces sont aussi à mettre en place au sein du site web. Parmi elles, la création d'un sitemap contribue à améliorer le SEO sur Google.

Qu'est-ce qu'un sitemap XML ?

Un sitemap XML est un fichier crucial qui contient, en principe, toutes les URLs de votre site web, ou du moins toutes celles que vous souhaitez soumettre pour indexation aux moteurs de recherche comme Google, Yahoo, ou Bing.

Ce document XML joue le rôle d'un annuaire détaillé de votre site Internet, offrant aux moteurs de recherche toutes les informations nécessaires pour explorer chaque page HTML et crawler efficacement le contenu de votre site, assurant ainsi qu'aucune page importante, y compris celles gérées par des systèmes de gestion de contenu comme WordPress, ne soit omise.

Quels sont les avantages du sitemap pour votre SEO ?

Le CMS génère souvent automatiquement le sitemap XML, qui passe inaperçu, et on ne réalise pas son intérêt pour le SEO du site web. Pourtant, créer un sitemap s'avère être une bonne stratégie de référencement naturel.

Guider les moteurs de recherche dans la profondeur de crawl

Illustration de 3 personnes avec des loupes en train de crawl le sitemap d'un site.

Les sitemaps XML sont particulièrement intéressants, car ils permettent de vous protéger un tant soit peu contre ce qu'on appelle la profondeur de crawl.

Pour rendre les choses un peu plus concrètes, imaginons un site e-commerce avec beaucoup de catégories, de sous-catégories, et même de sous-sous-catégories.

Avec un crawl classique des robots de Google, les urls placées très bas dans l'arborescence risquent de ne jamais être visitées, et donc de ne jamais être indexées. Mais si vous déclarez ces urls dans le sitemap, le Googlebot saura qu'il doit aller visiter ces pages, et lui accordera son attention.

Piloter les déclarations d'urls et les priorités

Le second avantage notable du sitemap XML réside dans sa capacité à vous permettre de gérer avec précision quelles pages vous déclarez à Google pour l'indexation et celles sur lesquelles vous souhaitez mettre l'accent. 

Par exemple, lors du lancement de votre site web, si vous désirez que Google accorde une attention particulière à vos pages de catégories et à votre page d'accueil, vous pouvez créer un sitemap XML spécifiquement dédié à ces pages importantes. En incluant uniquement ces URLs essentielles dans votre sitemap, vous dirigez efficacement les moteurs de recherche vers le contenu que vous jugez prioritaire.

Pour argumenter cette technique, rappelons que lors d'un crawl de Google, seulement 80 % de ses lectures de nouvelles pages se font à travers une navigation classique. Les 20 % restants ne se font qu'en suivant les liens du sitemap.

Optimiser le budget crawl

Par extension, le sitemap XML permet d'optimiser votre budget crawl, puisque vous pouvez guider Google directement vers les pages que vous jugez prioritaires, sans le laisser perdre son temps sur des pages inutiles, ou moins importantes. Ce n'est pas l'élément le plus décisif, mais il est à prendre en ligne de compte. Le sitemap fait ainsi partie des techniques de fine tuning pour votre SEO, autrement dit, il permet de mettre en place des tâches extrêmement précises pour améliorer le référencement naturel de votre site Internet.

Comment marche un sitemap XML ?

Un sitemap XML est régi par les règles dictées par le site sitemaps.org, et notamment par son protocole. Le sitemap XML, comme son nom l'indique, est donc un fichier XML dans lequel vous allez déclarer une url et sa localisation, et de façon facultative, la date de sa dernière modification, sa fréquence de changement, et la priorité du crawl.

Bon à savoir : pendant longtemps, la priorité de crawl avait pour vocation de mettre l'accent sur les pages les plus importantes. Aujourd'hui, Google lui-même reconnaît que la priorité de crawl n'est plus du tout utilisée, et donc totalement obsolète.

Les astuces à savoir avec le sitemap

La mise en place d'un sitemap XML n'est pas forcément très intuitif, et il peut être intéressant de connaître certaines astuces pour optimiser le sitemap de son site.

Créer un fichier sitemap d'index

Illustration d'un homme ajoutant une case dans un index sitemap.

Si votre site Internet comporte énormément d'urls, ne vous sentez pas obligé pour autant de créer un sitemap XML gigantesque. Il existe un autre fichier, en couple avec le sitemap, appelé le sitemap index, et qui permet d'avoir un annuaire de sitemaps au sein desquels vous avez plusieurs sous-sitemaps.

On peut, par exemple, avoir un sitemap pour les catégories de produits, un autre pour les produits, et encore un autre pour les pages institutionnelles.

Pour résumer, un fichier d'index de sitemap est un annuaire de tous vos autres sitemaps, qui sont eux-mêmes des annuaires de vos urls.

Le plugin Yoast SEO sur WordPress génère automatiquement le sitemap d'index dans de nombreux cas.

Bon à savoir : Google autorise les sitemaps de 50 Mo maximum, avec une limite de 50 000 urls. Si votre site web est conséquent, vous devriez diviser votre sitemap en plusieurs sous-sitemaps.

Soumettre le sitemap aux moteurs de recherche

L'idéal est de déclarer votre sitemap directement auprès de Google, en utilisant la Google Search Console. C'est très important pour la prise en considération de la sitemap par les robots de Google, et pour accélérer l'indexation de vos pages web. Rappelons quand même que l'indexation n'est pas systématique dans ce cas-là. 

Vous devez également déclarer le sitemap XML dans le fichier robots.txt en utilisant la fonction sitemap:url du sitemap.

Vérifier la façon dont le CMS régit les urls de votre site web

La plupart des CMS, tels que WordPress ou PrestaShop, génèrent automatiquement un sitemap. On a donc tendance à les laisser gérer. Il faut toutefois penser à régler, dans les paramètres du CMS, la façon dont il va régir les urls indiquées, pour que ne soient présentes que les urls utiles.

En effet, avec beaucoup de CMS, il est fréquent de voir sur le sitemap des urls totalement obsolètes ou inutiles pour Google, ce qui n'est pas souhaitable. C'est d'autant plus vrai que, sans sitemap, Google ne les aurait jamais découvertes, et vous n'auriez jamais eu de pages indexées inutilement.

Les conseils pour optimiser votre sitemap pour le SEO

Après avoir fait le tour des subtilités d'un sitemap, il ne reste plus qu'à le mettre en place. Pour cela, voici quelques astuces pour optimiser votre sitemap pour le SEO.

Personnaliser votre sitemap

Avec un sitemap, vous avez la chance de pouvoir faire ce que vous voulez. Imaginons alors un exemple : vous avez un site e-commerce avec 200 000 urls dont 100 000 produits, et votre priorité est de vous référencer sur la catégorie de produits, plutôt que sur le produit en lui-même. Avec un sitemap, il est possible de ne pas présenter les urls de vos produits, pour vous concentrer sur les catégories, sous-catégories, voire les sous-sous-catégories.

Pour y parvenir, vous pouvez donc faire un réglage manuel du sitemap, ou via les réglages du CMS, dans lequel vous ne déclarez que les urls qui vous intéressent. Google aura ainsi plus de chances de les crawler, et donc d'augmenter sa considération pour elles.

Créer un sitemap d'images

Illustration d'un homme devant un sitemap d'images.

Beaucoup de sites, aujourd'hui, ont besoin de se référencer sur Google Images et ont la volonté d'être visibles dans cette partie-là du moteur de recherche, que ce soit parce qu'ils sont dans la photographie, ou parce que leurs produits sont susceptibles de ressortir facilement sur une recherche Google Images.

Il existe alors la possibilité de faire un sitemap d'images. Que ce soit en association avec une url, grâce à la balise image:loc, ou à travers un sitemap dédié aux images et illustrations, il est tout à fait possible d'en faire une priorité lors de la création d'un sitemap.

Vous avez alors deux possibilités :

  • Faire un sitemap à part, pour toutes les images ;

  • Faire un sitemap où vous allez associer une url à une image, grâce à la balise image:loc.

Dans les deux cas, vous allez améliorer la pertinence aux yeux de Google de vos illustrations, et vous aurez plus de chances de ressortir dans Google Images.

Gérer l'indexation des pages

Le sitemap est aussi un très bon allié dans tous les cas où vous souhaitez retirer rapidement des pages de l'index de Google, avant de les rendre inaccessibles ou de les rediriger.

Cela peut être le cas, par exemple, si vous avez été victime d'un hack avec énormément d'urls à désindexer, ou si vous avez fait un audit du site et que vous vous êtes rendu compte qu'il y avait beaucoup de pages spam ou inutiles à supprimer.

Vous pouvez alors placer une instruction "noindex" sur toutes ces pages, et ensuite faire un sitemap dédié aux pages "noindex". Cela peut paraître contre-intuitif, étant donné qu'on n'a pas envie que Google les crawle, mais pour que Google désindexe une page, il faut d'abord qu'il la parcoure. Alors, faire un sitemap dédié aux pages sur lesquelles on vient de renseigner une instruction "noindex" permet à Google de prendre plus rapidement en compte cette instruction.

Booster l'indexation de certaines pages

Dans une bonne pratique, il est conseillé de faire régulièrement de l'analyse croisée entre les pages que vous avez réellement sur un site web, et celles que vous souhaiteriez voir indexées, mais qui ne le sont pas, pour diverses raisons (maillage, erreurs de crawl...).

En ce sens, il est tout à fait possible de créer un sitemap dédié aux pages pertinentes pour votre activité, mais qui n'ont pas encore été indexées, et le déclarer dans la Search Console et le robots.txt. Vous indiquez alors à Google d'aller le crawler, et il va prendre en compte rapidement les pages.
Si Google a une chance de les indexer, il les référencera alors.

Même si votre sitemap est généré automatiquement par votre CMS, il est toujours intéressant de garder la main dessus pour mieux régir vos urls. Lemon Interactive peut alors vous aider à construire un sitemap cohérent qui permettra aux moteurs de recherche d'explorer vos pages, et idéalement, d'améliorer votre SEO.

Comment fonctionne un sitemap ?

Qu'est-ce qu'un sitemap en SEO ?


Un sitemap en SEO est une carte qui aide les moteurs de recherche à indexer correctement les pages de votre site web. Il s'agit d'un fichier XML qui liste URL par URL pour informer Google des pages importantes et de leur hiérarchie, ainsi que de la fréquence de leurs mises à jour, optimisant ainsi le crawl et l'indexation.

Comment générer un sitemap ?


Pour générer un sitemap, utilisez un outil tel que Google Search Console ou un générateur de sitemap en ligne. Après avoir sélectionné les pages à inclure, créez le fichier XML et soumettez-le à Google via la Search Console. Assurez-vous que le fichier sitemap est actualisé régulièrement pour refléter les changements de votre site.

Où se trouve le fichier Sitemap XML ?


Pour trouver votre sitemap XML, ajoutez simplement "https://cdn.lemon-interactive.fr/sitemap.xml" à la base de l'URL de votre site (exemple : "votresite.com/sitemap.xml"). Vous pouvez également accéder au sitemap via votre tableau de bord de référencement en suivant : Marketing > Référencement > Sitemap.