Savez-vous ce qu’est un plan de site ? Il s’agit d’un élément qui, surtout pour les grands sites comme les sites de commerce électronique, a une double importance non négligeable. Il permet aux utilisateurs de s’orienter facilement en améliorant l’UX, et à Google et aux moteurs de recherche d’identifier et de comprendre la structure d’un site Web. Voyons en détail ce qu’est le plan de site XML, quels autres formats existent et sa valeur SEO notable, découvrant également comment le générer et l’envoyer à Google via Google Search Console.
Qu’est-ce qu’un plan de site ?
Commençons par la définition de Google :
Un plan de site est un fichier dans lequel vous fournissez des informations sur les pages, les vidéos et les autres fichiers de votre site, ainsi que sur la manière dont les différents éléments sont liés. Les moteurs de recherche comme Google lisent ce fichier pour explorer votre site plus efficacement.
Le plan de site indique aux moteurs de recherche quelles pages et quels fichiers de votre site vous semblent importants. Il fournit également des informations précieuses à leur sujet, telles que la date de la dernière mise à jour de la page et si elle existe des versions dans d’autres langues.
Pour faire simple, on peut dire qu’il s’agit d’un fichier qui contient les URL (pages, images et autres ressources) d’un site Web : c’est comme une carte qui peut aider l’utilisateur à s’orienter et le moteur de recherche à comprendre et à « digérer » les sections et les contenus.
Les robots des moteurs de recherche continueront à scanner le site Web. La présence d’un plan de site ne compense pas la création d’infrastructures peu conviviales pour le référencement. Mais dans tous les cas, l’automatisation aura dans un seul fichier la synthèse du site. Et cela, comme nous le verrons, surtout pour les très grands, peut être un support extrêmement valable.
Lorsque nous nous concentrons sur l’importance du plan du site à des fins de référencement, nous faisons référence au fichier au format XML. Avant de nous concentrer sur son utilité à des fins d’indexation, distinguons ses différents types.
À quoi sert un plan de site et pourquoi est-il essentiel pour le référencement ?
Le plan du site relie notre site Web aux moteurs de recherche. Il ne s’agit pas simplement d’une liste de pages, mais d’un outil actif qui optimise le flux d’informations entre le site et les moteurs de recherche, contribuant ainsi à renforcer notre présence en ligne.
Avec un plan de site, les robots d’exploration comme Googlebot peuvent analyser votre site plus efficacement. Ils ont une vue complète du contenu disponible et des chemins pour y accéder. Ce document sert de guide détaillé qui facilite la navigation dans l’architecture du site.
Les robots d’exploration Web sont généralement en mesure de trouver la plupart du contenu via des liens internes. Mais un plan de site donne aux moteurs de recherche une compréhension plus rapide et plus précise de la structure de votre site. Cela est particulièrement bénéfique pour les grands sites ou les sites avec des structures d’URL complexes, où certaines pages pourraient autrement passer inaperçues.
Un aspect crucial du plan du site est la capacité de signaler aux moteurs de recherche les pages les plus pertinentes pour les utilisateurs et pour notre entreprise. En mettant régulièrement à jour votre plan de site, nous informons Google des nouvelles pages ou des modifications apportées, garantissant ainsi qu’elles sont explorées en temps opportun.
Différence entre sitemap.xml et sitemap.html
Les plans de site peuvent être classés en deux formats
Plan du site XML
Une norme adoptée par Google et d’autres moteurs de recherche. L’objectif est en effet de fournir aux webmasters la possibilité de créer et de communiquer au moteur de recherche un fichier utile pour interpréter plus facilement les différentes sections et contenus d’un site web ;
Plan du site HTML
Il s’agit d’une page qui fournit à l’utilisateur un aperçu du site. C’est un élément assez obsolète sur le web actuel. D’ailleurs, de moins en moins de sites créent un plan de site HTML et le proposent aux utilisateurs.
Le but de ce format est d’améliorer l’expérience utilisateur (l’utilisateur a, sur une seule page, un aperçu des différentes rubriques, auxquelles il peut accéder en un clic). Néanmoins, si le site est construit de manière simple, logique et rationnelle, vous pouvez même vous en passer.
Outre ces deux types, il existe également des plans de site dits spéciaux (par exemple, ceux contenant uniquement des images) qui peuvent, à leur tour, être créés et envoyés à Google via la Search Console.
Plans de site XML et utilitaires SEO
L’utilité du référencement est relative au type de site Web. Si nous en avons un contenant dix pages, peut-être liées dans le menu principal, sa présence ou son absence est un aspect complètement hors de propos. Cependant, la situation est différente pour les grands sites, comme ceux du commerce électronique.
Le guide Google nous aide à comprendre quand il est important de le faire. Mais nous pouvons souligner qu’il peut être efficace et nécessaire, notamment dans :
- Sites volumineux : les nombreuses pages et sections du site pourraient dérouter le moteur de recherche. Le plan du site, dans ce cas, est un support pour l’interprétation du site lui-même ;
- Des sites avec des pages et des rubriques mal connectées : monter un site web de cette manière est, d’un point de vue SEO, une démarche non vertueuse. Dans ce cas, cependant, la présence du plan du site peut au moins partiellement compenser la structure peu adaptée au référencement ;
- Nouveaux sites pour les sites nouvellement publiés et qui, par conséquent, ne bénéficient pas de backlinks d’autres sites, l’utilisation d’un plan de site XML pour l’indexation initiale est un aspect à ne pas sous-estimer ;
- Sites avec différents contenus multimédias : en cas de présence massive d’images, de vidéos ou d’autres éléments multimédias, cela peut s’avérer très utile à des fins d’indexation.
Un plan de site XML, en revanche, a une importance négligeable dans :
- Petits sites : classés comme tels lorsqu’ils ne dépassent pas environ 500 pages ;
- Sites bien structurés : projets web où les différentes sections sont liées et connectées de manière vertueuse et hiérarchique (dans ces cas cependant, si le site est volumineux, communiquer un plan de site est une pratique fortement recommandée) ;
- Fichiers multimédias : les sites avec peu d’images ou d’autres contenus multimédias peuvent même ne pas nécessiter de plan de site.
Comment créer un plan de site XML ?
Maintenant que nous avons vu ce que c’est et son importance dans le référencement, voyons comment en créer un. S’il s’agit de sites statiques non créés avec un CMS, il est possible de les générer via des services Web comme ceux proposés par xml-sitemaps.com.
Une fois que vous avez entré l’URL du site pour lequel vous avez besoin d’un plan de site, celui-ci est alors automatiquement créé.
Le fichier XML sera ensuite téléchargé et inséré dans la racine principale où le site Web est hébergé. Toutefois, il est certainement plus facile d’en créer un nouveau avec un CMS, où il existe généralement des extensions et des plugins qui le génèrent et le mettent à jour de manière entièrement automatique.
Ce dernier aspect est essentiel dans les sites dynamiques, où de nouveaux contenus sont constamment créés et donc ajoutés au plan de site XML. Sur WordPress, en particulier, nous vous conseillons deux plugins : Yoast et Rank Math.
Une fois créé, vous pouvez y accéder en ajoutant sitemap.xml à l’URL principale de votre site Web. Voici par exemple le nôtre : https://expertseo-consulting.com/sitemap_index.xml.
Comment soumettre un plan de site à Google ?
L’étape finale, après la création, consiste à communiquer notre sitemap.xml à Google via le très utile outil Search Console. Dans le menu vertical à gauche, à l’intérieur du tableau de bord, il y a l’élément « Plan du site ».
Comme nous pouvons le voir sur l’image, il suffira d’insérer l’URL du plan du site et de le soumettre. Dans la case immédiatement en dessous, vous pouvez surveiller son statut, comprendre si l’envoi a réussi et s’il y a des erreurs. La colonne « URL détectées » nous donne un résumé des pages acquises par l’outil made in Google.
Bonnes pratiques pour l’utilisation des plans de site
La documentation de Google offre des conseils pratiques sur la manière d’utiliser efficacement les plans de site, en s’appuyant sur le protocole de plan de site mentionné ci-dessus. Il se concentre notamment sur des aspects tels que les limites de taille, l’emplacement des fichiers et les URL incluses.
Limites de taille et de division du plan du site
Chaque format de plan de site a une limite de 50 Mo (non compressé) ou de 50 000 URL par fichier unique. Si vous dépassez l’une de ces limites, vous devrez diviser votre plan de site en fichiers plus petits. Vous pouvez créer un fichier d’index de vos plans de site, appelé index de plan de site, et soumettre uniquement celui-ci à Google.
Vous pouvez également soumettre à la fois les plans de site individuels et le fichier d’index, en particulier si vous souhaitez surveiller les performances de chaque plan de site via la Search Console. Sachez que Google ne prend pas en compte l’ordre des URL dans le plan du site ; la seule contrainte est la taille du fichier.
Codage et emplacement du fichier de plan de site
Le plan du site doit être encodé en UTF-8. Il peut être hébergé dans n’importe quel répertoire du site, mais gardez à l’esprit qu’il affecte uniquement les fichiers du même répertoire ou de ses sous-répertoires. Pour maximiser l’efficacité, placez simplement le plan à la racine du site, afin qu’il puisse influencer tous les fichiers présents.
Utilisation d’URL complètes et absolues
Dans le plan du site, vous devez utiliser des URL complètes et absolues. Google explorera les URL exactement telles qu’elles sont répertoriées. Par exemple, si le site est https://www.example.com, vous ne devez pas saisir une URL relative comme mypage.html, mais l’URL complète : https://www.example.com/mypage.html.
Inclure les URL souhaitées dans les résultats de recherche
Le plan du site doit contenir les URL que vous souhaitez voir apparaître dans les résultats de recherche Google. Les moteurs de recherche ont tendance à afficher des URL canoniques, et les plans de site peuvent influencer ce choix.
S’il existe différentes versions d’une page pour mobile et ordinateur de bureau, il est recommandé d’inclure une seule version ou les deux dans votre plan de site. Prenez le soin de spécifier les annotations appropriées pour indiquer quelle URL correspond à chaque version.
Sélection d’URL canoniques
Créer un plan de site signifie indiquer aux moteurs de recherche quelles URL sont préférées à afficher dans les résultats de recherche, c’est-à-dire les URL canoniques. Si le même contenu est accessible via différentes URL, vous devez choisir l’URL préférée à inclure dans le plan du site et exclure les autres qui mènent au même contenu.
Quelles pages exclure du plan du site
Dans le contexte des meilleures pratiques en matière de plan de site, sachez que vous n’avez pas besoin d’inclure toutes les URL de votre site. En fait, il existe des types spécifiques de pages qu’il vaut mieux laisser de côté, car elles n’ajoutent pas de valeur significative.
Votre plan de site doit contenir uniquement les URL les plus importantes, celles qui offrent un réel avantage aux utilisateurs et que vous souhaitez que les moteurs de recherche indexent. Les autres pages doivent être exclues du plan du site, bien que cela ne garantisse pas qu’elles seront complètement ignorées par les robots d’exploration, à moins que vous n’utilisiez le noindex.
Il est notamment conseillé d’exclure les catégories de pages suivantes du plan du site :
- Pages non canoniques : versions alternatives d’une page principale.
- Pages en double : Contenu identique ou très similaire sur différentes URL.
- Pages de pagination : telles que celles utilisées pour naviguer entre différentes pages d’une liste.
- URL avec paramètres : pages qui contiennent des paramètres dans l’URL qui n’offrent pas de contenu unique.
- Pages de résultats de recherche internes : Résultats générés à partir de recherches effectuées au sein du site.
- URL générées par filtre : Pages créées en appliquant des filtres ou des options de tri.
- Pages d’archives : collections d’anciens contenus qui ne sont plus pertinents.
- Redirections et erreurs : URL qui renvoient les codes d’état 3xx (redirection), 4xx (page non trouvée) ou 5xx (erreurs de serveur).
- Pages bloquées par robots.txt : URL qui ont déjà été exclues via ce fichier de configuration.
- Pages taguées noindex : pages que vous avez déjà choisis de ne pas indexer.
- Contenu accessible par formulaire : tel que des PDF ou d’autres documents téléchargeables via des formulaires de génération de leads.
- Pages de service : telles que les pages de connexion, les listes de souhaits ou les paniers d’achat.
En excluant ces pages du plan du site, vous optimisez le processus d’indexation, concentrant l’attention des moteurs de recherche sur le contenu le plus pertinent et améliorant ainsi la visibilité du site.
Conclusion
Créer et communiquer un plan de site XML est un aspect d’optimisation SEO qui ne doit jamais être négligé, surtout sur les grands sites. Si, par exemple, vous gérez un e-commerce, c’est certainement un élément fondamental dans les activités de positionnement.
Générer et mettre à jour un plan de site peut être une tâche simple ou complexe, selon le type de CMS ou de système que vous utilisez pour gérer le contenu et les pages de votre site Web. Si vous avez besoin d’aide pour votre projet, notre agence web tunisie est là pour vous aider.