La structure d'un site détermine quelles pages les robots explorent et dans quel ordre, parce qu'un moteur ne lit pas votre site comme un humain : il avance de lien en lien. Tout ce qui n'est pas relié par un chemin de liens internes lisible reste, pour lui, difficile à atteindre. Une architecture en profondeur excessive (au-delà de trois à quatre clics depuis l'accueil) éloigne mécaniquement certaines URL du parcours du robot, et une page orpheline, sans aucun lien entrant, n'apparaît sur le chemin d'aucune exploration. La structure agit donc en amont : elle conditionne ce que le moteur a seulement la chance de croiser.
Cette page traite de cette mécanique précise, structure vers découverte. Le choix de l'arborescence concrète à adopter (type de hiérarchie, silo, profondeur cible, format d'URL) est un sujet voisin mais distinct, traité dans quelle structure de site est la plus efficace pour le SEO.
Pourquoi le robot dépend du chemin de liens
Un moteur découvre une page de deux façons principales : un lien interne qui pointe vers elle, ou sa présence dans le sitemap XML. Le maillage interne reste le signal dominant, car il transmet aussi le contexte (l'ancre, la page d'origine, la place dans la navigation). Une page citée depuis l'accueil ou une grande catégorie est rencontrée tôt et souvent. Une page enfouie sous plusieurs niveaux, accessible seulement par une pagination lointaine, est rencontrée tard et rarement.
La profondeur de clic résume bien cet effet : plus une URL est loin de l'accueil en nombre de clics, plus le robot tarde à la croiser et moins il y revient. Les signaux structurels qui pèsent le plus :
- la profondeur de clic depuis l'accueil,
- le nombre et la qualité des liens internes entrants,
- la présence dans la navigation ou un fil d'Ariane,
- l'absence d'obstacles sur le chemin (redirections en chaîne, paramètres qui démultiplient les variantes).
À retenir
Une page peut exister, être en ligne et parfaite, et rester invisible si aucun chemin de liens ne mène jusqu'à elle. Le robot ne devine pas une URL, il la rencontre.
Ce que la structure oriente, et ce qu'elle ne décide pas
La structure pèse sur le crawl, c'est-à-dire sur l'exploration et la fréquence de passage. Elle ne dit rien, en revanche, des étapes qui suivent. Savoir si une page explorée sera ensuite retenue dans l'index relève d'un autre mécanisme, expliqué dans la différence entre crawl et indexation. Et la quantité de ressources qu'un moteur accorde à l'exploration d'un site se joue dans l'impact du budget de crawl. L'angle propre de cette page tient en une phrase : la structure conditionne la découverte et le rythme de visite, en amont de ces deux questions.
Un exemple courant l'illustre. Un site lance une rubrique de fiches accessibles uniquement via un filtre à facettes en JavaScript, sans lien direct depuis les catégories. Les fiches existent, mais aucune ancre stable ne pointe vers elles. Résultat probable : le robot peine à les atteindre, leur passage est espacé, et leur arrivée dans les résultats traîne. Ajouter des liens internes depuis les pages de catégorie change ce chemin du tout au tout, sans toucher au contenu des fiches.
Le piège classique
Confondre « la page est publiée » et « la page est reliée ». Un contenu de qualité posé en bout d'arborescence, sans lien entrant, donne au robot toutes les raisons de l'explorer en dernier, ou jamais.
Penser le chemin dès la conception
Ces chemins de liens se décident bien plus facilement à la conception du site qu'en rattrapage. Prévoir où chaque type de page sera relié, et garder les contenus importants proches de l'accueil, relève autant du SEO que de la création de site. Reprendre une arborescence déjà figée demande, à l'inverse, des arbitrages de redirections et de maillage plus lourds.
En pratique, la bonne question n'est pas « combien de pages ai-je ? » mais « depuis quelles pages chaque contenu important est-il atteignable, et en combien de clics ? ». C'est ce chemin, pas le volume, que votre structure met entre les mains du robot.
