Une métrique de cannibalisation au niveau des modèles permettant d’identifier des intentions de recherche dupliquées entre des types de pages répétables, comme les pages à facettes, les pages de catégorie, les pages d’archives et d’autres pages similaires.
L’Index de Cannibalisation des Modèles mesure à quelle fréquence plusieurs URL construites à partir du même modèle se positionnent pour les mêmes requêtes. Il est important car il met en évidence la cannibalisation systémique au niveau du modèle, où une seule correction peut nettoyer des centaines ou des milliers de pages concurrentes.
Indice de cannibalisation par gabarit (TCI) correspond à la part des requêtes pour lesquelles 2 URL ou plus issues du même gabarit se positionnent les unes contre les autres. C’est important, car les audits de cannibalisation URL par URL ne capturent pas le vrai problème sur les grands sites : à grande échelle, le gabarit génère des intentions dupliquées.
La formule est simple : requêtes comportant 2+ URL parentes positionnées à partir d’un même gabarit / total des requêtes positionnées pour ce gabarit x 100. Si un gabarit de navigation à facettes génère 1 000 requêtes positionnées et que 320 d’entre elles déclenchent plusieurs variantes de couleur, de taille ou de tri, alors le TCI est de 32 %.
C’est exploitable. Un TCI de 32 % sur un gabarit PLP indique généralement une logique canonical faible, des combinaisons de paramètres indexables ou une différenciation trop légère entre pages “sœurs”. Sur les sites d’envergure, c’est là que se situe le gaspillage.
Récupérez les données de requêtes et de pages d’atterrissage depuis Google Search Console sur 90 jours. Rattachez chaque URL à un identifiant de gabarit via votre CMS, une carte des modèles d’URL, ou une extraction personnalisée depuis Screaming Frog. Ensuite, regroupez par gabarit + requête et comptez les URL de positionnement distinctes.
Moz et Surfer SEO sont moins pertinents ici. Ce n’est pas un problème de scoring de contenu. C’est un problème de gabarit et d’indexation.
La correction dépend de l’intention. Parfois il s’agit de canonicalisation. Parfois de consolidation 301. Parfois de noindex. Parfois, les pages doivent rester distinctes, mais le contenu (copie), la logique des titres et le maillage interne doivent rendre la séparation d’intention évidente.
La principale erreur consiste à considérer tout recouvrement comme mauvais. Ce n’est pas le cas. Un partage temporaire de requêtes entre gabarits adjacents est normal, en particulier pendant la réindexation, les migrations, ou lorsque Google teste la diversité des résultats. John Mueller de Google a répété à de nombreuses reprises qu’il n’existe pas de “pénalité” formelle pour la cannibalisation ; Google choisit simplement l’URL qu’il estime la mieux correspondre à la requête. C’est la nuance. Le TCI est un indicateur de diagnostic, pas un indicateur de Google.
Autre limite : les données de requêtes dans GSC sont échantillonnées et tronquées. Sur des sites très volumineux, le recouvrement longue traîne est sous-estimé. Utilisez donc le TCI comme modèle de priorisation, puis validez avec les logs serveur, les contrôles d’indexation et des revues SERP en temps réel. Si Ahrefs montre un recouvrement mais pas GSC, ne faites confiance à aucun des deux aveuglément. Vérifiez les URL réellement positionnées.
Utilisé correctement, le TCI vous aide à corriger un gabarit et à récupérer les performances sur 500 ou 5 000 pages. C’est pourquoi les équipes avancées le suivent.
Dominez l’espace SERP en tirant parti des PAA pour gagner …
Détectez rapidement les scrapers, imposez un contrôle canonique strict et …
Lorsque des URL à faible valeur encombrent la file d’attente …
Purger de manière programmatique l’index bloat afin de récupérer le …
Les données d’agent utilisateur (user-agent) permettent de distinguer les vrais …
Dominez l’espace SERP en tirant parti des PAA pour gagner …
Get expert SEO insights and automated optimizations with our platform.
Get Started Free