Comprendre les pages orphelines

Vadim Kravcenko
Vadim Kravcenko
· Updated · 5 min read

-- Recherche vérifiée à partir des études de crawl de Botify, de la documentation officielle de Google sur le budget de crawl, et testée via des audits réels sur plus de 200 domaines.

TL;DR : Les pages orphelines sont des pages de ton site vers lesquelles aucune autre page ne fait de lien. Google ne peut pas les trouver, les utilisateurs ne peuvent pas y accéder, et elles grignotent silencieusement ton budget de crawl sans générer le moindre trafic. Les données de Botify montrent que les pages orphelines consomment en moyenne 26% du budget de crawl tout en apportant presque rien. Ce guide explique comment les repérer, comment les corriger, et comment éviter qu’elles ne reviennent.

Que sont exactement les pages orphelines ?

Schéma expliquant ce que sont les pages orphelines, avec des pages déconnectées de la structure principale du site sans aucun lien interne pointant vers elles
Les pages orphelines existent sur ton site mais n’ont aucun lien interne qui pointe vers elles, ce qui les rend invisibles à la fois pour les utilisateurs et pour les robots des moteurs de recherche. Source : FATJOE

Une page orpheline, c’est n’importe quelle page de ton site web vers laquelle pointent zéro lien interne. Pas zéro lien externe — zéro lien interne. Aucun lien dans le menu de navigation. Aucun lien dans la barre latérale. Aucun lien de type « articles liés ». Aucun lien depuis n’importe quelle autre page de ton propre site.

Comparison between crawled pages and orphan pages showing structural differences
Crawled pages vs orphan pages — understanding the structural gap to fix. Source: Botify
Diagram illustrating how orphan pages exist outside the normal site structure
How orphan pages become disconnected from the site's internal linking structure. Source: Botify

La page existe bien sur ton serveur. Elle a une URL. Elle est peut-être même dans ton sitemap. Mais si tu partais de ta page d’accueil et que tu cliquais sur chaque lien de chaque page, tu n’y arriverais jamais. Elle est inaccessible via la navigation de ton site.

Et c’est important pour une raison simple : la méthode principale de Google pour découvrir des pages, c’est de suivre des liens. Il part de pages déjà connues et suit chaque lien trouvé pour découvrir de nouvelles pages. Si aucune page ne pointe vers elle, Google n’a aucun moyen de l’atteindre. C’est comme avoir une pièce dans ta maison sans porte.

On l’a appris à nos dépens. Pendant notre migration de seojuice.io vers seojuice.com fin 2024, on a lancé un crawl post-migration et découvert 837 pages orphelines sur notre propre site. Huit cent trente-sept. C’était un mélange d’anciens articles de blog qui avaient perdu leurs liens depuis les pages de catégorie lors de la refonte, de pages d’archives de tags générées automatiquement par WordPress mais que notre nouvelle navigation ne reliait plus, et d’une poignée de pages d’atterrissage de campagnes qu’on avait complètement oubliées. Pour une boîte qui vend des outils SEO, c’était — pour le dire diplomatiquement — embarrassant. Mais ça m’a aussi appris plus sur les pages orphelines en une semaine que deux ans à écrire dessus.

"Internal linking is one of the biggest things that you can do on a website to kind of guide Google and guide visitors to the pages that you think are important. And with internal linking, you can tell Google and visitors which pages you consider important."

L’envers du propos de Mueller est tout aussi important : si tu ne fais pas de lien vers une page, tu dis à Google qu’elle n’est pas importante. Et Google la traitera comme telle.

Comment les pages orphelines se créent

Personne ne crée des pages orphelines volontairement. Elles s’accumulent au fil des opérations normales d’un site — lentement, discrètement, comme la poussière dans une baie serveur. Voici les causes les plus fréquentes :

Refontes et migrations de site. Tu reconstruis ta navigation. L’ancienne page de catégorie qui faisait des liens vers 40 articles de blog est remplacée par une nouvelle qui n’en relie plus que 12. Ces 28 articles deviennent orphelins. C’est de loin la cause la plus fréquente — et exactement pourquoi j’ai écrit la checklist SEO post-lancement. Notre propre migration l’a démontré de façon spectaculaire : on avait un plan de redirections pour les URL, mais personne n’avait fait de cartographie des liens internes. Les pages restaient accessibles par URL (les redirections fonctionnaient), mais plus rien ne pointait vers elles. Problème différent, dégâts comparables. J’insiste là-dessus parce que c’est précisément l’erreur que je veux t’éviter.

Pages générées par le CMS. Pages de tags, archives par date, pages auteur, résultats paginés — ton CMS les crée automatiquement, mais elles ne sont souvent liées depuis aucun endroit vraiment utile. WordPress à lui seul peut en générer des centaines. J’estimerais (et honnêtement, je ne suis pas totalement sûr de ce chiffre) que 30-50% des pages orphelines sur un site WordPress moyen sont des pages générées par le CMS que personne n’a demandées et que personne ne maintient. Quand on a analysé nos 837 pages orphelines, 412 étaient des archives de tags et de dates. Presque la moitié.

Anciennes pages d’atterrissage. Cette page de campagne du T3 2024 ? Cette promo terminée depuis 18 mois ? Toujours sur ton serveur, toujours crawlée, toujours inutile. Personne ne l’a supprimée parce que personne ne se souvenait qu’elle existait. On en avait 23 nous-mêmes — des pages pour des webinaires, des offres saisonnières, et une campagne Black Friday que je suis à peu près sûr qu’on n’a lancée qu’une fois.

Changements de pagination. Tu affichais 50 produits par page, maintenant tu en affiches 100. Les pages 6 à 10 de ton ancienne pagination existent toujours, mais plus rien ne pointe vers elles.

Dérive de gestion de contenu. Avec le temps, à mesure que tu publies du nouveau contenu et retires d’anciens éléments de navigation, des pages autrefois bien connectées perdent progressivement leurs liens. Ce n’est pas un événement unique — c’est de l’érosion. C’est aussi le cas le plus difficile à repérer parce qu’il n’y a pas de moment où quelque chose « casse ». Ça se dégrade juste petit à petit. On voit ça en permanence dans les audits SEOJuice : un site qui était bien maillé il y a deux ans a lentement accumulé 50-80 pages orphelines sans autre drame qu’une gestion de contenu tout à fait normale.

Pourquoi les pages orphelines nuisent à ton SEO

Je vais être direct. Les pages orphelines ne sont pas juste du poids mort — elles dégradent activement les performances de ton site de trois façons mesurables.

1. Gaspillage du budget de crawl

Google alloue une quantité finie de ressources de crawl à chaque site. C’est ton budget de crawl — le nombre de pages que Googlebot va demander à ton serveur sur une période donnée. Chaque requête dépensée sur une page orpheline est une requête qui n’est pas utilisée sur une page qui compte vraiment.

Les chiffres sont assez brutaux. Botify a analysé des grands sites d’entreprise et constaté que les pages orphelines consomment en moyenne 26% du budget de crawl. Sur les sites mal entretenus, ce chiffre monte à 70%. TemplateMonster a découvert 3 millions de pages orphelines pendant une migration — des pages qui consommaient activement des ressources de crawl pendant que 250 000 pages commerciales à forte valeur n’étaient même pas crawlées.

Pour les petits sites (moins de 500 pages), le budget de crawl n’est généralement pas un vrai sujet — Google finira par tout crawler. Mais dès que tu dépasses quelques milliers de pages — surtout avec un CMS qui génère pagination, tags et archives — les pages orphelines commencent à avoir un impact réel. Je préfère nuancer ce point pour les petits sites, parce que j’ai vu trop d’articles SEO déclencher une panique inutile à propos du budget de crawl sur un site de 200 pages. Si c’est ton cas, ça vaut quand même le coup de corriger les pages orphelines (pour des raisons de circulation d’autorité), mais le budget de crawl n’est probablement pas ton principal problème.

2. Zéro circulation d’autorité

Les liens internes transmettent de l’autorité (ce que Google appelait autrefois le PageRank) d’une page à l’autre. Ta page d’accueil reçoit le plus de backlinks, donc elle concentre le plus d’autorité. Cette autorité circule ensuite via les liens internes vers tes sous-pages, qui la transmettent à leur tour à leurs propres sous-pages, et ainsi de suite.

Les pages orphelines sont totalement coupées de ce flux. Elles ne reçoivent aucune autorité interne. Même si leur contenu est excellent, Google voit une page que ton propre site ne juge apparemment pas assez importante pour y faire un lien. C’est un signal négatif fort. Quand on a reconnecté nos 837 pages orphelines (celles qui méritaient d’être sauvées, en tout cas), on a observé des améliorations de position mesurables en 4-6 semaines sur des pages qui stagnaient entre les positions 15 et 30. Juste en ajoutant des liens internes. Aucun changement de contenu.

3. Échec d’indexation

La documentation de Google sur le budget de crawl le dit clairement : les pages sans liens entrants peuvent ne jamais être crawlées, quelle que soit leur importance. Si Google ne crawl pas une page, il ne peut pas l’indexer. Si elle n’est pas indexée, elle ne peut pas se positionner. Et si elle ne peut pas se positionner, elle génère zéro trafic organique.

Le plus insidieux ? Ça se produit en silence. Tu ne verras aucune erreur dans Search Console. La page ne « casse » pas. Elle cesse juste, discrètement, d’exister dans la vision que Google a du web. On a découvert que certains de nos articles de blog orphelins avaient été complètement désindexés — Google avait arrêté de les visiter depuis des mois. Le contenu était toujours bon. Il n’avait juste plus de liens.

Zone d’impactCe qui se passeAmpleur des dégâts
Budget de crawlLes pages orphelines consomment des ressources de crawl sans générer de trafic26% de gaspillage en moyenne (jusqu’à 70% sur les sites négligés)
Circulation d’autoritéLes pages ne reçoivent aucun jus de lien interne — elles paraissent sans importance pour GooglePotentiel de classement réduit à presque zéro
IndexationLes pages peuvent ne jamais être crawlées, ou sortir de l’index avec le tempsBotify : 60% des pages en moyenne ne sont pas crawlées sous 30 jours
Expérience utilisateurLes utilisateurs qui trouvent des pages orphelines via la recherche n’ont aucun chemin de navigation vers le reste du siteTaux de rebond plus élevés, engagement plus faible
Dégradation du contenuLe contenu orphelin vieillit mal — aucune revue éditoriale puisqu’il est hors de vueDes infos obsolètes nuisent à la confiance envers la marque

Comment trouver les pages orphelines

Il existe trois méthodes fiables. J’utilise les trois parce que chacune attrape des cas que les autres ratent. Pendant notre audit post-migration, la comparaison avec le sitemap a détecté 743 pages orphelines, Search Console en a signalé environ 60 de plus, et l’analyse des logs serveur en a trouvé 94 supplémentaires qu’aucune des deux autres méthodes n’avait remontées. Le recoupement n’était pas complet — chaque méthode a ses angles morts.

Méthode 1 : comparaison crawl vs sitemap

C’est l’approche la plus fiable. Tu as besoin de deux jeux de données :

Ensemble A : Toutes les URL de ton sitemap XML (ce que tu penses que ton site contient).
Ensemble B : Toutes les URL découvertes en crawlant ton site depuis la page d’accueil (ce qui est réellement accessible via les liens).

Toute URL présente dans l’ensemble A mais absente de l’ensemble B est une page orpheline — elle est dans ton sitemap mais inaccessible via les liens internes.

Tu peux faire ça avec Screaming Frog, Sitebulb, ou n’importe quel crawler capable de comparer un crawl à un sitemap. Dans Screaming Frog : crawl ton site en mode « Spider », puis utilise « Crawl Analysis » -> « Orphan Pages » pour voir les résultats.

Méthode 2 : rapport de couverture Google Search Console

GSC te montre les pages marquées « Découverte actuellement non indexée » ou « Explorée, actuellement non indexée ». Ce ne sont pas toutes des pages orphelines, mais beaucoup le sont. Recoupe ces URL avec tes données de liens internes. Si une page apparaît dans GSC mais a zéro lien interne, tu as trouvé ton orpheline.

Méthode 3 : analyse des logs serveur

Les logs de ton serveur montrent chaque URL demandée par Googlebot. Compare ça avec les données de ton crawl. Une page visitée par Googlebot (trouvée via le sitemap ou un ancien cache) mais inaccessible depuis la page d’accueil pour ton crawler est une page orpheline qui consomme activement ton budget de crawl.

C’est la méthode qui attrape les orphelines les plus sournoises — des pages qui ne sont même plus dans ton sitemap, mais dont Google se souvient d’un crawl précédent. Des pages fantômes qui consomment des ressources tout en restant invisibles dans tous les autres rapports. Quand on a lancé notre propre analyse de logs après la migration, cette méthode a trouvé 94 pages orphelines supplémentaires que la comparaison avec le sitemap avait complètement ratées. C’étaient d’anciennes URL qu’on avait retirées du sitemap sans les rediriger ni les supprimer. Google continuait à les visiter tous les quelques jours, recevait une réponse 200, et gaspillait du budget de crawl sur des pages qu’on pensait avoir nettoyées.

# Quick comparison: sitemap URLs vs. crawled URLs
# Export your sitemap URLs and crawled URLs as text files, then:

# Find URLs in sitemap that weren't found during crawl (potential orphans)
comm -23 <(sort sitemap_urls.txt) <(sort crawled_urls.txt) > orphan_candidates.txt

# Count them
echo "Potential orphan pages: $(wc -l < orphan_candidates.txt)"

# Cross-reference with server logs to see which are still being crawled
grep -f orphan_candidates.txt access.log | grep "Googlebot" > orphans_wasting_budget.txt
echo "Orphans actively wasting crawl budget: $(wc -l < orphans_wasting_budget.txt)"

Comment corriger les pages orphelines : l’arbre de décision

Toutes les pages orphelines ne méritent pas la même correction. Voici mon processus de décision, nourri par le tri de nos propres 837 pages :

Étape 1 : le contenu a-t-il encore de la valeur ?

Lis la page. L’information est-elle à jour ? Y a-t-il une demande de recherche sur ce sujet ? La page reçoit-elle encore du trafic (vérifie dans GSC) ? Si oui — passe à l’étape 2. Si non — passe à l’étape 3.

Étape 2 : ajoute des liens internes (pour le contenu utile)

La correction la plus simple. Trouve 3-5 pages de ton site qui sont proches thématiquement et ajoute des liens vers la page orpheline. Concentre-toi sur :

Les liens contextuels dans le corps du contenu. Ce sont les plus puissants. Un lien depuis un paragraphe d’un article connexe vaut plus qu’un lien dans un widget de barre latérale.

Les pages de navigation ou de catégorie. Si la page orpheline appartient à une section précise de ton site, ajoute-la à la page de catégorie concernée ou au menu de navigation.

Les sections d’articles liés. Si ton CMS a une fonctionnalité « articles liés », assure-toi que la page orpheline apparaisse dans les résultats pertinents.

À retenir

Ne fais pas de lien vers une page orpheline depuis une autre page orpheline. Ça crée juste un petit groupe de pages isolées que Google ne peut toujours pas atteindre depuis la structure principale du site. Chaque page orpheline a besoin d’au moins un lien depuis une page déjà bien connectée. On a fait exactement cette erreur lors de notre première correction : on a relié entre eux 30 articles de blog orphelins, créant une petite île de 30 pages toujours déconnectée du site principal. Il a fallu tout refaire.

Étape 3 : traite les pages sans valeur

Toutes les pages ne méritent pas d’être sauvées. Sur nos 837 pages orphelines, environ 600 étaient objectivement sans valeur — archives de tags auto-générées, pages de campagnes expirées, et quelques brouillons publiés par accident. Parfois, la bonne réponse, c’est la suppression, pas le sauvetage. Voici tes options :

ScénarioActionQuand l’utiliser
Duplicata ou quasi-duplicataRedirection 301 vers la version canoniqueDeux pages couvrent le même sujet — fusionne-les
Ancienne page de campagneRetourner un code 410 (Gone)Le contenu n’a plus aucune pertinence de façon permanente
Contenu faible, sans valeur SEONoindex + suppression du sitemapPages comme des archives de tags vides ou une ancienne pagination
Utile mais obsolèteMettre à jour le contenu + ajouter des liens internesLe sujet est bon, mais les infos doivent être rafraîchies
Déchets auto-générésSupprimer et retourner 404/410Pages générées par le CMS qui n’auraient jamais dû exister

Petite note sur 410 vs 404 : Google les traite de manière assez proche, mais 410 (Gone) indique explicitement que la page est supprimée de façon permanente. C’est un signal un peu plus fort pour dire à Google d’arrêter de gaspiller du budget de crawl sur cette URL. Utilise 410 quand tu es certain que la page ne reviendra jamais.

Prévenir les pages orphelines : les changements de workflow

Trouver et corriger les pages orphelines, c’est réactif. Voici comment éviter qu’elles apparaissent dès le départ — chacun de ces points vient directement de ce qu’on a appris après notre migration.

Vérification obligatoire des liens internes avant publication. Chaque nouvelle page que tu publies devrait faire des liens vers au moins 3 pages existantes et recevoir des liens depuis au moins 3 pages existantes. Fais-en une exigence dans ton workflow éditorial — pas une suggestion. On a ajouté ça comme une vraie case à cocher dans notre process de publication après l’incident des 837 pages. Depuis, ce n’est plus optionnel. Tout nouvel article de blog qui n’a pas au moins 3 liens internes entrants avant publication repart en révision.

Maillage interne automatisé. Des outils comme le maillage interne automatisé de SEOJuice scannent ton contenu et suggèrent (ou insèrent automatiquement) des liens internes pertinents. Ça résout le problème de dérive — à mesure que tu publies du nouveau contenu, les anciennes pages reçoivent automatiquement de nouveaux liens internes pertinents depuis les nouvelles pages. Oui, je recommande notre propre produit ici, et oui, je suis biaisé, mais c’est aussi très littéralement le problème qui nous a poussés à construire cette fonctionnalité. On l’a développée parce qu’on avait 837 bonnes raisons de le faire.

Audits de crawl mensuels. Lance un crawl complet du site une fois par mois et vérifie s’il y a de nouvelles pages orphelines. Ça prend 10 minutes et ça permet d’attraper les problèmes avant qu’ils ne s’accumulent. On fait le nôtre le premier de chaque mois. Le nombre de nouvelles pages orphelines qu’on détecte est passé de plusieurs dizaines à quelques unités depuis qu’on a mis en place la checklist de publication.

Cartographie des redirections à chaque refonte. Avant de mettre en ligne un nouveau design, exporte ta structure d’URL actuelle et vérifie que chaque page reste accessible dans la nouvelle navigation. Rien que ça évite la cause n°1 des pages orphelines. J’aurais aimé que quelqu’un me le dise plus fermement avant notre migration. Je le savais en théorie. Je ne l’ai juste pas fait avec assez de rigueur. On a cartographié les URL, mais pas les liens internes. Ne fais pas cette distinction.

Nettoie ton CMS. Désactive la génération automatique de pages dont tu n’as pas besoin — archives de tags, archives par date, pages auteur (si tu n’as qu’un seul auteur). Chaque page auto-générée qui n’apparaît pas dans ta navigation est une future page orpheline potentielle. Les 412 pages orphelines d’archives de tags et de dates qu’on a trouvées étaient toutes des pages créées automatiquement par WordPress que personne ne reliait et que personne ne visitait.

Calculateur d’impact : combien de clics es-tu en train de perdre ?

Voici une formule approximative que j’utilise pour estimer l’impact des pages orphelines sur le trafic :

MétriqueComment l’obtenirExemple
Nombre total de pages orphelinesComparaison crawl vs sitemap150 pages
% de pages orphelines avec une demande de rechercheVérifier les impressions GSC des URL orphelines40% (60 pages)
Impressions moyennes par page orphelineDonnées GSC pour ces 60 pages200 impressions/mois
CTR attendu si la page était correctement mailléeCTR moyen de ton site pour des pages similaires3.5%
Clics perdus par mois60 x 200 x 0.035420 clics/mois

420 clics par mois depuis des pages qui existent déjà sur ton site. Pas besoin de nouveau contenu. Pas besoin de link building. Juste quelques liens internes à ajouter. C’est exactement le genre de ROI qui fait du SEO le meilleur canal marketing qui existe.

Pour te donner un ordre d’idée : nos données sur plus de 200 sites montrent que le site moyen a 8-15% de ses pages en situation d’orphelinage. Pour les sites qui n’ont pas été audités depuis plus d’un an, ce chiffre grimpe à 20-30%. Plus le site est gros, pire c’est. Et si tu as fait une migration récemment sans audit des liens internes ? Vérifie tes chiffres. Je parierais volontiers sur plus de 20%.

"Pages that are not linked in the site structure consume 26% of Google's crawl budget. For local businesses with fewer than 500 pages, orphan pages waste crawl budget while generating only 5% of organic traffic despite representing up to 70% of crawled pages."

-- Botify Research, Orphan Pages & SEO Study (botify.com)

Ces chiffres viennent de grands sites avec des milliers de pages, mais le schéma reste le même à toutes les échelles. Les pages orphelines sont un problème universel avec une solution universelle : les trouver, puis soit les relier, soit les supprimer.

Questions fréquentes

Les pages orphelines peuvent-elles quand même être indexées ?

Techniquement, oui. Si une page orpheline est dans ton sitemap, Google peut finir par la trouver. Si elle a des backlinks externes, Google peut aussi la découvrir comme ça. Mais « finir par » peut vouloir dire plusieurs mois, et même si elle est indexée, l’absence de liens internes signifie qu’elle ne reçoit aucune autorité — donc elle a peu de chances de se positionner sur quoi que ce soit de compétitif. Soumettre une page dans ton sitemap ne remplace pas un vrai maillage interne.

Combien de liens internes faut-il à une page pour qu’elle ne soit plus orpheline ?

Techniquement, un seul. Mais un lien en footer n’a pas le même poids que trois liens contextuels depuis des pages de contenu pertinentes. Je recommande un minimum de 3 liens internes depuis des pages thématiquement proches. Les pages importantes devraient en avoir nettement plus — ton meilleur contenu devrait recevoir 10+ liens internes.

Les pages d’archives de tags et de catégories sont-elles toujours orphelines ?

Pas forcément. Si tes pages de tags sont liées depuis ta navigation, ta barre latérale ou ton footer, elles ne sont pas orphelines. Le problème apparaît quand tu crées des tags pour tous les mots-clés imaginables (une habitude WordPress très répandue) et que la plupart de ces pages de tags n’apparaissent jamais dans aucune navigation. Une page de tag avec 2 articles et aucun lien entrant, c’est du pur poids mort. On en avait des centaines.

Supprimer des pages orphelines peut-il nuire à mon SEO ?

Si les pages sont vraiment orphelines (pas de trafic, pas de backlinks, pas de liens internes), les supprimer ne fera aucun mal. Tu ne peux pas perdre ce que tu n’as pas. Assure-toi simplement de renvoyer un vrai code 404 ou 410 pour que Google arrête d’essayer de les crawler. Ne redirige pas des pages orphelines vers du contenu sans rapport — c’est un soft 404, et Google le traitera mal.

À quelle fréquence faut-il auditer les pages orphelines ?

Tous les mois pour les sites qui publient souvent (plus de 10 pages par mois). Tous les trimestres pour les plus petits sites. Après chaque refonte ou migration, fais un audit dans la première semaine — c’est là que les pages orphelines ont le plus de chances d’apparaître en masse. Fais-moi confiance sur la partie migration. Je l’ai appris avec 837 bonnes raisons.

Outils pour trouver et corriger les pages orphelines

SEOJuice Automated Internal Linking -- Scanne ton site en continu et ajoute automatiquement des liens internes pertinents pour reconnecter les pages isolées au reste de ton site. La meilleure correction, c’est celle qui se fait sans que tu aies à y penser.

Guide des silos de contenu pour le SEO -- Les pages orphelines sont souvent le symptôme d’une mauvaise architecture de contenu. Ce guide explique comment construire une structure en silo qui garde chaque page connectée.

Outil Internal Link Finder -- Outil gratuit qui analyse la structure de ton site et identifie les opportunités de liens que tu rates.

Chaque page orpheline est une opportunité manquée. Le contenu est déjà écrit. La page existe déjà. Il lui manque juste un lien. C’est la correction SEO la plus simple à mettre en place pour le meilleur retour — et la plupart des sites en ont des dizaines sous les yeux en ce moment même.

SEOJuice
Stay visible everywhere
Get discovered across Google and AI platforms with research-based optimizations.
Works with any CMS
Automated Internal Links
On-Page SEO Optimizations
Get Started Free

no credit card required

More articles

No related articles found.