-- Ricerca verificata sulla base degli studi di crawl di Botify, della documentazione ufficiale di Google sul crawl budget e testata con audit reali su oltre 200 domini.
TL;DR: Le orphan pages sono pagine del tuo sito che non ricevono alcun link interno. Google non riesce a trovarle tramite la normale navigazione interna, gli utenti non possono raggiungerle dalla navigazione del sito e intanto assorbono crawl budget senza generare traffico. I dati di Botify mostrano che le orphan pages assorbono in media il 26% del crawl budget pur contribuendo quasi per nulla ai risultati. In questa guida ti spiego come trovarle, come sistemarle e come evitare che si ripresentino.

Una orphan page è una pagina del tuo sito che non riceve alcun link interno. Non zero link esterni -- zero link interni. Nessun link dal menu di navigazione. Nessun link dalla sidebar. Nessun link dai “post correlati”. Nessun link da qualunque altra pagina del tuo stesso sito.


La pagina esiste sul server. Ha un URL. Potrebbe perfino essere nella sitemap. Ma se partissi dalla homepage e cliccassi ogni link su ogni pagina, non ci arriveresti mai. È irraggiungibile attraverso la navigazione del sito.
Ecco perché conta: il modo principale in cui Google scopre le pagine è seguire i link. Parte da pagine che conosce già e segue ogni link che trova per scoprirne di nuove. Se una pagina non riceve link, Google non ha un percorso per arrivarci. È come avere una stanza in casa senza porta.
L'abbiamo scoperto a nostre spese. Durante la migrazione da seojuice.io a seojuice.com alla fine del 2024, abbiamo eseguito una scansione post-migrazione e trovato 837 orphan pages sul nostro stesso sito. Ottocentotrentasette. Erano un mix di vecchi articoli del blog che avevano perso i link dalle pagine categoria nel redesign, pagine archivio dei tag generate automaticamente da WordPress ma non più collegate dalla nuova navigazione, e una manciata di landing page di campagne che ci eravamo completamente dimenticati. Per un'azienda che vende strumenti SEO, è stato -- per dirla con diplomazia -- imbarazzante. Però mi ha insegnato più cose sulle orphan pages in una settimana di quanto non avessero fatto due anni passati a scriverne.
"Internal linking is super critical for SEO. I think it's one of the biggest things that you can do on a website to kind of guide Google and guide visitors to the pages that you think are important. And what that does is it tells search engines, well, these pages are really important."
L'altro lato del punto di Mueller è altrettanto importante: se non stai collegando una pagina, stai dicendo a Google che non è importante. E Google la tratterà di conseguenza.
Nessuno crea orphan pages apposta. Si accumulano durante la normale gestione di un sito -- lentamente, in modo invisibile, come la polvere nei rack dei server. Ecco i colpevoli più comuni:
Redesign del sito e migrazioni. Hai rifatto la navigazione. La vecchia pagina categoria che collegava 40 articoli del blog è stata sostituita da una nuova che ne collega 12. Quei 28 articoli ora sono orphan pages. Questa è di gran lunga la causa più comune -- ed è esattamente il motivo per cui ho scritto la checklist SEO post-lancio. La nostra migrazione lo ha dimostrato in modo quasi teatrale: avevamo una mappa dei redirect per gli URL, ma nessuno aveva fatto una mappa dei link interni. Le pagine erano raggiungibili via URL (i redirect funzionavano), ma non c'era più nulla che le collegasse. Un problema diverso, ma altrettanto dannoso. Insisto su questo punto perché è l'errore che vorrei evitare a ogni lettore.
Pagine generate dal CMS. Pagine tag, archivi per data, pagine autore, risultati paginati -- il tuo CMS le crea automaticamente, ma spesso non sono collegate da nessuna sezione davvero rilevante del sito. Solo WordPress può generarne centinaia. Stimerei (e qui sono sinceramente poco sicuro del numero) che il 30-50% delle orphan pages su un sito WordPress medio siano pagine generate dal CMS che nessuno ha chiesto e nessuno mantiene. Quando abbiamo analizzato le nostre 837 orphan pages, 412 erano pagine tag e archivi per data. Quasi la metà.
Vecchie landing page. Quella pagina campagna del Q3 2024? La promozione finita 18 mesi fa? È ancora sul server, continua a essere scansionata e continua a non contribuire a nulla. Nessuno l'ha rimossa perché nessuno si ricordava che esistesse. Noi ne avevamo 23 -- pagine per webinar, offerte stagionali e una campagna Black Friday che, se ricordo bene, abbiamo fatto una volta sola.
Cambiamenti nella paginazione. Prima mostravi 50 prodotti per pagina, ora ne mostri 100. Le pagine 6-10 della vecchia paginazione esistono ancora ma non ricevono più link da nessuna parte.
Deriva nella gestione dei contenuti. Col tempo, mentre pubblichi nuovi contenuti e rimuovi vecchi elementi di navigazione, pagine che una volta erano ben collegate perdono lentamente i loro link. Non è un singolo evento -- è erosione. Questa è la più difficile da intercettare perché non c'è un momento preciso in cui qualcosa “si rompe”. Semplicemente degrada poco alla volta. Lo vediamo continuamente negli audit di SEOJuice: un sito che due anni fa era ben collegato ha accumulato lentamente 50-80 orphan pages senza nessun dramma particolare, solo normale operatività editoriale.
Vado dritto al punto. Le orphan pages non sono solo peso morto -- danneggiano attivamente le performance del tuo sito in tre modi misurabili.
Google assegna a ogni sito una quantità finita di risorse per la scansione. Questo è il tuo crawl budget -- il numero di pagine che Googlebot richiederà al tuo server in un dato periodo. Ogni richiesta spesa su una orphan page è una richiesta non spesa su una pagina che conta davvero.
I numeri sono netti. Botify ha analizzato siti enterprise e ha scoperto che le orphan pages assorbono in media il 26% del crawl budget. Nei siti gestiti male, quel numero arriva al 70%. TemplateMonster ha scoperto 3 milioni di orphan pages durante una migrazione -- pagine che consumavano attivamente risorse di scansione mentre 250,000 pagine commerciali di valore non venivano scansionate affatto.
Per i siti piccoli (sotto le 500 pagine), il crawl budget di solito non è un problema -- Google prima o poi scansionerà tutto. Ma appena superi qualche migliaio di pagine -- soprattutto con un CMS che genera paginazione, tag e archivi -- le orphan pages iniziano ad avere un impatto reale. Voglio stare attento a non esagerare questo punto per i siti più piccoli, perché ho visto troppi articoli SEO creare panico inutile sul crawl budget di un sito da 200 pagine. Se sei in quel caso, vale comunque la pena sistemare le orphan pages (per motivi di autorità interna), ma il crawl budget non è il tuo problema principale.
I link interni trasferiscono autorità (quello che Google una volta chiamava PageRank) da una pagina all'altra. La tua homepage riceve il maggior numero di link esterni, quindi ha più autorità. Quell'autorità scorre attraverso i link interni verso le sottopagine, che a loro volta la trasferiscono alle loro sottopagine, e così via.
Le orphan pages sono completamente tagliate fuori da questo flusso. Ricevono zero autorità interna. Anche se hanno contenuti ottimi, Google vede una pagina che il tuo stesso sito apparentemente non considera abbastanza importante da collegare. È un segnale negativo forte. Quando abbiamo ricollegato le nostre 837 orphan pages (quelle che valeva la pena salvare, almeno), abbiamo visto miglioramenti misurabili nel ranking entro 4-6 settimane per pagine che stavano ferme tra le posizioni 15-30. Solo aggiungendo link interni. Nessuna modifica ai contenuti.
La documentazione di Google sul crawl budget lo dice chiaramente: le pagine senza link in entrata potrebbero restare non scansionate indipendentemente dalla loro importanza. Se Google non scansiona una pagina, non può indicizzarla. Se non è indicizzata, non può posizionarsi. Se non può posizionarsi, genera zero traffico organico.
La parte più subdola? Succede in silenzio. Non vedrai un errore in Search Console. La pagina non “si rompe”. Semplicemente smette di esistere, piano piano, nella visione che Google ha di internet. Abbiamo scoperto che alcuni dei nostri articoli orfani erano stati completamente deindicizzati -- Google aveva smesso di visitarli mesi prima. Il contenuto era ancora valido. Semplicemente non aveva link.
| Area di impatto | Cosa succede | Entità del danno |
|---|---|---|
| Crawl Budget | Le orphan pages consumano risorse di scansione senza generare traffico | 26% di spreco medio (fino al 70% sui siti trascurati) |
| Autorità interna | Le pagine ricevono zero link equity interna -- appaiono poco importanti a Google | Potenziale di ranking ridotto quasi a zero |
| Indicizzazione | Le pagine potrebbero non essere mai scansionate, oppure uscire dall'indice col tempo | Botify: 60% delle pagine in media non scansionate entro 30 giorni |
| User Experience | Gli utenti che trovano orphan pages via ricerca non hanno un percorso di navigazione verso il resto del sito | Bounce rate più alto, engagement più basso |
| Decadimento dei contenuti | I contenuti orfani diventano obsoleti -- nessuna revisione editoriale perché sono fuori vista | Informazioni datate danneggiano la fiducia nel brand |
Ci sono tre metodi affidabili. Io uso tutti e tre perché ognuno intercetta cose che gli altri si perdono. Durante il nostro audit post-migrazione, il confronto con la sitemap ha trovato 743 orphan pages, Search Console ne ha segnalate altre 60 circa, e l'analisi dei log del server ne ha trovate altre 94 che nessuno degli altri due metodi aveva individuato. La sovrapposizione non era completa -- ogni metodo ha i suoi punti ciechi.
Questo è l'approccio più affidabile. Ti servono due set di dati:
Set A: Ogni URL nella tua XML sitemap (quello che pensi contenga il tuo sito).
Set B: Ogni URL scoperto scansionando il sito dalla homepage (quello che è davvero raggiungibile tramite link).
Qualsiasi URL presente nel Set A ma non nel Set B è una orphan page -- è nella sitemap ma non è raggiungibile tramite link interni.
Puoi farlo con Screaming Frog, Sitebulb o qualsiasi crawler che permetta il confronto con una sitemap. In Screaming Frog: fai la scansione del sito in modalità “Spider”, poi usa “Crawl Analysis” -> “Orphan Pages” per vedere i risultati.
GSC ti mostra pagine “Scoperta -- attualmente non indicizzata” oppure “Scansionata -- attualmente non indicizzata”. Non sono tutte orphan pages, ma molte sì. Incrocia questi URL con i dati dei tuoi link interni. Se una pagina è in GSC ma ha zero link interni, hai trovato la tua orphan page.
I log del server mostrano ogni URL richiesto da Googlebot. Confrontali con i dati della tua scansione. Una pagina che Googlebot visita (trovata tramite sitemap o vecchia cache) ma che il tuo crawler non riesce a raggiungere dalla homepage è una orphan page che sta consumando attivamente crawl budget.
Questo è il metodo che becca le orphan pages più subdole -- pagine che non sono nemmeno nella sitemap, ma che Google si ricorda da una scansione precedente. Pagine fantasma che consumano risorse ma sono invisibili in ogni altro report. Quando abbiamo eseguito la nostra analisi dei log dopo la migrazione, questo metodo ha trovato altre 94 orphan pages che il confronto con la sitemap si era perso del tutto. Erano vecchi URL che avevamo rimosso dalla sitemap ma che non avevamo né reindirizzato né eliminato. Google continuava a visitarli ogni pochi giorni, riceveva una risposta 200 e sprecava crawl budget su pagine che pensavamo di aver già ripulito.
# Quick comparison: sitemap URLs vs. crawled URLs
# Export your sitemap URLs and crawled URLs as text files, then:
# Find URLs in sitemap that weren't found during crawl (potential orphans)
comm -23 <(sort sitemap_urls.txt) <(sort crawled_urls.txt) > orphan_candidates.txt
# Count them
echo "Potential orphan pages: $(wc -l < orphan_candidates.txt)"
# Cross-reference with server logs to see which are still being crawled
grep -f orphan_candidates.txt access.log | grep "Googlebot" > orphans_wasting_budget.txt
echo "Orphans actively wasting crawl budget: $(wc -l < orphans_wasting_budget.txt)"
Non tutte le orphan pages meritano la stessa soluzione. Ecco il mio processo decisionale, modellato sul triage delle nostre 837:
Leggi la pagina. Le informazioni sono ancora attuali? C'è domanda di ricerca per questo argomento? La pagina riceve traffico almeno minimo (controlla in GSC)? Se sì -- vai allo Step 2. Se no -- vai allo Step 3.
È la soluzione più semplice. Trova 3-5 pagine del tuo sito che siano tematicamente correlate e aggiungi link verso la orphan page. Concentrati su:
Link contestuali nel corpo del testo. Sono i più forti. Un link da un paragrafo di un articolo correlato vale più di un link da un widget in sidebar.
Pagine di navigazione o categoria. Se la orphan page appartiene a una sezione specifica del sito, aggiungila alla pagina categoria rilevante o al menu di navigazione.
Sezioni di contenuti correlati. Se il tuo CMS ha una funzione “related posts”, assicurati che la orphan page compaia nei risultati pertinenti.
Punto chiave
Non collegare una orphan page da un'altra orphan page. Così crei solo un gruppetto di pagine isolate che Google continua a non poter raggiungere dalla struttura principale del sito. Ogni orphan page ha bisogno di almeno un link da una pagina ben collegata. Noi abbiamo fatto esattamente questo errore nella prima correzione: abbiamo collegato tra loro 30 articoli orfani, creando una piccola isola di 30 pagine ancora scollegata dal sito principale. Abbiamo dovuto rifare tutto.
Non tutte le pagine meritano di essere salvate. Delle nostre 837 orphan pages, circa 600 erano davvero inutili -- archivi tag generati automaticamente, pagine campagna scadute e qualche bozza pubblicata per sbaglio. A volte la risposta giusta è cancellare, non salvare. Ecco le opzioni:
| Scenario | Azione | Quando usarla |
|---|---|---|
| Duplicato o quasi duplicato | 301 redirect verso la versione canonica | Due pagine sullo stesso tema -- uniscile |
| Pagina campagna obsoleta | Restituisci codice di stato 410 (Gone) | Il contenuto è irrilevante in modo permanente |
| Contenuto scarno, nessun valore di ricerca | Noindex + rimozione dalla sitemap | Pagine come archivi tag vuoti o vecchia paginazione |
| Valida ma datata | Aggiorna il contenuto + aggiungi link interni | Buon argomento, ma informazioni da rinfrescare |
| Spazzatura auto-generata | Elimina e restituisci 404/410 | Pagine generate dal CMS che non sarebbero mai dovute esistere |
Una nota veloce su 410 vs. 404: Google li tratta in modo simile, ma 410 (Gone) dice esplicitamente a Google che la pagina è stata rimossa in modo permanente. È un segnale leggermente più forte per smettere di sprecare crawl budget su quell'URL. Usa 410 quando sei certo che la pagina non tornerà mai più.
Trovare e sistemare le orphan pages è un lavoro reattivo. Ecco come evitare che compaiano fin dall'inizio — e sì, ognuno di questi punti arriva direttamente dalle lezioni prese in faccia dopo la nostra migrazione.
Controllo obbligatorio dei link interni prima della pubblicazione. Ogni nuova pagina che pubblichi dovrebbe collegare almeno 3 pagine esistenti ed essere collegata da almeno 3 pagine esistenti. Rendilo un requisito nel tuo workflow editoriale -- non un suggerimento. Dopo l'incidente delle 837 pagine, noi l'abbiamo aggiunto come checkbox letterale nel processo di pubblicazione. Da allora non è più stato opzionale. Qualsiasi nuovo articolo del blog che non abbia almeno 3 link interni in entrata prima della pubblicazione viene rimandato indietro.
Internal linking automatizzato. Strumenti come l'automated linking di SEOJuice analizzano i tuoi contenuti e suggeriscono (o inseriscono automaticamente) link interni rilevanti. Questo risolve il problema della deriva -- mentre pubblichi nuovi contenuti, le vecchie pagine ricevono automaticamente link da quelle nuove. Sì, qui sto consigliando il nostro prodotto, e sì, sono di parte, ma è anche davvero il problema che ci ha spinti a costruire questa funzione. L'abbiamo costruita perché avevamo 837 motivi per farlo.
Audit di scansione mensili. Esegui una scansione completa del sito una volta al mese e controlla se ci sono nuove orphan pages. Richiede 10 minuti e intercetta i problemi prima che si sommino. Noi lo facciamo il primo di ogni mese. Da quando abbiamo implementato la checklist di pubblicazione, il numero di nuove orphan pages che troviamo è sceso da decine a singole unità.
Mappatura dei redirect a ogni redesign. Prima di lanciare un nuovo design, esporta la struttura URL attuale e verifica che ogni pagina sia raggiungibile nella nuova navigazione. Questo da solo previene la causa numero 1 delle orphan pages. Vorrei che qualcuno me l'avesse detto con più forza prima della nostra migrazione. Lo sapevo in teoria. Semplicemente non l'ho fatto in modo abbastanza rigoroso. Noi abbiamo mappato gli URL ma non i link interni. Non fare la stessa distinzione.
Ripulisci il tuo CMS. Disattiva la generazione automatica di pagine che non ti servono -- archivi tag, archivi per data, pagine autore (se hai un solo autore). Ogni pagina auto-generata che non compare nella navigazione è una potenziale orphan page. Le 412 orphan pages tra tag e archivi data che abbiamo trovato erano tutte pagine create automaticamente da WordPress che nessuno aveva mai collegato o visitato.
Ecco una formula approssimativa che uso per stimare l'impatto sul traffico delle orphan pages:
| Metrica | Come ottenerla | Esempio |
|---|---|---|
| Totale orphan pages | Confronto scansione vs. sitemap | 150 pagine |
| % di orphan pages con domanda di ricerca | Controlla le impression in GSC per gli URL orphan | 40% (60 pagine) |
| Impression medie per orphan page | Dati GSC per quelle 60 pagine | 200 impression/mese |
| CTR atteso se correttamente collegate | CTR medio del tuo sito per pagine simili | 3.5% |
| Click persi al mese | 60 x 200 x 0.035 | 420 click/mese |
420 click al mese da pagine che esistono già sul tuo sito. Nessun nuovo contenuto da creare. Nessuna link building. Solo qualche link interno in più. Questo è il tipo di ROI che rende la SEO il miglior canale marketing che esista.
Per dare un contesto: i nostri dati su oltre 200 siti mostrano che il sito medio ha l'8-15% delle proprie pagine orphan. Per i siti che non vengono sottoposti ad audit da oltre un anno, quel numero sale al 20-30%. Più grande è il sito, peggio diventa. E se hai fatto una migrazione di recente senza un audit dei link interni? Controlla i numeri. Io scommetterei sull'over del 20%.
"Le pagine che non sono collegate nella struttura del sito consumano il 26% del crawl budget di Google. Per le attività locali con meno di 500 pagine, le orphan pages sprecano crawl budget generando solo il 5% del traffico organico, pur rappresentando fino al 70% delle pagine scansionate."
Questi numeri arrivano da siti enterprise con migliaia di pagine, ma il pattern si ripete a ogni scala. Le orphan pages sono un problema universale con una soluzione universale: trovale e poi o le colleghi oppure le rimuovi.
Tecnicamente sì. Se una orphan page è nella sitemap, Google potrebbe prima o poi trovarla. Se ha backlink esterni, Google può scoprirla anche così. Ma “prima o poi” può voler dire mesi, e anche se viene indicizzata, l'assenza di link interni significa zero autorità interna -- quindi è improbabile che si posizioni per query competitive. Inserire una pagina nella sitemap non sostituisce un internal linking fatto bene.
Tecnicamente, uno. Ma un link nel footer non ha lo stesso peso di tre link contestuali da pagine di contenuto rilevanti. Io consiglio un minimo di 3 link interni da pagine tematicamente correlate. Le pagine importanti dovrebbero averne molti di più -- i tuoi contenuti principali dovrebbero ricevere 10+ link interni.
Non necessariamente. Se le tue pagine tag sono collegate dalla navigazione, dalla sidebar o dal footer, non sono orphan. Il problema nasce quando crei tag per qualsiasi keyword immaginabile (abitudine molto WordPress) e la maggior parte di quelle pagine tag non compare mai in nessuna navigazione. Una pagina tag con 2 articoli e nessun link in entrata è puro peso morto. Noi ne avevamo centinaia.
Se le pagine sono davvero orphan (niente traffico, niente backlink, niente link interni), eliminarle non danneggerà nulla. Non puoi perdere quello che non hai. Assicurati solo di restituire un corretto codice di stato 404 o 410 così Google smette di provare a scansionarle. Non reindirizzare orphan pages verso contenuti non correlati -- quello viene trattato come un soft 404 e Google potrebbe considerarlo negativamente.
Mensilmente per i siti che pubblicano spesso (più di 10 pagine al mese). Trimestralmente per i siti più piccoli. Dopo ogni redesign o migrazione del sito, fai un audit entro la prima settimana -- è lì che le orphan pages tendono a comparire in massa. Fidati sulla parte della migrazione. L'ho imparato con 837 motivi.
SEOJuice Automated Internal Linking -- Analizza continuamente il tuo sito e aggiunge automaticamente link interni ai contenuti orfani. La soluzione migliore è quella che succede senza che tu debba pensarci.
Guida ai Content Silos per SEO -- Le orphan pages sono un sintomo di una cattiva architettura dei contenuti. Questa guida spiega come costruire una struttura a silo che mantenga ogni pagina collegata.
Strumento Internal Link Finder -- Strumento gratuito che analizza la struttura del tuo sito e identifica opportunità di linking che ti stai perdendo.
Ogni orphan page è un'opportunità mancata. Il contenuto è già scritto. La pagina esiste già. Le serve solo un link. È la correzione SEO a più basso sforzo e più alto rendimento che ci sia -- e in questo momento la maggior parte dei siti ne ha decine davanti agli occhi.
no credit card required