Quando URL di basso valore intasano la coda di scansione di Google, le pagine importanti vengono scoperte e aggiornate più lentamente del dovuto.
La diluizione del budget di indicizzazione avviene quando Google impiega risorse di crawling e indicizzazione su URL che non dovrebbero avere alcun valore—facet, parametri, duplicati, varianti sottili—anziché sul tuo pagine “money”, cioè quelle che generano risultati. È ancora più importante sui siti di grandi dimensioni perché l’attività di crawl sprecata ritarda la scoperta, il ricaricamento e l’indicizzazione delle pagine che contribuiscono a posizionamenti e ricavi.
Diluizione del budget di indicizzazione significa che troppi URL di scarso valore competono per l’attenzione del Googlebot. Su siti con 100.000+ URL, questo si traduce di solito in indicizzazione più lenta, ricrawl non aggiornati sulle template chiave e performance organica più debole proprio dove conta davvero.
Il problema pratico è semplice: il Googlebot sta sprecando richieste su URL di categoria filtrati, parametri di tracciamento, pagine di ricerca interna, varianti duplicate e pagine soft-empty invece che sugli URL commerciali o editoriali che vuoi indicizzare velocemente. Screaming Frog mostrerà la dimensione del fenomeno. I log del server ne dimostrano il costo.
Non è solo un punto di discussione sul crawl budget. Diventa un problema di indicizzazione quando Google continua a scoprire “spazzatura” più velocemente di quanto riesca a processare le tue pagine utili. In Google Search Console lo vedi spesso come un pattern gonfio di Scoperto - non indicizzato o Crawled - non indicizzato, associato a una copertura della sitemap che appare peggiore di quanto dovrebbe.
Su ecommerce enterprise, marketplace e archivi di editori, correggere la diluizione può ridurre in modo significativo il tempo fino all’indicizzazione. Ahrefs e Semrush possono aiutarti a isolare le pagine che dovrebbero posizionarsi ma non sono presenti nell’indice di Google. GSC e file di log dicono se la richiesta di crawl viene sprecata “a monte”.
Da soli, Moz e Surfer SEO non diagnosticano bene questo aspetto. Prima di tutto è un problema di technical SEO, non un tema di “scoring” del contenuto.
Inizia con tre fonti di dati: GSC Crawl Stats, i log grezzi del server e un crawl completo in Screaming Frog o Sitebulb. Se il 20%+ degli hit del Googlebot va verso URL parametrizzati, duplicati, reindirizzati o non indicizzabili, probabilmente hai un problema di diluizione che vale la pena risolvere. Su siti molto grandi, il 30%+ è comune.
Poi confronta:
John Mueller di Google ha detto più volte che il crawl budget conta soprattutto per i siti più grandi, e quella resta l’impostazione corretta. La precisazione: i team spesso danno la colpa al crawl budget quando il vero problema è la qualità. Se le pagine sono sottili, duplici o commercialmente intercambiabili, migliorare l’efficienza di crawl non obbligherà Google a indicizzarle.
Un avvertimento. Non usare robots.txt come scorciatoia per la pulizia. Se gli URL bloccati continuano ad attirare link o sono referenziati pesantemente internamente, Google può mantenerli in gioco come URL “scoperti” senza vedere le tue direttive canoniche o noindex. Ed è qui che la saggezza convenzionale si rompe.
Il set di KPI migliore è quello noioso ma utile: percentuale di spreco del crawl, rapporto tra indicizzati e inviati, giorni mediani fino all’indicizzazione per i nuovi URL e hit del Googlebot per ogni template di valore. Se quei numeri si muovono nella direzione giusta, la diluizione sta diminuendo. Se no, probabilmente stai trattando i sintomi.
Elimina l’inflazione dell’indice delle faccette per recuperare crawl budget sprecato, …
La PAA si colloca tra i featured snippet e la …
Mitiga la perdita di contenuti invisibili: migra le risorse basate …
Elimina la cannibalizzazione dei template per consolidare la link equity, …
Come le modifiche globali ai template cambiano il targeting delle …
Come l’indicizzazione incontrollata proveniente da template, facet e parametri spreca …
Get expert SEO insights and automated optimizations with our platform.
Get Started Free