-- Treść zweryfikowano na podstawie badań Botify dotyczących skanowania, oficjalnej dokumentacji Google o budżecie indeksowania oraz testów w realnych audytach na ponad 200 domenach.
TL;DR: Osierocone strony (orphan pages) to podstrony w twoim serwisie, do których nie prowadzi żaden link wewnętrzny. Google nie może ich łatwo znaleźć, użytkownicy nie mogą do nich dotrzeć, a one po cichu zjadają twój budżet indeksowania, nie generując praktycznie żadnego ruchu. Dane Botify pokazują, że orphan pages zużywają średnio 26% budżetu indeksowania, nie dając prawie nic w zamian. W tym poradniku pokażę ci, jak je znaleźć, jak je naprawić i jak sprawić, żeby nie wracały.

Orphan page to dowolna strona w twojej witrynie, do której prowadzi dokładnie zero linków wewnętrznych. Nie chodzi o zero linków zewnętrznych -- chodzi o zero linków wewnętrznych. Żadnego linku z menu. Żadnego linku z paska bocznego. Żadnego linku z sekcji „powiązane wpisy”. Żadnego linku z jakiegokolwiek innego miejsca w twoim własnym serwisie.


Taka strona istnieje na serwerze. Ma URL. Może nawet być w sitemapie. Ale gdybyś zaczął od strony głównej i przeklikał każdy link na każdej podstronie, nigdy byś do niej nie dotarł. Jest nieosiągalna z poziomu własnej nawigacji serwisu.
I właśnie dlatego to ma znaczenie: podstawową metodą odkrywania stron przez Google jest podążanie za linkami. Google startuje od znanych stron i przechodzi po każdym znalezionym linku, żeby odkrywać nowe adresy. Jeśli do strony nie prowadzi żaden link, Google nie ma ścieżki, żeby do niej dotrzeć. To trochę jak pokój w domu bez drzwi.
My przekonaliśmy się o tym boleśnie. Podczas migracji z seojuice.io na seojuice.com pod koniec 2024 przeprowadziliśmy skanowanie po wdrożeniu i odkryliśmy 837 osieroconych stron na naszej własnej stronie. Osiemset trzydzieści siedem. Była tam mieszanka starych wpisów blogowych, które straciły linki z kategorii po przebudowie serwisu, stron archiwów tagów generowanych automatycznie przez WordPressa, do których nowa nawigacja już nie prowadziła, oraz kilku stron docelowych z kampanii, o których kompletnie zapomnieliśmy. Jak na firmę, która sprzedaje narzędzia SEO, było to -- ujmując dyplomatycznie -- dość żenujące. Ale nauczyło mnie o orphan pages więcej w jeden tydzień niż dwa lata pisania o nich.
"Internal linking is one of the biggest things that you can do on a website to kind of guide Google and guide visitors to the pages that you think are important. And with internal linking, you can tell Google and visitors which pages you consider important."
Druga strona tego, co mówi Mueller, jest równie ważna: jeśli nie linkujesz do jakiejś strony, mówisz Google, że nie jest ważna. A Google potraktuje ją dokładnie w ten sposób.
Nikt nie tworzy orphan pages celowo. Pojawiają się w ramach zwykłego funkcjonowania serwisu -- powoli, po cichu, jak kurz w szafie serwerowej. Oto najczęstsze przyczyny:
Przebudowy i migracje serwisu. Przebudowujesz nawigację. Stara strona kategorii, która linkowała do 40 wpisów blogowych, zostaje zastąpiona nową, która linkuje tylko do 12. Te pozostałe 28 wpisów stają się osieroconymi stronami. To zdecydowanie najczęstsza przyczyna -- i dokładnie dlatego napisałem post-launch SEO checklist. Nasza własna migracja pokazała to aż za dobrze: mieliśmy mapę przekierowań dla URL-i, ale nikt nie przygotował mapy linków wewnętrznych. Strony były osiągalne po URL-u (przekierowania działały), ale nic już do nich nie linkowało. Inny problem, równie szkodliwy. Wracam do tego ciągle, bo to dokładnie ten błąd, którego chcę oszczędzić każdemu czytelnikowi.
Strony generowane przez CMS. Strony tagów, archiwa dat, strony autorów, wyniki paginacji -- twój CMS tworzy je automatycznie, ale często nie są podlinkowane z żadnego sensownego miejsca. Sam WordPress potrafi wygenerować ich setki. Szacuję (i naprawdę nie mam tu 100% pewności), że 30-50% osieroconych stron na przeciętnej stronie opartej o WordPressa to właśnie strony wygenerowane przez CMS, których nikt nie chciał i których nikt nie utrzymuje. Gdy przeanalizowaliśmy nasze 837 osieroconych stron, 412 z nich stanowiły strony tagów i archiwów dat. Prawie połowa.
Stare strony docelowe. Strona kampanii z Q3 2024? Promocja, która skończyła się 18 miesięcy temu? Nadal siedzi na serwerze, nadal jest skanowana, nadal nic nie wnosi. Nikt jej nie usunął, bo nikt nie pamiętał, że w ogóle istnieje. My sami mieliśmy 23 takie strony -- do webinarów, ofert sezonowych i kampanii Black Friday, którą, jeśli dobrze pamiętam, odpaliliśmy chyba raz.
Zmiany w paginacji. Kiedyś miałeś 50 produktów na stronę, teraz pokazujesz 100. Strony 6-10 ze starej paginacji nadal istnieją, ale nic już do nich nie linkuje.
Dryf w zarządzaniu treścią. Z czasem, gdy publikujesz nowe treści i usuwasz stare elementy nawigacji, strony, które kiedyś były dobrze połączone, powoli tracą linki. To nie jest jedno wydarzenie -- to erozja. I właśnie dlatego najtrudniej to wychwycić, bo nie ma jednego momentu, w którym coś się „psuje”. To po prostu stopniowo się pogarsza. W audytach SEOJuice widzimy to bez przerwy: serwis, który dwa lata temu miał sensowny internal linking, z czasem dorobił się 50-80 osieroconych stron bez żadnej wielkiej katastrofy, tylko w wyniku zwykłej codziennej pracy nad treścią.
Powiem to wprost. Orphan pages to nie tylko martwy ciężar -- one realnie pogarszają wyniki twojej strony na trzy mierzalne sposoby.
Google przydziela każdej witrynie skończoną ilość zasobów na skanowanie. To właśnie budżet indeksowania -- liczba stron, które Googlebot pobierze z twojego serwera w danym okresie. Każde żądanie zużyte na orphan page to żądanie, którego nie poświęcono stronie, która faktycznie ma znaczenie.
Liczby są dość brutalne. Botify przeanalizował duże serwisy i odkrył, że orphan pages zużywają średnio 26% budżetu indeksowania. Na źle utrzymanych stronach ten wynik dochodzi do 70%. TemplateMonster odkrył 3 miliony osieroconych stron podczas migracji -- strony aktywnie pochłaniały zasoby skanowania, podczas gdy 250 000 wartościowych stron komercyjnych nie było skanowanych w ogóle.
Dla małych serwisów (poniżej 500 stron) budżet indeksowania zwykle nie jest dużym problemem -- Google i tak z czasem przeskanuje całą witrynę. Ale gdy przekraczasz kilka tysięcy stron -- szczególnie przy CMS-ie, który generuje paginację, tagi i archiwa -- orphan pages zaczynają mieć realny wpływ. Chcę tu uważać, żeby nie przesadzić z dramatyzmem w przypadku małych stron, bo widziałem już zbyt wiele artykułów SEO wywołujących niepotrzebną panikę o budżet indeksowania na stronie z 200 URL-ami. Jeśli to twój przypadek, orphan pages nadal warto naprawić (choćby ze względu na przepływ autorytetu), ale budżet indeksowania nie jest twoim głównym problemem.
Linki wewnętrzne przekazują autorytet (to, co Google kiedyś nazywał PageRank) z jednej strony na drugą. Strona główna zwykle zbiera najwięcej linków zewnętrznych, więc ma najwięcej autorytetu. Ten autorytet przepływa przez linki wewnętrzne do podstron, potem do ich podstron i tak dalej.
Orphan pages są całkowicie odcięte od tego przepływu. Nie dostają żadnego wewnętrznego autorytetu. Nawet jeśli mają świetną treść, Google widzi stronę, której twój własny serwis najwyraźniej nie uznał za wystarczająco ważną, żeby do niej linkować. To bardzo mocny negatywny sygnał. Gdy ponownie podłączyliśmy nasze 837 osieroconych stron (te, które w ogóle warto było ratować), zobaczyliśmy mierzalne wzrosty pozycji w ciągu 4-6 tygodni dla stron, które wcześniej tkwiły na pozycjach 15-30. Samo dodanie linków wewnętrznych. Bez zmian w treści.
Dokumentacja Google dotycząca budżetu indeksowania mówi to wprost: strony bez linków przychodzących mogą pozostać nieskanowane niezależnie od ich znaczenia. Jeśli Google nie skanuje strony, nie może jej zaindeksować. Jeśli nie jest zaindeksowana, nie może rankować. Jeśli nie może rankować, nie generuje organicznego ruchu.
Najgorsze jest to, że dzieje się to po cichu. Nie zobaczysz błędu w Search Console. Strona się nie „psuje”. Po prostu stopniowo przestaje istnieć w obrazie internetu, jaki widzi Google. Odkryliśmy, że część naszych osieroconych wpisów blogowych została całkowicie wyindeksowana -- Google przestał je odwiedzać miesiące wcześniej. Treść nadal była dobra. Po prostu nie miała linków.
| Obszar wpływu | Co się dzieje | Skala szkód |
|---|---|---|
| Budżet indeksowania | Orphan pages zużywają zasoby skanowania, nie generując ruchu | Średnio 26% strat (do 70% na zaniedbanych stronach) |
| Przepływ autorytetu | Strony nie dostają żadnego internal link equity -- wyglądają na nieważne dla Google | Potencjał rankingowy spada niemal do zera |
| Indeksacja | Strony mogą nigdy nie zostać zeskanowane albo z czasem wypaść z indeksu | Botify: średnio 60% stron nie jest skanowanych w ciągu 30 dni |
| User Experience | Użytkownicy, którzy trafią na orphan pages z wyszukiwarki, nie mają ścieżki nawigacyjnej do reszty serwisu | Wyższy bounce rate, niższe zaangażowanie |
| Starzenie się treści | Osierocone strony się dezaktualizują -- nikt ich nie przegląda redakcyjnie, bo są poza zasięgiem wzroku | Nieaktualne informacje osłabiają zaufanie do marki |
Są trzy niezawodne metody. Używam wszystkich trzech, bo każda wyłapuje rzeczy, które umykają pozostałym. Podczas naszego audytu po migracji porównanie z sitemapą wykryło 743 osierocone strony, Search Console dorzucił jeszcze około 60, a analiza logów serwera znalazła dodatkowe 94, których nie wykryła żadna z dwóch pozostałych metod. Pokrycie nie było pełne -- każda metoda ma swoje martwe punkty.
To najbardziej niezawodne podejście. Potrzebujesz dwóch zbiorów danych:
Zbiór A: każdy URL z twojej XML sitemapy (czyli to, co twoim zdaniem zawiera serwis).
Zbiór B: każdy URL odkryty podczas skanowania strony od homepage (czyli to, do czego faktycznie da się dojść przez linki).
Każdy URL ze zbioru A, którego nie ma w zbiorze B, to orphan page -- jest w sitemapie, ale nie da się do niego dotrzeć przez linki wewnętrzne.
Możesz to zrobić w Screaming Frog, Sitebulb albo dowolnym crawlerze, który potrafi porównać wyniki z sitemapą. W Screaming Frog: skanujesz stronę w trybie „Spider”, a potem używasz „Crawl Analysis” -> „Orphan Pages”, żeby zobaczyć wyniki.
GSC pokazuje strony oznaczone jako „Discovered -- currently not indexed” albo „Crawled -- currently not indexed”. Nie wszystkie z nich są orphan pages, ale wiele tak. Zestaw te URL-e z danymi o linkach wewnętrznych. Jeśli strona jest w GSC, ale ma zero linków wewnętrznych, właśnie znalazłeś orphan page.
Logi serwera pokazują każdy URL, o który prosi Googlebot. Porównaj to z danymi ze skanowania. Strona, którą Googlebot odwiedza (bo znalazł ją kiedyś w sitemapie albo w starym cache), ale do której twój crawler nie może dojść od homepage, to orphan page, który aktywnie zjada budżet indeksowania.
To metoda, która wyłapuje najbardziej podstępne przypadki -- strony, których nie ma już nawet w sitemapie, ale które Google nadal pamięta z wcześniejszych skanowań. Takie strony-duchy, które zużywają zasoby, a są niewidoczne w każdym innym raporcie. Gdy po migracji uruchomiliśmy własną analizę logów, ta metoda wykryła dodatkowe 94 osierocone strony, których porównanie z sitemapą nie znalazło w ogóle. Były to stare URL-e, które usunęliśmy z sitemapy, ale których nie przekierowaliśmy ani nie skasowaliśmy. Google nadal odwiedzał je co kilka dni, dostawał odpowiedź 200 i marnował budżet indeksowania na stronach, które byliśmy przekonani, że już posprzątaliśmy.
# Quick comparison: sitemap URLs vs. crawled URLs
# Export your sitemap URLs and crawled URLs as text files, then:
# Find URLs in sitemap that weren't found during crawl (potential orphans)
comm -23 <(sort sitemap_urls.txt) <(sort crawled_urls.txt) > orphan_candidates.txt
# Count them
echo "Potential orphan pages: $(wc -l < orphan_candidates.txt)"
# Cross-reference with server logs to see which are still being crawled
grep -f orphan_candidates.txt access.log | grep "Googlebot" > orphans_wasting_budget.txt
echo "Orphans actively wasting crawl budget: $(wc -l < orphans_wasting_budget.txt)"
Nie każda orphan page wymaga tego samego rozwiązania. Oto mój proces decyzyjny, oparty na segregowaniu naszych własnych 837 przypadków:
Przeczytaj stronę. Czy informacje są aktualne? Czy jest popyt w wyszukiwarce na ten temat? Czy strona generuje jakikolwiek ruch (sprawdź w GSC)? Jeśli tak -- przejdź do Kroku 2. Jeśli nie -- przejdź do Kroku 3.
Najprostsza naprawa. Znajdź 3-5 stron w swoim serwisie, które są tematycznie powiązane, i dodaj z nich linki do orphan page. Skup się na:
Linkach kontekstowych w treści. To najmocniejsze linki. Link z akapitu w powiązanym wpisie blogowym jest więcej wart niż link z widgetu w pasku bocznym.
Stronach nawigacyjnych lub kategoriach. Jeśli orphan page należy do konkretnej sekcji twojego serwisu, dodaj ją do odpowiedniej strony kategorii albo menu nawigacyjnego.
Sekcjach powiązanych wpisów. Jeśli twój CMS ma funkcję „related posts”, upewnij się, że orphan page pojawia się w odpowiednich wynikach.
Najważniejszy wniosek
Nie linkuj do orphan page z innej orphan page. To tylko tworzy klaster odizolowanych stron, do których Google nadal nie może dotrzeć z głównej struktury serwisu. Każda orphan page potrzebuje przynajmniej jednego linku z dobrze podłączonej strony. My popełniliśmy dokładnie ten błąd przy pierwszej próbie naprawy: połączyliśmy 30 osieroconych wpisów blogowych między sobą, tworząc małą wyspę 30 stron, która nadal była odcięta od reszty witryny. Trzeba było robić to od nowa.
Nie każdą stronę warto ratować. Z naszych 837 orphan pages około 600 było faktycznie bezwartościowych -- automatycznie generowane archiwa tagów, wygasłe strony kampanii i kilka szkiców, które przypadkiem zostały opublikowane. Czasem właściwą odpowiedzią jest usunięcie, a nie ratunek. Oto opcje:
| Sytuacja | Działanie | Kiedy użyć |
|---|---|---|
| Duplikat lub prawie duplikat | 301 redirect do wersji kanonicznej | Dwie strony obejmują ten sam temat -- połącz je |
| Nieaktualna strona kampanii | Zwróć kod statusu 410 (Gone) | Treść jest trwale nieistotna |
| Thin content bez wartości w wyszukiwarce | Noindex + usuń z sitemapy | Strony typu puste archiwa tagów albo stara paginacja |
| Wartościowa, ale nieaktualna | Zaktualizuj treść + dodaj linki wewnętrzne | Dobry temat, ale informacje wymagają odświeżenia |
| Automatycznie wygenerowany śmieć | Usuń i zwróć 404/410 | Strony generowane przez CMS, które nigdy nie powinny były istnieć |
Krótka uwaga o 410 vs. 404: Google traktuje je podobnie, ale 410 (Gone) wprost mówi Google, że strona została usunięta na stałe. To trochę mocniejszy sygnał, żeby przestać marnować budżet indeksowania na ten URL. Używaj 410 wtedy, gdy masz pewność, że strona już nigdy nie wróci.
Szukanie i naprawianie orphan pages to działanie reaktywne. Oto jak zapobiegać ich pojawianiu się w pierwszej kolejności -- każda z tych rzeczy wynika bezpośrednio z naszych lekcji po migracji.
Obowiązkowy check linków wewnętrznych przed publikacją. Każda nowa strona, którą publikujesz, powinna linkować do co najmniej 3 istniejących stron i mieć co najmniej 3 linki z istniejących stron. Zrób z tego wymóg w swoim workflow redakcyjnym -- nie sugestię. Po incydencie z 837 stronami dodaliśmy to jako dosłowny checkbox do procesu publikacji. Od tamtej pory nie było to opcjonalne. Każdy nowy wpis blogowy, który przed publikacją nie ma przynajmniej 3 przychodzących linków wewnętrznych, wraca do poprawki.
Automatyczny internal linking. Narzędzia takie jak automated linking od SEOJuice skanują twoją treść i sugerują (albo automatycznie wstawiają) trafne linki wewnętrzne. To rozwiązuje problem dryfu -- kiedy publikujesz nowe treści, starsze strony automatycznie dostają linki z nowych. Tak, polecam tutaj własny produkt, i tak, jestem stronniczy, ale to też autentycznie problem, który zmotywował nas do zbudowania tej funkcji. Zbudowaliśmy ją, bo mieliśmy ku temu 837 powodów.
Miesięczne audyty skanowania. Raz w miesiącu uruchom pełne skanowanie serwisu i sprawdź, czy pojawiły się nowe orphan pages. To zajmuje 10 minut i łapie problemy, zanim się skumulują. My robimy to pierwszego dnia każdego miesiąca. Liczba nowych orphan pages, które wyłapujemy, spadła z dziesiątek do pojedynczych cyfr od momentu wdrożenia checklisty publikacyjnej.
Mapowanie przekierowań przy każdej przebudowie serwisu. Zanim wypuścisz nowy design, wyeksportuj obecną strukturę URL-i i zweryfikuj, że każda strona jest osiągalna w nowej nawigacji. To samo w sobie eliminuje przyczynę numer 1 orphan pages. Szkoda, że nikt nie powiedział mi tego bardziej dosadnie przed naszą migracją. Wiedziałem to teoretycznie. Po prostu nie zrobiłem tego wystarczająco dokładnie. Zmapowaliśmy URL-e, ale nie linki wewnętrzne. Nie popełniaj tego samego rozróżnienia.
Posprzątaj swój CMS. Wyłącz automatyczne generowanie stron, których nie potrzebujesz -- archiwów tagów, archiwów dat, stron autorów (jeśli masz jednego autora). Każda automatycznie generowana strona, której nie ma w nawigacji, to potencjalna orphan page. Te 412 orphan pages z tagów i archiwów dat, które znaleźliśmy, to były strony utworzone automatycznie przez WordPressa, do których nikt nigdy nie linkował i których nikt nigdy nie odwiedzał.
Oto prosty wzór, którego używam, żeby oszacować wpływ orphan pages na ruch:
| Metryka | Jak ją uzyskać | Przykład |
|---|---|---|
| Łączna liczba orphan pages | Porównanie skanowania z sitemapą | 150 stron |
| % orphan pages z popytem w wyszukiwarce | Sprawdź impressions w GSC dla orphan URL-i | 40% (60 stron) |
| Średnia liczba impressions na orphan page | Dane GSC dla tych 60 stron | 200 impressions/miesiąc |
| Oczekiwany CTR przy poprawnym podlinkowaniu | Średni CTR twojej strony dla podobnych stron | 3.5% |
| Utracone kliknięcia miesięcznie | 60 x 200 x 0.035 | 420 kliknięć/miesiąc |
420 kliknięć miesięcznie ze stron, które już istnieją w twoim serwisie. Bez tworzenia nowej treści. Bez link buildingu. Wystarczy dodać kilka linków wewnętrznych. To właśnie ten rodzaj ROI, który sprawia, że SEO jest najlepszym kanałem marketingowym, jaki istnieje.
Dla kontekstu: nasze dane z ponad 200 stron pokazują, że przeciętna witryna ma 8-15% swoich stron w statusie orphan. W serwisach, które nie były audytowane od ponad roku, ten wynik rośnie do 20-30%. Im większa strona, tym gorzej to wygląda. A jeśli niedawno robiłeś migrację bez audytu linków wewnętrznych? Sprawdź swoje liczby. Założyłbym się o over na 20%.
"Pages that are not linked in the site structure consume 26% of Google's crawl budget. For local businesses with fewer than 500 pages, orphan pages waste crawl budget while generating only 5% of organic traffic despite representing up to 70% of crawled pages."
Te liczby pochodzą z dużych serwisów z tysiącami stron, ale sam wzorzec powtarza się w każdej skali. Orphan pages to uniwersalny problem z uniwersalnym rozwiązaniem: znajdź je i albo je podlinkuj, albo usuń.
Technicznie tak. Jeśli orphan page jest w sitemapie, Google może ją w końcu znaleźć. Jeśli ma external backlinks, Google może odkryć ją w ten sposób. Ale „w końcu” może oznaczać miesiące, a nawet jeśli strona zostanie zaindeksowana, brak linków wewnętrznych oznacza zerowy autorytet -- więc raczej nie będzie rankować na nic konkurencyjnego. Dodanie strony do sitemapy nie zastępuje poprawnego internal linkingu.
Technicznie jeden. Ale jeden link ze stopki nie ma tej samej wagi co trzy linki kontekstowe z trafnych tematycznie stron. Polecam minimum 3 linki wewnętrzne z powiązanych stron. Ważne strony powinny mieć ich wyraźnie więcej -- twój top content powinien mieć 10+ linków wewnętrznych prowadzących do niego.
Niekoniecznie. Jeśli twoje strony tagów są podlinkowane z nawigacji, paska bocznego albo stopki, to nie są orphan pages. Problem pojawia się wtedy, gdy tworzysz tagi pod każde możliwe słowo kluczowe (częsty nawyk w WordPressie), a większość tych stron tagów nigdy nie pojawia się w żadnej nawigacji. Strona tagu z 2 wpisami i bez linków przychodzących to czysty martwy ciężar. Mieliśmy takich setki.
Jeśli strony są naprawdę osierocone (brak ruchu, brak backlinków, brak linków wewnętrznych), ich usunięcie niczemu nie zaszkodzi. Nie możesz stracić czegoś, czego i tak nie masz. Po prostu upewnij się, że zwracasz poprawny kod 404 albo 410, żeby Google przestał próbować je skanować. Nie przekierowuj orphan pages na niepowiązane treści -- to soft 404 i Google to ukarze.
Co miesiąc dla stron, które publikują często (więcej niż 10 stron miesięcznie). Co kwartał dla mniejszych serwisów. Po każdej przebudowie albo migracji zrób audyt w ciągu pierwszego tygodnia -- to właśnie wtedy orphan pages najczęściej pojawiają się hurtowo. Zaufaj mi w kwestii migracji. Nauczyłem się tego, mając 837 powodów.
SEOJuice Automated Internal Linking -- stale skanuje twój serwis i automatycznie dodaje linki wewnętrzne do osieroconych treści. Najlepsza naprawa to ta, która dzieje się bez twojego udziału.
Content Silos for SEO Guide -- orphan pages są objawem słabej architektury treści. Ten poradnik pokazuje, jak zbudować strukturę silo, która sprawi, że każda strona pozostanie połączona z resztą serwisu.
Internal Link Finder Tool -- darmowe narzędzie analizujące strukturę twojej strony i wskazujące okazje do linkowania, które ci umykają.
Każda orphan page to stracona szansa. Treść jest już napisana. Strona już istnieje. Potrzebuje tylko linku. To poprawka SEO o najniższym koszcie i najwyższym zwrocie, jaka istnieje -- a większość stron siedzi właśnie teraz na dziesiątkach takich okazji.
no credit card required
No related articles found.