Páginas huérfanas: qué son y cómo afectan tu SEO

Vadim Kravcenko
Vadim Kravcenko
· 5 min read

-- Investigación verificada con estudios de rastreo de Botify, la documentación oficial de Google sobre presupuesto de rastreo y pruebas en auditorías reales de sitios en más de 200 dominios.

TL;DR: Las páginas huérfanas son páginas de tu sitio a las que ninguna otra página enlaza. Google no puede encontrarlas, los usuarios no pueden llegar a ellas y, en silencio, consumen tu presupuesto de rastreo sin generar casi nada de tráfico. Los datos de Botify muestran que las páginas huérfanas consumen en promedio el 26% del presupuesto de rastreo mientras aportan casi nada. En esta guía te explico cómo encontrarlas, cómo corregirlas y cómo evitar que vuelvan a aparecer.

¿Qué son exactamente las páginas huérfanas?

Diagrama que explica qué son las páginas huérfanas y muestra páginas desconectadas de la estructura principal del sitio web, sin enlaces internos hacia ellas
Las páginas huérfanas existen en tu sitio, pero no tienen ningún enlace interno apuntando hacia ellas, lo que las vuelve invisibles tanto para los usuarios como para los rastreadores de los motores de búsqueda. Fuente: FATJOE

Una página huérfana es cualquier página de tu sitio web que no tiene ningún enlace interno apuntando hacia ella. No hablo de cero enlaces externos: hablo de cero enlaces internos. Sin enlace en el menú de navegación. Sin enlace en la barra lateral. Sin enlace de “posts relacionados”. Sin enlace desde ningún otro lugar dentro de tu propio sitio.

Comparison between crawled pages and orphan pages showing structural differences
Crawled pages vs orphan pages — understanding the structural gap to fix. Source: Botify
Diagram illustrating how orphan pages exist outside the normal site structure
How orphan pages become disconnected from the site's internal linking structure. Source: Botify

La página existe en tu servidor. Tiene una URL. Incluso puede estar en tu sitemap. Pero si empezaras en tu página de inicio y fueras haciendo clic en cada enlace de cada página, nunca llegarías a ella. Es inalcanzable a través de la propia navegación de tu sitio.

Y esto importa por una razón muy simple: el método principal de Google para descubrir páginas es seguir enlaces. Empieza en páginas conocidas y sigue cada enlace que encuentra para descubrir nuevas URLs. Si una página no tiene enlaces internos apuntando hacia ella, Google no tiene un camino claro para llegar a ella. Es como tener una habitación en tu casa sin puerta.

Nosotros aprendimos esto por las malas. Durante nuestra migración de seojuice.io a seojuice.com a finales de 2024, hicimos un rastreo después del lanzamiento y descubrimos 837 páginas huérfanas en nuestro propio sitio. Ochocientas treinta y siete. Había de todo: posts antiguos del blog que perdieron los enlaces internos desde páginas de categoría en el rediseño, páginas de archivo por etiquetas que WordPress había generado automáticamente pero que nuestra nueva navegación ya no incluía, y unas cuantas páginas de destino de campañas que habíamos olvidado por completo. Para una empresa que vende herramientas de SEO, esto fue —por decirlo diplomáticamente— bastante vergonzoso. También me enseñó más sobre páginas huérfanas en una semana que dos años escribiendo sobre ellas.

"Internal linking is one of the biggest things that you can do on a website to kind of guide Google and guide visitors to the pages that you think are important. And with internal linking, you can tell Google and visitors which pages you consider important."

La otra cara de lo que dice Mueller es igual de importante: si no estás enlazando a una página, le estás diciendo a Google que no es importante. Y Google la tratará como tal.

Páginas huérfanas: cómo se crean

Nadie crea páginas huérfanas a propósito. Se van acumulando con el funcionamiento normal de un sitio web: lento, invisible, como polvo en los racks del servidor. Estos son los culpables más comunes:

Rediseños y migraciones del sitio. Reconstruiste la navegación. La antigua página de categoría que enlazaba a 40 posts del blog fue reemplazada por una nueva que enlaza a 12. Esos 28 posts ahora son huérfanos. Esta es, por mucho, la causa más común, y exactamente por eso escribí la lista de verificación SEO posterior al lanzamiento. Nuestra propia migración lo demostró de forma espectacular: teníamos un mapa de redirecciones para las URLs, pero nadie hizo un mapa de enlaces internos. Las páginas eran accesibles por URL (las redirecciones funcionaban), pero ya no tenían enlaces internos apuntando hacia ellas desde ninguna parte. Problema distinto, daño igual de serio. Insisto en esto porque es el error que quiero que todo lector evite.

Páginas generadas por el CMS. Páginas de etiquetas, archivos por fecha, páginas de autor, resultados paginados: tu CMS las crea automáticamente, pero muchas veces no tienen enlaces internos desde ningún lugar relevante. Solo WordPress puede generar cientos de estas. Yo estimaría (y sinceramente no estoy del todo seguro de este número) que entre 30-50% de las páginas huérfanas en un sitio promedio de WordPress son páginas generadas por el CMS que nadie pidió y nadie mantiene. Cuando analizamos nuestras propias 837 huérfanas, 412 eran páginas de etiquetas y archivos por fecha. Casi la mitad.

Páginas de destino antiguas. ¿Esa página de campaña del Q3 2024? ¿La promoción que terminó hace 18 meses? Sigue recibiendo rastreo y sigue sin aportar nada. Nadie la eliminó porque nadie recordaba que existía. Nosotros teníamos 23 de estas: páginas para webinars, ofertas estacionales y una campaña de Black Friday que estoy bastante seguro de que hicimos una sola vez.

Cambios en la paginación. Antes mostrabas 50 productos por página, ahora muestras 100. Las páginas 6-10 de tu paginación antigua siguen existiendo, pero ya nada tiene enlaces internos hacia ellas.

Deriva en la gestión del contenido. Con el tiempo, a medida que publicas contenido nuevo y eliminas elementos viejos de navegación, páginas que antes estaban bien conectadas van perdiendo enlaces internos poco a poco. No es un solo evento: es erosión. Esta es la más difícil de detectar porque no hay un momento claro en el que algo “se rompe”. Simplemente se degrada gradualmente. Lo vemos constantemente en auditorías de SEOJuice: un sitio que estaba bien enlazado hace dos años ha acumulado lentamente 50-80 páginas huérfanas sin nada más dramático que las operaciones normales de contenido.

Por qué las páginas huérfanas dañan tu SEO

Voy a ser directo. Las páginas huérfanas no son solo peso muerto: dañan activamente el rendimiento de tu sitio de tres formas medibles.

1. Desperdicio de presupuesto de rastreo

Google asigna una cantidad finita de recursos de rastreo a cada sitio. Ese es tu presupuesto de rastreo: el número de páginas que Googlebot le pedirá a tu servidor en un periodo determinado. Cada solicitud gastada en una página huérfana es una solicitud que no se gasta en una página que sí importa.

Los datos son contundentes. Botify analizó sitios de gran escala y encontró que las páginas huérfanas consumen en promedio el 26% del presupuesto de rastreo. En sitios mal mantenidos, ese número llega al 70%. TemplateMonster descubrió 3 millones de páginas huérfanas durante una migración: páginas que consumían recursos de rastreo mientras 250,000 páginas comerciales valiosas ni siquiera estaban siendo rastreadas.

En sitios pequeños (menos de 500 páginas), el presupuesto de rastreo normalmente no es un problema: Google acabará rastreándolo todo. Pero en cuanto pasas de unos pocos miles de páginas —especialmente con un CMS que genera paginación, etiquetas y archivos— las páginas huérfanas empiezan a tener un impacto real. Quiero ser cuidadoso para no exagerar esto en sitios pequeños, porque ya he visto demasiados artículos de SEO generar pánico innecesario sobre el presupuesto de rastreo en un sitio de 200 páginas. Si ese es tu caso, igual vale la pena corregir las páginas huérfanas (por razones de flujo de autoridad), pero el presupuesto de rastreo no es tu principal problema.

2. Cero flujo de autoridad

Los enlaces internos transmiten autoridad (lo que Google antes llamaba PageRank) de una página a otra. Tu página de inicio recibe la mayor cantidad de enlaces externos, así que tiene más autoridad. Esa autoridad fluye a través de los enlaces internos hacia tus subpáginas, y de ahí a sus subpáginas, y así sucesivamente.

Las páginas huérfanas quedan completamente fuera de ese flujo. Reciben cero autoridad interna. Aunque tengan gran contenido, Google ve una página que tu propio sitio aparentemente no considera lo bastante importante como para enlazarla. Esa es una señal negativa fuerte. Cuando reconectamos nuestras 837 huérfanas (las que valía la pena salvar, al menos), vimos mejoras medibles en rankings en 4-6 semanas para páginas que estaban estancadas entre las posiciones 15-30. Solo agregando enlaces internos. Sin tocar el contenido.

3. Fallos de indexación

La documentación de Google sobre presupuesto de rastreo lo dice sin rodeos: las páginas sin enlaces entrantes pueden quedarse sin rastrear independientemente de su importancia. Si Google no rastrea una página, no puede indexarla. Si no está indexada, no puede posicionar. Si no puede posicionar, genera cero tráfico orgánico.

La parte más insidiosa es que esto ocurre en silencio. No verás un error en Search Console. La página no “se rompe”. Simplemente deja de existir, discretamente, dentro de la visión que Google tiene de internet. Descubrimos que algunos de nuestros posts huérfanos del blog habían sido desindexados por completo: Google había dejado de visitarlos meses antes. El contenido seguía siendo bueno. Solo que no tenía enlaces.

Área de impactoQué ocurreEscala del daño
Presupuesto de rastreoLas páginas huérfanas consumen recursos de rastreo sin generar tráfico26% de desperdicio promedio (hasta 70% en sitios descuidados)
Flujo de autoridadLas páginas reciben cero link equity interno — parecen poco importantes para GoogleEl potencial de ranking se reduce casi a cero
IndexaciónLas páginas pueden no rastrearse nunca, o salir del índice con el tiempoBotify: 60% de las páginas en promedio no se rastrean dentro de 30 días
Experiencia de usuarioLos usuarios que encuentran páginas huérfanas vía búsqueda no tienen una ruta clara hacia el resto del sitioMayor bounce rate, menor engagement
Deterioro del contenidoLas páginas huérfanas se quedan obsoletas — no reciben revisión editorial porque quedan fuera de vistaLa información desactualizada daña la confianza en la marca

Cómo encontrar páginas huérfanas

Hay tres métodos fiables. Yo uso los tres porque cada uno detecta cosas que los otros no ven. Durante nuestra auditoría posterior a la migración, la comparación con el sitemap detectó 743 huérfanas, Search Console señaló otras 60 más o menos, y el análisis de logs del servidor encontró 94 adicionales que ninguno de los otros dos métodos había detectado. La superposición no era completa: cada método tiene puntos ciegos.

Método 1: comparación entre rastreo y sitemap

Este es el enfoque más fiable. Necesitas dos conjuntos de datos:

Conjunto A: cada URL en tu XML sitemap (lo que tú crees que contiene tu sitio).
Conjunto B: cada URL descubierta al rastrear tu sitio desde la página de inicio (lo que realmente es accesible a través de enlaces).

Cualquier URL del Conjunto A que no esté en el Conjunto B es una página huérfana: está en tu sitemap, pero no es accesible mediante enlaces internos.

Puedes hacerlo con Screaming Frog, Sitebulb o cualquier crawler que permita comparar contra un sitemap. En Screaming Frog: rastrea tu sitio en modo “Spider” y luego usa “Crawl Analysis” -> “Orphan Pages” para ver los resultados.

Método 2: informe de cobertura de Google Search Console

GSC te muestra páginas marcadas como “Descubierta: actualmente no indexada” o “Rastreada: actualmente no indexada”. No todas son páginas huérfanas, pero muchas sí. Cruza esas URLs con tus datos de enlaces internos. Si una página aparece en GSC pero no tiene enlaces internos apuntando hacia ella, ahí tienes tu huérfana.

Método 3: análisis de logs del servidor

Los logs del servidor muestran cada URL que solicita Googlebot. Compáralos con tus datos de rastreo. Una página que Googlebot visita (porque la encontró en el sitemap o en una caché antigua) pero a la que tu crawler no puede llegar desde la página de inicio es una huérfana que está consumiendo presupuesto de rastreo activamente.

Este es el método que detecta las huérfanas más escurridizas: páginas que ni siquiera están en tu sitemap, pero que Google recuerda de un rastreo anterior. Páginas fantasma que consumen recursos pero son invisibles en cualquier otro reporte. Cuando hicimos nuestro propio análisis de logs después de la migración, este método detectó 94 páginas huérfanas adicionales que la comparación con el sitemap había pasado por alto por completo. Eran URLs antiguas que habíamos quitado del sitemap pero que no habíamos redirigido ni eliminado. Google seguía visitándolas cada pocos días, obtenía una respuesta 200 y desperdiciaba presupuesto de rastreo en páginas que nosotros creíamos ya resueltas.

# Quick comparison: sitemap URLs vs. crawled URLs
# Export your sitemap URLs and crawled URLs as text files, then:

# Find URLs in sitemap that weren't found during crawl (potential orphans)
comm -23 <(sort sitemap_urls.txt) <(sort crawled_urls.txt) > orphan_candidates.txt

# Count them
echo "Potential orphan pages: $(wc -l < orphan_candidates.txt)"

# Cross-reference with server logs to see which are still being crawled
grep -f orphan_candidates.txt access.log | grep "Googlebot" > orphans_wasting_budget.txt
echo "Orphans actively wasting crawl budget: $(wc -l < orphans_wasting_budget.txt)"

Cómo corregir páginas huérfanas: el árbol de decisión

No todas las páginas huérfanas merecen la misma solución. Este es mi proceso de decisión, basado en el triage de nuestras propias 837:

Paso 1: ¿el contenido sigue siendo valioso?

Lee la página. ¿La información sigue vigente? ¿Hay demanda de búsqueda para este tema? ¿La página recibe algo de tráfico al menos (revisa GSC)? Si la respuesta es sí, ve al Paso 2. Si no, ve al Paso 3.

Paso 2: agrega enlaces internos (para contenido valioso)

La solución más simple. Encuentra 3-5 páginas de tu sitio que estén relacionadas temáticamente y agrega enlaces a la página huérfana. Enfócate en:

Enlaces contextuales dentro del contenido. Son los más fuertes. Un enlace desde el párrafo de un post relacionado vale más que un enlace desde un widget de la barra lateral.

Páginas de navegación o categoría. Si la página huérfana pertenece a una sección específica de tu sitio, añádela a la página de categoría relevante o al menú de navegación.

Secciones de posts relacionados. Si tu CMS tiene una función de “posts relacionados”, asegúrate de que la página huérfana aparezca en los resultados relevantes.

Conclusión clave

No enlaces una página huérfana desde otra página huérfana. Eso solo crea un clúster de páginas aisladas al que Google sigue sin poder llegar desde la estructura principal de tu sitio. Toda página huérfana necesita al menos un enlace interno desde una página bien conectada. Nosotros cometimos exactamente este error en la primera ronda de corrección: enlazamos 30 posts huérfanos entre sí, creando una pequeña isla de 30 páginas que seguía desconectada del sitio principal. Hubo que rehacerlo.

Paso 3: decide qué hacer con las páginas sin valor

No toda página merece ser salvada. De nuestras 837 huérfanas, aproximadamente 600 no valían realmente nada: archivos de etiquetas generados automáticamente, páginas de campañas expiradas y algunos borradores que se habían publicado por accidente. A veces la respuesta correcta es eliminar, no rescatar. Estas son tus opciones:

EscenarioAcciónCuándo usarla
Duplicada o casi duplicadaRedirección 301 a la versión canónicaDos páginas cubren el mismo tema — fusiónalas
Página de campaña desactualizadaDevolver código de estado 410 (Gone)El contenido es permanentemente irrelevante
Contenido thin, sin valor de búsquedaNoindex + eliminar del sitemapPáginas como archivos de etiquetas vacíos o paginación antigua
Valiosa pero desactualizadaActualizar contenido + agregar enlaces internosBuen tema, pero la información necesita refresh
Basura generada automáticamenteEliminar y devolver 404/410Páginas generadas por el CMS que nunca debieron existir

Una nota rápida sobre 410 vs. 404: Google los trata de forma similar, pero 410 (Gone) le dice explícitamente a Google que la página fue eliminada de forma permanente. Es una señal un poco más fuerte para que deje de desperdiciar presupuesto de rastreo en esa URL. Usa 410 cuando estés seguro de que la página no volverá jamás.

Cómo prevenir páginas huérfanas: cambios en el proceso

Encontrar y corregir páginas huérfanas es una tarea reactiva. Así es como puedes evitar que aparezcan desde el principio — y sí, cada uno de estos puntos salió directamente de nuestras lecciones posteriores a la migración.

Revisión obligatoria de enlaces internos antes de publicar. Cada página nueva que publiques debería enlazar a por lo menos 3 páginas existentes y tener enlaces internos desde al menos 3 páginas existentes. Haz que esto sea un requisito dentro de tu proceso de contenido, no una sugerencia. Nosotros lo añadimos como un checkbox literal en nuestro proceso de publicación después del incidente de las 837 páginas. Desde entonces no ha sido opcional. Cualquier nuevo post del blog que no tenga al menos 3 enlaces internos entrantes antes de publicarse, se devuelve.

Enlazado interno automatizado. Herramientas como el enlazado interno automatizado de SEOJuice escanean tu contenido y sugieren (o insertan automáticamente) enlaces internos relevantes. Esto resuelve el problema de la deriva: a medida que publicas contenido nuevo, las páginas antiguas reciben enlaces internos automáticamente desde las nuevas. Sí, aquí estoy recomendando nuestro propio producto, y sí, soy parcial, pero también este es genuinamente el problema que nos motivó a construir la funcionalidad en primer lugar. La construimos porque teníamos 837 razones para hacerlo.

Auditorías mensuales de rastreo. Haz un rastreo completo del sitio una vez al mes y revisa si aparecieron nuevas páginas huérfanas. Esto toma 10 minutos y detecta problemas antes de que se acumulen. Nosotros hacemos el nuestro el primer día de cada mes. La cantidad de nuevas huérfanas que detectamos bajó de decenas a un solo dígito desde que implementamos la lista de verificación de publicación.

Mapeo de redirecciones en cada rediseño. Antes de lanzar un nuevo diseño, exporta tu estructura actual de URLs y verifica que cada página sea accesible en la nueva navegación. Solo esto ya evita la causa #1 de las páginas huérfanas. Ojalá alguien me lo hubiera dicho con más fuerza antes de nuestra migración. Lo sabía en teoría. Simplemente no lo hice con suficiente rigor. Mapeamos URLs, pero no enlaces internos. No cometas esa misma distinción.

Limpia tu CMS. Desactiva la generación automática de páginas que no necesitas: archivos por etiquetas, archivos por fecha, páginas de autor (si tienes un solo autor). Cada página autogenerada que no esté en tu navegación es una potencial huérfana. Las 412 huérfanas de etiquetas y archivos por fecha que encontramos eran todas páginas que WordPress creó automáticamente y a las que nadie enlazó ni visitó jamás.

Calculadora de impacto: ¿cuántos clics estás perdiendo?

Esta es una fórmula aproximada que uso para estimar el impacto en tráfico de las páginas huérfanas:

MétricaCómo obtenerlaEjemplo
Total de páginas huérfanasComparación entre rastreo y sitemap150 páginas
% de huérfanas con demanda de búsquedaRevisa impresiones en GSC para URLs huérfanas40% (60 páginas)
Impresiones promedio por página huérfanaDatos de GSC para esas 60 páginas200 impresiones/mes
CTR esperado si estuviera bien enlazadaCTR promedio de tu sitio para páginas similares3.5%
Clics perdidos por mes60 x 200 x 0.035420 clics/mes

420 clics al mes de páginas que ya existen en tu sitio. Sin crear contenido nuevo. Sin link building. Solo agregando algunos enlaces internos. Ese es el tipo de ROI que hace que el SEO sea el mejor canal de marketing que existe.

Para darte contexto: nuestros datos en más de 200 sitios muestran que el sitio web promedio tiene entre 8-15% de sus páginas huérfanas. En sitios que no se han auditado en más de un año, ese número sube a 20-30%. Cuanto más grande es el sitio, peor se pone. Y si hiciste una migración recientemente sin una auditoría de enlaces internos, revisa tus números. Yo apostaría por arriba de 20%.

"Pages that are not linked in the site structure consume 26% of Google's crawl budget. For local businesses with fewer than 500 pages, orphan pages waste crawl budget while generating only 5% of organic traffic despite representing up to 70% of crawled pages."

-- Botify Research, Orphan Pages & SEO Study (botify.com)

Esos números vienen de sitios de gran escala con miles de páginas, pero el patrón se mantiene en cualquier escala. Las páginas huérfanas son un problema universal con una solución universal: encuéntralas y luego enlázalas o elimínalas.

Preguntas frecuentes

¿Las páginas huérfanas todavía pueden indexarse?

Técnicamente, sí. Si una página huérfana está en tu sitemap, Google puede terminar encontrándola. Si tiene backlinks externos, Google también puede descubrirla por esa vía. Pero “puede terminar” puede significar meses y, aunque se indexe, la falta de enlaces internos significa que recibe cero autoridad, así que es poco probable que posicione para algo competitivo. Incluir una página en tu sitemap no sustituye un enlazado interno correcto.

¿Cuántos enlaces internos necesita una página para no ser huérfana?

Técnicamente, uno. Pero un enlace desde el footer no pesa lo mismo que tres enlaces contextuales desde páginas de contenido relevantes. Yo recomiendo un mínimo de 3 enlaces internos desde páginas relacionadas temáticamente. Las páginas importantes deberían tener bastantes más: tu contenido principal debería tener 10+ enlaces internos hacia él.

¿Las páginas de etiquetas y archivos de categoría siempre son huérfanas?

No necesariamente. Si tus páginas de etiquetas están enlazadas desde la navegación, la barra lateral o el footer, no son huérfanas. El problema aparece cuando creas etiquetas para cada keyword imaginable (un hábito muy común en WordPress) y la mayoría de esas páginas de etiquetas nunca aparece en ninguna navegación. Una página de etiqueta con 2 posts y sin enlaces entrantes es puro peso muerto. Nosotros teníamos cientos así.

¿Eliminar páginas huérfanas perjudica mi SEO?

Si las páginas están realmente huérfanas (sin tráfico, sin backlinks, sin enlaces internos), eliminarlas no perjudicará nada. No puedes perder lo que no tienes. Solo asegúrate de devolver un código de estado 404 o 410 correcto para que Google deje de intentar rastrearlas. No redirijas páginas huérfanas a contenido no relacionado: eso es un 404 suave y Google lo penalizará.

¿Con qué frecuencia debería auditar páginas huérfanas?

Mensualmente para sitios que publican con frecuencia (más de 10 páginas al mes). Trimestralmente para sitios más pequeños. Después de cada rediseño o migración del sitio, haz una auditoría dentro de la primera semana: ese es el momento en que las páginas huérfanas suelen aparecer en masa. Créeme con la parte de la migración. Yo lo aprendí con 837 razones.

Herramientas para encontrar y corregir páginas huérfanas

Enlazado interno automatizado de SEOJuice -- Escanea continuamente tu sitio y agrega automáticamente enlaces internos a contenido huérfano. La mejor solución es la que ocurre sin que tengas que pensar en ella.

Guía de silos de contenido para SEO -- Las páginas huérfanas son un síntoma de una arquitectura de contenido deficiente. Esta guía explica cómo construir una estructura de silos que mantenga cada página conectada.

Herramienta para encontrar enlaces internos -- Herramienta gratuita que analiza la estructura de tu sitio e identifica oportunidades de enlazado que estás dejando pasar.

Cada página huérfana es una oportunidad perdida. El contenido ya está escrito. La página ya existe. Solo necesita un enlace interno. Esa es la mejora SEO con menos esfuerzo y más retorno que existe, y la mayoría de los sitios ahora mismo acumulan decenas de ellas sin aprovechar.

SEOJuice
Stay visible everywhere
Get discovered across Google and AI platforms with research-based optimizations.
Works with any CMS
Automated Internal Links
On-Page SEO Optimizations
Get Started Free

no credit card required

More articles

No related articles found.