Join our community of websites already using SEOJuice to automate the boring SEO work.
See what our customers say and learn about sustainable SEO that drives long-term growth.
Explore the blog →TL;DR: Las herramientas de IA citan las páginas que pueden interpretar, no las que “posicionan”. La mayoría de los sitios ya publican contenido que resulta invisible para ChatGPT, Perplexity y Bing Copilot porque la estructura es incorrecta, no porque el texto sea malo. A continuación: qué cambió en nuestro propio sitio tras corregir el schema de una sola página en 20 minutos, las tres estadísticas que explican por qué esto importa (Semrush, Profound, NYT), qué debes arreglar este mes y en qué compras de “SEO con IA” me equivoqué.
Incluye datos de volumen de citas atribuibles (Semrush, Profound, NYT), una sección sobre llms.txt y la metodología documentada del caso de estudio de la página /data.
Escribí esto porque medimos citas de IA para los clientes de SEOJuice, y la única forma de confiar en lo que les decía era probar primero en seojuice.io. El resultado me sorprendió. Nuestra página de inicio se citaba para “qué es SEOJuice”, pero dos de nuestras páginas más útiles (la de exploración /data y la landing de /tools) no aparecían en Perplexity en absoluto para consultas que deberían dominar. La corrección fue menos trabajo de lo que esperaba. Enmarcarla llevó más tiempo.
[IMAGEN: captura de Perplexity lado a lado — izquierda, “¿Qué es SEOJuice?” con cita; derecha, “mejores herramientas de datos SEO para SaaS” sin cita. Tomada 14-02-2026.]
Tres números y una conclusión.
1. Semrush analizó 10 000 consultas informativas a finales de 2025 y encontró que Google AI Overviews aparecía en el 88 % de ellas, con un 85,79 % de las URL citadas dentro del top 10 orgánico. El informe completo está en el blog de Semrush. Señal: si ya no rankeas, estadísticamente es poco probable que te citen. Pero solo posicionar tampoco basta, y por eso este artículo importa.
2. The New York Times informó de una caída interanual del 36,5 % en los clics procedentes de resultados de búsqueda influidos por IA hacia medios en principios de 2026, resumido en el análisis de SEO Sherpa. El tráfico no desapareció: se absorbió en la caja de respuesta.
3. La investigación de señal de consenso de Profound (publicada T4 2025) halló que las páginas citadas por ChatGPT, Perplexity y Bing Copilot para la misma consulta coinciden solo un 12 % del tiempo, lo que significa que cada motor decide a quién citar de forma parcialmente independiente. No puedes optimizar para uno y asumir que los demás seguirán.
Mi conclusión: el trabajo no es “más SEO”. Es reestructurar tres o cuatro páginas para que el modelo tenga algo que extraer. Lo hicimos en /data y el resultado fue medible; lo explico enseguida.
Mucha gente aún escribe como si intentara impresionar a Google circa 2015: meter palabras clave, inflar el conteo de palabras, poner un H1 y publicar. Eso gana la página 3 de un SERP que nadie lee y cero citas en ChatGPT o Perplexity.
Estos modelos no rankean sitios web. Recuperan, resumen y, a veces, citan en función de lo claro que puedan entender y reempaquetar tu contenido. El objetivo ya no es solo “posicionar en Google”, sino “ser citable por cualquier máquina que lea tu página”.
| Característica | Búsqueda Google | ChatGPT / Perplexity / Bing AI |
|---|---|---|
| Método de indexación | Basado en palabras clave + enlaces | Coincidencia semántica con embeddings (a mediados de 2026; las arquitecturas cambian) |
| Comportamiento del usuario | Clics y escaneos | Lee el resumen; clics < 10 %, según el panel SparkToro 2026 |
| Selección de página | Ranking algorítmico | Recuperación sobre un conjunto candidato más pequeño y citación heurística |
| Formato de salida | Lista de páginas | Respuestas, citas, contenido directo |
| Estilo de contenido óptimo | Artículos optimizados SEO | Conciso, estructurado, parseable por máquina |
Lo probé el trimestre pasado. Pregunté a Perplexity “¿Qué es SEOJuice?” y obtuve una respuesta decente que citaba nuestra homepage. Luego pregunté “¿Qué herramientas SEO son buenas para fundadores SaaS?” Salieron dos competidores. Nosotros no. Reformulé la consulta cuatro veces. Nada. Entonces pedí a Perplexity que describiera cada una de las tres marcas mostradas. Dos respuestas eran detalladas; una, vaga. Esa última tenía florituras de marketing y contenido renderizado con JavaScript; sus páginas eran más bonitas que las nuestras, pero su estructura era peor.
Esa prueba cambió mi forma de pensar. Nuestra página (la fuente autorizada) era invisible, no porque el texto fuese malo sino porque no facilitaba al modelo extraer una frase.
«La cita es el nuevo backlink. La moneda son respuestas estructuradas y extraíbles, no solo la autoridad de dominio». — Aleyda Solis, en la sesión de búsqueda con IA de noviembre 2025 en BrightonSEO.
Este es el caso de estudio sobre el que se apoya el resto del artículo, así que seré específico.
Página: seojuice.io/data/. Estado al 20-01-2026: grid de Tailwind con widgets de datos, sin bloque FAQ, solo schema Article. Bing Webmaster Tools la mostraba indexada. Perplexity mostraba cero citas para las 12 consultas que seguía.
Lo que cambié (en 20 min, el 22-01-2026):
Cómo medí las citas: pruebas manuales en Perplexity, 12 consultas fijas semanales. Mezcla de marca («qué es la página de datos de seojuice»), categoría («panel de seguimiento de citas SEO») y función («exportar datos de citas Perplexity a CSV»). Navegación privada, caché limpio, copié resultados a Google Sheet y marqué cada respuesta que enlazara seojuice.io. Muy básico.
Resultado: para el 05-02-2026 (poco más de dos semanas) 3 de las 12 consultas incluyeron la página /data en la lista de fuentes de Perplexity. No eran consultas que hubiera apuntado. Dos ni siquiera tenía página dedicada. El AI necesitaba la pista estructural; el contenido ya estaba.
No puedo asegurar que fuese solo el schema. El cambio de H1 y la frase de definición ayudaron, e hice los tres ajustes el mismo día. Si repitiera, los espaciaría una semana. Pero la lectura direccional se mantiene: la corrección estructural fue el desbloqueo barato.
Un modelo no rastrea tu sitio completo: lee páginas aisladas y construye una representación interna de cada una. Prioriza claridad, estructura semántica y frases citables. Intros largas: inútiles. Lenguaje corporativo: omitido. Se fija en definiciones, resúmenes, FAQs, listas paso a paso y encabezados limpios.
Pruébalo: abre Perplexity y pregunta «¿Qué es (tu empresa)?» Comprueba si muestra tu sitio. Si no, ahí está el problema que resolvemos.
Si tu página es un muro de texto con descripciones vagas, frases repetitivas de marketing y sin datos estructurados, las herramientas de IA no te citarán, aunque seas la mejor fuente. No verán tu valor a menos que se lo expliques como a un becario sin contexto y con 3 segundos de atención.
Si has leído otras guías de SEO-IA este año, habrás visto llms.txt. Aquí la versión práctica.
llms.txt es un archivo propuesto (como un robots.txt para modelos de lenguaje) que vive en /llms.txt y señala a los sistemas de IA qué contenido de tu sitio es prioritario, en texto plano y sin JavaScript. La propuesta salió de Answer.AI a finales de 2024 y Anthropic la citó en su documentación: docs.anthropic.com/llms.txt.
Evaluación honesta: no sé si sirve de algo todavía. En 2025 el debate en r/SEO y Twitter SEO estuvo dividido. Algunos vieron señales suaves tras añadirlo; otros, nada. Mi lectura, mayo 2026: es barato (un archivo plano, 10 min en un sitio pequeño) y de bajo riesgo, así que lo añado. No esperes un salto de citas solo por llms.txt.
El acceso de rastreadores es más tangible. PerplexityBot, ChatGPT-User, ClaudeBot y GPTBot son los user-agents que verás en logs. BingPreview sirve indirectamente a Perplexity y Copilot vía el índice de Bing, así que asegurar el rastreo de Bing es el mayor apalancamiento. Envía tu sitemap a Bing Webmaster Tools. Verifica en logs que esos bots no estén bloqueados por el WAF o CDN. He visto el interruptor “Block AI bots” de Cloudflare activado sin querer en tres sitios de clientes en 2025; un solo switch hizo irrelevante todo lo demás.
Optimizar para ChatGPT, Perplexity o Bing AI no es engañar un nuevo algoritmo. Es diseñar contenido para una máquina sin tiempo para matices. Tu página debe facilitar la extracción.
Cada URL debe cubrir un tema distinto, sin desvíos. ChatGPT prefiere respuestas limpias y sin ambigüedades. Si tu página mezcla cinco servicios, tres tangentes y la historia del fundador, la ignorará.
Bien:
tp-link.com/us/support/faq/2680/(“Cómo restaurar de fábrica un router TP-Link”) — intención única, estilo FAQ, posiciona y se cita porque URL, H1 y contenido responden a la misma pregunta.
Mal:yourdomain.com/supportcon un bloque FAQ de 20 ítems — respuestas enterradas, el modelo no sabe cuál coincide.
Los LLM usan el schema para atajar el tema de tu página. Usa FAQPage para bloques de preguntas y respuestas, Article para contenidos editoriales, Product para SKUs, HowTo solo para páginas realmente procedimentales.
Corrección a algo que dije en 2025: recomendé añadir schema HowTo en todas las páginas de soporte. Salió mal. Google señaló algunas páginas no procedimentales con advertencias manuales de rich results y tuvimos que revertir. HowTo es para “paso 1, paso 2, paso 3”. Úsalo donde encaje, no como parche general.
Herramienta: pasa tu URL por validator.schema.org para verificar que el schema se interprete.
La IA extrae por fragmentos. Hazlos evidentes: viñetas, pasos numerados, definiciones, frases cortas (sobre todo al principio) y FAQs con preguntas en negrita y respuestas claras.
P: ¿Qué es SEOJuice?
SEOJuice es una herramienta de optimización web que detecta problemas técnicos de SEO y ofrece soluciones paso a paso priorizadas por impacto en tráfico.
Ese bloque es citable y listo para citar. El mismo contenido como párrafo no lo sería.
| Error | Solución |
|---|---|
| Títulos vagos como “Solutions” | Reescribe con la consulta del usuario: “¿Cómo resuelve X nuestro Y para Z?” |
| Meta title ≠ H1 en página | Hazlos coincidir (±10 caracteres); señales mixtas reducen la confianza |
| Encabezados en mayúsculas/estilos | Usa etiquetas H2/H3 reales; el CSS no aporta semántica |
| Intros genéricas (“En el mundo actual…”) | Empieza con la respuesta en la primera frase |
| Keyword stuffing | Sustituye por una declaración temática fuerte y tres ejemplos concretos |
No escribes para un crawler; escribes para una máquina que comprimirá tu contenido en dos frases y, con suerte, citará tu dominio al final.
Los LLM no valoran backlinks ni densidad de palabras clave en sentido tradicional, aunque hay correlación indirecta: las páginas con buenos backlinks suelen rankear y las que rankean forman parte del set candidato. Los datos de Profound 2025 indican que la correlación existe pero es laxa. La cuestión real: ¿puede el modelo extraer tu contenido en una caja de respuesta sin convertirlo en galimatías?
«Para reiniciar tu router, desenchúfalo 10 segundos y vuelve a enchufarlo. Espera 60 segundos antes de probar la conexión».
«Reiniciar un router es algo que los usuarios pueden considerar cuando tienen problemas. Un posible paso es desenchufar el dispositivo un tiempo».
La primera versión es citable. La segunda se ignora o se parafrasea mal.
Volviendo a la prueba de Perplexity del inicio: cuando comparé nuestra página con las dos competidoras citadas, su ventaja era esta. Sus definiciones eran precisas, los verbos activos y las frases se podían copiar intactas. Nuestra información estaba enterrada bajo tres párrafos de preámbulo. El modelo no tenía un bloque limpio que extraer.
Los LLM leen las primeras líneas de cada sección, extraen viñetas y pasos numerados, ignoran intros largas y se saltan la información enterrada salvo que esté en lista o claramente señalada.
Cada sección de tu sitio es una posible caja de respuesta. Tu tarea: que la respuesta sea obvia, extraíble y segura para que la IA la cite sin alucinar ni reescribir.
Cuando reescribí nuestra página /pricing de un volcado de funcionalidades a un texto guiado por definiciones en marzo 2026, la tasa de rebote bajó de 78 % a 61 % en 21 días. Mismo tráfico, misma oferta, distinta estructura. A los humanos les gustó por la misma razón que a un modelo: la respuesta estaba arriba y lo demás era contexto.
Arranca con el dato clave y luego amplía. Los LLM priorizan la claridad sobre el suspense.
Sí: «SEOJuice es una herramienta de optimización web que audita problemas técnicos de SEO y recomienda soluciones priorizadas según impacto potencial de tráfico».
No: «El SEO es complicado. Muchas herramientas intentan simplificarlo, pero pocas lo logran. Llega SEOJuice, un nuevo enfoque que…»
Los LLM no esperarán tu clímax. Pasarán de largo.
Cada H2 debería servir también como consulta de usuario.
| Encabezado antiguo | Encabezado amigable para IA |
|---|---|
| «Benefits» | «¿Cuáles son los beneficios de usar SEOJuice?» |
| «How It Works» | «¿Cómo audita tu sitio SEOJuice?» |
| «Features» | «¿Qué funciones ofrece SEOJuice?» |
No conviertas esto en un pozo de 40 horas. No necesitas rehacer todo tu sitio. Debes lograr que 4-6 páginas sean recuperables. Empieza por las que tengan muchas impresiones y alto rebote; ya están en el set candidato, solo fallan en la citación.
Gasté 200 $ en un SaaS popular de “seguimiento de citas IA” en febrero 2026 (no diré el nombre, pero si miraste ese mercado lo viste). El panel decía que seojuice.io aparecía en docenas de respuestas IA. Cuando rehíce manualmente una muestra de 20 prompts, solo tres nos citaban de verdad en Perplexity o ChatGPT. El resto eran datos obsoletos, la cita era otra URL de nuestro dominio o el prompt era tan raro que nadie lo usaría.
Probé dos herramientas más. Mismo patrón: recuentos inflados de 4 a 10 veces. Mi postura actual: hasta que la herramienta madure, mejor un Google Sheet, 20 prompts reales de clientes y 15 minutos semanales. Tal vez en 2027 mejoren. Hoy no.
No son solo para lectores; son bloques citables para IA.
Un contenido citable es claro, estructurado y autónomo: definiciones cortas, viñetas, FAQs y respuestas directas. Las IA citan lo que pueden extraer sin esfuerzo. El análisis de Semrush 2025 sobre AI Overviews halló que el 85,79 % de las URL citadas están en el top 10 orgánico; el ranking tradicional sigue siendo el precio de entrada.
Ejecuta prompts de marca y categoría en Perplexity y Bing Copilot semanalmente. Mantén una lista de 10-15 prompts en una hoja y etiqueta cada URL citada. Contrasta cualquier herramienta de terceros con sesiones reales antes de creer su panel.
No. Empieza por tus páginas más valiosas: muchas impresiones, alto rebote o contenido pilar. Añade bloques FAQ, reestructura encabezados y simplifica intros. Ahí está la mayor parte del valor.
No es estrictamente obligatorio, pero mejora visibilidad. El schema dice a la IA de qué va tu página sin hacerla adivinar. FAQPage y Article son seguros; HowTo solo para contenido procedimental real.
No. Bien hecho, ayuda a ambos. Contenido estructurado y citable rankea mejor, gana más backlinks y ahora también aparece en motores IA.
Es un archivo plano en /llms.txt que indica a los rastreadores de IA qué páginas son más importantes. La propuesta es nueva (finales de 2024) y su impacto práctico es incierto a mayo 2026. Es barato y de bajo riesgo; si tienes 10 minutos, añádelo, pero no esperes milagros por sí solo.
no credit card required
No related articles found.