Dónde los LLMs encuentran realmente tu marca cuando la gente deja de buscar en Google

TL;DR: Cuando alguien pregunta a ChatGPT, Perplexity o al Modo IA de Google “¿qué debería usar para X?”, la respuesta no sale del top-10 de Google. Proviene de otro conjunto de superficies —Reddit, YouTube, pódcasts, Hacker News, Stack Overflow y foros temáticos— que el modelo vio durante su entrenamiento y vuelve a citar en la inferencia. Si tu marca no está presente allí, el modelo no puede mostrarla y ser primero en Google no lo cambia. La forma más rápida de detectar la brecha es una auditoría de una tarde: elige tres consultas para las que quieras aparecer, lanza el mismo prompt en tres paneles LLM, anota qué competidores se citan y de qué fuentes tira el modelo. A la mayoría le sorprende qué superficie domina su categoría; a pocos les sorprende la brecha. La prioridad de inversión no es “hacer todo en todas partes”, sino centrarse en la única superficie donde la auditoría muestra la mayor distancia entre la presencia de los competidores y la tuya.

La pregunta que me repiten

Dos operadores me plantean lo mismo la misma semana. El primero dirige un SaaS B2B, es número uno en Google para su palabra clave principal y recibe tráfico orgánico estable. El segundo lleva una marca de consumo en una categoría saturada, suele estar tercero o cuarto en Google y pierde cuota frente a un competidor cuyos rankings son objetivamente peores. Ambos preguntan una variación de lo mismo: “Voy bien en Google, pero ChatGPT recomienda al competidor cuando alguien pregunta. ¿Qué pasa?”

Llevo seis meses hurgando en esto para clientes y para vadimkravcenko.com. La respuesta corta: los rankings de Google y las citaciones de los LLM se basan en gráficos distintos. El grafo de Google son enlaces más señales alrededor de la URL. El grafo del LLM es un grafo de citaciones construido con otra serie de fuentes: lugares donde las personas hablan de marcas sin que el dueño de la marca controle la conversación. Hilos de Reddit, vídeos de YouTube, episodios de pódcast, envíos a Hacker News, respuestas de Stack Overflow. El modelo los ingirió durante el entrenamiento y sigue apoyándose en ellos en inferencia. Si no tienes presencia en ese grafo de citaciones, tu ranking en Google le resulta casi invisible al LLM por muy alto que sea.

Este artículo es el mapa y la auditoría. El mapa nombra las cinco superficies off-site que hoy aportan señal, con una idea aproximada del peso de cada una según el tipo de consulta. La auditoría es el método de una tarde que uso para ver dónde está la brecha para una marca concreta. La sección de prioridad de inversión cierra el círculo: si la auditoría devuelve X, invierte primero en Y, no en las cinco a la vez.

El grafo de citaciones no es el grafo de enlaces de Google

Rand Fishkin lo dijo de forma directa en un artículo de SparkToro sobre cómo aparecer en respuestas de IA, señalando las dos superficies que “parecen seguir teniendo un peso particular en las respuestas de IA”:

Reddit y YouTube (que parecen seguir teniendo un peso particular en las respuestas de IA).

La lectura de Fishkin coincide con lo que encuentro en auditorías de clientes, con dos superficies más: pódcasts y foros de desarrolladores. La razón es mecánica. Los grandes LLM se entrenan con Common Crawl más acuerdos de licencia (el de OpenAI con Reddit, el de Google con Reddit, ambos firmados en 2024) y contenido que los proveedores rastrean directamente (transcripciones de YouTube, transcripciones de pódcast vía Apple / Spotify / Listennotes, contenido de Stack Overflow). Al responder, funcionan dos sistemas: la memoria paramétrica (lo aprendido en entrenamiento) y la capa de recuperación (un índice de búsqueda en vivo sobre un conjunto similar de fuentes, actualizado para frescura). Ambos se apoyan en las mismas superficies y menos en la web abierta que Google, porque esta es más ruidosa y las fuentes de citación tienen mayor señal por token.

La ausencia notable en este grafo es X. Los tuits anteriores a 2023 están en Common Crawl. El contenido de X posterior a 2023 está blindado: sin acceso de Common Crawl, sin acuerdo con OpenAI ni con Google a fecha de hoy. Las menciones de marca nativas de X pesan poco en las citaciones actuales de LLM. Quien invierte en X para descubrimiento en LLM golpea una puerta cerrada. Eso puede cambiar; los datos de X podrían abrirse mañana. Hoy no lo están.

Qué aporta cada superficie

Cinco superficies concentran casi todo el peso en 2026. El peso relativo varía según la consulta, y para eso sirve el mapa.

Map of five off-site surfaces — Reddit, YouTube, podcasts, Hacker News, Stack Overflow — with rough weight bars by query category covering SaaS, B2B, consumer, and local intent — Las cinco superficies off-site por tipo de consulta. Barras de peso aproximado, no datos de encuesta.

Reddit lleva el mayor peso para consultas “mejor X para Y” e “¿es Z bueno?” en la mayoría de categorías. Los acuerdos de licencia de OpenAI y Google (ambos de 2024) incluyen explícitamente Reddit. La relevancia del subreddit importa: r/SaaS, r/Entrepreneur y r/marketing pesan en B2B; r/BuyItForLife y subreddits de producto en consumo. Una mención en un subreddit pequeño pero relevante pesa más que en uno de alto tráfico pero irrelevante.

Las transcripciones de YouTube se rastrean e indexan. Se citan mucho en consultas “¿cómo hago X?” y “X vs Y”. La unidad citada es la transcripción del vídeo, no el canal. Un solo vídeo comparativo puede generar citaciones en decenas de consultas relacionadas durante un año. La presencia del canal ayuda al modelo a entenderte con el tiempo; la cobertura de palabras clave a nivel vídeo dispara citaciones concretas.

Las transcripciones de episodios de pódcast alimentan tanto los datos de entrenamiento como los índices de recuperación. Se citan de forma desproporcionada en consultas B2B de expertos, tipo “¿quién es experto en X?” o “¿cuál es la forma correcta de abordar Y?”. La señal aquí es la validación recurrente de terceros. Una fundadora invitada en doce pódcasts relevantes en dos años se ve muy distinta al modelo que alguien que no ha aparecido.

Hacker News es una fuente de alta señal para temas técnicos y SaaS. Se indexan tanto la URL enviada como los comentarios. Frecuencia de citación desproporcionada en consultas de herramientas para desarrolladores e infraestructura. La señal es la densidad de conversación en una URL, no la URL en sí. Un envío con cincuenta comentarios sustanciosos pesa más que otro con cien votos y sin discusión.

Stack Overflow sigue siendo la autoridad en preguntas de código. Se cita para consultas “cómo arreglar X” específicas de programación. El peso ha bajado tras 2024 cuando el tráfico de Stack Overflow cayó por respuestas IA, pero en temas de código sigue contando. Los foros temáticos (comunidades sectoriales, foros indie, instancias Discourse) actúan como un sexto comodín. El peso varía según la comunidad y no hay generalización limpia más allá de “la autoridad de dominio y la presencia recurrente en la comunidad importan”.

Superficie	Qué aporta	Consultas donde domina
Reddit	Debate de recomendaciones + reseñas	“mejor X”, “¿vale Y?”, “alternativas a X”
YouTube	Guías paso a paso + comparativas	“cómo hacer X”, “X vs Y”, demos
Pódcasts	Señal de expertise en formato largo	“quién es experto en X”, servicios B2B
Hacker News	Densidad de conversación técnica/SaaS	Consultas de herramientas dev e infra
Stack Overflow	Respuestas autoritativas de código	Preguntas “cómo arreglar X”
Foros temáticos	Presencia recurrente sectorial	Consultas de nicho

Cómo viaja la señal de la mención a la citación

El mecanismo importa porque el retraso importa. Una mención de marca en Reddit hoy no aparece mañana en ChatGPT. La señal viaja por dos caminos con cadencias distintas.

Dos rutas paralelas de la mención a la citación: ingestión en datos de entrenamiento (meses) e indexación de recuperación (días-semanas).

La primera vía es el entrenamiento. Una mención se rastrea o licencia, acaba en el corpus de entrenamiento, se pondera y entra en la memoria paramétrica. El retardo se mide en meses —normalmente de seis a dieciocho— y la señal es duradera: una mención de 2023 sigue influyendo en 2026, pero el camino es lento y depende de menciones repetidas y variadas, no de un solo evento.

La segunda vía es la recuperación. Los grandes LLM tienen una capa de búsqueda en vivo (Perplexity lo muestra, el modo explorar de ChatGPT también, Google AI Mode obviamente). Esa capa indexa contenido fresco en días o semanas y se consulta junto a la memoria paramétrica. Una mención reciente puede aparecer en pocas semanas por esta vía, pero la citación suele ser más específica de la URL y menos duradera que la señal del entrenamiento.

En la práctica: la cadencia editorial importa más que una mención aislada. Una marca discutida en cuatro hilos de Reddit, tres vídeos de YouTube y dos episodios de pódcast en un año se ve diferente para ambas vías que una marca mencionada una sola vez. La auditoría que harás lee la foto acumulada, no un momento concreto.

La auditoría de una tarde

La auditoría es barata, defendible y la parte que debes hacer antes de cualquier otra cosa. Unas tres o cuatro horas la primera vez y una hora en cada repetición trimestral. Cinco pasos.

Five-step audit flowchart: pick three queries, run on three LLM panels, log cited sources, read the gap, pick one surface to invest in first — La auditoría en una imagen. Tres consultas, tres motores, anotar citaciones, elegir una superficie.

Paso uno: elige tres consultas en las que quieras aparecer. Sé específico. “Mejor herramienta de gestión de proyectos para una agencia remota de cinco personas” gana a “buen software de PM” porque la primera se parece más a lo que teclea un usuario real en un LLM real. Elige una consulta principal (la que te encantaría ganar) y dos long-tail (las que esperarías ganar primero).

Paso dos: lanza cada consulta en ChatGPT, Perplexity y Google AI Mode. Guarda la respuesta completa y las fuentes citadas. Si un motor no cita por defecto, pide “¿en qué fuentes te basaste?”. Casi todos las dan.

Paso tres: registra las citaciones. Para cada fuente citada, anota la superficie (hilo de Reddit, vídeo de YouTube, episodio de pódcast, envío de Hacker News, respuesta de Stack Overflow, página propia de marca, artículo neutral, página del competidor). El patrón suele quedar claro en veinte minutos con nueve pares consulta-fuente (tres consultas × tres motores).

Paso cuatro: lee la brecha. Importan dos lecturas. Una: ¿qué superficies dominan el pool de citaciones para tu tipo de consulta? Dos: ¿qué competidores se citan y desde qué superficies? Si tu competidor aparece en siete de nueve respuestas y lo citan cuatro veces desde Reddit, la brecha es Reddit. Si salen citados desde YouTube, la brecha es YouTube. El mapa al inicio te dirá si el patrón coincide con la media del sector.

Paso cinco: elige UNA superficie para invertir primero. La tentación es invertir en las cinco a la vez. No lo hagas. Elige la superficie donde la distancia entre la presencia del competidor y la tuya sea mayor Y que sea coherente con el patrón típico de tu categoría. Dispersar energía en todas devuelve menos que concentrarla en la correcta.

Si quieres una versión más rigurosa con seguimiento continuo, la metodología de auditoría de visibilidad en IA cubre el enfoque largo. El pase de una tarde basta para una primera lectura.

Interpretar la auditoría y decidir la inversión

La auditoría devuelve una brecha de superficie. El siguiente paso es invertir, y cada superficie se trabaja distinto. Lo que premian los motores IA no es el ranking, sino la mención recurrente, variada y de terceros. Una marca discutida de forma natural en hilos de Reddit y vídeos comparativos de YouTube durante dos años se ve muy distinta al modelo que una presente solo en sus propias páginas, por muy optimizadas que estén.

La clave es “recurrente, variada y de terceros”. El comportamiento promocional se penaliza más que la ausencia. La inversión que funciona se gana: participar en subreddits como usuario real, apoyar a creadores de YouTube relevantes con patrocinios o apariciones, ir como invitado a pódcasts con expertise, debatir en Hacker News con opiniones técnicas genuinas y no promocionales.

Two-column investment-priority table mapping audit results — competitors cited from Reddit, YouTube, podcasts, Hacker News, or Stack Overflow — to the first off-site surface to invest in — Tabla de decisión de prioridad de inversión. Cruza tu auditoría con la primera superficie a invertir.

Resultado de auditoría	Primera inversión
Competidores citados desde hilos de Reddit y tú ausente	Presencia ganada en Reddit en 3-5 subs relevantes durante 6 meses
Competidores citados en vídeos de YouTube	Menciones patrocinadas en canales de categoría O construir canal con cadencia mensual
Competidores citados en episodios de pódcast	Apariciones como invitado en 6-10 pódcasts de categoría en un año
Competidores citados desde envíos de Hacker News	Artículos técnicos propios publicados en HN por miembros del equipo con historial
Competidores citados desde respuestas de Stack Overflow	Horas del equipo de ingeniería en hilos de alto valor de tu categoría

Dos notas prácticas tras seis meses viendo operadores aplicar esto. Uno, el plazo mínimo es seis meses para que registre y doce para ver cambios significativos. Quien prometa menos te vende humo. Dos, la inversión en superficie no es comprar una herramienta sino tiempo del equipo. Una brecha en Reddit no se cierra con un “tool”, sino con una persona creíble dedicando dos horas semanales a 3-5 subreddits.

Cuando esto se complica

El mapa de cinco superficies es una foto del estado actual, no un cuadro permanente. Debajo se mueven tres cosas.

Uno, los pesos cambian cuando cambia el entrenamiento. La próxima generación puede ponderar más los pódcasts y menos Reddit, o girar hacia recuperación sobre memoria paramétrica favoreciendo otra superficie. El mapa es lectura de mediados de 2026; en 2027 puede ser distinto.

Dos, las superficies cambian. El cortafuegos de X es reciente. El debilitamiento de Stack Overflow también. Bluesky, Threads y Mastodon aún no pesan en ninguna auditoría que haya corrido, pero en un año tal vez sí. Hay que releer el mapa cada par de trimestres; la auditoría sobrevive a las relecturas.

Tres, la conducta promocional se detecta y penaliza más rápido de lo que la señal se acumula. Una marca que contrata una agencia para sembrar posts en docenas de subs en un mes no ve beneficio y a menudo sufre penalizaciones: la cultura de moderadores de Reddit, el antispam de Reddit y las tuberías de entrenamiento lo cazan. La inversión que funciona es más lenta y aburrida de lo que promete cualquier agencia.

Franqueza para el lector: el mapa será distinto en doce meses. El método de auditoría no. Repite la auditoría cada trimestre, actualiza el mapa y ajusta la inversión. No firmes contratos multianuales con quien prometa “citaciones en ChatGPT”: no pueden, las superficies cambian y lo que funciona requiere tiempo del equipo más que trabajo de agencia.

Lo que esto no sustituye

La presencia off-site complementa, no sustituye, la optimización on-site. El schema markup, datos estructurados, jerarquía de páginas limpia, enlazado interno y calidad de contenido que cubren las piezas de optimización on-site para LLM siguen importando. Hacen que la mención de marca sea parseable y que, cuando alguien llegue a tu web desde una citación, la página refuerce la señal en vez de degradarla.

Mi marco mental: la presencia off-site hace que el LLM te conozca; la calidad on-site decide si esa conciencia se convierte en citación o en descarte. Ambas son necesarias. La mayoría ha sobreinvertido on-site y subinvertido off-site porque lo on-site parece concreto y lo off-site territorio del equipo de marketing. La pieza de optimización para búsqueda AI-first cubre el lado on-site; la pieza de SEO impulsado por IA cubre el marco conjunto.

Si te salió una brecha de superficie

Dos lecturas de siguiente acción según la auditoría.

Si la brecha es amplia y los competidores se citan desde tres o más superficies mientras tú estás ausente en casi todas, la pieza sobre multisource SEO es la siguiente. Aborda la presencia multi-plataforma sin mapa superficie a superficie. Si la brecha es estrecha y concentrada en una superficie, los deep dives específicos son los siguientes: SEO para pódcasts para el camino de pódcasts, SEO de vídeo para YouTube, marca en ChatGPT para el ángulo más estrecho, y GEO menciones en IA para el marco conceptual.

La pieza que no necesitas es la que promete “optimizar ChatGPT en 30 días”. La auditoría es lo que vale. Córrela, lee la brecha, elige una superficie, compromete un año de foco del equipo y reaudita en tres meses. Las superficies cambiarán; el método seguirá funcionando.

Our powerful suite of automation tools for SEO

Learn, discover, and get inspired by our content

Dónde los LLM encuentran realmente tu marca cuando la gente deja de buscar en Google