seojuice

La pila SEO de código abierto que es transparente sobre lo que reemplaza

Vadim Kravcenko
Vadim Kravcenko
· Updated · 13 min read

TL;DR: Las mejores herramientas SEO de código abierto no son un clon barato de Semrush. Son un stack más reducido y honesto para auditar páginas, ser dueño de tus datos analíticos, rastrear tu propio sitio, probar el rendimiento y realizar investigación privada de las SERP sin fingir que un repositorio de GitHub puede sustituir una base de datos de palabras clave propietaria.

Deja de buscar un reemplazo de Semrush de código abierto

La mayoría de quienes buscan “herramientas SEO de código abierto” están haciendo la pregunta equivocada.

Diagram comparing site-owned SEO tasks with web-scale SEO data tasks
Fuente: análisis OSS de SEOJuice. Ordena las tareas SEO según dónde vivan los datos antes de elegir una herramienta.

Quieren un sustituto gratuito para Ahrefs, Semrush, Screaming Frog, Surfer y GA4 en una lista ordenada. Esa herramienta no existe. Probablemente tampoco debería existir, porque el stack SEO de código abierto útil no es una gran plataforma: es un conjunto de herramientas específicas que hacen bien un único trabajo y mantienen bajo tu control las partes que realmente importan.

Las herramientas SEO de código abierto son más fuertes donde el trabajo ocurre en tu propio sitio: rastreo, comprobaciones de renderizado, validación de metadatos, analítica, diagnóstico de Core Web Vitals, análisis tipo log y QA de contenido. Son más débiles donde el valor proviene de redes de datos privadas: volumen de keywords, índices de backlinks, estimaciones de clickstream, movimientos históricos de SERP y estimaciones de tráfico de competidores.

Lo aprendí por las malas. En mindnow, el trabajo de SEO para clientes solía convertirse en una factura de herramientas antes de convertirse en un problema de tráfico. En vadimkravcenko.com pagaba por plataformas que abría dos veces al mes. Con seojuice.io, el stack se volvió más limpio cuando dejé de buscar “el Semrush open source” y empecé a separar auditoría, analítica, rastreo, comprobaciones de contenido e investigación de SERP en trabajos distintos.

Si quieres volumen de palabras clave y datos de enlaces baratos, probablemente aún necesites una herramienta de pago. Si quieres control, capacidad de auditoría, propiedad de los datos y comprobaciones técnicas SEO repetibles, las herramientas de código abierto suelen ser suficientes.

La regla práctica

Si la herramienta necesita toda la web como base de datos, el open source suele quedarse atrás; si la herramienta necesita tu sitio como base de datos, el open source puede ser excelente.

Esa regla ahorra tiempo. No juzgues Lighthouse contra Ahrefs. No juzgues Matomo contra un rank tracker. No trates SearXNG como una base de datos de keywords. Cada herramienta pertenece a un trabajo distinto, y mezclar esos trabajos es como las recopilaciones que acaban siendo inútiles.

Lo que debería significar realmente “herramienta SEO de código abierto”

“Gratis” y “código abierto” se confunden con demasiada frecuencia. Un plan gratuito aún puede bloquear tus datos, restringir exportaciones, ocultar su metodología, cambiar precios y desaparecer tras un plan enterprise cuando tu sitio crece.

Flowchart for evaluating whether an SEO tool is truly open source
Fuente: rúbrica de evaluación de herramientas de SEOJuice. Cinco filtros que una herramienta debe superar antes de ganar la etiqueta de código abierto.

Screaming Frog es un crawler SEO útil. Lo he usado. Muchos SEOs técnicos deberían seguir pagándolo. Pero su versión gratuita no lo convierte en open source, y tratarlo como un proyecto Apache-2.0 o GPL hace que la gente compare precios en lugar de control.

Para este artículo, una herramienta SEO de código abierto necesita más que un enlace a GitHub. La licencia debe ser visible. El proyecto debe mostrar mantenimiento. Los datos deben poder exportarse. Debe existir una vía creíble de auto-alojamiento donde sea relevante. Y la herramienta debe resolver un flujo de trabajo SEO real, no solo tener “seo” en el topic del repositorio.

Comprobación Por qué importa
Licencia visible Confirma si el código puede inspeccionarse, bifurcarse o auto-alojarse
Mantenimiento activo Evita adoptar crawlers, parsers o paquetes de analítica abandonados
Acceso a exportación Mantiene los datos SEO portables si tu flujo de trabajo cambia
Ruta de auto-alojamiento Da control sobre logs, analítica y políticas de retención de datos
Trabajo SEO claro Evita acumular proyectos aleatorios de GitHub que no resuelven problemas de flujo de trabajo

El último punto es el más importante. Una herramienta puede estar bellamente diseñada y aun así ser irrelevante para tu proceso SEO. Ordena por trabajo, no por brillo.

Las mejores herramientas SEO de código abierto por trabajo, no por hype

Una lista ordenada por estrellas es fácil de escribir y difícil de usar. La mejor pregunta es: ¿qué tarea SEO necesitas terminar esta semana?

Matrix of open source SEO tools mapped to common SEO jobs
Fuente: recopilación OSS de SEOJuice. Las licencias reflejan la licencia declarada actualmente por cada proyecto.

Auditorías técnicas y calidad de página: Lighthouse

Lighthouse es la herramienta inicial por defecto porque ofrece comprobaciones rápidas y repetibles a nivel de página. Está integrado en Chrome DevTools, disponible desde la línea de comandos y fácil de ejecutar en CI (la salida CLI es útil cuando necesitas informes legibles por máquina).

“Lighthouse es una herramienta automatizada y de código abierto que te ayuda a mejorar la calidad de las páginas web.” Google Chrome Developers, Documentación de Lighthouse
“Incluye auditorías de rendimiento, accesibilidad, SEO y más.” Google Chrome Developers, Documentación de Lighthouse

Para SEO, Lighthouse es útil porque detecta fallos básicos antes de que se conviertan en hábitos de publicación. Etiquetas title ausentes. Mal comportamiento móvil. Pistas de indexación. Regresiones de rendimiento. Errores de accesibilidad que también afectan la calidad de la página. No te dirá si una página merece existir, pero sí si es técnicamente vergonzosa.

El README de GitHub enmarca el lado del desarrollador de manera similar: Lighthouse analiza aplicaciones y páginas web mientras recopila métricas modernas de rendimiento e información sobre buenas prácticas. Ese es el modelo mental correcto. Lighthouse es una herramienta de calidad de página — no un crawler de sitio completo, ni una herramienta de keywords, ni un índice de backlinks, ni un motor de priorización de negocio.

Dónde destaca:

  • Diagnóstico de rendimiento para plantillas individuales y páginas clave
  • Investigación de Core Web Vitals antes de una publicación
  • Comprobaciones básicas de SEO, accesibilidad y buenas prácticas
  • Checks en CI para equipos que publican a menudo
  • Detección de regresiones cuando cambian las plantillas

Dónde se queda corto: no rastrea tu sitio completo por sí mismo, no entiende tu estrategia de contenido y puntuará gustosamente una página que nadie debería haber publicado. Úsalo para hacer cumplir estándares. No le pidas que sea tu líder SEO.

Propiedad de la analítica: Matomo

Matomo es la opción de analítica abierta más completa. Si tu equipo quiere acceso a datos a largo plazo, auto-alojamiento y más control que GA4, Matomo merece estar en la lista corta.

“Matomo es la principal plataforma de analítica libre y gratuita.” README de Matomo
“Eres dueño de tus datos de analítica web: como Matomo se instala en tu servidor, los datos se almacenan en tu propia base de datos.” README de Matomo

Esa segunda frase es todo el argumento. Para SEO, los datos analíticos no son solo un dashboard: son evidencia. ¿Qué páginas ganan tráfico no de marca? ¿Qué artículos antiguos siguen recibiendo visitas? ¿Qué secciones del sitio se ignoran? ¿Qué landing pages convierten mal a pesar de posicionar bien?

GA4 puede responder parte de eso. Aun así, muchos equipos odian trabajar en él. Matomo te da un modelo más propio, especialmente cuando la retención de datos, el consentimiento y la continuidad de los informes importan.

El intercambio es real. Necesitas hosting, actualizaciones, almacenamiento, copias de seguridad y configuración. Alguien debe hacerse cargo de la instalación (en sitios de clientes, esto puede ser una ventaja o una carga). Si nadie del equipo quiere esa responsabilidad, quizá sea más sensato un producto de analítica alojado.

Analítica ligera de visitantes: Plausible y Umami

Matomo es amplio; Plausible y Umami son más ligeros. Tienen sentido cuando quieres informes de tráfico limpios sin montar un departamento de analítica a su alrededor.

Plausible es open source, pero también tiene un negocio serio detrás. Eso importa porque “código abierto” a veces despierta una preocupación legítima: ¿seguirá existiendo este proyecto el año que viene?

“El software libre y de código abierto puede ser sostenible y pagar tu alquiler.” Marko Saric, Cofundador de Plausible Analytics

Esa frase no es solo filosofía. Habla del riesgo de la herramienta. No quieres reconstruir el tracking cada año porque un mantenedor se quemó o un repositorio quedó en silencio.

Umami es la opción auto-alojada más simple para muchos equipos.

“Umami es una alternativa simple, rápida y centrada en la privacidad a Google Analytics.” README de Umami

Aquí fue donde cambié de opinión (me equivoqué durante años). Solía pensar que la analítica debía ser exhaustiva para ser útil. Para muchos flujos de trabajo SEO, limpio y consistente supera a exhaustivo.

Si solo necesitas ver qué páginas reciben visitas, de dónde llega el tráfico y si las actualizaciones de contenido avanzan en la dirección correcta, Plausible o Umami pueden ser suficientes. No son herramientas SEO técnicas por sí mismas. Ayudan a los SEOs a ver si el trabajo genera demanda a nivel de página sin volcar todos los informes en GA4.

Investigación de SERP sin entregar cada consulta: SearXNG

SearXNG suele malinterpretarse en listas SEO. No es un rank tracker, ni una base de datos de keywords, y no te dará volumen de búsqueda fiable, inteligencia de backlinks ni estimaciones de clics.

“SearXNG es un metabuscador gratuito que agrega resultados de hasta 249 servicios de búsqueda.” Documentación de SearXNG

Eso lo hace útil para un trabajo más reducido: flujos de investigación donde quieres comparar patrones de resultados, reducir la personalización de sesión o construir herramientas internas en torno a observaciones de búsqueda.

Usos SEO prácticos incluyen:

  • Comprobar cómo difieren los tipos de resultados entre buscadores
  • Realizar investigación manual de SERP sin usar la sesión personal del navegador
  • Construir herramientas internas de investigación para equipos de contenido
  • Comparar la intención de consulta entre motores antes de redactar briefs
  • Detectar si una consulta está dominada por foros, páginas de producto, vídeos o guías

No lo sobrevalores. Las políticas de scraping siguen importando. Las leyes locales también. Los motores de búsqueda pueden bloquear, limitar o cambiar su comportamiento. SearXNG puede apoyar la investigación, pero no hace que la recopilación de SERP sea mágicamente libre de riesgos.

Ayudantes SEO opcionales para desarrolladores

Algunas herramientas SEO de código abierto no son productos pulidos; son librerías, validadores, linters y scripts. Está bien. Para equipos técnicos, eso puede ser más útil que un dashboard.

Las categorías útiles son previsibles:

  • Comprobadores de enlaces rotos internos y externos
  • Validadores de sitemaps para la salida XML y cobertura de índices
  • Parsers de datos estructurados para validar schema durante la publicación
  • Linters de Markdown y HTML para reglas de títulos, encabezados e imágenes
  • Librerías de crawlers para auditorías personalizadas, especialmente en sitios con mucho JavaScript

Ten cuidado con las librerías de crawlers. Un sitio estático simple puede auditarse con un pequeño script. Un marketplace con URL facetadas, variantes de plantillas y millones de combinaciones rastreables probablemente necesite controles de rastreo más sólidos (aquí es donde la mayoría de los equipos sobre-ingenian demasiado tarde). Si tu sitio es una single page application, el timing del crawler y el HTML renderizado importan; escribí más sobre eso en la guía SPA SEO.

La regla es aburrida pero fiable: si tu equipo puede mantener scripts, los checks personalizados son potentes. Si nadie los mantendrá, se convierten en otra herramienta interna abandonada.

El stack SEO de código abierto que realmente usaría

Si empezara de cero, no construiría una gran suite SEO open source. Ejecutaría un stack pequeño y haría que cada herramienta se ganara su lugar.

Recommended open source SEO stack arranged by workflow
Fuente: stack OSS recomendado por SEOJuice. Reducido, propio y combinado con datos de pago solo cuando el trabajo lo exige.
Tarea SEO Herramienta Por qué
Auditoría de página Lighthouse Rápido, documentado, compatible con CI y suficiente para filtros de calidad repetibles
Analítica Matomo, Plausible o Umami Elige según profundidad de informes, tolerancia al hosting y necesidad de propiedad
Investigación de SERP SearXNG Útil para flujos de investigación privada, no para rank tracking
QA de contenido Linters de Markdown o HTML más checks personalizados Mejor para reglas de publicación repetibles que la revisión manual
Comprobaciones de rastreo Librerías de crawler abiertas o scripts Útiles cuando el sitio es técnico y el equipo puede mantener los scripts

Ese stack cubre el trabajo que realmente confío a las herramientas open source. Revisa páginas. Mide tráfico. Apoya la investigación. Automatiza el QA aburrido. Da espacio a los equipos técnicos para construir auditorías específicas del sitio.

En seojuice.io, la herramienta más útil suele ser estrecha y aburrida. El enlaceado interno programático, las comprobaciones de salud de página y el QA de contenido no necesitan un dashboard cinematográfico. Necesitan reglas repetibles. Cada artículo necesita un H1; cada página indexable necesita un título y una meta description; cada página importante necesita enlaces internos; cada página obsoleta necesita una razón para seguir indexada.

Por eso también soy cauto con las promesas “todo en uno”. Una herramienta que encuentra problemas es útil. Un sistema que convierte comprobaciones repetidas en un hábito de publicación es mejor. Las herramientas de código abierto pueden exponer los problemas; SEOJuice ayuda a operacionalizar el trabajo repetido en enlaces internos, salud de página y mantenimiento de contenido.

La herramienta debe reducir juicios repetidos, no crear una nueva adicción al dashboard.

Dónde fallan las herramientas SEO de código abierto

El código abierto te salva del vendor lock-in, no de pensar.

Chart showing strengths and limits of open source SEO tools
Fuente: análisis OSS de SEOJuice. Las barras reflejan una lectura cualitativa de la cobertura OSS en 2026, no una puntuación de benchmark.

Los puntos débiles son previsibles. Las herramientas open source normalmente no pueden igualar las bases de datos de keywords propietarias, los grandes índices de backlinks, los conjuntos de datos históricos de SERP o las estimaciones de tráfico basadas en clickstream. Esos productos son caros porque la recopilación de datos es cara.

Puedes crear un scraper de keywords. Puedes rastrear algunas páginas. Puedes recopilar tus propios rankings. Pero no recrearás casualmente un índice de backlinks a escala web con un repositorio de fin de semana y un VPS. Si la tarea SEO depende de datos de mercado amplios fuera de tu sitio, los proveedores de pago suelen tener la ventaja.

El open source también desplaza el coste. Tal vez pagues menos en suscripciones, pero pagas en configuración, hosting, actualizaciones, monitorización, copias de seguridad y mantenimiento. No es un mal trato, solo una factura distinta.

El encaje organizativo decide mucho. Un bloguero solitario puede preferir herramientas alojadas porque el tiempo importa más que el acceso al código. Un equipo técnico puede preferir analítica auto-alojada y auditorías personalizadas porque el control se multiplica. Una agencia puede necesitar ambos: checks open source para flujos propios, datos de pago para investigación competitiva e informes amigables para clientes en la zona gris.

La trampa es fingir que una elección es moralmente superior. Usa open source donde el control mejore el trabajo. Paga por los datos cuando los datos sean el producto.

Cómo elegir las herramientas SEO de código abierto adecuadas

No empieces por la herramienta. Empieza por la tarea.

  1. Nombra la tarea SEO.
  2. Decide si los datos viven en tu sitio o fuera de tu sitio.
  3. Revisa la licencia y el historial de mantenimiento.
  4. Prueba las rutas de exportación antes de confiar en la herramienta.
  5. Ejecuta un flujo de trabajo real antes de añadirla al stack.

“Mejorar el SEO” no es una tarea. “Encontrar títulos rotos en mi sitio” es una tarea. “Comprobar si los nuevos artículos se publican sin meta descriptions” es una tarea. “Marcar páginas sin enlaces internos tras la publicación” es una tarea. El open source puede ayudar ahí.

“Estimar la autoridad de backlinks de un competidor en toda la web” es otra clase de tarea. También lo es “encontrar cada hueco de keywords en un mercado con volumen fiable”. Usa un proveedor de datos de pago ahí o acepta que los datos serán débiles.

La comprobación de la licencia es menos glamurosa que la demo, pero importa. ¿Puedes inspeccionar el código? ¿Puedes bifurcarlo? ¿Puedes auto-alojarlo? ¿El proyecto publica releases? ¿Se responden los issues? ¿El repositorio lleva dos años en silencio?

Luego prueba las exportaciones. Si una herramienta te ayuda a recopilar datos de rastreo, eventos analíticos, comprobaciones de contenido u observaciones de rankings, deberías poder mover esos datos a otro lugar. CSV, JSON, acceso a base de datos, API: cualquiera sirve. Un dashboard bonito sin vía de salida es solo otra historia de lock-in con mejor branding.

Por último, ejecuta un flujo de trabajo real. No una demo. No un sitio de ejemplo. Tu sitio, tus plantillas, tu proceso de publicación, tu equipo. Ahí es donde las herramientas revelan si reducen trabajo o solo añaden configuración.

Recomendación final: usa open source por control, no por ahorros fantasiosos

Las mejores herramientas SEO de código abierto no intentan convertirse en una suite inflada “todo en uno”. Ahí está su ventaja.

Empieza con Lighthouse para auditorías de página. Elige Matomo si quieres analítica amplia y propia. Elige Plausible o Umami si quieres informes más ligeros y respeto por la privacidad de los visitantes. Usa SearXNG para flujos de investigación donde no quieras que cada consulta esté ligada a un navegador logueado. Añade pequeños scripts, linters y validadores para comprobaciones de publicación repetibles.

Luego añade herramientas de pago solo donde la tarea requiera datos que no puedes recopilar razonablemente por tu cuenta: volumen de keywords, investigación de backlinks, inteligencia competitiva y conjuntos de datos históricos de SERP.

El error es tratar el open source como un cupón. La mejor razón es el control: código inspeccionable, datos portables, opciones de auto-alojamiento y checks que se ajustan a tu sitio en lugar del flujo de trabajo de otro.

Construye el stack alrededor del trabajo SEO que repites cada semana, no alrededor de la categoría de herramienta que alguien puso en una recopilación.

FAQ

¿Son suficientemente buenas las herramientas SEO de código abierto para un trabajo SEO profesional?

Sí, para las tareas adecuadas. Son fuertes para auditorías de página, propiedad de la analítica, QA de contenido, comprobaciones técnicas y flujos de trabajo personalizados. Son más débiles para volumen de keywords, datos de backlinks e inteligencia competitiva porque dependen de grandes conjuntos de datos privados.

¿Cuál es la mejor alternativa open source a Semrush?

No hay una verdadera alternativa open source a Semrush. Puedes montar un stack open source que cubra algunos trabajos cercanos a Semrush, pero ningún repositorio abierto ofrece la misma red de datos de keywords, backlinks y competidores.

¿Es Lighthouse una herramienta SEO?

Lighthouse es parcialmente una herramienta SEO. Audita rendimiento, accesibilidad, fundamentos SEO y buenas prácticas a nivel de página. Es excelente para comprobaciones repetibles de calidad de página, pero no sustituirá a un crawler, una herramienta de keywords ni una estrategia de contenido.

¿Debo usar Matomo, Plausible o Umami?

Usa Matomo si necesitas analítica más profunda y puedes asumir el coste operativo. Usa Plausible o Umami si quieres informes más ligeros y una configuración sencilla. La elección correcta depende de cuánta profundidad de informes necesitas y quién mantendrá el sistema.

¿Se puede usar SearXNG para rank tracking?

No de forma fiable. SearXNG puede apoyar la investigación y comparación de SERP, pero el rank tracking requiere configuraciones estables de ubicación, manejo de dispositivos, programación de consultas, almacenamiento y recolección conforme a políticas. Trata SearXNG como herramienta de investigación, no como base de datos de rankings.

¿Quieres que las comprobaciones SEO aburridas se ejecuten cada semana?

Las herramientas open source pueden exponer los problemas. SEOJuice ayuda con el trabajo repetido que sigue: enlaces internos, comprobaciones de salud de página y mantenimiento de contenido que no debería depender de que alguien recuerde abrir otro dashboard.

SEOJuice
Stay visible everywhere
Get discovered across Google and AI platforms with research-based optimizations.
Works with any CMS
Automated Internal Links
On-Page SEO Optimizations
Get Started Free

no credit card required

More articles

No related articles found.