🤖 VISIBILIDAD DE BOTS DE IA

Monitorea cada AI crawler que toca tu sitio.

GPTBot, ClaudeBot, PerplexityBot, Amazonbot, OAI-SearchBot, Bytespider — están indexando tu contenido ahora mismo. Quien ranquee en sus respuestas gana la próxima década de búsqueda. Pero no puedes optimizar lo que no puedes medir.

SysWP Radar rastrea cada request de AI crawler en tiempo real: qué bot, qué páginas, con qué frecuencia, desde dónde. Captura server-side — no necesita JavaScript (porque los AI crawlers no ejecutan JS).

Por qué tus herramientas actuales no ven AI crawlers

Google Analytics, Plausible, Fathom y cualquier otra herramienta de analytics basada en pixel JS corren dentro del navegador del visitante. Los AI crawlers buscan contenido vía HTTP puro, sin navegador. Envían una string User-Agent identificándose, golpean tus URLs, descargan el HTML — y se van sin nunca ejecutar tus etiquetas <script>.

Resultado: tu "reporte de tráfico" muestra 0 visitas de OpenAI, Anthropic o Perplexity, mientras en realidad sus bots podrían ser la fuente #1 de indexación en tu sitio.

Los AI crawlers que Radar rastrea

Cada uno tiene un papel distinto en la economía de la IA:

  • GPTBot — crawler de entrenamiento de OpenAI + citas del ChatGPT search. UA: Mozilla/5.0 ... GPTBot/1.x. El contenido citado aparece en las respuestas de ChatGPT (Search GPT).
  • ClaudeBot — crawler de Anthropic para entrenamiento de Claude y citas en Claude.ai. UA: ClaudeBot/1.0; +claudebot@anthropic.com.
  • PerplexityBot — crawler en tiempo real del answer engine de Perplexity. UA: Mozilla/5.0 (compatible; PerplexityBot/1.0). Las páginas citadas aparecen en los source pills de Perplexity.
  • Amazonbot — IA de shopping de Alexa + Rufus de Amazon. UA: Mozilla/5.0 (Linux; Amazonbot/0.1). Importante para visibilidad en e-commerce.
  • OAI-SearchBot — crawler standalone de search de OpenAI (separado del GPTBot). UA: OAI-SearchBot/1.0.
  • Bytespider — entrenamiento de IA de ByteDance / TikTok. UA incluye Bytespider.
  • YouBot — buscador You.com.
  • cohere-ai — crawler de entrenamiento de Cohere AI.
  • Anthropic-AI — crawler secundario de Anthropic (separado del ClaudeBot).
  • FacebookExternalHit — entrenamiento del Llama de Meta + previews de links de Facebook.
  • Google-Extended — señal separada de Google para opt-out de entrenamiento de Bard / Gemini.

Qué hacer con los datos de AI crawlers

  • SEO para respuestas de IA (GEO). Mira qué páginas revisita cada crawler. Si el GPTBot regresa repetidamente a /blog/ataques-wordpress-q1/, esa página está siendo ponderada como una fuente fuerte de respuesta — invierte en contenido similar.
  • Optimización de ancho de banda. Los AI crawlers pueden consumir 20-50% de los recursos del servidor en sitios enfocados en contenido. Ahora sabes cuáles.
  • Detección de gaps de contenido. Si un crawler golpea 404s, es contenido que la gente está preguntándole a asistentes de IA y tú no tienes.
  • Verificación de opt-out. Si configuraste reglas en el robots.txt para bloquear crawlers específicos, verifica que estén respetándolas. La mayoría las respeta; algunos no.

Cómo configurarlo

El classifier de SysWP Radar auto-detecta todos los AI crawlers conocidos sin ninguna configuración. Instala el plugin de WordPress (o pega una línea de JavaScript para cualquier otra plataforma) y el panel de bots IA se llena en minutos.

  1. Crear cuenta gratis
  2. Añade tu sitio → obtén el Site ID de 12 caracteres
  3. WordPress: instala el plugin SysRadar + pega el Site ID en Settings → SysRadar
  4. Otras plataformas: pega la etiqueta de script antes del </head>

Dentro de los 10 segundos de la próxima visita de AI crawler, ves en Dashboard → Top AI bots: nombre, conteo de hits, top páginas rastreadas, país de origen (la mayoría de los AI crawlers corren desde AWS US-East).

Preguntas frecuentes

¿Puedo bloquear el GPTBot / ClaudeBot si quiero?
Radar detecta; no bloquea. Para bloquear, añade reglas Disallow en el robots.txt (la mayoría de los crawlers las respetan) o usa una regla WAF contra el User-Agent. O empareja Radar con SysWP Shield para deploy de regla con 1 clic.
¿Qué tan precisa es la clasificación?
Hacemos match contra User-Agent strings publicados + verificamos reverse-DNS cuando el crawler publica sus IPs (Google, OpenAI). Los falsos positivos son raros; los falsos negativos pueden ocurrir si un crawler lanza sin anunciarse — actualizamos el classifier cuando aparecen nuevos productos de IA.
¿Funciona sin WordPress?
Sí. El pixel JavaScript funciona en cualquier plataforma. El plugin de WordPress añade captura server-side extra para los blind spots específicos de WP (wp-json, xmlrpc, etc.) — pero la detección core de AI crawler funciona en cualquier lugar.
¿Funciona en tiempo real?
Sí. Los eventos aparecen en el dashboard en 5-10 segundos del hit del crawler. El alerts engine también puede dispararse cuando un crawler específico aparece por primera vez (útil para trackear nuevos lanzamientos de IA conforme ocurren).

Mira qué IA está leyendo tu contenido.

Plan free para siempre. La mayoría de los sitios ven el primer hit de GPTBot o ClaudeBot dentro de una hora después de la instalación.

Crear cuenta gratis →

Los primeros 100 clientes pagantes aseguran 50% de por vida.

Temas relacionados