

Muchos sitios web en Argentina bloquean sin querer a los rastreadores de inteligencia artificial. Esto puede reducir la visibilidad de una marca en herramientas como ChatGPT, Perplexity, Gemini y otros motores generativos que cada vez mas personas usan para buscar proveedores, comparar servicios o investigar antes de comprar.
Este articulo explica como verificar si tu sitio esta bloqueando esos rastreadores y que hacer si lo esta.
Por que importa que la IA pueda rastrear tu sitio
Los motores de busqueda tradicionales (Google, Bing) rastrean la web para indexar paginas y mostrarlas en resultados. Los modelos de IA hacen algo similar: rastrean contenido publico para entrenarse o para generar respuestas.
Si tu sitio bloquea esos rastreadores, puede pasar lo siguiente:
- Tu empresa no aparece cuando alguien le pregunta a ChatGPT por proveedores de tu rubro.
- Tu contenido no es considerado como fuente por herramientas de investigacion con IA.
- Tu marca pierde presencia en el ecosistema de busquedas generativas que crece cada mes.
Para empresas que quieren visibilidad a futuro, habilitar el rastreo es una decision estrategica.
Que rastreadores de IA existen
Los principales rastreadores de sistemas de IA que visitan sitios web son:
- GPTBot (OpenAI / ChatGPT)
- Claude-Web (Anthropic / Claude)
- Google-Extended (Google / Gemini)
- PerplexityBot (Perplexity AI)
- FacebookBot (Meta AI)
- Applebot-Extended (Apple / Apple Intelligence)
- CCBot (Common Crawl, base de datos usada por muchos modelos)
Cada uno tiene su propio user-agent que puede ser bloqueado o permitido en el archivo robots.txt.
Paso 1: Revisar tu archivo robots.txt
El robots.txt es el primer lugar donde se bloquean rastreadores. Esta en la raiz de tu dominio: tudominio.com/robots.txt.
Un bloqueo total se ve asi:
User-agent: *
Disallow: /
Esto bloquea a todos los rastreadores, incluidos los de IA. Si tu sitio tiene esto, no esta siendo rastreado por nadie.
Un bloqueo especifico a GPTBot se veria asi:
User-agent: GPTBot
Disallow: /
Que buscar: cualquier bloqueo que incluya los user-agents de IA mencionados arriba.
Como habilitar rastreadores de IA en robots.txt
Para permitir todos los rastreadores:
User-agent: *
Allow: /
Para permitir rastreadores de IA especificos si el resto esta bloqueado:
User-agent: GPTBot
Allow: /
User-agent: Claude-Web
Allow: /
User-agent: Google-Extended
Allow: /
Paso 2: Revisar los headers HTTP
Algunos servidores o plugins de seguridad agregan headers que restringen el rastreo. El mas comun es X-Robots-Tag: noindex, nofollow.
Para revisar los headers de tu sitio, podes usar:
- La herramienta de desarrollador del navegador (F12 → Network → Headers).
- La extension ModHeader o SEO Minion.
- Herramientas online como Headers.io.
Si ves noindex o nofollow en los headers de paginas que deberian ser publicas, hay un problema de configuracion.
Paso 3: Verificar metatags en el HTML
Ademas del robots.txt y los headers, el rastreo puede bloquearse desde el HTML de la pagina.
Buscar en el <head> de tu sitio:
<meta name="robots" content="noindex, nofollow">
Esta linea le dice a todos los rastreadores que no indexen ni sigan los links de esa pagina. Si aparece en paginas publicas que queres posicionar, hay que quitarla o cambiarla a index, follow.
Paso 4: En WordPress, verificar el ajuste de visibilidad
WordPress tiene una opcion en Ajustes > Lectura que dice "Solicitar a los motores de busqueda que no indexen este sitio". Si esta activa, Google Search Console lo reporta como advertencia y todos los rastreadores reciben instruccion de no indexar.
Verificar que esa casilla este desmarcada en sitios productivos.
Paso 5: Revisar plugins de seguridad o cache
Algunos plugins de WordPress pueden agregar reglas de bloqueo sin que lo pidas:
- Wordfence: puede bloquear user-agents desconocidos.
- Cloudflare: puede bloquear bots clasificados como automatizados.
- W3 Total Cache o WP Rocket: en ciertos modos, pueden interferir con headers.
Revisar las reglas de firewall y listas de bots bloqueados en cada plugin de seguridad.
Paso 6: Verificar con Search Console y herramientas de rastreo
Google Search Console tiene una herramienta de inspeccion de URLs que permite verificar si una pagina es indexable. Tambien indica si hay restricciones de robots.txt o metatags.
Para rastreadores de IA fuera de Google, podes usar:
- ScreamingFrog: simula el rastreo y muestra que paginas estan bloqueadas.
- Bing Webmaster Tools: tiene diagnosticos similares a Search Console.
Que hacer si tu sitio esta bloqueando IA
- Editar el robots.txt para permitir los rastreadores que queres habilitar.
- Revisar y corregir metatags noindex en paginas publicas.
- Verificar la configuracion de WordPress (Ajustes > Lectura).
- Auditar plugins de seguridad para que no bloqueen bots legitimos.
- Validar headers HTTP en paginas principales.
Si usas WordPress y no estas seguro de como hacerlo sin romper nada, conviene hacerlo con ayuda tecnica.
Decision estrategica: que permitir y que bloquear
No es obligatorio permitir todo. Hay contenido que puede tener sentido proteger del rastreo de IA: bases de datos propias, contenido premium, datos internos.
Para la mayoria de los sitios de negocios en Argentina, sin embargo, el contenido publico deberia estar disponible para rastreadores de IA. La visibilidad en ecosistemas generativos va a seguir creciendo.
Lectura relacionada
Articulos relacionados
Ver todo el blog
Automatizaciones que ahorran tiempo en marketing


Servicio relacionado
SEO para IA: preparar tu marca para la nueva búsqueda
SEO para IA en Argentina. Preparamos tu marca para aparecer en ChatGPT, Gemini y Perplexity. Estructura, entidades y autoridad temática.
Explorar este servicio¿Tenés un proyecto en mente?
