Generador de Robots.txt

Construye el archivo de directrices para los motores de búsqueda de forma visual y evita que Google rastree zonas privadas de tu web.

1. Reglas Generales

Acceso por defecto (Todos los robots):

Retraso de rastreo (Crawl-delay):

Enlace al Sitemap XML:

2. Bloqueos Específicos

Directorios o URLs a bloquear (separados por comas):

Bloquear Google Imágenes Bloquear Bingbot Bloquear Yandex Bloquear Baidu Bloquear AhrefsBot Bloquear GPTBot (IA)

3. Código Generado

Copia este texto y guárdalo en un archivo llamado robots.txt en la raíz de tu dominio.

Estándar SEO

El código generado cumple estrictamente con el Protocolo de Exclusión de Robots utilizado por Google, Bing y Yahoo.

Control de Rastreo IA

Incluye opciones preconfiguradas para bloquear el acceso a bots de Inteligencia Artificial (como ChatGPT) que escrapean tu contenido.

100% Privado

La construcción del archivo se ejecuta localmente en tu navegador. Ningún dato de tu estructura web es enviado a nuestros servidores.

¿Qué es un archivo Robots.txt y por qué es vital para el SEO?

El archivo robots.txt es un simple archivo de texto sin formato que se aloja en el directorio principal (raíz) de tu sitio web (por ejemplo, https://tuweb.com/robots.txt). Actúa como la "recepción" de tu página: es lo primero que leen los robots de los motores de búsqueda (como Googlebot) antes de empezar a rastrear tu contenido.

Su función principal es indicar a estos rastreadores a qué partes de tu sitio web pueden acceder y cuáles están prohibidas. Esto es fundamental para optimizar tu "Presupuesto de Rastreo" (Crawl Budget), asegurando que Google no pierda el tiempo indexando páginas de acceso administrativo, carritos de compra o archivos internos sin valor SEO.

Entendiendo la sintaxis: User-agent y Disallow

La estructura del archivo se basa en dos comandos clave:

User-agent: Define a qué robot específico se dirige la regla. Un asterisco (*) significa que la regla aplica a todos los bots del mundo.
Disallow: Indica la ruta exacta de la URL que no debe ser rastreada. Si se deja vacío, significa que el bot tiene vía libre absoluta.

Declaración del Sitemap

Una de las mejores prácticas de SEO Técnico que incluye nuestro generador es añadir la ruta hacia tu sitemap.xml al final del archivo robots.txt. Esto funciona como un mapa del tesoro directo para los buscadores alternativos que quizás no tengas configurados en herramientas como Google Search Console, acelerando la indexación de tus nuevos artículos.

Preguntas Frecuentes sobre Robots.txt

¿Qué pasa si no tengo un archivo robots.txt?

Si un motor de búsqueda no encuentra el archivo robots.txt en tu dominio, asumirá por defecto que tiene permiso total para rastrear e indexar todas y cada una de las URLs, imágenes y archivos de tu servidor a los que pueda acceder mediante enlaces.

¿El robots.txt oculta mis páginas de los resultados de Google?

No necesariamente. El comando Disallow impide el rastreo, pero si la URL recibe enlaces externos potentes, Google podría indexarla igualmente mostrando un mensaje genérico. Para desindexar o esconder una página de los resultados de forma segura, debes utilizar la etiqueta meta noindex en el código HTML de esa página concreta.

¿Cómo compruebo si mi nuevo robots.txt funciona?

Una vez que hayas guardado y subido el archivo a la carpeta principal de tu hosting, puedes verificarlo entrando a tu cuenta de Google Search Console. En el menú de Ajustes encontrarás el informe de "Robots.txt" donde Google te confirmará si puede leerlo correctamente y cuándo fue la última vez que lo procesó.