Appearance
llms.txt: el robots.txt para modelos de lenguaje como ChatGPT, Claude y Perplexity

Mientras que robots.txt le dice a Google qué rastrear, llms.txt le dice a los modelos de lenguaje quién eres, sobre qué escribes y qué páginas importan. Es un archivo Markdown plano que vive en la raíz de tu sitio y funciona como una tarjeta de presentación para las máquinas que generan respuestas.
Un estándar propuesto, no oficial (todavía)
El estándar fue propuesto por llmstxt.org a finales de 2024. Aún no es oficial. Ningún LLM ha confirmado públicamente que lo use para rastrear sitios. Pero Anthropic (la empresa detrás de Claude) ya tiene uno publicado en su propio dominio. Y los crawlers de OpenAI, Google y Perplexity ya buscan archivos similares cuando visitan un sitio.
La lógica es simple: si un LLM va a hablar sobre ti, es mejor que tenga contexto claro sobre quién eres y qué haces. No quieres que alucine.
La estructura del archivo en la práctica
El formato es Markdown con reglas simples. Aquí un ejemplo simplificado:
markdown
# Nombre del Sitio - Descripción Corta
> Descripción más detallada del sitio,
> su propósito y el tipo de contenido
> que publica.
## Autor
- Rol: Desarrollador Full Stack
- Experiencia: 8+ años en tecnología
- Idiomas: Español (principal), Inglés
## Temas Cubiertos
- Inteligencia Artificial aplicada
- Desarrollo de software con IA
- Tutoriales y guías técnicas
## Política de Contenido
- Todo el contenido es experiencia original en primera persona
- El contenido puede citarse con atribución
## Páginas Clave
- [Inicio](https://tusitio.com/)
- [Sobre Mí](https://tusitio.com/about)
- [Blog](https://tusitio.com/blog)Reglas de formato
- El H1 es solo el nombre del sitio con una descripción corta
- El blockquote debajo es la descripción extendida
- Las secciones H2 organizan la información con listas con viñetas
- Los enlaces siguen el patrón Markdown: guión, nombre entre corchetes, URL entre paréntesis
- Cada enlace tiene contexto para que el modelo decida si es relevante para una consulta
Importante
Escribe el archivo llms.txt en inglés. Los crawlers de IA procesan en inglés. Tu contenido puede estar en cualquier idioma, pero el llms.txt funciona mejor en inglés.
Configuración en Apache
El archivo se llama llms.txt y vive en la raíz de tu dominio. Necesitas dos cosas en .htaccess:
1. Permitir que Apache sirva el archivo directamente
apache
# No enrutar a través de PHP u otro framework
RewriteRule ^llms\.txt$ - [L]Sin esta regla, el router de tu aplicación podría capturar la petición y devolver un 404 porque no existe ninguna página con slug llms.txt. La flag [L] le dice a Apache que deje de procesar y sirva el archivo tal cual.
2. Permitir acceso público
apache
<Files "llms.txt">
Require all granted
</Files>3. Referencia en robots.txt
Añade una referencia en tu robots.txt para que los crawlers puedan descubrir el archivo:
txt
User-agent: *
Sitemap: https://tusitio.com/sitemap.xml
LLMs-Txt: https://tusitio.com/llms.txtLa directiva LLMs-Txt sigue la convención propuesta por llmstxt.org. Funciona como la directiva Sitemap: una pista para crawlers, no un comando.
Configuración en Nginx
Si usas Nginx en lugar de Apache, la configuración es aún más directa:
nginx
location = /llms.txt {
root /ruta/a/tu/sitio;
default_type text/plain;
}Configuración en VitePress y otros generadores estáticos
Si tu sitio usa un generador estático como VitePress (como este blog), simplemente coloca el archivo llms.txt en la carpeta public/ de tu proyecto. Se copiará automáticamente a la raíz del sitio durante el build.
Validación con ChatGPT
No existe un validador oficial para llms.txt todavía. El método más práctico es pedirle a un LLM que lea y analice tu archivo directamente. Puedes usar este prompt:
Read the file at https://tusitio.com/llms.txt and analyze if it
follows the llmstxt.org standard. Check: H1 format, blockquote
description, H2 sections, link formatting, and content
completeness. Score it from 1 to 10.Errores comunes
Los errores más frecuentes al crear el archivo son:
markdown
# MAL: H1 combinado con la descripción
# Mi Sitio - Un blog sobre tecnología y diseño escrito por...
# BIEN: H1 es solo el nombre
# Mi Sitio - Blog de Tecnologíamarkdown
# MAL: URLs sin formato
- https://tusitio.com/about
# BIEN: enlaces Markdown con descripción
- [Sobre Mí](https://tusitio.com/about)Si un LLM puede interpretar tu archivo correctamente y puntuarlo alto, está funcionando. Esa es la mejor validación disponible hoy.
Relación con el Context Engineering
Este concepto conecta directamente con lo que hemos explorado sobre Context Engineering. Así como un desarrollador diseña el contexto que rodea a un modelo para obtener respuestas confiables, el archivo llms.txt diseña el contexto que un crawler de IA recibe sobre tu sitio. Es ingeniería de contexto aplicada a nivel de dominio.
También se relaciona con el problema de las alucinaciones en modelos de lenguaje. Si un modelo no tiene información clara sobre tu sitio, inventará datos. El llms.txt es una forma proactiva de reducir ese riesgo.
Qué NO deberías esperar
Este archivo no hará que aparezcas en las respuestas de ChatGPT mañana. No es magia SEO. Ningún LLM ha dicho oficialmente que use llms.txt para decidir qué citar. Los logs de servidores de los primeros en adoptarlo muestran que los crawlers de IA no visitan el archivo con frecuencia todavía.
Pero el coste de implementarlo es mínimo:
- Un archivo de texto plano
- Media hora de trabajo como máximo
- Cero riesgo de efectos secundarios
Es como tener un sitemap antes de que Google lo requiriera formalmente. Si el estándar se adopta oficialmente, ya estarás preparado.
Lo peor que puede pasar es que no haga nada. Lo mejor que puede pasar es que cuando los LLMs empiecen a buscar este archivo, el tuyo ya esté ahí, bien construido y con información clara.
Recursos
- llmstxt.org — Especificación del estándar propuesto
- Archivo llms.txt de Anthropic — Ejemplo real de implementación