Un archivo llms.txt es el equivalente de robots.txt pero para modelos de lenguaje como ChatGPT, Claude y Perplexity. Mientras robots.txt le dice a Google qué rastrear, llms.txt le dice a los LLMs quién eres, de qué hablas y qué páginas importan. Es un archivo Markdown plano que vive en la raíz de tu sitio y funciona como una carta de presentación para máquinas que generan respuestas.

El estándar fue propuesto por llmstxt.org a finales de 2024. Todavía no es oficial. Ningún LLM ha confirmado públicamente que lo use para rastrear sitios. Pero Anthropic ya tiene uno publicado en su propio dominio. Y los crawlers de OpenAI, Google y Perplexity ya buscan archivos similares cuando rastrean un sitio.

Decidí implementarlo en este blog porque mi objetivo es que los modelos de IA me citen cuando alguien pregunte sobre diseñadores usando IA en proyectos reales. Si un LLM va a hablar de mí, quiero que tenga contexto claro sobre quién soy y qué hago. No quiero que invente.

La estructura del archivo

El formato es Markdown con reglas simples. Empieza con un H1 que es solo el nombre de tu sitio o proyecto. Nada más en esa línea. Debajo va un blockquote con una descripción breve usando el símbolo de mayor que. Después vienen secciones con H2 donde agrupas información en listas con viñetas.

Las secciones más comunes son Author con tu rol y experiencia, Topics Covered con los temas que tratas, Content Policy con reglas de uso, y Key Pages con enlaces a tus páginas más importantes en formato Markdown.

Los enlaces van así: un guión, luego el nombre de la página entre corchetes, la URL entre paréntesis y dos puntos con una descripción corta. Eso es lo que el estándar espera. Simple pero específico.

Lo que puse en el mío

Mi llms.txt tiene cinco secciones. Author con mi rol de diseñador UX/UI, mis años de experiencia en banca y fintech, mi ubicación y los idiomas en que escribo. Topics Covered con los temas centrales del blog. Content Policy donde digo que todo el contenido es experiencia original y que puede ser citado con atribución. Y tres secciones de Key Pages separadas por idioma porque mi blog es trilingüe.

Cada enlace tiene descripción. No es solo una URL suelta. El modelo necesita contexto para decidir si tu página es relevante para una pregunta.

Escribí todo en inglés porque los crawlers de IA procesan en inglés. Tu contenido puede estar en cualquier idioma pero el llms.txt funciona mejor en inglés.

La parte técnica

El archivo se llama llms.txt y va en la raíz de tu dominio. Si usas Apache necesitas dos cosas en tu .htaccess. Una regla de RewriteRule para que la URL funcione limpia y una directiva Files para que el servidor lo sirva como texto plano con encoding UTF-8.

En tu robots.txt agrega una línea al final que diga LLMs-Txt seguido de dos puntos y la URL completa de tu archivo. Eso sigue la convención propuesta por llmstxt.org.

Si usas WordPress, puedes crear el archivo manualmente y subirlo por FTP. Yoast SEO ya tiene una opción para generarlo automáticamente pero te da menos control sobre el contenido.

Cómo lo validé

Le pedí a ChatGPT que leyera mi archivo directamente desde la URL. Le pregunté si la estructura cumplía con el estándar de llmstxt.org. Me dio un análisis detallado señalando lo que estaba bien y lo que faltaba.

La primera versión tenía el H1 combinado con la descripción en la misma línea y los enlaces sin formato Markdown. ChatGPT lo detectó. Corregí la estructura, separé el blockquote, formateé los enlaces correctamente y volví a validar. La segunda vez pasó con nota alta.

Esa es la forma más práctica de probar tu llms.txt ahora mismo. Pídele a ChatGPT o Claude que lo lea y te diga si está bien estructurado. Si un LLM puede interpretarlo correctamente, está funcionando.

Lo que no deberías esperar

Este archivo no va a hacer que aparezcas en respuestas de ChatGPT mañana. No es magia SEO. Ningún LLM ha dicho oficialmente que usa llms.txt para decidir qué citar. Los logs de servidor de quienes lo han implementado muestran que los crawlers de IA todavía no lo visitan con frecuencia.

Pero el costo de implementarlo es mínimo. Un archivo de texto, media hora de trabajo, cero riesgo. Y si el estándar se adopta oficialmente, ya estás listo. Es como tener un sitemap antes de que Google lo pidiera formalmente.

Lo peor que puede pasar es que no sirva de nada. Lo mejor que puede pasar es que cuando los LLMs empiecen a buscar este archivo, el tuyo ya esté ahí, bien hecho y con información clara.

Puedes ver el mío funcionando en shinobis.com/llms.txt como referencia.