Hay una pregunta que me lleva rondando unos meses: ¿saben los modelos de IA lo que hay en tu web, o simplemente adivinan?
La respuesta corta es que adivinan. Y llms.txt es el primer intento serio de cambiar eso. Si te interesa que tu negocio aparezca en respuestas de ChatGPT, Perplexity, Claude o cualquier otro modelo, este archivo empieza a importar más de lo que parece. Como consultor SEO en Asturias, lo estoy viendo de primera mano con clientes que preguntan exactamente esto: «¿cómo hago para salir en la IA?»
Vamos al grano.
Qué es llms.txt (y para qué sirve exactamente)
llms.txt es un archivo de texto en formato Markdown que colocas en la raíz de tu web, concretamente en tudominio.com/llms.txt.
Su función es simple: decirle a los modelos de lenguaje grande (LLMs) qué es tu web, qué páginas tiene, y qué contenido es relevante para que lo entiendan bien.
Piénsalo así. Google tiene robots.txt para saber qué rastrear y sitemap.xml para encontrar URLs. Los LLMs no funcionan igual. No rastrean en tiempo real, no siguen sitemaps, y cuando procesan tu web, lo hacen de forma mucho más caótica. llms.txt les da un punto de entrada limpio.
La propuesta viene de Jeremy Howard (el de fast.ai), que publicó la especificación en 2024. Todavía no hay un estándar oficial adoptado por todos los modelos, pero la adopción está creciendo. Anthropic, por ejemplo, ya ha mostrado interés en este tipo de señales.
La diferencia con robots.txt y el sitemap
Aquí hay confusión frecuente, así que lo dejo claro:
- robots.txt: le dice a los crawlers qué pueden y qué no pueden indexar. Es una barrera, no una explicación.
- sitemap.xml: lista URLs para que los buscadores las encuentren. Sin contexto, sin jerarquía semántica.
- llms.txt: explica en lenguaje natural qué es tu web, cuáles son las páginas más importantes y qué hace cada una. Es para que una IA lo entienda, no para que un bot lo procese.
Son complementarios. No sustituye a nada, se añade.
Cómo es la estructura de un llms.txt
El formato es Markdown. Sencillo, sin complicaciones técnicas. Un ejemplo básico:
# Alejandro Tamargo - Consultor SEO
> Consultor SEO freelance especializado en negocios locales, ecommerce y estrategia de contenidos. Basado en Asturias, trabajo con clientes de toda España.
## Páginas principales
- [Inicio](https://alejandrotamargo.com/): presentación de servicios
- [Auditoría SEO](https://alejandrotamargo.com/auditoria-seo/): análisis técnico y de contenidos de webs
- [Blog SEO](https://alejandrotamargo.com/blog/): artículos sobre SEO, IA y estrategia digital
## Artículos recomendados
- [GEO vs SEO](https://alejandrotamargo.com/blog/geo-vs-seo/): diferencias y cómo adaptar tu estrategia
- [Fundamentos de IA para SEO](https://alejandrotamargo.com/blog/fundamentos-ia-marketing-digital-seo/): qué necesitas saber
- [E-E-A-T: qué es y cómo trabajarlo](https://alejandrotamargo.com/blog/eeat-que-es/): señales de autoridad para Google y para los LLMs
Así de sencillo. No necesitas código, no necesitas tocar ningún archivo del servidor más allá de subir un .txt a la raíz.
Por qué esto empieza a importar en 2025 y 2026
El SEO está cambiando porque Google ya no es el único punto de entrada. Perplexity tiene millones de usuarios. ChatGPT responde preguntas que antes terminaban en un clic a tu web. Y los AI Overviews de Google han reducido los clics en muchas búsquedas informacionales.
En este contexto, que un modelo de IA entienda bien tu web no es un extra. Es parte de ser visible.
Esto es exactamente el territorio del GEO (Generative Engine Optimization): optimizar para que los motores generativos te citen, te mencionen, te recomienden. Y llms.txt es una de las señales más directas que puedes darles.
No estás optimizando para un algoritmo que puntúa palabras clave. Estás optimizando para un modelo que intenta entender quién eres y si merece la pena mencionarte.
Esto está sobrevalorado (y esto no)
Seré directo porque hay mucho hype con este tema.
Sobrevalorado: pensar que por subir un llms.txt tu web va a aparecer en todas las respuestas de ChatGPT mañana. No funciona así. Los LLMs no lo leen en tiempo real, y la mayoría actualiza su conocimiento en ciclos de meses.
No sobrevalorado: empezar a construir esta señal ahora. Los modelos que sí rastrean activamente, como Perplexity o el modo de búsqueda de Bing con IA, sí pueden leerlo. Y cuando los grandes modelos actualicen su base de datos, tener este archivo bien hecho va a contar.
Es como el SEO técnico básico: no te da resultados de un día para otro, pero si no lo tienes, te va lastrando.
Quién lo está adoptando ya
Hay bastantes webs relevantes que ya tienen su llms.txt publicado. Puedes comprobarlo directamente añadiendo /llms.txt a cualquier dominio.
Cloudflare lo tiene. Vercel lo tiene. Varias herramientas SaaS de marketing digital también. En España todavía es territorio casi virgen, lo que es una oportunidad clara si te mueves antes que tu competencia.
Lo he revisado en varios sectores: ni el 5% de las webs de negocios locales en España tienen algo parecido. En nichos más técnicos la adopción sube un poco, pero sigue siendo baja.
Cómo crearlo paso a paso
No hay excusa técnica para no tenerlo. Esto es lo que necesitas:
- Crea un archivo llamado exactamente
llms.txt - Escríbelo en Markdown: un título con
#, un párrafo descriptivo con>, y secciones con##para tus páginas más importantes - Incluye las URLs absolutas de tus páginas clave (no las relativas)
- Sube el archivo a la raíz de tu dominio, junto a
robots.txtysitemap.xml - Verifica que está accesible en
tudominio.com/llms.txt
Si usas WordPress, puedes subirlo directamente por FTP/SFTP a la carpeta raíz, o mediante el gestor de archivos de tu hosting. Nada de plugins necesarios.
Existe también una versión extendida llamada llms-full.txt que incluye el contenido completo de las páginas en lugar de solo los enlaces. Es útil si quieres que los modelos tengan acceso directo al texto de tus artículos sin tener que rastrear nada. Para la mayoría de webs, la versión estándar es suficiente para empezar.
Qué poner (y qué no poner) dentro
He visto algunos llms.txt mal hechos y el error suele ser el mismo: meterlo todo. El archivo pierde utilidad si es un volcado caótico de URLs.
Lo que sí tiene sentido incluir:
- Una descripción concisa de quién eres y a quién ayudas
- Las páginas principales de servicios
- Los artículos del blog más completos y relevantes para tu temática
- Páginas de categorías si tienes un blog estructurado
Lo que no tiene sentido:
- Páginas de política de privacidad o aviso legal
- URLs de paginación
- Páginas en construcción o con contenido thin
- Parámetros de URLs de filtros o búsquedas internas
La lógica es la misma que cuando piensas en E-E-A-T: dale a la IA lo que demuestra que sabes de lo que hablas. No le des ruido.
La relación con el SEO técnico de siempre
Una cosa que me parece importante aclarar: llms.txt no reemplaza tener una web bien estructurada. Si tu web tiene problemas de indexación, contenido duplicado o páginas lentas, un archivo de texto no los tapa.
Lo que sí hace es complementar una web que ya funciona. Si tu web está bien trabajada técnicamente y tienes contenido de calidad, llms.txt es una capa extra que ayuda a los LLMs a entender mejor ese trabajo. Si tu web está rota o vacía, no cambia nada.
Es igual que el SEO de siempre: los atajos no existen, pero las señales bien construidas acumulan.
¿Quieres que tu web esté preparada para la búsqueda con IA?
En una auditoría SEO revisamos también estos aspectos técnicos emergentes, no solo el SEO clásico.
Mi recomendación práctica
Si gestionas tu propia web o la de un cliente, dedica 20 minutos a crear un llms.txt básico. No es un proyecto, es una tarea pequeña con potencial de retorno a largo plazo.
La ventana de diferenciación en España está abierta ahora. Dentro de un año, esto va a estar en todas las guías de SEO técnico y todo el mundo lo va a tener. El que lo implante antes gana terreno.
Y si ya tienes tu estrategia de GEO trabajada, llms.txt es el complemento natural. Son las dos caras de lo mismo: hacerle fácil a la IA entender que eres la fuente que merece citar.
SEO + IA
¿Tu web está preparada para la IA?
Reviso tu web, identifico qué señales le faltan para los LLMs y te doy un plan claro. Sin humo.
