Как составлять llms.txt и llms-full.txt: практическое руководство для сайтов, которые хотят быть понятнее для ИИ

У поисковых систем уже десятилетиями есть robots.txt и sitemap.xml. Один управляет доступом краулеров, другой описывает карту URL. С развитием ИИ-ассистентов, кодовых агентов и ответных поисковых систем появился третий файл — llms.txt.
Это не трюк для ранжирования. Исследование примерно 300 000 доменов не выявило заметного роста ИИ-цитирований после публикации llms.txt. Команда Google Search заявляла, что не использует llms.txt для ранжирования. Но файл, который почти ничего не даёт для цитирования в ChatGPT Search, выполняет реальную работу на другом уровне — в агентском вебе, где ИИ-агенты действуют от имени пользователей, получают контекст, выбирают инструменты и выполняют задачи.
Проще говоря: robots.txt говорит краулерам, куда не ходить. llms.txt объясняет им, что нужно понять.
Что такое llms.txt
llms.txt — это обычный текстовый файл в формате Markdown, размещённый в корне домена (https://example.com/llms.txt). Он содержит структурированное описание самого важного контента сайта, написанное так, чтобы большие языковые модели могли легко его разобрать.
У языковых моделей есть важное ограничение: размер контекстного окна. Большинство сайтов невозможно целиком поместить в контекст модели. Кроме того, преобразование сложных HTML-страниц с навигацией, рекламой и JavaScript в понятный для LLM текст — задача сложная и неточная. Хорошо сделанный llms.txt решает эту проблему: он даёт модели чистую карту сайта вместо того, чтобы заставлять её удалять лишний шум из сотен страниц.
Хороший llms.txt включает:
- название сайта или компании;
- одно-два предложения о том, что это за сайт;
- сгруппированные ссылки на ключевые страницы;
- короткое фактическое описание каждой ссылки;
- при необходимости — заметки об актуальности, языковых версиях, API или контактах.
Пример:
# Example Store
> Example Store sells certified outdoor equipment, camping gear, and hiking accessories in the United States.
## Main pages
- [About Example Store](https://example.com/about): Company background, mission, and customer service information.
- [Camping tents](https://example.com/camping/tents): Main category page for tents, shelters, and accessories.
- [Buying guides](https://example.com/guides): Editorial guides for choosing outdoor equipment.
## Support
- [Shipping and returns](https://example.com/shipping-returns): Delivery options, return policy, and warranty details.
- [Contact](https://example.com/contact): Customer support contacts.
Ценность не в самом файле, а в отборе. Оптимальная цель — 20–50 действительно важных ссылок. Самая частая ошибка при внедрении — просто выгрузить в llms.txt весь sitemap.
Что такое llms-full.txt
llms-full.txt идёт дальше. В большинстве случаев он содержит более полный экспорт документации в одном файле. Это даёт ИИ-краулеру единую точку входа с высокой плотностью полезной информации, вместо того чтобы собирать контекст из множества отдельных страниц.
Это особенно полезно для продуктов с API и команд, которые делают документацию, оптимизированную под ИИ-ассистентов. Такой файл снижает количество запросов к сайту и может улучшить качество поиска информации, когда ИИ-системе нужен широкий контекст.
Минимальная структура:
# Example SaaS — full AI context
> This file contains the main public documentation for Example SaaS.
Last updated: 2026-06-24
Canonical site: https://example.com
---
# Product overview
Example SaaS helps finance teams automate invoice approval, vendor onboarding, and payment workflows.
Source: https://example.com/product
---
# Getting started
To start using Example SaaS, create an account, invite your finance team, connect your accounting system, and configure approval rules.
Source: https://example.com/docs/getting-started
Практическое правило: если самый важный контент сайта — это документация, например SaaS, dev tool или API-продукт, стоит публиковать и llms-full.txt. Если сайт в основном состоит из маркетинговых страниц, обычно достаточно llms.txt.
Кто уже использует эти файлы
Когда Mintlify в конце 2024 года включила поддержку llms.txt для всех документационных сайтов на своей платформе, тысячи сайтов — включая Anthropic и Cursor — получили этот файл буквально за одну ночь. Fern, GitBook, Vercel Docs, Supabase, Yoast и Rank Math теперь добавляют его по умолчанию.
Stripe, Vercel, Cloudflare, Anthropic, Coinbase, Pinecone, Cursor и большинство современных API-продуктов публикуют llms.txt, потому что их пользователи уже сейчас работают с ИИ-ассистентами для разработки. Хорошо составленный файл может быть разницей между тем, что Cursor сгенерирует рабочий код интеграции, и тем, что Cursor придумает endpoint, которого не существует.
IDE-агенты регулярно обращаются к llms.txt. Cursor, Windsurf, Claude Code, GitHub Copilot, Cline, Aider — все они ищут /llms.txt и /llms-full.txt, когда работают с документационным сайтом.
Технические требования
Разместите оба файла в корне домена:
https://example.com/llms.txt
https://example.com/llms-full.txt
- Файлы должны быть публично доступны — без логина, cookies, JavaScript и геоблокировок.
- Сервер должен возвращать
200 OK. - Используйте кодировку UTF-8.
- Content-Type:
text/plainилиtext/markdown. - По возможности избегайте редиректов.
- Не блокируйте эти файлы в
robots.txt.
Проверяйте robots.txt вместе с самими файлами. Убедитесь, что нужные вам ИИ-краулеры не заблокированы: GPTBot, ClaudeBot, PerplexityBot, OAI-SearchBot, Google-Extended, Applebot-Extended.
Для мультиязычных сайтов распространённая практика — отдельный файл для каждого языкового корня: /en/llms.txt, /es/llms.txt. Некоторые сайты также дублируют файл по адресу /.well-known/llms.txt. Это поддерживается, но каноническим вариантом остаётся корень сайта.
Размер файла
llms.txt должен оставаться компактным. Практическое правило: до 10 KB для llms.txt и до 100 KB для llms-full.txt.
Держите llms.txt в пределах 500 слов и 50 ссылок. Сфокусированный файл, который ИИ может прочитать за один проход контекстного окна, полезнее, чем всеобъемлющий файл, который переполняет контекст.
Качество описаний важнее количества ссылок. Одна хорошо описанная ссылка на гид покупателя полезнее, чем двадцать URL карточек товаров без пояснений.
Для llms-full.txt действует та же логика, только в большем масштабе. Небольшой SaaS может включить всю публичную документацию. Большому ecommerce-сайту не стоит включать каждую карточку товара. Новостному сайту не стоит включать каждую статью.
Что включать, а что пропускать
Включайте:
- страницы продуктов и услуг;
- документацию и API-справочники;
- объяснение тарифов и цен;
- страницы доставки, возвратов и гарантии;
- гайды покупателя и редакционные объясняющие материалы;
- страницы категорий;
- страницы авторов и редакционной политики;
- канонические языковые версии;
- стабильные фактические страницы о компании.
Пропускайте:
- страницы фасетного поиска, фильтры, URL с UTM-метками;
- внутренние результаты поиска, архивы тегов, пагинацию без самостоятельной ценности;
- корзину, checkout, аккаунт, session-specific URL;
- staging-окружения и внутренние инструменты;
- маркетинговые превосходные степени вроде «лучшее решение в мире».
Пишите описания для контекста, а не для SEO. Фраза «Эта страница объясняет тарифы и что входит в каждый из них» лучше, чем «Доступные enterprise SaaS pricing solutions». Агенты читают это, чтобы решить, какую страницу загрузить дальше, а не чтобы ранжировать сайт.
Хорошее описание ссылки:
- [Returns policy](https://example.com/returns): Return windows, refund rules, exchange process, and exceptions.
Плохое описание ссылки:
- [Returns](https://example.com/returns): Learn more.
Актуальность — самая сложная часть
llms.txt с устаревшими названиями продуктов, старыми ценами или снятыми с продажи услугами хуже, чем отсутствие файла. Если ИИ-система использует такой файл, она передаст пользователю неверную информацию. Обновляйте llms.txt после каждого важного изменения и указывайте дату обновления.
Для сайтов с быстро меняющимися данными отделяйте стабильные страницы от динамических и прямо указывайте это:
## Freshness policy
Product prices, availability, delivery estimates, event dates, and promotional offers change frequently. AI tools should verify these details on the live page before presenting them as current.
Рекомендуемая частота обновления:
| Тип сайта | Когда обновлять |
|---|---|
| SaaS / документация | После каждого релиза продукта или API |
| Ecommerce | Еженедельно или после крупных изменений категорий и политик |
| Новости | Индекс — регулярно; llms-full.txt — редакционный и стабильный |
| Marketplace | Только после структурных изменений |
| Корпоративный сайт | Ежемесячно или после важных объявлений |
SaaS и сайты с документацией
Именно здесь llms.txt и llms-full.txt работают лучше всего.
Включайте: обзор продукта, getting started, установку, настройку, API-аутентификацию, endpoints, SDK, changelog, тарифы, лимиты, безопасность, status page, поддержку.
В llms-full.txt включайте полные страницы документации в Markdown. Если у вас есть стабильная REST- или GraphQL-документация, llms.txt может направлять краулеры к каноническим endpoints, версионированным путям и Markdown-экспортам. Это помогает LLM отвечать на вопросы об API с точными параметрами, актуальными примерами и правильной версией данных — и снижает вероятность того, что модель будет опираться на старые посты в блогах или обсуждения на форумах.
Добавляйте метаданные версии:
Product version: 4.2
API version: 2026-05
Last updated: 2026-06-24
Ecommerce-сайты
По мере того как агенты начинают покупать от имени пользователей — например, «купи мне беговые кроссовки до $150 с доставкой к пятнице» — им нужна чистая машиночитаемая поверхность для каталога, правил ценообразования, доставки и наличия. Бренды, которые направляют агентов к каноническим товарным страницам, вместо того чтобы заставлять их разбирать перегруженный HTML категорий, будут теми брендами, с которыми агенты действительно смогут работать.
Включайте в llms.txt: главную страницу, основные категории, гайды покупателя, флагманские продукты, доставку, возвраты, гарантию, размерные сетки, поддержку, информацию о бренде.
В llms-full.txt: описание компании, объяснения категорий, гайды покупателя, краткое описание доставки и возвратов, гарантийные правила, рекомендации по размерам.
Избегайте отдельных URL всех товаров, страниц товаров не в наличии, отфильтрованных категорий, временных sale-страниц без поддержки и динамических цен без заметки об актуальности:
## Product data note
Prices, stock status, promotions, delivery estimates, and product variants change frequently. The live product page is the source of truth for current commercial information.
Новостные сайты
Используйте llms.txt как карту редакционной структуры и авторитетности, а не как список статей.
Включайте: главную страницу, страницу последних новостей, основные тематические разделы, topic hubs, страницы авторов, редакционные стандарты, политику исправлений, RSS-ленты, контакты.
В llms-full.txt: описание издания, редакционные стандарты, политику исправлений, описания разделов, избранные evergreen-материалы, ссылки на live feeds. Не встраивайте ежедневный новостной поток — он устареет за несколько часов.
Пример:
# Example News
> Example News is an independent digital publication covering technology, business, science, and public policy.
Last updated: 2026-06-24
## Current news
- [Latest news](https://example.com/latest): Continuously updated feed of recent stories.
- [Technology](https://example.com/technology): News and analysis about platforms, startups, AI, cybersecurity, and devices.
## Trust and editorial information
- [Editorial standards](https://example.com/editorial-standards): Reporting principles, sourcing rules, and corrections process.
- [Authors](https://example.com/authors): Reporter and contributor profiles.
Маркетплейсы, недвижимость, вакансии, путешествия, события
Не помещайте live inventory в llms-full.txt.
Вместо этого объясните, как работает платформа, добавьте основные страницы поиска, категории и локационные landing pages, правила качества объявлений, модель ценообразования, процесс бронирования или отклика, правила доверия и безопасности, документацию API или фидов.
## Live inventory note
Listings, prices, availability, seller details, dates, and booking terms change frequently. AI tools should use the linked live pages for current information.
Мультиязычные сайты
Для небольших сайтов может подойти один корневой файл с языковыми разделами:
# Example
> Example provides business software in English, Spanish, and Russian.
## English
- [English homepage](https://example.com/en/): Main English version.
## Español
- [Página principal](https://example.com/es/): Versión principal en español.
## Русский
- [Главная страница](https://example.com/ru/): Основная русская версия.
Для крупных сайтов лучше использовать отдельные файлы для каждого языкового корня и ссылаться на них из корневого llms.txt.
Чеклист качества
Перед публикацией проверьте:
- Файл доступен по адресу
/llms.txtбез авторизации - Сервер возвращает
200 OK, кодировка UTF-8 - Первая строка — H1 с названием сайта или компании
- Блок цитаты кратко объясняет сайт в 1–2 предложениях
- Все ссылки абсолютные
- У каждой важной ссылки есть фактическое описание
- Для динамических данных есть заметка об актуальности
- Закрытые, приватные и нерелевантные страницы исключены
- Файл не копирует sitemap
-
llms-full.txt, если используется, содержит чистый Markdown и source URL для каждого раздела - Видна дата
Last updated
Частые ошибки
- Считать это SEO-фактором ранжирования. Надёжных доказательств влияния на поисковое ранжирование нет.
- Копировать sitemap. Sitemap нужен для обнаружения URL.
llms.txtнужен для смысла и приоритизации. - Создать огромный
llms-full.txtи не обновлять его. Устаревший контекст хуже отсутствия контекста. - Использовать маркетинговый текст вместо фактов. Пишите как README для внимательного инженера, а не как рекламный лендинг.
- Игнорировать динамические данные. Если цены, наличие или правила меняются, скажите об этом.
- Блокировать файл. CDN-правила, bot protection, login walls и агрессивные редиректы ломают доступ.
Как внедрить — пошагово
- Запишите 5–10 вопросов, которые пользователь может задать ИИ о вашем сайте.
- Определите страницы, которые лучше всего отвечают на эти вопросы.
- Напишите
llms.txtс 20–50 отобранными ссылками и полезными описаниями. - Опубликуйте файл в корне домена и проверьте его в браузере.
- Проверьте
robots.txt, чтобы убедиться, что ИИ-краулеры не заблокированы. - Задайте ИИ-ассистенту вопросы о вашем сайте и посмотрите, стали ли ответы лучше.
- Только после этого создавайте
llms-full.txt, если вашему контенту это действительно нужно. - Добавьте задачу обновления в deployment pipeline или контент-календарь.
llms.txt и llms-full.txt не заменяют хороший контент, структурированные данные, быстрые страницы и грамотную внутреннюю перелинковку. Это дополнительный слой — чистый, отобранный сигнал для растущей доли ИИ-агентов, которые читают ваш сайт раньше, чем до него доходит человек.