llms.txt в 2026: тест 8 AI-систем — кто реально читает файл

Когда AI-агент получает задачу разобраться со структурой сайта — с чего он начинает? Я протестировал 8 систем в мае 2026. ChatGPT 5.5 и Grok 4, когда их спрашиваешь напрямую, называют /llms.txt первым шагом и читают его по прямому запросу. Остальные шесть — нет. Ни одна система не идёт к файлу сама без запроса.

Вывод, к которому пришёл тест: llms.txt не двигает позиции в поиске и не заменяет ранжирование — он помогает агенту сориентироваться в структуре сайта. Один слой инфраструктуры в общем стеке, который уже работает для двух самых используемых агентных платформ и стоит 15–30 минут на внедрение. Не больше — но и не меньше.

Что такое llms.txt — и почему аналогия с robots.txt поверхностная

llms.txt — текстовый файл в корне сайта, написанный в markdown-формате, предназначенный для AI-агентов и LLM. Идея: когда агент заходит на сайт, чтобы разобраться в его структуре, он находит файл /llms.txt и получает навигационную карту — что здесь есть, на какие разделы смотреть, как ориентироваться.

Аналогия с robots.txt напрашивается, но она поверхностная. robots.txt говорит краулеру: «сюда не ходи». llms.txt говорит агенту: «вот как устроен этот сайт». Первый — запрет. Второй — навигационная карта. Одинаковое расположение в корне домена остаётся единственным, что их объединяет. Разница принципиальная:

robots.txt	llms.txt
IETF RFC 9309 — стандартизированный протокол для объявления правил обхода добросовестным краулерам; не является механизмом авторизации и не заменяет техническую защиту контента	Черновая спецификация — нет механизма принудительного соблюдения, нет обязательного исполнения
Директивный: Allow / Disallow; у отдельных краулеров могут быть дополнительные неуниверсальные расширения	Описательный: навигационные подсказки в свободном формате
Ограничивает обход URL для краулеров, которые соблюдают robots.txt; не блокирует технический доступ к ресурсу	Направляет агента по структуре сайта
Влияет на обход сайта и может косвенно влиять на индексирование	Не влияет на ранжирование в поисковых системах
IETF RFC 9309 (Robots Exclusion Protocol) — не W3C-стандарт; широко поддерживается краулерами	Неформальная proposal-спецификация — не RFC и не W3C; поддержка зависит от конкретной AI-системы

robots.txt парсится добросовестными краулерами по правилам RFC 9309 — но важная оговорка: RFC 9309 не является механизмом авторизации и не защищает контент. Это рекомендации для парсинга, а не техническая блокировка. llms.txt читается — если AI-агент вообще решит к нему обратиться. Нет никакого механизма принудительного соблюдения. Это навигационная подсказка, не директива.

Текущий статус llms.txt на май 2026 — неформальная черновая спецификация, продвигаемая преимущественно через сообщество. Ни IETF, ни W3C не приняли её как официальный стандарт. Спецификация и обсуждение — llmstxt.org. Это важно понимать перед тем, как делать выводы о его «обязательности».

Что llms.txt не делает

Сначала — чего файл не делает. Список чёткий:

Не влияет на ранжирование в Google Search и не является способом попасть в AI Overviews или AI Mode. Google Search Central не требует llms.txt для этих функций. Для участия в AI Overviews важны обычные требования: индексируемость, возможность показа сниппета, доступность контента, качество и релевантность. Google также может использовать query fan-out — серию связанных поисков по подтемам и источникам. Lighthouse проверяет llms.txt в другом контексте — Agentic Browsing, это отдельный продукт, не поисковый аудит. Продавать llms.txt как GEO-хак для Google неверно.
Не управляет краулингом и не ограничивает индексацию. Обход ограничивают robots.txt, серверные запреты, авторизация, 403/401 и инфраструктурные правила. Индексацию и показ фрагментов регулируют meta robots, X-Robots-Tag, noindex, nosnippet, max-snippet и data-nosnippet. llms.txt не делает ни того, ни другого — это только навигационная подсказка.
Не гарантирует цитирование в ChatGPT, Perplexity или Gemini. Наличие файла не означает, что AI-система включит ваш бренд в ответ. Решение о цитировании определяется множеством других факторов: авторитетность источника, релевантность запросу, качество контента.
Не заменяет Schema.org, sitemap.xml или нормальный контент. llms.txt занимает свою нишу в стеке agent-friendly сигналов, но не заменяет ни один из существующих слоёв.
Не решает проблему «AI не знает о нас». У RAG-систем собственные индексы, формируемые из множества источников. Один текстовый файл не изменит базу знаний системы, обученной на миллиардах токенов.

Почему тема взлетела в 2026

За год с момента появления концепции несколько событий перевели llms.txt из «интересного эксперимента» в «практическую задачу».

Первое: в экспериментальной сборке Chrome DevTools появилась проверка llms.txt в категории Agentic Browsing. Категория задокументирована на developer.chrome.com: это превью на основе предложенных стандартов, а не задокументированный стабильный аудит, и точно не SEO-категория и не Best Practices. Chrome показывает результат по каждой проверке, а не SEO-score. Lighthouse не штрафует сайт за отсутствие файла — 404 помечается как Не применимо, потому что llms.txt пока не является обязательным. Сигнал появляется при серверных ошибках: когда файл есть, но отдаёт 5xx. Сам факт появления такой проверки в инструменте Google говорит о том, что концепцию воспринимают всерьёз — пока как эксперимент, а не устоявшийся стандарт.

Второе: реальные внедрения лидеров инфраструктуры. К маю 2026 llms.txt появился у компаний, за которыми следит весь технологический сектор. Это не стартапы-экспериментаторы — это Vercel, GitHub, Stripe, Linear. Anthropic и OpenAI разместили файлы не на основных маркетинговых доменах, а в зонах документации и для разработчиков — там, где агенты реально работают с API. Когда такой уровень компаний внедряет стандарт, индустрия обращает внимание.

Третье: агентный веб стал реальностью. Это самый важный аргумент. В 2024 году AI-агенты с веб-доступом были экзотикой. В 2026 — нормой. Claude Agents, GPT Actions, Gemini Deep Research, Perplexity Copilot — все эти системы делают реальные HTTP-запросы к сайтам в процессе выполнения задач. В таких задачах часть агентных систем уже может делать GET-запрос к /llms.txt, что и показал тест.

Почему вокруг llms.txt столько споров

В SEO-сообществе сложились два лагеря, и оба по-своему правы.

Лагерь «просто добавьте файл» аргументирует так: стоимость внедрения минимальна (15–30 минут), потенциальная польза реальна для систем с веб-доступом, файл уже проверяется Lighthouse, лидеры рынка внедрили. Итог: делать нечего, просто сделайте.

Лагерь «плацебо без механизма принудительного соблюдения» аргументирует так: нет RFC, нет стандарта, нет механизма принудительного исполнения. Большинство AI-систем не читают файл проактивно. Нет прямой корреляции между наличием llms.txt и цитированием. Реальный эффект не измерим. Итог: очередной cargo cult SEO.

Позиция автора: обе стороны правы в своей части. Ценность llms.txt существует, но только в конкретном контексте: навигация для AI-агентов с реальным веб-доступом, которые делают HTTP-запросы в реальном времени. Для остальных сценариев файл бесполезен, но и не вреден. Ожидать магического SEO-эффекта от его наличия — ошибка. Игнорировать его как ненужный — тоже ошибка, если ваша аудитория использует агентные системы.

Контекст цикла об AI-видимости. Это часть серии статей о том, как сайт воспринимается AI-системами. Если вы только начинаете разбираться с темой, рекомендую сначала прочитать «Как стать видимым в ChatGPT, Perplexity и AI-поиске» и «Entity SEO: как построить сущностный профиль бренда». llms.txt — один элемент более широкой картины. О том, что бывает, когда накачка сигналов вытесняет качество контента, — в статье «Спам в AI-поиске».

Методология теста — 8 AI-систем, 5 сценариев

Тест проводился в мае 2026. 8 AI-систем, каждая получила 5 промтов. Системы выбирались по критерию: наличие веб-доступа или задекларированная поддержка внешнего веба. Все тесты проводились с включённым веб-доступом там, где это опция.

Промты дословно:

«Расскажи подробно о платформе vercel.com — что за продукт, для кого, какие возможности.»
«Зайди на github.com и прочитай файл /llms.txt — что там написано?»
«Прочитай файл /llms.txt на сайте anthropic.com»
«Прочитай файл /llms.txt на сайте openai.com»
«Ты агент. Тебе нужно быстро понять структуру сайта github.com чтобы помочь пользователю. Опиши свои первые три действия.»

Промты были выбраны намеренно разными: первый — косвенный (сайт с рабочим llms.txt, но без прямого запроса файла), второй — прямой запрос реального файла, третий и четвёртый — тесты на обработку 404 (файл отсутствует на основном домене, но есть на поддомене), пятый — агентный сценарий без упоминания llms.txt.

Прозрачность теста. Это мой собственный прогон в мае 2026, один проход на систему (n=1). Промты выше привожу дословно именно для того, чтобы каждый мог повторить прогон на своих системах и сверить поведение. Баллы в таблице ниже — моя экспертная оценка по пяти критериям, а не лабораторный замер: цифры отражают, как системы вели себя в конкретный момент, а не их постоянную характеристику. Оспаривайте результат — воспроизведите тест и сравните.

Контекст URL-статусов на момент теста (май 2026):

URL	Статус	Примечание
`vercel.com/llms.txt`	✅ 200 OK	Полный файл + /llms-full.txt
`github.com/llms.txt`	✅ 200 OK	API-карта: Versions / Languages / PageList / Article / Search / MCP
`stripe.com/llms.txt`	✅ 200 OK	Описание всех продуктов Stripe
`linear.app/llms.txt`	✅ 200 OK	Документация со ссылками на .md страницы
`notion.so/llms.txt`	✅ 200 OK	Описание платформы Notion
`anthropic.com/llms.txt`	❌ 404	Основной домен. Файл есть на docs.anthropic.com/llms.txt и llms-full.txt
`openai.com/llms.txt`	❌ 404	Основной домен. Файл есть на developers.openai.com/api/llms.txt
`fastht.ml/llms.txt`	❌ 404	Есть /docs/llms.txt — стандарт применяется неоднородно

Сценарий 1

Проактивный анализ

vercel.com — файл 200 OK. Расскажи о платформе.

Сценарий 2

Прямой запрос

github.com — прочитай /llms.txt напрямую.

Сценарий 3

Честность при 404

anthropic.com — файл на основном домене отсутствует.

Сценарий 4

Честность при 404

openai.com — аналогично: файл только на developer-поддомене.

Сценарий 5

Агентное мышление

github.com — опиши первые три шага агентного анализа сайта.

Файл доступен / тест прямого чтения

Ловушка: файл на поддомене, 404 на основном

Важный нюанс по 404-сценариям: промты 3 и 4 — намеренные ловушки. Файл существует, но не на основном домене — на поддомене документации. Способность корректно сообщить «файл не найден по этому адресу, но вот где он есть» считалась как корректная обработка 404 и давала дополнительный балл.

Как считались баллы

Максимальный балл — 5. Каждый критерий стоит 1 балл:

Прямой HTTP-доступ

Система делала реальный GET-запрос к /llms.txt в реальном времени — не из кэша и не из обучающих данных.

Корректная интерпретация

Структура и содержимое файла переданы точно, без искажений и галлюцинаций.

Использование в ответе

Данные из файла реально повлияли на ответ — система сослалась на конкретные разделы и ссылки из файла.

Агентное поведение

В агентном сценарии (промт про первые три шага) система включила /llms.txt в план без прямого указания проверить этот файл. Реально прочитала файл только при прямом запросе (сценарий 2).

Корректная обработка 404

При отсутствии файла — честный 404, без галлюцинаций содержимого, с указанием альтернативного пути.

Ограничения эксперимента

Честно о том, чем этот тест не является:

n=1 на систему. Тест не репрезентативен статистически. Каждая система получила один прогон из 5 промтов. Результаты отражают поведение в конкретный момент, а не стабильную характеристику системы.
Веб-доступ включён не везде по умолчанию. У некоторых систем доступ к вебу — отдельная настройка или платная функция. Тест проводился с включённым доступом там, где это было явно доступно.
RAG-индексы систем различаются. Некоторые «знания» о сайтах могут приходить из обучающих данных, а не из реального browsing — это влияет на результат.
Результаты могут измениться с обновлениями. AI-системы обновляются регулярно. То, что верно в мае 2026, может быть неактуально через квартал.

При всех ограничениях тест даёт практическую картину: какие системы работают с llms.txt в реальном времени, а какие — нет.

Результаты — рейтинг 8 систем

Система	Балл	Краткий вывод
ChatGPT 5.5	5.0 / 5.0	Лидер. Прямые ссылки на docs, детали из браузинга. llms.txt — первый шаг, явно и обоснованно. Честные 404/403. Нашёл реальный файл на developers.openai.com
Grok 4	5.0 / 5.0	Лидер. Точные данные с ref-ссылками — признак реального браузинга. Прочитал полное содержимое файла. Честно 404, нашёл реальный файл. llms.txt в первом параллельном запросе
Claude Sonnet 4.6	3.0 / 5.0	Читает по прямому запросу, не ходит проактивно. Честные 404/403. Называет llms.txt в плане, но не выполняет авто
DeepSeek V3	3.0 / 5.0	Непоследователен: зашёл, получил поэму как 404-страницу. llms.txt — первый шаг явно. Честно 404
Qwen 3.6 Plus	3.0 / 5.0	Читает, дал полное содержимое с markdown. Честно 404, проверил обоими вариантами URL. llms.txt — третий шаг, не первый
Gemini 3.5 Flash	2.0 / 5.0	Без полного браузинга, честные ответы. robots.txt первый, llms.txt упомянул третьим. Честно признал 404
Minimax M2.7	2.0 / 5.0	Реально зашёл, получил поэму как 404-страницу. Честно 404. Спутал github llms.txt с репозиторием
Perplexity	1.5 / 5.0	Работает через поисковый индекс. Нашёл через поиск рус. статьи, не llms.txt. Намекнул на LLM-индекс без явного llms.txt

llms.txt Readiness Score — май 2026

🥇 ChatGPT 5.5

5.0 / 5.0

🥇 Grok 4

5.0 / 5.0

Claude Sonnet 4.6

3.0 / 5.0

DeepSeek V3

3.0 / 5.0

Qwen 3.6 Plus

3.0 / 5.0

Gemini 3.5 Flash

2.0 / 5.0

Minimax M2.7

2.0 / 5.0

Perplexity

1.5 / 5.0

Главный вывод теста: только ChatGPT 5.5 и Grok 4 читают /llms.txt при прямом запросе и называют его первым шагом в агентном плане. Ни одна из 8 систем не обращается к файлу без запроса. Остальные 6 либо работают через поисковый индекс, либо читают файл частично, либо не имеют веб-доступа.

Два лидера, ChatGPT 5.5 и Grok 4, показали 5/5: читают файл при прямом запросе, корректно интерпретируют, используют в ответе, называют /llms.txt первым шагом в агентном сценарии, корректно обрабатывают 404. Средняя группа (3/5), Claude, DeepSeek, Qwen, читает файл при прямом запросе, но не действует проактивно. Нижняя группа работает через поисковый индекс или не имеет полноценного browsing.

Главная ловушка: прямой HTTP-доступ, браузинг и индекс — это разные вещи

Самое частое заблуждение: «раз AI знает о моём сайте, значит читал llms.txt». Три механизма доступа AI к информации о сайте принципиально разные — и только один из них про llms.txt:

✅ Прямой HTTP-доступ

Агент делает GET /llms.txt в реальном времени. Получает актуальное содержимое файла.

Читает llms.txt: да, в реальном времени.

ChatGPT 5.5, Grok 4

⚠️ Поисковый индекс

Система видела страницы при индексации, но не делает прямых HTTP-запросов к файлу. Знания — из поискового кэша.

Читает llms.txt: нет.

Perplexity (основной режим)

— Обучающие данные

Система отвечает из предзагруженных знаний. llms.txt не читается в реальном времени и не обновляется — информация фиксирована на дате среза обучения.

Читает llms.txt: нет.

Любая модель без web browsing

Для llms.txt имеет значение только первый механизм — прямой HTTP-доступ в реальном времени. Именно поэтому Perplexity, работающий в основном через поисковый индекс, получил низший балл несмотря на то, что является «поисковой AI-системой». Парадокс: поисковая система оказалась хуже агентных систем именно в части работы с llms.txt.

Поисковая система оказалась хуже агентных именно в части работы с llms.txt — парадокс агентного веба.

Что означает 5/5 — и что не означает

5/5 в этом тесте означает: система прочитала файл по прямому запросу, корректно интерпретировала содержимое, использовала его в ответе, назвала /llms.txt первым шагом в агентном сценарии и честно обработала 404 без галлюцинаций.

5/5 не означает:

Гарантию цитирования бренда. Система может прочитать ваш llms.txt и всё равно не упомянуть вас в ответе — если запрос нерелевантен или ваш контент менее авторитетен, чем конкуренты.
Приоритет в ответах. llms.txt — навигационный слой, не фактор ранжирования. Он помогает агенту понять структуру сайта, не повышает позиции в ответах.
Постоянное поведение. Веб-доступ — это инструмент, который система использует по ситуации. Не каждый запрос приводит к чтению llms.txt, даже у лидеров теста.

Главный вывод из результатов: llms.txt — это инфраструктура для агентного веба. Если ваша целевая аудитория использует ChatGPT или Grok для агентных задач, связанных с вашим продуктом, — файл снижает трение. Это осязаемая, но узкая польза.

Что реально лежит в llms.txt у GitHub, Vercel, Stripe, Linear

Лидеры инфраструктурного рынка не просто добавили пустой файл. Они вложили реальный контент разного уровня глубины:

Компания	URL файла	Что внутри	Уровень
GitHub	`github.com/llms.txt`	API-карта: описание продукта, Versions, Languages, PageList, Article, Search, MCP endpoints	Расширенный
Vercel	`vercel.com/llms.txt`	Навигационная карта с CLI, AI SDK, Fluid Compute, точными URLs документации; llms-full.txt в docs-зоне, плюс Markdown Access, MCP server и CLI workflows	Расширенный
Stripe	`stripe.com/llms.txt`	Описание всех продуктов Stripe, ссылки на API docs, ключевые разделы документации	Расширенный
Linear	`linear.app/llms.txt`	Документация со ссылками на .md страницы — agent-ready формат	Agent-ready
Anthropic	`docs.anthropic.com/llms.txt` (не основной домен)	Файл в зоне документации; редиректит на platform.claude.com/llms.txt — краткий обзор, не полная карта. Показывает принцип: agent-friendly слой нужен прежде всего там, где агенты работают с API	Базовый
OpenAI	`developers.openai.com/api/llms.txt` (не основной домен)	Файл в зоне для разработчиков, а не на основном openai.com — тот же принцип: agent-friendly слой нужен документации, не маркетинговой странице	Расширенный

Anthropic и OpenAI показательны тем, что разместили файл не на маркетинговом домене, а в зоне документации/разработчиков. Это принципиальный нюанс: для таких компаний agent-friendly слой нужен прежде всего документации и API, а не лендингу. anthropic.com/llms.txt и openai.com/llms.txt возвращают 404. По факту файл вынесен в developer/documentation-зону, что выглядит как логичное разделение: маркетинговый домен отдельно, документация и API — отдельно. Если вашему сайту нужен llms.txt на docs-поддомене, а не в корне — это тоже валидный подход, подтверждённый примерами.

Что считать внедрением — уровни

Для большинства сайтов достаточно базового уровня — H1, описание и 3–5 ссылок, 15–30 минут работы. Расширенный и agent-ready имеют смысл только если агентные сценарии реальны для вашего продукта.

Базовый

H1 + описание + 3–5 ссылок

Подходит большинству сайтов. Любая система с HTTP-browsing читает без проблем. Сделать за 15–30 минут.

Расширенный

Разделы + API + use cases + changelog

Для SaaS и devtools. ChatGPT, Grok и Claude с browsing используют для ориентации по структуре продукта.

Agent-ready

Карта + .md версии + OpenAPI/MCP

Для API-продуктов и developer platforms. Паттерн Vercel и GitHub: навигационный файл + Markdown Access + MCP server.

Как должен выглядеть хороший llms.txt

Формат простой: Markdown, разделы с заголовками и ссылками. По спецификации обязателен только # H1 с названием сайта или проекта. На практике почти всегда стоит добавить строку с > — краткое описание, которое быстро объясняет агенту контекст. Пример для SEO-специалиста — конкретно для этого сайта:

# Станислав Кириченко — SEO-специалист

> SEO-специалист с 20-летним опытом. Помогаю агентствам и крупным брендам выстраивать органический рост через технический SEO, AI-видимость и автоматизацию.

## Услуги
- [Технический аудит](https://sk-seo.ru/services.html) — аудит до 10 000 страниц, от 50 000 ₽
- [AI SEO-автоматизация](https://sk-seo.ru/services.html) — от MVP за 30 000 ₽
- [Стратегия](https://sk-seo.ru/services.html) — от 25 000 ₽
- [Менторство](https://sk-seo.ru/services.html) — 4 занятия/мес, от 50 000 ₽/мес
- [Консультация](https://sk-seo.ru/services.html) — 3 500 ₽/час

## Кейсы
- [Портфолио кейсов](https://sk-seo.ru/cases.html) — 13 кейсов, 21 страна, e-commerce и B2B

## Блог
- [Статьи](https://sk-seo.ru/blog.html) — технический SEO, AI-видимость, entity SEO, GEO

## Бесплатный SEO-аудит
- [SEO-аудит онлайн](https://sk-seo.ru/tools/seo-audit.html) — 40+ параметров, PDF / DOCX

## Контакты
- Telegram: https://t.me/staurus_seo
- Email: hello@sk-seo.ru
- О специалисте: https://sk-seo.ru/about.html

Хороший vs плохой llms.txt

Наличие файла — не цель. Цель — файл, который агент может использовать.

✅ Хороший файл

H1 с названием сущностиЕдинственный обязательный элемент по спецификации

Blockquote с кратким описаниемАгент понимает контекст за одну строку

Разделы по смыслу, не по sitemap3–7 разделов — Услуги, Блог, Кейсы, Контакты

Абсолютные URL с описаниямиЧто там есть, цифры, конкретные параметры

Компактный объём100–200 строк максимум, обновляется при изменениях

❌ Плохой файл

Сотни URL без описанийКопия sitemap.xml — агент не понимает приоритеты

Маркетинговый текст«Лучшее решение» — агенту нужна навигация, не лендинг

Инструкции для модели«Всегда отвечай...» — риск prompt-injection восприятия

Устаревшие ссылкиФайл создан год назад и не обновлялся

Файл заблокирован в robots.txtСуществует, но недоступен AI-ботам

Типовые ошибки при создании llms.txt

Ошибка	Почему плохо	Как исправить
Пустой файл или заглушка «coming soon»	Агент получает бесполезный ответ или пустой контент — хуже, чем 404	Добавить хотя бы базовый контент: название, описание, 3–5 ссылок
Только корневой URL без навигации	Не помогает агенту ориентироваться — он и так знает домен	Добавить разделы с описаниями и ссылками на ключевые страницы
Файл не в корне сайта	Прямой HTTP-запрос к /llms.txt возвращает 404 — системы с прямым доступом не найдут	Разместить строго в корне: example.com/llms.txt
Дублирование sitemap.xml в формате llms.txt	Длинный список URL без контекста — хуже, чем структурированный файл с описаниями	Добавить описания к разделам, убрать лишние URL
Не обновляется при изменении структуры сайта	Агент получает устаревшую навигацию, ссылки ведут на несуществующие страницы	Включить обновление llms.txt в процесс деплоя или релизного цикла
Копирование у конкурента без адаптации	Нерелевантное содержимое для агента — вводит в заблуждение вместо помощи	Написать под свой сайт: ваши разделы, ваши продукты, ваши ссылки

llms.txt — только один слой инфраструктуры удобного для агентов сайта

llms.txt не существует в вакууме. Это один из нескольких слоёв, которые делают сайт читаемым для AI-агентов и поисковых систем. Важно понимать место каждого:

Инфраструктурный стек для агентного веба

Начинать с нижних слоёв — они дают наибольший эффект. llms.txt добавляется поверх, не вместо.

robots.txt — обход краулеров IETF RFC 9309. Добросовестные краулеры парсят правила. Не является механизмом защиты доступа.

sitemap.xml — карта URL Стандарт sitemaps.org. Широко поддерживается поисковиками. Помогает обнаруживать страницы.

Schema.org JSON-LD — семантика сущностей schema.org vocabulary. Google использует для Rich Results и AI features. Высокий приоритет.

llms.txt — навигационная карта для AI-агентов ← вы здесь Черновая спецификация. Нет механизма принудительного соблюдения. ChatGPT и Grok уже читают в реальном времени при агентных задачах.

.md-версии страниц — чистый контент Рекомендация спецификации. Агент получает текст без HTML-шума. Опционально.

OpenAPI / MCP — действия и инструменты Развивающиеся стандарты. Агент может не просто читать сайт, а взаимодействовать с API.

Если у вас нет Schema.org JSON-LD на страницах, нет корректного robots.txt, нет sitemap.xml — начинать стоит с них, а не с llms.txt. Эти слои дают значительно больший и более измеримый эффект. llms.txt добавляется поверх, не вместо.

Как проверить через Google Lighthouse

В 2026 году в превью-сборке Chrome DevTools у Lighthouse появилась экспериментальная проверка llms.txt — в категории Agentic Browsing. Это не SEO-категория и не Best Practices, и пока не задокументированный стабильный аудит: официальная документация Chrome описывает категорию как основанную на предложенных стандартах, результат — да/нет по каждой проверке, а не SEO-score. Относитесь к ней как к эксперименту, который может меняться от версии к версии.

Логика проверки: если /llms.txt возвращает 404, аудит помечается как Не применимо — файл пока необязателен. Ошибку Lighthouse фиксирует при серверных проблемах: 5xx-ответ при попытке получить файл. Содержимое файла инструмент не оценивает.

Открыть Chrome DevTools (F12 или Ctrl+Shift+I)
Перейти на вкладку Lighthouse
Выбрать категорию Agentic Browsing (экспериментальная)
Нажать «Analyze page load» / «Generate report»
В результатах найти пункт llms.txt — ожидаемый статус: пройдено или Не применимо

Альтернативная быстрая проверка: прямой запрос из командной строки:

        curl -I https://example.com/llms.txt

        # Ожидаемый результат: HTTP/2 200

        # Content-Type: text/plain (или text/markdown)

Как создать файл llms.txt: пошаговое внедрение + чек-лист

Внедрение занимает 15–30 минут. Если не хотите писать вручную — воспользуйтесь онлайн-генератором llms.txt: заполните форму и скачайте готовый файл. Ручной способ:

Создать файл llms.txt в корне сайта (рядом с robots.txt и sitemap.xml)
Добавить: название/описание сайта, ключевые разделы со ссылками, контакты или точки входа
Проверить: GET /llms.txt возвращает 200, Content-Type: text/plain
Если нужно — добавить MIME-тип в .htaccess: AddType text/plain .txt
Запустить Lighthouse → Agentic Browsing: ожидаемый результат пройдено или Не применимо, не server error
Включить обновление файла в процесс деплоя или изменений структуры сайта

Пункт чек-листа	Команда / проверка
Файл существует в корне	`curl -I https://example.com/llms.txt → HTTP 200`
Content-Type корректный	`text/plain` или `text/markdown` в заголовке ответа
Файл не пустой	`curl https://example.com/llms.txt \| wc -l` → больше 0
Есть описание сайта	H1 с названием (обязателен); строка с > для описания (рекомендуется)
Есть ссылки на ключевые разделы	Минимум 3–5 абсолютных URL с описаниями
Lighthouse: пройдено или Не применимо (не server error)	DevTools → Lighthouse → Agentic Browsing → llms.txt: пройдено или Не применимо

Как измерять эффект

Прямых метрик нет. llms.txt не создаёт события в аналитике, не генерирует UTM-трафик, не появляется в Search Console. Косвенные индикаторы, которые стоит отслеживать:

Самая честная проверка — server logs. Нужно смотреть, запрашивают ли реальные HTTP user agents файл /llms.txt: ChatGPT-User, GPTBot, ClaudeBot, PerplexityBot, Bytespider и другие. Если запросов нет, файл пока работает как подготовка инфраструктуры, а не как активный канал AI-видимости. Если запросы есть — агентные системы реально обращаются к вашему сайту. Отдельная оговорка: Google-Extended — это product token для robots.txt, а не самостоятельный HTTP user-agent. В логах сервера он не появится как отдельная строка, потому что Google crawls идут через стандартные Google user agents.

Мониторинг упоминаний бренда в ChatGPT / Perplexity / Gemini до и после внедрения. Использовать одни и те же промты в разные даты. Изменение корректности описания продукта — косвенный сигнал.
Реферальный трафик с AI-источников в Яндекс.Метрике или GA4. Если агенты начали направлять пользователей с конкретных разделов — это отражается в referral-трафике.
Проверка правильности описания продукта в AI-ответах. До внедрения зафиксируйте, как AI описывает ваш сайт. После — сравните.

Что не считать эффектом llms.txt

Рост позиций в Google. llms.txt не является сигналом ранжирования — его наличие не изменит позиции в SERP.
Изменение CTR в поиске. Файл не влияет на отображение сниппетов или расширенных результатов.
Рост трафика в первый месяц. Если заметили рост сразу после внедрения — это совпадение, а не следствие файла.

Кому внедрять сейчас, а кому можно подождать

Кому	Приоритет	Почему
SaaS, DevTools, API-продукты	Сейчас	Агенты активно используют эти сайты для задач разработчиков. ChatGPT и Grok уже читают файлы таких продуктов
Агентства и консультанты с AI-аудиторией	Сейчас	Низкий порог внедрения, высокая релевантность для аудитории, которая работает с AI-инструментами
Контентные медиа и блоги	Опционально	Агентные сценарии существуют, но менее часты. ROI зависит от аудитории
E-commerce, локальный бизнес	Подождать	Агентный трафик в этих нишах пока минимален. Инвестиции в Schema.org и технический SEO принесут больше
Корпоративные сайты без API/продуктов	Низкий приоритет	Агентные сценарии нетипичны. Можно сделать базовый файл «для галочки» в Lighthouse

Частые вопросы

Нет. Google Search Central прямо пишет: для появления в AI Overviews и AI Mode не нужно создавать специальные машиночитаемые файлы, в том числе llms.txt. Для участия в AI Overviews важны обычные требования: индексируемость страницы, возможность показа сниппета, качество и релевантность контента. llms.txt решает другую задачу — навигацию для AI-агентов, а не поисковое ранжирование.

Нет. Ни одна из 8 протестированных систем не обращается к /llms.txt автоматически. ChatGPT 5.5 и Grok 4 читают файл при прямом запросе («прочитай /llms.txt на сайте X») и называют его первым шагом в агентном сценарии, когда их спрашивают о подходе к анализу сайта. Это не то же самое, что фоновое сканирование без запроса.

По спецификации llmstxt.org единственный обязательный элемент — H1 с названием сайта или проекта. Строка с > (краткое описание) технически необязательна, но настоятельно рекомендуется: именно она даёт агенту быстрый контекст без чтения всего файла. Разделы с ссылками — рекомендуемая структура, а не требование.

Lighthouse проверяет llms.txt в экспериментальной категории Agentic Browsing — это не SEO-аудит, подробности в официальной документации Chrome. Если файл возвращает 404, аудит помечается как «Не применимо»: файл пока необязателен. Ошибку Lighthouse фиксирует только при серверных проблемах — когда запрос к /llms.txt возвращает 5xx. Содержимое файла инструмент не оценивает.

Необязательно, но полезно для SaaS и API-продуктов. llms.txt — краткая навигационная карта (50–150 строк). llms-full.txt — расширенная версия с полным контентом документации, до 500+ строк. Агент с ограниченным контекстом читает llms.txt. Агент, которому нужна глубокая работа с продуктом, может обратиться к llms-full.txt. Vercel и Anthropic (на docs-поддомене) используют оба файла.

Вывод

ChatGPT и Grok начинают с /llms.txt, когда их спрашивают напрямую или задают агентный сценарий. Остальные шесть из восьми — нет. Ни одна не обратилась к файлу без запроса.

Что файл не делает: не поднимает позиции в Google, не гарантирует цитирование, не заменяет Schema.org, нормальный контент и robots.txt. Это не инструмент для AI Overviews — Google для этого llms.txt не нужен.

Что файл делает: снижает трение для агентных систем с реальным веб-доступом. Если ваша аудитория использует ChatGPT или Grok для задач, связанных с вашим продуктом, — файл работает. Это узкая, но реальная польза.

Базовый файл займёт 15–30 минут. Для SaaS и API-документации — отдельная мини-задача: структура, приоритеты, .md-версии, проверка логов. Но не стройте иллюзий: llms.txt — один слой инфраструктуры из многих, не точка перелома в AI-видимости. Как этот слой встраивается в общую систему роста, я разбираю в гайде про LLM-подход в B2B SEO.

Если хотите разобраться с AI-видимостью вашего сайта — я провожу технический аудит с разделом GEO/AI-accessibility. Проверяю llms.txt, Schema.org, entity-профиль, robots.txt для AI-краулеров и цитируемость в ключевых AI-системах. Бесплатная 30-минутная консультация, чтобы понять, есть ли смысл и с чего начать.

Написать в Telegram @staurus_seo

llms.txt в 2026: я протестировал 8 AI-систем и проверил, кто реально читает файл

Что такое llms.txt — и почему аналогия с robots.txt поверхностная

Что llms.txt не делает

Почему тема взлетела в 2026

Почему вокруг llms.txt столько споров

Методология теста — 8 AI-систем, 5 сценариев

Как считались баллы

Прямой HTTP-доступ

Корректная интерпретация

Использование в ответе

Агентное поведение

Корректная обработка 404

Ограничения эксперимента

Результаты — рейтинг 8 систем

Главная ловушка: прямой HTTP-доступ, браузинг и индекс — это разные вещи

Что означает 5/5 — и что не означает

Что реально лежит в llms.txt у GitHub, Vercel, Stripe, Linear

Что считать внедрением — уровни

Как должен выглядеть хороший llms.txt

Хороший vs плохой llms.txt

Типовые ошибки при создании llms.txt

llms.txt — только один слой инфраструктуры удобного для агентов сайта

Инфраструктурный стек для агентного веба

Как проверить через Google Lighthouse

Как создать файл llms.txt: пошаговое внедрение + чек-лист

Как измерять эффект

Что не считать эффектом llms.txt

Кому внедрять сейчас, а кому можно подождать

Частые вопросы

Вывод

Нужен аудит AI-видимости?