Когда AI-агент получает задачу разобраться со структурой сайта — с чего он начинает? Я протестировал 8 систем в мае 2026. ChatGPT 5.5 и Grok 4, когда их спрашиваешь напрямую, называют /llms.txt первым шагом и читают его по прямому запросу. Остальные шесть — нет. Ни одна система не идёт к файлу сама без запроса.

Вывод, к которому пришёл тест: llms.txt — не SEO-хак и не сигнал ранжирования. Это один навигационный слой в стеке инфраструктуры, который уже работает для двух самых используемых агентных платформ и стоит 15–30 минут на внедрение. Не больше — но и не меньше.

Что такое llms.txt — и почему аналогия с robots.txt поверхностная

llms.txt — текстовый файл в корне сайта, написанный в markdown-формате, предназначенный для AI-агентов и LLM. Идея: когда агент заходит на сайт, чтобы разобраться в его структуре, он находит файл /llms.txt и получает навигационную карту — что здесь есть, на какие разделы смотреть, как ориентироваться.

Аналогия с robots.txt напрашивается, но она поверхностная. robots.txt говорит краулеру: «сюда не ходи». llms.txt говорит агенту: «вот как устроен этот сайт». Первый — запрет. Второй — навигационная карта. Одинаковое расположение в корне домена — единственное, что их объединяет. Разница принципиальная:

robots.txt llms.txt
IETF RFC 9309 — стандартизированный протокол для объявления правил обхода добросовестным краулерам; не является механизмом авторизации и не заменяет техническую защиту контента Черновая спецификация — нет механизма принудительного соблюдения, нет обязательного исполнения
Директивный: Allow / Disallow; у отдельных краулеров могут быть дополнительные неуниверсальные расширения Описательный: навигационные подсказки в свободном формате
Ограничивает обход URL для краулеров, которые соблюдают robots.txt; не блокирует технический доступ к ресурсу Направляет агента по структуре сайта
Влияет на обход сайта и может косвенно влиять на индексирование Не влияет на ранжирование в поисковых системах
IETF RFC 9309 (Robots Exclusion Protocol) — не W3C-стандарт; широко поддерживается краулерами Неформальная proposal-спецификация — не RFC и не W3C; поддержка зависит от конкретной AI-системы

robots.txt парсится добросовестными краулерами по правилам RFC 9309 — но важная оговорка: RFC 9309 не является механизмом авторизации и не защищает контент. Это рекомендации для парсинга, а не техническая блокировка. llms.txt читается — если AI-агент вообще решит к нему обратиться. Нет никакого механизма принудительного соблюдения. Это навигационная подсказка, не директива.

Текущий статус llms.txt на май 2026 — неформальная черновая спецификация, продвигаемая преимущественно через сообщество. Ни IETF, ни W3C не приняли её как официальный стандарт. Спецификация и обсуждение — llmstxt.org. Это важно понимать перед тем, как делать выводы о его «обязательности».

Что llms.txt не делает

Сначала — чего файл не делает. Список чёткий:

Почему тема взлетела в 2026

За год с момента появления концепции несколько событий перевели llms.txt из «интересного эксперимента» в «практическую задачу».

Первое: Google Lighthouse добавил проверку llms.txt в экспериментальную категорию Agentic Browsing. Важный нюанс: это не SEO-аудит и не Best Practices. Chrome прямо указывает, что категория основана на предложенных стандартах и показывает результат по каждой проверке, а не SEO-score. Lighthouse не штрафует сайт за отсутствие файла — 404 помечается как Не применимо, потому что llms.txt пока не является обязательным. Сигнал появляется при серверных ошибках: когда файл есть, но отдаёт 5xx. Сам факт появления проверки в инструменте Google показывает, что концепция воспринимается серьёзно.

Второе: реальные внедрения лидеров инфраструктуры. К маю 2026 llms.txt появился у компаний, за которыми следит весь технологический сектор. Это не стартапы-экспериментаторы — это Vercel, GitHub, Stripe, Linear. Anthropic и OpenAI разместили файлы не на основных маркетинговых доменах, а в зонах документации и для разработчиков — там, где агенты реально работают с API. Когда такой уровень компаний внедряет стандарт, индустрия обращает внимание.

Третье: агентный веб стал реальностью. Это самый важный аргумент. В 2024 году AI-агенты с веб-доступом были экзотикой. В 2026 — нормой. Claude Agents, GPT Actions, Gemini Deep Research, Perplexity Copilot — все эти системы делают реальные HTTP-запросы к сайтам в процессе выполнения задач. В таких задачах часть агентных систем уже может делать GET-запрос к /llms.txt — именно это и показал тест.

Почему вокруг llms.txt столько споров

В SEO-сообществе сложились два лагеря, и оба по-своему правы.

Лагерь «просто добавьте файл» аргументирует так: стоимость внедрения минимальна (15–30 минут), потенциальная польза реальна для систем с веб-доступом, файл уже проверяется Lighthouse, лидеры рынка внедрили. Итог: делать нечего, просто сделайте.

Лагерь «плацебо без механизма принудительного соблюдения» аргументирует так: нет RFC, нет стандарта, нет механизма принудительного исполнения. Большинство AI-систем не читают файл проактивно. Нет прямой корреляции между наличием llms.txt и цитированием. Реальный эффект не измерим. Итог: очередной cargo cult SEO.

Позиция автора: обе стороны правы в своей части. Ценность llms.txt существует — но только в конкретном контексте: навигация для AI-агентов с реальным веб-доступом, которые делают HTTP-запросы в реальном времени. Для остальных сценариев — файл бесполезен, но и не вреден. Ожидать магического SEO-эффекта от его наличия — ошибка. Игнорировать его как ненужный — тоже ошибка, если ваша аудитория использует агентные системы.

Контекст цикла об AI-видимости. Это часть серии статей о том, как сайт воспринимается AI-системами. Если вы только начинаете разбираться с темой — рекомендую сначала прочитать «Как стать видимым в ChatGPT, Perplexity и AI-поиске» и «Entity SEO: как построить сущностный профиль бренда». llms.txt — один элемент более широкой картины.

Методология теста — 8 AI-систем, 5 сценариев

Тест проводился в мае 2026. 8 AI-систем, каждая получила 5 промтов. Системы выбирались по критерию: наличие веб-доступа или задекларированная поддержка внешнего веба. Все тесты проводились с включённым веб-доступом там, где это опция.

Промты дословно:

  1. «Расскажи подробно о платформе vercel.com — что за продукт, для кого, какие возможности.»
  2. «Зайди на github.com и прочитай файл /llms.txt — что там написано?»
  3. «Прочитай файл /llms.txt на сайте anthropic.com»
  4. «Прочитай файл /llms.txt на сайте openai.com»
  5. «Ты агент. Тебе нужно быстро понять структуру сайта github.com чтобы помочь пользователю. Опиши свои первые три действия.»

Промты были выбраны намеренно разными: первый — косвенный (сайт с рабочим llms.txt, но без прямого запроса файла), второй — прямой запрос реального файла, третий и четвёртый — тесты на обработку 404 (файл отсутствует на основном домене, но есть на поддомене), пятый — агентный сценарий без упоминания llms.txt.

Контекст URL-статусов на момент теста (май 2026):

URL Статус Примечание
vercel.com/llms.txt ✅ 200 OK Полный файл + /llms-full.txt
github.com/llms.txt ✅ 200 OK API-карта: Versions / Languages / PageList / Article / Search / MCP
stripe.com/llms.txt ✅ 200 OK Описание всех продуктов Stripe
linear.app/llms.txt ✅ 200 OK Документация со ссылками на .md страницы
notion.so/llms.txt ✅ 200 OK Описание платформы Notion
anthropic.com/llms.txt ❌ 404 Основной домен. Файл есть на docs.anthropic.com/llms.txt и llms-full.txt
openai.com/llms.txt ❌ 404 Основной домен. Файл есть на developers.openai.com/api/llms.txt
fastht.ml/llms.txt ❌ 404 Есть /docs/llms.txt — стандарт применяется неоднородно
Сценарий 1
Проактивный анализ
vercel.com — файл 200 OK. Расскажи о платформе.
Сценарий 2
Прямой запрос
github.com — прочитай /llms.txt напрямую.
Сценарий 3
Честность при 404
anthropic.com — файл на основном домене отсутствует.
Сценарий 4
Честность при 404
openai.com — аналогично: файл только на developer-поддомене.
Сценарий 5
Агентное мышление
github.com — опиши первые три шага агентного анализа сайта.
Файл доступен / тест прямого чтения
Ловушка: файл на поддомене, 404 на основном

Важный нюанс по 404-сценариям: промты 3 и 4 — намеренные ловушки. Файл существует, но не на основном домене — на поддомене документации. Способность корректно сообщить «файл не найден по этому адресу, но вот где он есть» считалась как корректная обработка 404 и давала дополнительный балл.

Как считались баллы

Максимальный балл — 5. Каждый критерий стоит 1 балл:

01

Прямой HTTP-доступ

Система делала реальный GET-запрос к /llms.txt в реальном времени — не из кэша и не из обучающих данных.

02

Корректная интерпретация

Структура и содержимое файла переданы точно, без искажений и галлюцинаций.

03

Использование в ответе

Данные из файла реально повлияли на ответ — система сослалась на конкретные разделы и ссылки из файла.

04

Агентное поведение

В агентном сценарии (промт про первые три шага) система включила /llms.txt в план без прямого указания проверить этот файл. Реально прочитала файл только при прямом запросе (сценарий 2).

05

Корректная обработка 404

При отсутствии файла — честный 404, без галлюцинаций содержимого, с указанием альтернативного пути.

Ограничения эксперимента

Честно о том, чем этот тест не является:

При всех ограничениях тест даёт практическую картину: какие системы работают с llms.txt в реальном времени, а какие — нет.

Результаты — рейтинг 8 систем

Система Балл Краткий вывод
ChatGPT 5.5 5.0 / 5.0 Лидер. Прямые ссылки на docs, детали из браузинга. llms.txt — первый шаг, явно и обоснованно. Честные 404/403. Нашёл реальный файл на developers.openai.com
Grok 4 5.0 / 5.0 Лидер. Точные данные с ref-ссылками — признак реального браузинга. Прочитал полное содержимое файла. Честно 404, нашёл реальный файл. llms.txt в первом параллельном запросе
Claude Sonnet 4.6 3.0 / 5.0 Читает по прямому запросу, не ходит проактивно. Честные 404/403. Называет llms.txt в плане, но не выполняет авто
DeepSeek V3 3.0 / 5.0 Непоследователен: зашёл, получил поэму как 404-страницу. llms.txt — первый шаг явно. Честно 404
Qwen 3.6 Plus 3.0 / 5.0 Читает, дал полное содержимое с markdown. Честно 404, проверил обоими вариантами URL. llms.txt — третий шаг, не первый
Gemini 3.5 Flash 2.0 / 5.0 Без полного браузинга, честные ответы. robots.txt первый, llms.txt упомянул третьим. Честно признал 404
Minimax M2.7 2.0 / 5.0 Реально зашёл, получил поэму как 404-страницу. Честно 404. Спутал github llms.txt с репозиторием
Perplexity 1.5 / 5.0 Работает через поисковый индекс. Нашёл через поиск рус. статьи, не llms.txt. Намекнул на LLM-индекс без явного llms.txt
llms.txt Readiness Score — май 2026
🥇 ChatGPT 5.5
5.0 / 5.0
🥇 Grok 4
5.0 / 5.0
Claude Sonnet 4.6
3.0 / 5.0
DeepSeek V3
3.0 / 5.0
Qwen 3.6 Plus
3.0 / 5.0
Gemini 3.5 Flash
2.0 / 5.0
Minimax M2.7
2.0 / 5.0
Perplexity
1.5 / 5.0
Главный вывод теста: только ChatGPT 5.5 и Grok 4 читают /llms.txt при прямом запросе и называют его первым шагом в агентном плане. Ни одна из 8 систем не обращается к файлу без запроса. Остальные 6 либо работают через поисковый индекс, либо читают файл частично, либо не имеют веб-доступа.

Два лидера — ChatGPT 5.5 и Grok 4 — показали 5/5: читают файл при прямом запросе, корректно интерпретируют, используют в ответе, называют /llms.txt первым шагом в агентном сценарии, корректно обрабатывают 404. Средняя группа (3/5) — Claude, DeepSeek, Qwen — читают файл при прямом запросе, но не действуют проактивно. Нижняя группа работает через поисковый индекс или не имеет полноценного browsing.

Главная ловушка: прямой HTTP-доступ, браузинг и индекс — это разные вещи

Самое частое заблуждение: «раз AI знает о моём сайте, значит читал llms.txt». Три механизма доступа AI к информации о сайте принципиально разные — и только один из них про llms.txt:

✅ Прямой HTTP-доступ

Агент делает GET /llms.txt в реальном времени. Получает актуальное содержимое файла.

Читает llms.txt: да, в реальном времени.

ChatGPT 5.5, Grok 4

⚠️ Поисковый индекс

Система видела страницы при индексации, но не делает прямых HTTP-запросов к файлу. Знания — из поискового кэша.

Читает llms.txt: нет.

Perplexity (основной режим)

— Обучающие данные

Система отвечает из предзагруженных знаний. llms.txt не читается в реальном времени и не обновляется — информация фиксирована на дате среза обучения.

Читает llms.txt: нет.

Любая модель без web browsing

Для llms.txt имеет значение только первый механизм — прямой HTTP-доступ в реальном времени. Именно поэтому Perplexity, работающий в основном через поисковый индекс, получил низший балл несмотря на то, что является «поисковой AI-системой». Парадокс: поисковая система оказалась хуже агентных систем именно в части работы с llms.txt.

Поисковая система оказалась хуже агентных именно в части работы с llms.txt — парадокс агентного веба.

Что означает 5/5 — и что не означает

5/5 в этом тесте означает: система прочитала файл по прямому запросу, корректно интерпретировала содержимое, использовала его в ответе, назвала /llms.txt первым шагом в агентном сценарии и честно обработала 404 без галлюцинаций.

5/5 не означает:

Главный вывод из результатов: llms.txt — это инфраструктура для агентного веба. Если ваша целевая аудитория использует ChatGPT или Grok для агентных задач, связанных с вашим продуктом, — файл снижает трение. Это осязаемая, но узкая польза.

Что реально лежит в llms.txt у GitHub, Vercel, Stripe, Linear

Лидеры инфраструктурного рынка не просто добавили пустой файл. Они вложили реальный контент разного уровня глубины:

Компания URL файла Что внутри Уровень
GitHub github.com/llms.txt API-карта: описание продукта, Versions, Languages, PageList, Article, Search, MCP endpoints Расширенный
Vercel vercel.com/llms.txt Навигационная карта с CLI, AI SDK, Fluid Compute, точными URLs документации; llms-full.txt в docs-зоне, плюс Markdown Access, MCP server и CLI workflows Расширенный
Stripe stripe.com/llms.txt Описание всех продуктов Stripe, ссылки на API docs, ключевые разделы документации Расширенный
Linear linear.app/llms.txt Документация со ссылками на .md страницы — agent-ready формат Agent-ready
Anthropic docs.anthropic.com/llms.txt (не основной домен) Файл в зоне документации; редиректит на platform.claude.com/llms.txt — краткий обзор, не полная карта. Показывает принцип: agent-friendly слой нужен прежде всего там, где агенты работают с API Базовый
OpenAI developers.openai.com/api/llms.txt (не основной домен) Файл в зоне для разработчиков, а не на основном openai.com — тот же принцип: agent-friendly слой нужен документации, не маркетинговой странице Расширенный

Anthropic и OpenAI показательны тем, что разместили файл не на маркетинговом домене, а в зоне документации/разработчиков. Это принципиальный нюанс: для таких компаний agent-friendly слой нужен прежде всего документации и API, а не лендингу. anthropic.com/llms.txt и openai.com/llms.txt возвращают 404. По факту файл вынесен в developer/documentation-зону, что выглядит как логичное разделение: маркетинговый домен отдельно, документация и API — отдельно. Если вашему сайту нужен llms.txt на docs-поддомене, а не в корне — это тоже валидный подход, подтверждённый примерами.

Что считать внедрением — уровни

Для большинства сайтов достаточно базового уровня — H1, описание и 3–5 ссылок, 15–30 минут работы. Расширенный и agent-ready имеют смысл только если агентные сценарии реальны для вашего продукта.

Базовый
H1 + описание + 3–5 ссылок
Подходит большинству сайтов. Любая система с HTTP-browsing читает без проблем. Сделать за 15–30 минут.
Расширенный
Разделы + API + use cases + changelog
Для SaaS и devtools. ChatGPT, Grok и Claude с browsing используют для ориентации по структуре продукта.
Agent-ready
Карта + .md версии + OpenAPI/MCP
Для API-продуктов и developer platforms. Паттерн Vercel и GitHub: навигационный файл + Markdown Access + MCP server.

Как должен выглядеть хороший llms.txt

Формат простой: Markdown, разделы с заголовками и ссылками. По спецификации обязателен только # H1 с названием сайта или проекта. На практике почти всегда стоит добавить строку с > — краткое описание, которое быстро объясняет агенту контекст. Пример для SEO-специалиста — конкретно для этого сайта:

# Станислав Кириченко — SEO-специалист > SEO-специалист с 20-летним опытом. Помогаю агентствам и крупным брендам выстраивать органический рост через технический SEO, AI-видимость и автоматизацию. ## Услуги - [Технический аудит](https://sk-seo.ru/services.html) — аудит до 10 000 страниц, от 50 000 ₽ - [AI SEO-автоматизация](https://sk-seo.ru/services.html) — от MVP за 30 000 ₽ - [Стратегия](https://sk-seo.ru/services.html) — от 25 000 ₽ - [Менторство](https://sk-seo.ru/services.html) — 4 занятия/мес, от 50 000 ₽/мес - [Консультация](https://sk-seo.ru/services.html) — 3 500 ₽/час ## Кейсы - [Портфолио кейсов](https://sk-seo.ru/cases.html) — 13 кейсов, 21 страна, e-commerce и B2B ## Блог - [Статьи](https://sk-seo.ru/blog.html) — технический SEO, AI-видимость, entity SEO, GEO ## Бесплатный SEO-аудит - [SEO-аудит онлайн](https://sk-seo.ru/tools/seo-audit.html) — 40+ параметров, PDF / DOCX ## Контакты - Telegram: https://t.me/staurus_seo - Email: hello@sk-seo.ru - О специалисте: https://sk-seo.ru/about.html

Хороший vs плохой llms.txt

Наличие файла — не цель. Цель — файл, который агент может использовать.

✅ Хороший файл
H1 с названием сущностиЕдинственный обязательный элемент по спецификации
Blockquote с кратким описаниемАгент понимает контекст за одну строку
Разделы по смыслу, не по sitemap3–7 разделов — Услуги, Блог, Кейсы, Контакты
Абсолютные URL с описаниямиЧто там есть, цифры, конкретные параметры
Компактный объём100–200 строк максимум, обновляется при изменениях
❌ Плохой файл
Сотни URL без описанийКопия sitemap.xml — агент не понимает приоритеты
Маркетинговый текст«Лучшее решение» — агенту нужна навигация, не лендинг
Инструкции для модели«Всегда отвечай...» — риск prompt-injection восприятия
Устаревшие ссылкиФайл создан год назад и не обновлялся
Файл заблокирован в robots.txtСуществует, но недоступен AI-ботам

Типовые ошибки при создании llms.txt

Ошибка Почему плохо Как исправить
Пустой файл или заглушка «coming soon» Агент получает бесполезный ответ или пустой контент — хуже, чем 404 Добавить хотя бы базовый контент: название, описание, 3–5 ссылок
Только корневой URL без навигации Не помогает агенту ориентироваться — он и так знает домен Добавить разделы с описаниями и ссылками на ключевые страницы
Файл не в корне сайта Прямой HTTP-запрос к /llms.txt возвращает 404 — системы с прямым доступом не найдут Разместить строго в корне: example.com/llms.txt
Дублирование sitemap.xml в формате llms.txt Длинный список URL без контекста — хуже, чем структурированный файл с описаниями Добавить описания к разделам, убрать лишние URL
Не обновляется при изменении структуры сайта Агент получает устаревшую навигацию, ссылки ведут на несуществующие страницы Включить обновление llms.txt в процесс деплоя или релизного цикла
Копирование у конкурента без адаптации Нерелевантное содержимое для агента — вводит в заблуждение вместо помощи Написать под свой сайт: ваши разделы, ваши продукты, ваши ссылки

llms.txt — только один слой инфраструктуры удобного для агентов сайта

llms.txt не существует в вакууме. Это один из нескольких слоёв, которые делают сайт читаемым для AI-агентов и поисковых систем. Важно понимать место каждого:

Инфраструктурный стек для агентного веба

Начинать с нижних слоёв — они дают наибольший эффект. llms.txt добавляется поверх, не вместо.

robots.txt — обход краулеров IETF RFC 9309. Добросовестные краулеры парсят правила. Не является механизмом защиты доступа.
sitemap.xml — карта URL Стандарт sitemaps.org. Широко поддерживается поисковиками. Помогает обнаруживать страницы.
Schema.org JSON-LD — семантика сущностей schema.org vocabulary. Google использует для Rich Results и AI features. Высокий приоритет.
llms.txt — навигационная карта для AI-агентов ← вы здесь Черновая спецификация. Нет механизма принудительного соблюдения. ChatGPT и Grok уже читают в реальном времени при агентных задачах.
.md-версии страниц — чистый контент Рекомендация спецификации. Агент получает текст без HTML-шума. Опционально.
OpenAPI / MCP — действия и инструменты Развивающиеся стандарты. Агент может не просто читать сайт, а взаимодействовать с API.

Если у вас нет Schema.org JSON-LD на страницах, нет корректного robots.txt, нет sitemap.xml — начинать стоит с них, а не с llms.txt. Эти слои дают значительно больший и более измеримый эффект. llms.txt добавляется поверх, не вместо.

Как проверить через Google Lighthouse

Google Lighthouse в 2026 году добавил проверку llms.txt в экспериментальную категорию Agentic Browsing — это не SEO-категория и не Best Practices. Chrome описывает её как основанную на предложенных стандартах; результат — да/нет по каждой проверке, а не SEO-score.

Логика проверки: если /llms.txt возвращает 404, аудит помечается как Не применимо — файл пока необязателен. Ошибку Lighthouse фиксирует при серверных проблемах: 5xx-ответ при попытке получить файл. Содержимое файла инструмент не оценивает.

  1. Открыть Chrome DevTools (F12 или Ctrl+Shift+I)
  2. Перейти на вкладку Lighthouse
  3. Выбрать категорию Agentic Browsing (экспериментальная)
  4. Нажать «Analyze page load» / «Generate report»
  5. В результатах найти пункт llms.txt — ожидаемый статус: пройдено или Не применимо

Альтернативная быстрая проверка: прямой запрос из командной строки:

curl -I https://example.com/llms.txt
# Ожидаемый результат: HTTP/2 200
# Content-Type: text/plain (или text/markdown)

Как создать файл llms.txt: пошаговое внедрение + чек-лист

Внедрение занимает 15–30 минут. Если не хотите писать вручную — воспользуйтесь онлайн-генератором llms.txt: заполните форму и скачайте готовый файл. Ручной способ:

  1. Создать файл llms.txt в корне сайта (рядом с robots.txt и sitemap.xml)
  2. Добавить: название/описание сайта, ключевые разделы со ссылками, контакты или точки входа
  3. Проверить: GET /llms.txt возвращает 200, Content-Type: text/plain
  4. Если нужно — добавить MIME-тип в .htaccess: AddType text/plain .txt
  5. Запустить Lighthouse → Agentic Browsing: ожидаемый результат пройдено или Не применимо, не server error
  6. Включить обновление файла в процесс деплоя или изменений структуры сайта
Пункт чек-листа Команда / проверка
Файл существует в корне curl -I https://example.com/llms.txt → HTTP 200
Content-Type корректный text/plain или text/markdown в заголовке ответа
Файл не пустой curl https://example.com/llms.txt | wc -l → больше 0
Есть описание сайта H1 с названием (обязателен); строка с > для описания (рекомендуется)
Есть ссылки на ключевые разделы Минимум 3–5 абсолютных URL с описаниями
Lighthouse: пройдено или Не применимо (не server error) DevTools → Lighthouse → Agentic Browsing → llms.txt: пройдено или Не применимо

Как измерять эффект

Прямых метрик нет. llms.txt не создаёт события в аналитике, не генерирует UTM-трафик, не появляется в Search Console. Косвенные индикаторы, которые стоит отслеживать:

Самая честная проверка — server logs. Нужно смотреть, запрашивают ли реальные HTTP user agents файл /llms.txt: ChatGPT-User, GPTBot, ClaudeBot, PerplexityBot, Bytespider и другие. Если запросов нет — файл пока работает как подготовка инфраструктуры, а не как активный канал AI-видимости. Если запросы есть — агентные системы реально обращаются к вашему сайту. Отдельная оговорка: Google-Extended — это product token для robots.txt, а не самостоятельный HTTP user-agent. В логах сервера он не появится как отдельная строка — Google crawls идут через стандартные Google user agents.

Что не считать эффектом llms.txt

Кому внедрять сейчас, а кому можно подождать

Кому Приоритет Почему
SaaS, DevTools, API-продукты Сейчас Агенты активно используют эти сайты для задач разработчиков. ChatGPT и Grok уже читают файлы таких продуктов
Агентства и консультанты с AI-аудиторией Сейчас Низкий порог внедрения, высокая релевантность для аудитории, которая работает с AI-инструментами
Контентные медиа и блоги Опционально Агентные сценарии существуют, но менее часты. ROI зависит от аудитории
E-commerce, локальный бизнес Подождать Агентный трафик в этих нишах пока минимален. Инвестиции в Schema.org и технический SEO принесут больше
Корпоративные сайты без API/продуктов Низкий приоритет Агентные сценарии нетипичны. Можно сделать базовый файл «для галочки» в Lighthouse

Частые вопросы

Нет. Google Search Central прямо пишет: для появления в AI Overviews и AI Mode не нужно создавать специальные машиночитаемые файлы, в том числе llms.txt. Для участия в AI Overviews важны обычные требования: индексируемость страницы, возможность показа сниппета, качество и релевантность контента. llms.txt решает другую задачу — навигацию для AI-агентов, а не поисковое ранжирование.

Нет. Ни одна из 8 протестированных систем не обращается к /llms.txt автоматически. ChatGPT 5.5 и Grok 4 читают файл при прямом запросе («прочитай /llms.txt на сайте X») и называют его первым шагом в агентном сценарии, когда их спрашивают о подходе к анализу сайта. Это не то же самое, что фоновое сканирование без запроса.

По спецификации llmstxt.org единственный обязательный элемент — H1 с названием сайта или проекта. Строка с > (краткое описание) технически необязательна, но настоятельно рекомендуется: именно она даёт агенту быстрый контекст без чтения всего файла. Разделы с ссылками — рекомендуемая структура, а не требование.

Lighthouse проверяет llms.txt в экспериментальной категории Agentic Browsing — это не SEO-аудит. Если файл возвращает 404, аудит помечается как «Не применимо»: файл пока необязателен. Ошибку Lighthouse фиксирует только при серверных проблемах — когда запрос к /llms.txt возвращает 5xx. Содержимое файла инструмент не оценивает.

Необязательно, но полезно для SaaS и API-продуктов. llms.txt — краткая навигационная карта (50–150 строк). llms-full.txt — расширенная версия с полным контентом документации, до 500+ строк. Агент с ограниченным контекстом читает llms.txt. Агент, которому нужна глубокая работа с продуктом, может обратиться к llms-full.txt. Vercel и Anthropic (на docs-поддомене) используют оба файла.

Вывод

ChatGPT и Grok начинают с /llms.txt, когда их спрашивают напрямую или задают агентный сценарий. Остальные шесть из восьми — нет. Ни одна не обратилась к файлу без запроса.

Что файл не делает: не поднимает позиции в Google, не гарантирует цитирование, не заменяет Schema.org, нормальный контент и robots.txt. Это не инструмент для AI Overviews — Google для этого llms.txt не нужен.

Что файл делает: снижает трение для агентных систем с реальным веб-доступом. Если ваша аудитория использует ChatGPT или Grok для задач, связанных с вашим продуктом, — файл работает. Это узкая, но реальная польза.

Базовый файл займёт 15–30 минут. Для SaaS и API-документации — отдельная мини-задача: структура, приоритеты, .md-версии, проверка логов. Но не стройте иллюзий: llms.txt — один слой инфраструктуры из многих, не точка перелома в AI-видимости.

Если хотите разобраться с AI-видимостью вашего сайта — я провожу технический аудит с разделом GEO/AI-accessibility. Проверяю llms.txt, Schema.org, entity-профиль, robots.txt для AI-краулеров и цитируемость в ключевых AI-системах. Бесплатная 30-минутная консультация, чтобы понять, есть ли смысл и с чего начать.

Написать в Telegram @staurus_seo