Большой сайт нельзя аудировать как обычный. Это не вопрос амбиций или масштаба — это вопрос другого типа проблем, другого инструментария и другой логики приоритизации.
На сайте с миллионами страниц вы физически не можете проверить каждый URL. Это не нужно. И это не поможет.
Enterprise SEO — это работа с системами, шаблонами и процессами. Не со страницами.
Что такое Enterprise SEO
Enterprise SEO — это не «SEO для большого сайта». Это другой класс задач. Размер играет роль, но он не главное. Главное — сложность системы: шаблоны, параметры, логи, команды, релизы, регрессии.
В обычном SEO единица работы — страница. В enterprise единица работы — шаблон, сегмент или процесс. Один шаблон на 400 000 страниц стоит дороже, чем тысяча точечных исправлений — и наоборот, один сломанный релиз может обрушить результаты годовой работы.
В этот класс обычно попадают проекты, где:
- Сотни тысяч и миллионы URL.
- Несколько шаблонов, каждый из которых отвечает за большой сегмент трафика.
- Регулярные релизы, затрагивающие SEO-критичные сигналы.
- Лог-анализ и crawl budget — постоянные темы, а не разовые проекты.
- Команда разработки и SEO работают в разных операционных циклах.
| Ось сравнения | Обычное SEO | Enterprise SEO |
|---|---|---|
| Единица анализа | Отдельная страница | Шаблон, сегмент, тип URL |
| Тип проблем | Точечные ошибки | Системные и шаблонные паттерны |
| Приоритизация | По чек-листу | По вкладу шаблона в money-трафик |
| Команда | 1–2 SEO-специалиста | SEO + разработка + аналитика + контент |
| Ключевые KPI | Позиции, трафик | Crawl coverage по шаблонам, indexation efficiency, выручка по сегментам |
| Частота регрессий | Редко | Каждый релиз — потенциальная регрессия |
| Роль логов и шаблонов | Опционально | Основной инструмент работы |
Какие сайты относятся к enterprise
Enterprise SEO редко совпадает с «большой бренд». Чаще это определённая бизнес-модель, у которой объём, структура и частота изменений делают поштучные исправления бессмысленными.
Маркетплейсы
Миллионы карточек, десятки тысяч продавцов, динамические фильтры и сортировки. Каждое изменение шаблона карточки или категории затрагивает сразу весь каталог.
E-commerce с большими каталогами
Интернет-магазины на 100K+ SKU с вложенными категориями, фасетной навигацией, вариациями товаров. Основная боль — index bloat от параметров и crawl budget на служебных URL.
Classifieds
Объявления, авто, недвижимость, вакансии. Высокая ротация контента, короткий жизненный цикл объявления, сложная связка гео + категория + фильтры.
Media и UGC
Новостные сайты, блог-платформы, форумы, контент-порталы. Масштаб создаётся пользователями или редакцией в высоком темпе — архитектура тегов и разделов критична для crawl budget.
SaaS, docs, help-center
Документация продуктов, справочные базы, changelog-страницы. Объём растёт с функционалом, версии и языки создают параметрические дубли и проблемы канонизации.
Multi-brand и multi-region
Несколько брендов или стран на общей платформе. Для multi-brand и multi-region сайтов характерны: hreflang, зеркала, региональные версии, общие шаблоны с локальными отклонениями — enterprise даже при умеренном числе URL на бренд.
Качество исходных данных: где enterprise SEO ломается до шаблона
Прежде чем трогать шаблоны — проверь данные. Шаблон может быть технически безупречным, а выдача всё равно мусорная: потому что данные, которые он рендерит, битые. На enterprise это не редкость — это системная проблема.
Типичные источники мусора на уровне данных: пустые поля в базе (название товара есть, описание — нет), дубли в фидах от поставщиков (один и тот же артикул с разными атрибутами от трёх поставщиков), неунифицированные категории (один товар в трёх разных рубриках в зависимости от источника фида), битые атрибуты, нулевые значения там, где должны быть характеристики. Каждый такой случай — потенциально тысячи страниц, которые шаблон сгенерирует, но которые поисковик воспримет как low-quality или near-duplicate.
Последствия предсказуемы: пустые h1 и title там, где шаблон ждёт данных из поля «название»; мусор в фасетах («цвет: null», «размер: неизвестно»); раздутый index bloat из-за мусорных комбинаций фильтров с пустыми атрибутами; карточки-пустышки, которые технически индексируются, но реально не несут контента.
Решение — data validation pipeline на уровне PIM или CMS: обязательные поля как условие публикации, ретро-проверка существующего каталога, блокировка публикации до выполнения минимума. Это не SEO-задача — это задача для команды данных, но SEO должен её инициировать и поставить требования. Без этого любая работа с шаблонами даёт половину результата.
Programmatic SEO и масштабируемый рост страниц
Programmatic SEO — это не «автогенерация страниц». Это умножение качества на масштаб. Если данных нет, спроса нет и шаблон производит мусор — programmatic SEO это просто автоматизированный index bloat. Разница между growth-template и мусорным шаблоном определяется одним вопросом: есть ли уникальный поисковый спрос на каждый из этих URL?
Когда автогенерация страниц оправдана: спрос реально есть (хотя бы 50–100 запросов в месяц по шаблонному паттерну), данные заполнены и уникализированы, каждая страница решает задачу пользователя, а не просто воспроизводит шаблон с подставленным ключевым словом. Без этих трёх условий — programmatic не работает.
Growth-template vs мусорный шаблон
Есть самостоятельный спрос на каждую комбинацию. Данные заполнены — цены, описания, характеристики. Каждая страница отвечает на конкретный запрос, а не просто агрегирует.
Шаблон генерирует URL по всем комбинациям подряд без проверки спроса. Контент на 90% одинаковый, различается только подставленное ключевое слово. Нет данных — страницы пустые или с заглушками.
Какие page types масштабируются
Есть несколько паттернов, которые стабильно работают при правильных данных:
- Category × location — «ноутбуки в Москве», «аренда авто в Санкт-Петербурге». Работает при наличии локального стока или предложений.
- Brand × category — «телефоны Samsung», «кроссовки Nike мужские». Хорошо масштабируется при наполненных карточках.
- FAQ по паттернам — вопросы типа «как выбрать [товар]», «чем отличается [A] от [B]» с реальными ответами из базы знаний.
- Comparison pages — «[продукт A] vs [продукт B]» при наличии структурированных характеристик для сравнения.
- Региональные посадочные — при наличии реального регионального контента: адреса, цены, наличие.
Programmatic SEO без link graph не работает даже при хороших данных. Новые страницы, на которые нет внутренних ссылок, краулер не обходит регулярно. Link graph для programmatic — обязательная часть запуска, не опциональная.
Страницы vs шаблоны: принципиальная разница
Когда у вас 500K страниц и title на 80% из них генерируется одним шаблоном — проблема не в 400K страниц. Проблема в шаблоне.
Исправьте шаблон — закрыли 400K проблем одним коммитом. Продолжайте исправлять страницы поштучно — через год окажетесь на том же месте, только с большим техдолгом.
В чём главное расхождение
Чиним конкретные страницы, находим конкретные ошибки. Стандартный чек-лист работает.
Ищем дисфункциональные шаблоны, сегменты индекса и системные паттерны. Поштучные исправления — пустая трата времени.
Crawl budget: когда это реально проблема
Crawl budget становится реальным ограничением, когда объём сайта значительно превышает возможности бота обойти его за разумный срок.
Практическая эвристика: если ваш сайт содержит сотни тысяч URL и Googlebot по данным логов обходит менее 1–2% страниц в день — это сигнал, что crawl budget требует управления. Точный порог зависит от авторитетности домена, частоты обновлений и структуры.
- Важные страницы могут месяцами не переиндексироваться после изменений.
- Мусорные страницы в индексе расходуют бюджет в ущерб полезным.
- Новые разделы могут не появляться в выдаче неделями.
Поэтому первый вопрос в enterprise-аудите — не «есть ли дубли», а «как распределяется crawl budget и куда бот ходит чаще всего». Ответ — только в логах.
Лог-анализ: что видит бот против того, что видите вы
Server logs — единственный источник правды о том, как поисковый бот реально обходит сайт. GSC даёт агрегированную картину. Sitemap.xml — ваши намерения. Логи — реальность.
В логах видно:
- Какие разделы бот обходит чаще всего.
- Какие URL запрашивает, но не индексирует.
- Есть ли аномальные всплески запросов — сигнал проблемы.
- Насколько часто обходятся приоритетные коммерческие страницы.
- Какие страницы не посещались месяцами.
# 1. Установить зависимость (один раз): pip install openpyxl # 2. Положить log_analyzer.py в папку с лог-файлами (.log / .txt) и запустить: python log_analyzer.py # Что получите в log_analysis.xlsx: # Stats_* — топ URL, IP, статус-коды, распределение по часам # UA_* — все user agent с числом запросов # Bot_RL_* — rate-limit: Googlebot, Yandexbot, другие боты # Что смотреть в первую очередь: # 1. Bot_RL_* → max_requests_per_minute Googlebot — норма 1–3, аномалия > 20 # 2. Stats_* → url_counts по паттерну /page/, /filter/, /?= — # если > 40% краулинга, crawl budget уходит в мусор # 3. UA_* → незнакомые боты с высокой частотой — кандидаты на блокировку
Анализ шаблонов: одна проблема = миллион страниц
Проблемы на enterprise-сайтах существуют в двух режимах:
- Системные — возникают из шаблона и воспроизводятся на всех страницах, созданных по нему.
- Точечные — локализованы на конкретных URL и не масштабируются.
Большинство времени на enterprise-аудите нужно тратить на системные проблемы. Что ищем в шаблонах:
- Генерация дублирующегося title/description.
- Шаблонные h1 без уникализации.
- Canonical, который всегда указывает на себя — даже там, где это неверно.
- JavaScript-зависимые блоки, которые бот не видит.
- Пустой контент на страницах, сгенерированных из пустых полей базы данных.
Сегментация: «денежные шаблоны» в приоритете
На большом сайте всегда будет много шаблонов. Не все они одинаково важны. Логика: сначала работаем с сегментами, которые приносят деньги или имеют наибольший потенциал. Трафик сам по себе не всегда коррелирует с доходом — важна маржинальность и конверсия.
| Сегмент | Приоритет и логика |
|---|---|
| Категории 1–2 уровня | Максимальный: высокочастотные запросы, высокая маржа, прямой трафик |
| Карточки топ-продаж | Высокий: транзакционный спрос, конверсия, маржинальные товары |
| Страницы брендов | Средний: коммерческий, более узкий спрос |
| Страницы фильтров | Только при ценном уникальном спросе, иначе — noindex |
| Пагинация | Управлять краулингом, не давать попадать в индекс без нужды |
| Блог / контент | После коммерции — информационный трафик в воронку |
Index bloat: невидимая проблема
Index bloat — ситуация, когда в индексе находятся тысячи или миллионы страниц без реальной ценности.
Есть управленческий аспект: команда теряет фокус. Когда в GSC 5M страниц и половина из них — мусор, сложно понять, что реально нужно улучшать. Отчёты засорены, приоритеты размыты.
Типичные источники index bloat:
- Страницы пагинации без ограничений.
- Фильтры с параметрическими URL без управления.
- Технические страницы: авторизация, корзина, поиск по сайту.
- Устаревшие URL после редизайна или миграции.
- Дубли: trailing slash, www/без www, http/https.
Управление процессами: почему enterprise SEO ломается изнутри
Index bloat — это не только техническая проблема. Технические страницы попадают в индекс не потому что «так настроено», а потому что нет процесса, который не дал бы им туда попасть. Это уже вопрос управления SEO-процессами.
На больших сайтах SEO ломается не только снаружи. Оно ломается в процессах разработки, деплоя и управления контентом.
Чек-лист перед каждым релизом
Список SEO-проверок перед любым деплоем, затрагивающим шаблоны или URL-структуру. Без него каждый релиз — потенциальная регрессия. Классика: разработчик обновляет шаблон категорий, canonical сбрасывается на дефолт — 300 000 страниц теперь указывают сами на себя.
Проверка на тестовом окружении
Обязательный этап перед выкаткой в прод: title, canonical, robots, структура ссылок по SEO-критичным шаблонам. На ряде крупных проектов SEO-регрессия на боевом сервере обнаруживалась через две недели — когда Google уже переиндексировал.
Карта ответственных по типам страниц
У каждого типа страниц — конкретный ответственный, который согласует изменения с SEO-стороны. Нет ответственного — нет контроля. Типичная история: «мы не знали, что это сломает индекс».
Шаблон SEO-требований для разработки
Стандартный документ: как описывать SEO-требования в задачах разработчикам. Убирает «я не знал, что это влияет на SEO» — потому что всё написано до начала работы.
Процесс вывода URL из оборота
Как правильно удалять страницы: редиректы, noindex, консолидация. Без процесса страницы накапливаются годами. Видел сайты с 40% индекса из устаревших URL после трёх миграций — ни одна не была закрыта по правилам.
Фасетная навигация, фильтры и параметрические URL в Enterprise SEO
Фасетная навигация (faceted navigation) — один из главных источников проблем в enterprise SEO. На крупном e-commerce или classifieds каждая комбинация фильтров, сортировок и параметров может создавать новый URL. Один каталог на 10 000 товаров превращается в несколько миллионов страниц в индексе без единой новой строчки контента.
Какие фильтры индексируем, а какие — нет
Правило простое: индексируем те фасеты, у которых есть собственный спрос. Всё остальное — служебные URL, они нужны пользователю, но не поисковику.
- Индексируем: категории, бренды, типы товаров, цены в диапазонах, если под них есть запросы.
- Не индексируем: сортировки, сессионные параметры, UTM, персональные состояния, комбинации трёх и более фильтров одновременно.
- Спорная зона: размеры, цвета, материалы — проверяется по частотности запросов, а не «на всякий случай».
Как отличить ценные фасеты от мусора
Для каждого потенциально индексируемого фасета должно быть три «да»:
- Есть ли самостоятельный поисковый спрос на эту комбинацию?
- Есть ли у страницы уникальный смысл для пользователя — не просто отфильтрованный список, а посадочная страница?
- Готовы ли вы поддерживать контент и ссылки на эту страницу так же, как на обычную категорию?
Если хотя бы одно «нет» — это не SEO-страница, это служебный URL. Закрываем от индексации.
Canonical, noindex, robots и внутренние ссылки
Инструменты управления фасетами
Указывает предпочтительную версию, но не запрещает краулинг. Подходит для близких дубликатов (сортировки одной категории), не подходит для принципиально разных страниц.
Убирает страницу из индекса, но бот всё равно её обходит. Хорошо для фильтров, которые нужны пользователю, но не должны попадать в поиск.
Запрещает сам обход. Экономит crawl budget напрямую — но теряется передача сигналов. Применяется к точным шаблонам URL с параметрами сортировки, сессий, поиска.
Самый недооценённый инструмент. Если на служебную страницу нет внутренних ссылок — бот её почти не находит. Управление линковкой работает до любых canonical и noindex.
Как посчитать «полезные» и «мусорные» параметрические URL
Базовая методика:
- Выгружаем все параметрические URL из GSC Coverage и логов сервера.
- Сопоставляем с частотностью запросов: есть ли спрос на эту комбинацию параметров?
- Смотрим долю трафика и конверсий на этих URL за 90 дней.
- Всё, что не приносит ни трафика, ни запросов с реальным спросом — кандидат на закрытие.
Internal linking: link graph как инфраструктура краулера
Большинство SEO-специалистов думают о перелинковке как о способе передать вес с одной страницы на другую. На enterprise — это инфраструктура, по которой краулер вообще доходит до money templates. Нет ссылочной структуры — нет обхода, каким бы хорошим ни был robots.txt.
На большом сайте краулер не ходит по sitemap и не угадывает — он переходит по ссылкам. Внутренний link graph — это и есть карта дорог для бота. Ничто другое не заменяет её в полной мере.
Orphan pages: катастрофа на масштабе
Orphan pages — страницы без входящих внутренних ссылок. На сайте в 10 000 URL найти их легко. На сайте в 10 000 000 — они могут существовать годами, съедать crawl budget через sitemap и давать ноль результата: бот не обходит страницы, на которые никто не ведёт.
Типичные источники орфанов: страницы после миграции, где link graph не пересобрали под новые URL; автогенерированные карточки из фидов, не связанные ни с одной категорией; старые разделы, убранные из меню, но не закрытые и не переадресованные; страницы, на которые вели только удалённые разделы. Диагностика: Screaming Frog crawl + sitemap + GSC Coverage + логи. Орфаны — это URL, которые есть в sitemap или логах, но на которые Screaming Frog не пришёл ни по одной внутренней ссылке.
Crawl depth и money templates
Crawl depth (click depth) — сколько кликов нужно от главной страницы до конкретного URL. Типичная проблема на enterprise: money templates (карточки топ-продаж, категории с высокой конверсией) лежат на глубине 6–7 кликов. Бот обходит их реже, link equity доходит в остатках, индексация хромает — не потому что robots.txt что-то запрещает, а потому что структура сайта сама по себе отодвигает важные страницы на задворки.
Правило: money templates должны быть на глубине максимум 3–4 кликов от главной. Реализация — через хаб-страницы верхнего уровня, sitemap-страницы с прямыми ссылками на топ-карточки, перелинковку из блоков популярных категорий.
Link equity между шаблонами
Два паттерна распределения ссылочного веса
Главная и хабы верхнего уровня накапливают вес, но слабо раздают вниз. Карточки в хвосте каталога голодают — низкий приоритет краулинга, медленная индексация, слабое ранжирование.
Через хабы, related-блоки, breadcrumbs и тематические подборки вес стекает к money templates. Карточки индексируются, переобходятся после изменений, ранжируются в хвостовых запросах.
Инструменты распределения link equity: breadcrumbs (базовый минимум), related products / похожие товары (поведенческие данные), блоки «из той же категории», кросс-категорийные ссылки на тематические подборки, теги как хабы второго уровня, посадочные страницы под кластеры запросов.
Link hubs и автоматическая перелинковка
Хаб — страница-концентратор, которая связывает множество money-URL в одном шаблоне. Категории первого-второго уровня, тематические подборки, лендинги под кластеры запросов. Хабы решают две задачи одновременно: сокращают click depth и передают link equity к страницам, до которых иначе бот доберётся через месяц.
На enterprise перелинковка должна быть частью шаблона, не ручной работой редактора. Редактор физически не справится на 10 000 000 URL. Автоматическая реализация: категории ↔ карточки ↔ фильтры с ценным спросом, related-блоки по поведенческим данным, блоки «из той же категории» в шаблоне карточки.
XML Sitemap strategy: декларация, а не подсказка
У многих enterprise-специалистов отношение к sitemap — «зачем он нужен, если я смотрю логи». Это ошибка. Sitemap и логи решают разные задачи. Логи показывают, что бот реально обходит. Sitemap — что вы считаете своим индексом. Расхождение между ними — самый мощный диагностический инструмент на крупных проектах.
Sitemap index: организация для крупных сайтов
У одного sitemap-файла есть ограничения: 50 000 URL и 50 МБ. Для сайтов с несколькими миллионами URL нужен sitemap index — файл, который ссылается на сотни отдельных sitemap. Сегментация по логике бизнеса: sitemap-categories.xml, sitemap-products-1.xml … sitemap-products-N.xml, sitemap-brands.xml, sitemap-articles.xml. Money templates — обязательно в отдельных файлах, изолированно от служебных страниц.
Зачем сегментировать sitemap
- В GSC и Яндекс.Вебмастере статистика индексации показывается по каждому sitemap-файлу отдельно — можно увидеть, какой именно сегмент проседает, без разбора всего каталога.
- При проблемах с индексацией диагностика занимает минуты, а не часы: смотришь на конкретный файл, а не на общую цифру.
- Money templates в отдельном файле — сразу виден процент реально проиндексированных коммерческих URL.
- Новые сегменты можно регистрировать отдельно и отслеживать динамику с нуля.
lastmod как сигнал на переобход
lastmod не гарантирует переобход, но корректные значения и Google, и Яндекс используют для приоритизации. Главное правило: обновляйте lastmod только тогда, когда контент действительно меняется. Автогенерация lastmod=now на все URL убивает доверие к сигналу — боты перестают на него реагировать. Для money templates это критично: если цена, наличие или ключевые атрибуты изменились — lastmod должен обновиться, чтобы бот пришёл переобойти страницу.
Главный диагностический паттерн: sitemap ↔ logs ↔ GSC/Вебмастер
| Что сравниваем | Что показывает |
|---|---|
| Sitemap vs GSC «Indexed» | Декларируем, но Google не включил в индекс — сигнал проблем с качеством, каннибализацией или дублями |
| Sitemap vs логи Googlebot | Декларируем, но бот не обходит — проблема link graph или низкий приоритет по внутренним сигналам |
| Логи vs GSC «Indexed» | Бот ходит, но в индексе нет — signal rejection (качество, дубли, Low Quality контент) |
| Sitemap vs Яндекс.Вебмастер | Расхождение с Google — dual-stack проблема: разная логика работы с параметрами и зеркалами |
KPI и dashboard для Enterprise SEO
На enterprise-проектах метрики «позиции» и «общий трафик» почти бесполезны. Они агрегируют всё в одну цифру и скрывают то, что реально ломается — один шаблон или один сегмент. KPI должны строиться вокруг шаблонов и crawl-поведения, а не вокруг страниц.
Доля краулинга по money templates
Сколько % запросов Googlebot и YandexBot уходят на шаблоны, которые приносят деньги (категории, карточки, ключевые посадочные). Всё, что ниже 40–50%, — сигнал утечки crawl budget.
Indexation efficiency
Отношение «страниц в индексе» к «страниц, которые должны быть в индексе». Считается по шаблонам, а не по всему сайту. Ниже 80% в money-шаблонах — приоритетная проблема.
Полезные URL vs мусор в индексе
Доля шаблонов с реальным спросом и трафиком против служебных, параметрических и устаревших URL. На старте аудита типично 30/70 не в пользу полезных. Цель — перевернуть пропорцию.
Time-to-index
Сколько времени проходит от публикации новой страницы до её появления в индексе и выдаче. Метрика time-to-index замеряется по свежим шаблонам — карточки, объявления, статьи. Тренд важнее абсолютного значения.
Re-crawl latency после релизов
Сколько дней нужно Googlebot и YandexBot, чтобы переобойти ключевой шаблон после изменений. Метрика re-crawl latency критична: если релиз вышел неделю назад, а бот ещё не подошёл, вы не увидите эффекта и не успеете откатить регрессию.
Coverage важных шаблонов
Процент URL в каждом money-шаблоне со статусом «Indexed» в GSC. Падение на 5–10% — уже повод для расследования, не для спокойствия.
Органическая выручка и лиды по сегментам
Выручка и лиды в разрезе сегментов и шаблонов, а не всего сайта. Позволяет считать ROI работы по шаблонам, а не «общий рост SEO».
Доля шаблонов с корректными SEO-сигналами
По каждому шаблону проверяется: title, description, canonical, noindex, structured data. Сколько % шаблонов проходят чек-лист без регрессий — это единственная метрика, которая ловит поломки релизов.
Structured Data at Scale: разметка на миллионах URL
Добавить разметку Schema.org на один лендинг — задача на час. Развернуть structured data на миллионы URL — это уже архитектурная задача. Один баг в шаблоне разметки = миллион ошибок в GSC Rich Results и Яндекс Вебмастере за одну ночь. На enterprise масштаб меняет всё: контроль, приоритеты, мониторинг.
Структурированная разметка на enterprise — это не «добавили разметку». Это управляемый rollout по типам страниц с постоянным мониторингом ошибок в шаблонах. Главный риск: template-wide баг. Разработчик меняет шаблон карточки → поле price перестаёт попадать в разметку → миллион карточек теряет Product schema за один деплой.
| Тип страницы | Приоритетная schema | Почему |
|---|---|---|
| Карточка товара | Product + Offer (price, availability, currency) | Прямой выход в rich snippets: цена в выдаче, звёзды рейтинга, наличие. Максимальный CTR-буст. |
| Все страницы | BreadcrumbList | Хлебные крошки в Google и Яндексе, улучшение навигации в SERP, минимальный риск ошибок. |
| Категория / листинг | ItemList + BreadcrumbList | Разметка списка товаров улучшает понимание структуры сайта поисковиком. |
| Статьи, FAQ-страницы | Article / FAQPage | FAQPage даёт раскрытые ответы в SERP. Article — сигналы E-E-A-T для контентных шаблонов. |
| Главная / бренд-страница | Organization + AggregateRating | Entity signal, рейтинг компании в knowledge panel. |
| Локальный бизнес | LocalBusiness + GeoCoordinates | Региональные карточки, Local Pack в Google, привязка к геозапросам. |
Порядок приоритизации при rollout
На enterprise нельзя раскатывать всё сразу — слишком высок риск template-wide ошибок. Правило: сначала деньги, потом навигация, потом усиление.
- 1. Product + Offer — деньги прямо сейчас. Карточки с ценой и наличием в rich snippets дают измеримый рост CTR.
- 2. BreadcrumbList — низкий риск, высокий охват. Раскатывается на все шаблоны одним коммитом.
- 3. FAQPage на категориях — там, где есть реальные FAQ и статистика запросов это подтверждает.
- 4. Review + AggregateRating — только при наличии реальных отзывов. Фейковые рейтинги — путь к manual action.
- 5. SiteLinksSearchBox — последний приоритет, влияние минимальное.
priceCurrency в JSON-LD. Итог: 4,2M карточек потеряли поле currency в Product schema. GSC зафиксировал ошибку через 48 часов, но в Яндекс.Вебмастере регрессия появилась только через неделю. Фикс занял 20 минут. Обнаружение — 4 дня. Причина задержки: мониторинг GSC Rich Results проверялся раз в неделю вручную, а не автоматически.
Enterprise SEO на русскоязычном рынке: Google, Яндекс, регионы и шаблонные дубли
Enterprise SEO в RU — это не калька с англоязычной практики. Здесь работают два поисковика одновременно, с разной логикой индексации, разными инструментами вебмастера и разными типичными проблемами.
Dual-stack: Google и Яндекс одновременно
На большинстве русскоязычных enterprise-сайтов Яндекс даёт сопоставимый или больший трафик, чем Google — особенно в e-commerce, classifieds и медиа. Это значит, что нельзя строить стратегию только под Googlebot. Любое решение — canonical, robots.txt, редирект, обновление шаблона — оценивается сразу по двум поисковикам.
Типичная ошибка — проводить аудит «по англоязычным гайдам» и получать внезапные провалы в Яндексе: разная скорость переобхода, разная реакция на параметры, разная работа с зеркалами.
Лог-анализ по Googlebot и YandexBot раздельно
На enterprise-проекте в RU логи нужно фильтровать по обоим ботам и смотреть как единое поведение, так и расхождения:
- Какие шаблоны Googlebot обходит чаще, какие — YandexBot.
- Есть ли сегменты, где один бот ходит интенсивно, а другой их почти игнорирует.
- Как каждый бот реагирует на изменения в robots.txt, canonical и sitemap — скорость и полнота переобхода различаются.
Разные симптомы индексации
Google vs Яндекс: типичные расхождения
Агрессивнее кэширует и склеивает дубли по canonical. Быстрее выбрасывает из индекса страницы с низким качеством. Лучше переваривает JavaScript-контент.
Дольше держит устаревшие страницы в индексе. Острее реагирует на фильтры и параметры как на дубли. Медленнее обновляет выдачу после редизайна. Сильнее учитывает региональность и поведенческие сигналы.
Зеркала, параметры, региональность, шаблонные дубли
- Зеркала: http/https, www/без www, разные домены одного проекта — на больших сайтах это до сих пор живая проблема, особенно после миграций. В Яндексе история с главным зеркалом решается через редиректы и Вебмастер.
- Параметры URL: Яндекс чаще создаёт лишние дубли по параметрам, чем Google. Clean-param в robots.txt и согласованные canonical — обязательны.
- Региональность: для проектов на всю РФ — региональные поддомены, директории или единый домен с региональными страницами. Каждая схема тянет за собой разную модель crawl budget и разные шаблонные дубли.
- Шаблонные дубли: один и тот же шаблон категории на десятках регионов, различающийся только названием города и склонением — классическая enterprise-проблема в RU, которую англоязычные гайды не закрывают.
Hreflang и multi-country: где enterprise теряет пол-индекса
Для multi-region и multi-brand проектов hreflang — не «рекомендация для Google», а способ выжить. Любая ошибка в мультистране раздувает индекс на порядки и создаёт массу near-duplicate страниц, которые поисковик выбрасывает вместе с оригиналами.
Когда нужен hreflang, а когда — отдельная структура
Два подхода к мультистране
Контент один, но для разных языков или стран (en-us, en-gb, de-de). Используются директории или параметры. Подходит для SaaS и global e-commerce с единым каталогом.
Контент действительно разный в каждой стране: товары, цены, правила. Тогда это набор фактически независимых сайтов под одним брендом, hreflang здесь лишний.
Конфликт canonical + hreflang
Классическая ошибка: canonical указывает на en-us со всех локалей. При этом hreflang декларирует независимость каждой локали. Результат: Google игнорирует локальные версии, весь трафик консолидируется на одной версии, региональный трафик теряется. Правило: canonical должен быть self-referencing на каждой локальной версии. Hreflang — реципрокный, все ссылаются на всех.
Index bloat через мультистраны
Шаблон на 100 000 URL × 15 локалей = 1 500 000 URL в индексе. Если 80% контента на локалях — машинный перевод или прямая копия, Google классифицирует как near-duplicate и выбрасывает. Правило enterprise: локальная версия должна отличаться не только языком, но и контентом — цены, наличие, региональные особенности. Иначе это раздувание индекса без трафика.
Миграции и replatforming: где enterprise теряет больше всего
Enterprise SEO теряет больше всего именно на миграциях — не на плохой техничке, не на дублях и не на медленных шаблонах. Любая сложная миграция — это момент, когда годы накопленных сигналов могут схлопнуться за неделю, если не предусмотреть каждый слой.
Основные сценарии миграций
Смена CMS
Шаблоны, URL, рендеринг меняются одновременно. Максимальный риск — всё меняется сразу, отследить регрессии сложнее всего.
Смена URL-логики
Даже без смены CMS: были /category/id, стали /category/slug. 100% URL проекта попадают под редиректы — весь link graph нужно пересобирать.
Объединение разделов
Два раздела сливаются в один. Канонические URL меняются, старые остаются как редиректы. Риск потери link equity при неправильных цепочках.
Replatforming
Переезд с Bitrix на другую платформу, смена e-commerce движка. Параллельно — смена шаблонов и URL-структуры. Сложнее, чем каждый из них по отдельности.
Смена шаблонов без смены URL
«Косметическая» миграция, но если поменялись h1, title, структура контента — Google пересматривает релевантность. Возможны просадки даже без изменения URL.
Доменная миграция
Смена домена, объединение зеркал, переход на единый домен из региональных. Самый сложный сценарий в RU из-за специфики Яндекса с главным зеркалом.
Ключевые риски
- Потеря исторических сигналов — страницы, которые копили ссылочный вес годами, получают новые URL без редиректов → вес обнуляется.
- Разрыв redirect chains — A → B → C → D. Бот останавливается после 3–4 прыжков. Один промежуточный редирект сломан — страница D становится orphan.
- Index bloat после миграции — старые URL остаются в индексе неделями, новые параллельно индексируются → дубли, каннибализация.
- Потеря link graph — если не пересобрать внутреннюю перелинковку под новые URL, money templates становятся orphan.
- Расхождение Google и Яндекс — Google переобходит быстрее, Яндекс может месяцами держать старые URL. Dual-stack мониторинг обязателен.
План миграции с SEO-точки зрения
Pre-migration audit
Полная карта текущих URL, логов, индекса, ссылочного веса. Замер базовых показателей по шаблонам, money templates, crawl rate. Без этого нет точки отсчёта для оценки потерь.
Сопоставление старых URL с новыми
1:1 карта всех money URL. Для генерируемых URL — правила редиректов. Обязательный sign-off от SEO перед началом работ разработки.
Тестовое окружение
Все SEO-сигналы проверены на staging до выкатки: canonical, robots, hreflang, структура внутренних ссылок, sitemap, редиректы (301, не 302).
Поэтапный rollout
По возможности выкатываем частями: сначала небольшой сегмент, проверяем индексацию и логи — потом остальное. Один ошибочный шаблон не ломает весь сайт.
Post-migration мониторинг
Ежедневно в течение 4–8 недель: crawl rate по шаблонам, индексация новых URL, скорость отпадания старых, позиции по money-запросам, логи на 404 и redirect chains.
SEO Governance: операционная модель вместо пожаротушения
Ранее в статье (в разделе про управление процессами) мы говорили про базовые процессы: чек-листы, проверки на стейдже, ответственные за шаблоны. Это минимум. SEO Governance — уровень выше. Это взрослая операционная модель: RACI, sign-off, SLA, release gates, SEO QA, бэклог-процесс. На крупных проектах без этого SEO превращается в хаотичное пожаротушение, где каждый аудит откатывается через полгода.
RACI: кто owner по шаблону и сегменту
RACI — Responsible, Accountable, Consulted, Informed. На enterprise каждый шаблон и каждый money-сегмент должен иметь чёткую структуру ответственности:
- Responsible — кто делает работу (разработчик, контент-менеджер)
- Accountable — кто отвечает за результат (SEO-owner шаблона)
- Consulted — кто должен быть опрошен до изменений (SEO-lead, аналитика)
- Informed — кто уведомляется после (product, marketing)
Без явного accountable любая задача по шаблону зависает между отделами — «мы думали, они отвечают». Это стандартная история на крупных проектах без RACI.
SEO sign-off в процессе разработки
Любое изменение шаблонов, URL, meta-тегов, структурных сигналов проходит через SEO sign-off. Sign-off не «на словах», а в трекере: тикет не переходит в статус «done» без пометки от SEO. В Jira или Linear это реализуется кастомным workflow или обязательным reviewer. Через 3–6 месяцев работы с таким процессом большинство разработчиков начинают учитывать SEO-требования ещё до постановки задачи — sign-off становится обучающим инструментом.
Release gates для SEO-критичных изменений
Release gate — автоматическая или ручная проверка перед деплоем, которая блокирует релиз при срабатывании правил. Примеры автоматических gates: canonical не self-referencing на money templates — блок; robots.txt заблокировал раздел с трафиком — блок; sitemap уменьшился более чем на 10% — блок; noindex на money template — блок. Gates встраиваются в CI/CD. Для команд с частыми релизами — это единственный способ гарантировать, что деплой не ломает индексацию.
SLA на исправление SEO-регрессий
| Тип регрессии | Примеры | SLA |
|---|---|---|
| Critical | Money templates выпали из индекса, robots заблокировал трафик-сегмент, битые canonical массово | Фикс в тот же день, эскалация до руководства |
| Major | Падение crawl rate на ключевом шаблоне, просадка impressions в GSC на 15%+, регрессия structured data | 2–3 дня на исправление |
| Minor | Ошибки в отдельных URL, точечные 404, неоптимальный title на небольшом сегменте | Плановый бэклог, 1–2 недели |
Без SLA любая регрессия обсуждается «когда будут ресурсы». На enterprise это стоит денег каждый день.
SEO QA после деплоя и бэклог-процесс
- После каждого релиза — автоматический smoke-тест по money templates: canonical, robots, noindex, статус-коды, structured data.
- SEO-требования в тикетах формулируются как критерии приёмки, а не «пожелания»: «canonical = self», «title по шаблону X», «noindex на сервисные страницы».
- Тикет без SEO-критериев приёмки возвращается без выполнения.
- В бэклоге SEO-задачи приоритизируются по тому же процессу, что и продуктовые: impact × effort.
Observability: мониторинг и алерты
Алерты на ключевые метрики: crawl rate drop, indexation drop, 404 spike, redirect chain depth, изменения canonical. Источники: логи сервера, GSC API, Яндекс.Вебмастер API, Screaming Frog scheduled crawls. Без observability регрессия обнаруживается через недели — когда трафик уже провалился. С observability — в день релиза, когда откатить ещё не поздно.
SEO Testing и Experimentation: тестировать до выкатки
На enterprise нельзя выкатывать изменения шаблона без тестирования. Это не осторожность ради осторожности — это математика. Один сломанный шаблон на 500 000 страниц стоит в 500 000 раз дороже, чем ошибка на одной странице. При такой цене ошибки staged rollout — не лучшая практика, а обязательное условие работы.
SEO тестирование на enterprise решает два типа задач: предотвращение регрессий (не сломай то, что работает) и оптимизация шаблонов (найди вариант, который работает лучше). Методы для каждой задачи разные.
Два основных метода SEO-тестирования
Изменение сначала применяется к 10% страниц шаблона. Смотрим на метрики за 2–3 недели: crawl rate, impressions, clicks, indexation efficiency. Нет регрессии — раскатываем на 100%. Есть просадка — откатываем без потери всего сегмента.
Сравниваем два похожих сегмента: один с изменением, другой без. Изменение в title, H1 или structured data — видим delta по GSC clicks и impressions между сегментами. Требует предварительной сегментации и 4–6 недель на чистый результат.
Что тестируем
- Title formats — шаблон заголовка на карточках («купить [товар] в Москве» vs «[товар]: цена, фото, отзывы»). Небольшое изменение формулы заголовка на категориях может дать +10–15% к clicks в GSC.
- Meta description patterns — влияние на CTR из выдачи. Включение цены или CTA в description.
- H1 patterns — как отличие H1 от title влияет на ранжирование по хвостовым запросам.
- Structured data variants — добавление/изменение полей в Product или FAQPage. Влияние на rich snippets и CTR.
- Internal link patterns — какие блоки перелинковки улучшают crawl rate на money templates.
Как оценивать результат
Главный инструмент оценки — hold-out group в GSC. Сегмент A (с изменением) vs сегмент B (без изменения). Смотрим: clicks, impressions, average position, CTR за период до и после. Для crawl-экспериментов — лог-анализ: изменился ли crawl rate по шаблону через 2–4 недели.
Минимальный период оценки: 2–3 недели для title/description, 4–6 недель для структурных изменений (internal linking, schema). Быстрые выводы за 3 дня — мусор. У больших шаблонов переобход и переиндексация занимают время.
Tooling Stack для Enterprise SEO
Enterprise SEO без инструментальной базы — это работа вслепую. Не потому что инструменты делают SEO за вас, а потому что без них вы физически не в состоянии видеть то, что происходит с сайтом на миллионах страниц. Ни один человек не обработает вручную 10M URL, 90-дневные логи и выгрузки GSC API одновременно. Tooling — это не комфорт, это инфраструктура.
Log Analyzer
Парсинг access logs с выгрузкой по user-agent. Нужен всегда — логи — это единственный источник правды о поведении краулера. Варианты: ELK Stack (Elasticsearch + Kibana) для больших объёмов, ClickHouse для аналитики в реальном времени, BigQuery если логи уже туда льются. Минимальное хранение: 90 дней логов.
Crawler
Screaming Frog или Sitebulb для шаблонного аудита. На enterprise нужен scheduled mode: еженедельный краул выборки из 10–50K страниц по шаблонам для мониторинга регрессий. Ручной запуск «раз в квартал» — не инструмент, а ритуал.
GSC API + Яндекс.Вебмастер API
Выгрузка в BI или в скрипт. Не ручной просмотр раз в неделю, а автоматическая агрегация данных по шаблонам: impressions, clicks, coverage — разбитые по сегментам, а не суммарно по всему сайту.
BI / Dashboard
Looker Studio или DataLens (для RU-проектов DataLens бесплатен и быстро интегрируется с Яндекс.Метрикой и ClickHouse). Дашборд сводит GSC + логи + crawler в одном представлении по шаблонам. Без этой сводки метрики существуют в изоляции и не дают общей картины.
Scheduled QA Crawls
Еженедельный автоматический краул репрезентативной выборки: по 100–500 URL с каждого money template. Проверяет canonical, noindex, title, status code, structured data. Регрессия обнаруживается за 7 дней, а не за месяц.
Alert Layer
Автоматические оповещения при отклонениях: crawl rate упал на X%, indexation coverage снизилась на Y%, всплеск 404-ошибок выше порога, изменение объёма sitemap. Источники: GSC API + лог-мониторинг. Уведомления в Telegram/Slack/email. Без алертов регрессию замечают тогда, когда трафик уже упал.
Storage
Минимум: выгрузки GSC за 16 месяцев (GSC хранит только 16, потом теряется), логи за 90 дней, снимки краулов за 6 месяцев для сравнения до/после изменений. Без исторических данных SEO-эксперименты непроверяемы.
Порядок работ
Лог-анализ + карта crawl budget
Понять реальность до любых изменений. Без этого вы оптимизируете то, что вы видите, а не то, что видит бот.
Устранение index bloat в коммерческих сегментах
Прямой выигрыш в crawl budget — бот перераспределяет ресурс на полезные страницы.
Исправление системных шаблонных проблем
В «денежных» сегментах. Мультипликативный эффект: одно исправление — тысячи страниц.
Управление процессами
Процессы, которые не дадут всему сломаться снова. Это не разовая задача — это изменение операционной модели.
JavaScript SEO
Если рендеринг создаёт проблемы с доступностью контента для бота — отдельный аудит.
Пошаговая инструкция: как начать enterprise-аудит
Запросить логи сервера за 30–90 дней
Запрос к DevOps/системному администратору: access.log с фильтрацией по user-agent Googlebot и Яндексбот. Минимум 30 дней, лучше 90 — нужна статистически значимая картина.
Составить карту сегментов
Выгрузить все URL из GSC Coverage и Screaming Frog, размечить по типу шаблона: категории, карточки, фильтры, пагинация, блог, технические страницы. Без этой карты лог-анализ превратится в хаос цифр.
Сопоставить логи с картой сегментов
Сколько процентов краулинга уходит на каждый сегмент? Сколько уходит на мусор (пагинация, фильтры, технические страницы)? Это и есть карта потерь crawl budget.
Найти шаблонные проблемы в «денежных» сегментах
Screaming Frog: выгрузка title, description, h1, canonical, noindex по каждому сегменту. Какой процент шаблонных? Есть ли аномалии? Одна шаблонная проблема = приоритет выше любой точечной.
Составить план по сегментам, а не по страницам
Приоритизировать работы по принципу: какой сегмент даёт максимальный возврат при минимальных правках шаблона? Каждый пункт плана — это шаблонное исправление, а не список конкретных URL.
Что входит в enterprise-аудит: deliverables
Большинство аудитов — это PDF на 200 пунктов. Каждый пункт описывает проблему, даёт рекомендацию и не даёт ответа на главный вопрос бизнеса: что делать первым, зачем и какой эффект ожидать. Enterprise-аудит — это не документ, это набор рабочих инструментов для трёх команд одновременно: разработки, менеджмента и SEO.
Карта сегментов + template inventory
Полная таксономия типов страниц: какие шаблоны существуют, сколько URL в каждом, какой трафик и выручка. Это основа для любой дальнейшей работы — без карты невозможно ни приоритизировать, ни объяснить что и зачем делается.
Crawl loss map
Карта потерь crawl budget по шаблонам: куда уходит краулинг, какие сегменты недообходятся, где бот тратит ресурс вхолостую. Строится на лог-анализе. Показывает, почему money templates индексируются медленно — и что с этим делать.
Index quality report
Соотношение useful/junk URL по каждому шаблону. Сколько страниц в индексе реально обслуживают запросы, сколько — мусор. Часто вскрывает, что 40–60% индекса — это нерабочие страницы, которые съедают crawl budget и размывают сигналы качества.
Приоритизированный roadmap: impact/effort матрица
Не список из 300 правок, а 15–25 задач, расставленных по приоритету на основе вклада в трафик и сложности реализации. Каждая задача — шаблонное исправление с оценкой охвата (сколько URL затрагивает), ожидаемым эффектом и зависимостями.
Governance framework
RACI по шаблонам и типам задач, SLA на регрессии, шаблон SEO-требований для тикетов, release gates — что нужно проверить до деплоя. Это не «пожелания» — это операционная модель, без которой аудит откатывается за полгода.
Dashboard + KPI framework
Набор метрик по шаблонам с настроенными источниками данных: GSC API, Яндекс.Вебмастер API, логи, Screaming Frog. Что мерить, как мерить, какие алерты поставить. Не «дашборд с красивыми графиками», а мониторинговая система для обнаружения регрессий.
Два отдельных отчёта: для разработки и для бизнеса
Разработке нужны технические задачи с критериями приёмки, примерами и тест-кейсами. Менеджменту нужен ROI-ориентированный отчёт: что сломано, что потеряно, что даст фикс в трафике и деньгах. Один документ не закрывает обе потребности.
Migration plan (опционально)
Если по результатам аудита понятно, что текущая платформа или URL-структура не позволяет решить системные проблемы — отдельный документ с планом replatforming: этапы, риски, pre/post-migration метрики, SEO sign-off на каждом этапе.
Когда нужен enterprise-аудит
Три вопроса для диагностики
- Миллионы страниц в индексе, но органический трафик на уровне сайта с 50K URL
- Каждый новый раздел или миграция даёт непредсказуемый результат — иногда рост, иногда провал без явной причины
- GSC Coverage показывает 30%+ URL со статусом «Crawled – currently not indexed» по коммерческим сегментам
Обычный техаудит: единица работы — страница, глубина — чек-лист, результат — список ошибок с рекомендациями.
Enterprise-аудит: единица работы — шаблон и сегмент, глубина — лог-анализ + crawl behavior + governance, результат — roadmap с ROI, RACI, dashboard и release gates.
- Понятные приоритеты: что делаем первым и почему именно это
- Roadmap с оценкой impact — не «улучшим SEO», а «исправление шаблона карточек даст +X% к краулингу этого сегмента»
- Мониторинговый dashboard, который работает после аудита, а не пылится в папке
Частые вопросы
Работа с шаблонами и системами, а не с отдельными страницами. Исправление одного шаблона закрывает сотни тысяч проблем. Плюс управление процессами — механизмы, которые не дают сломать исправленное снова.
Логи — единственный источник правды о том, как поисковый бот реально обходит сайт. GSC даёт агрегат, sitemap — ваши намерения. Логи показывают реальность: куда бот ходит, что игнорирует, где аномалии.
На сайте с миллионами страниц вы физически не можете проверить каждый URL. Обычный аудит даёт список ошибок. Enterprise-аудит ищет системные паттерны и шаблонные проблемы — каждая из которых затрагивает тысячи URL одновременно.
Индексируем только те фасеты, у которых есть собственный поисковый спрос и уникальный смысл посадочной страницы. Сортировки, сессионные параметры и комбинации трёх и более фильтров закрываем через robots.txt или noindex. Управление внутренними ссылками работает сильнее, чем любые canonical.
В RU работают два поисковика параллельно — Google и Яндекс — с разной логикой индексации, обхода параметров и работы с зеркалами. Каждое техническое решение нужно оценивать сразу по обоим ботам. Лог-анализ ведётся раздельно по Googlebot и YandexBot, а региональность и шаблонные дубли между городами — отдельный класс задач, которого нет в англоязычных гайдах.
Работаете с крупным сайтом?
Проведу аудит с сегментацией шаблонов и лог-анализом — реальные приоритеты, а не список из 300 замечаний. Понятный план для разработки и менеджмента.
Написать в Telegram