Как проверить индексацию страниц сайта в Яндексе и Google
Что такое индексация и почему она важна
Индексация — процесс, при котором поисковый робот (краулер) находит страницу вашего сайта, обходит её, анализирует содержимое и добавляет в свою базу данных — индекс. Только проиндексированные страницы могут появляться в результатах поиска и приносить органический трафик.
Если страница не попала в индекс, с точки зрения поисковика она не существует. Создать идеальный текст с правильными ключевыми словами и получить ноль трафика только потому, что страница закрыта от индексации — распространённая и обидная ошибка.
Проверять индексацию нужно регулярно: после запуска новых страниц, после технических изменений на сайте и просто в рамках SEO-аудита.
Способы проверки индексации страниц
1. Оператор site: в поисковой строке
Самый быстрый способ — ввести в Яндексе или Google запрос вида site:ваш-домен.ru. Поисковик покажет все проиндексированные страницы и их общее количество.
Для проверки конкретной страницы используйте полный URL: site:ваш-домен.ru/nuzhnaya-stranica/. Если страница есть в выдаче — она проиндексирована. Если нет — нужно разбираться с причинами.
Ограничение метода: оператор site: показывает приблизительное количество страниц, а не точное. Яндекс и Google не раскрывают весь индекс через этот запрос.
2. Яндекс.Вебмастер
Наиболее достоверный источник данных об индексации для Рунета. В разделе «Индексирование» → «Страницы в поиске» вы увидите точное количество проиндексированных страниц и их динамику. Раздел «Исключённые страницы» покажет URL, которые Яндекс отказался добавлять в индекс, с указанием причины.
Для работы с Яндекс.Вебмастером необходимо подтвердить права на сайт — это делается один раз через мета-тег, HTML-файл или DNS-запись.
3. Google Search Console
Аналог Яндекс.Вебмастера для Google. Раздел «Покрытие» или «Индексирование страниц» показывает:
- Проиндексированные страницы
- Страницы с ошибками (404, 5xx, редиректные цепочки)
- Исключённые страницы с причиной (закрыта robots.txt, noindex, дубль и т.д.)
Инструмент «Проверка URL» в Google Search Console позволяет проверить конкретную страницу и запросить её индексацию вручную.
4. Массовая проверка через API
Когда нужно проверить сотни или тысячи URL, ручные способы не подходят. Инструмент проверки индексации на seotoolse.ru позволяет загрузить список URL и получить отчёт об их статусе в Яндексе и Google в пакетном режиме — через официальные API поисковых систем.
Это удобно для:
- Аудита после редизайна или переезда сайта
- Проверки, все ли новые страницы попали в индекс после публикации
- Поиска «выпавших» страниц в большом каталоге
Причины, по которым страница не индексируется
Проблемы с индексацией делятся на несколько групп:
Технические блокировки
- Закрытие в robots.txt. Директива
Disallowзапрещает роботу обход страницы. Это самая частая причина. Часто возникает случайно — например, когда robots.txt с разработки попадает на прод. - Мета-тег noindex. Тег
<meta name='robots' content='noindex'>в коде страницы прямо запрещает добавление в индекс. - Заголовок X-Robots-Tag: noindex — аналог мета-тега, но передаётся через HTTP-заголовок сервера.
- Закрытие паролём или авторизацией. Робот не может войти на страницу и не индексирует её.
Проблемы с качеством страницы
- Дублированный контент. Если несколько страниц содержат одинаковый или очень похожий текст, поисковик выберет «главную» и исключит остальные.
- Тонкий контент. Страницы с минимальным количеством полезного текста Яндекс может не счесть достаточно ценными для индексации.
- Слишком медленная загрузка. Робот тратит ограниченный «краулинговый бюджет» на сайт. Очень медленные страницы могут не обойтись.
Проблемы с краулингом
- Страница не связана ссылками. Если на страницу не ведёт ни одна внутренняя ссылка («страница-сирота»), робот может её попросту не найти.
- Ошибки сервера (5xx). Когда сервер возвращает ошибку при обходе, страница не индексируется и может быть исключена из индекса, если ошибки повторяются.
- Redirect-цепочки. Несколько последовательных редиректов увеличивают «вес» на краулинговый бюджет.
Как ускорить индексацию новых страниц
После публикации новой страницы поисковый робот придёт сам — но сроки непредсказуемы: от нескольких часов до нескольких недель.
Чтобы ускорить процесс:
- Отправьте URL через Яндекс.Вебмастер. В разделе «Индексирование» → «Переобход страниц» можно добавить конкретный URL в очередь на обход.
- Воспользуйтесь инструментом «Проверка URL» в Google Search Console и нажмите «Запросить индексацию».
- Обновите и отправьте sitemap.xml. Актуальная карта сайта помогает роботу быстро находить новые страницы.
- Поставьте внутренние ссылки. Добавьте ссылку на новую страницу с уже проиндексированных страниц сайта — это даст роботу путь к новому контенту.
Что делать, если страница выпала из индекса
Внезапное исчезновение страниц из индекса — тревожный сигнал. Алгоритм действий:
- Убедитесь, что страница доступна (нет 404, нет редиректа не туда).
- Проверьте robots.txt — не появилось ли новое правило Disallow.
- Проверьте код страницы на наличие мета-тега noindex.
- Посмотрите в Яндекс.Вебмастере раздел «Исключённые страницы» — там будет указана причина.
- Если причина не найдена, проверьте, не было ли обновления алгоритма в этот период.
Мониторинг индексации на постоянной основе
Разовая проверка — это хорошо, но важнее выстроить регулярный мониторинг. Рекомендуемая частота:
- После каждого крупного обновления сайта — немедленно
- Для активно пополняемых каталогов — еженедельно
- Для устойчивых сайтов — раз в месяц
Зарегистрируйтесь на seotoolse.ru — 1000 токенов бесплатно, без карты.