Sitemap.xml: как создать и проверить на ошибки
Что такое sitemap.xml и зачем он нужен
Sitemap.xml — файл в формате XML, который содержит список страниц вашего сайта и помогает поисковым роботам быстрее и полнее обходить сайт. Это не замена внутренней перелинковке и не гарантия индексации, но важный вспомогательный инструмент.
Особенно полезен sitemap в следующих ситуациях:
- Новый сайт, на который ещё нет внешних ссылок — робот может долго не приходить
- Крупный сайт с тысячами страниц и разветвлённой структурой
- Страницы не связаны внутренними ссылками (например, глубоко вложенные товары в каталоге)
- Контент обновляется часто и важно, чтобы поисковики знали об изменениях
- Наличие медиаконтента: изображений, видео — для них существуют отдельные типы sitemap
Структура файла sitemap.xml
Минимально корректный sitemap выглядит так:
<?xml version='1.0' encoding='UTF-8'?>
<urlset xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
<url>
<loc>https://example.ru/page/</loc>
<lastmod>2026-06-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>Обязателен только тег <loc> с полным URL страницы. Остальные теги рекомендуемые:
<lastmod>— дата последнего изменения в формате YYYY-MM-DD. Важный тег: поисковики ориентируются на него при решении, нужно ли перекачивать страницу.<changefreq>— предполагаемая частота обновлений (always, hourly, daily, weekly, monthly, yearly, never). На практике поисковики не всегда следуют этой подсказке.<priority>— относительная важность страницы от 0.0 до 1.0. Помогает роботу расставить приоритеты при обходе.
Как создать sitemap.xml
Автоматически через CMS или фреймворк
Большинство популярных CMS умеют генерировать sitemap самостоятельно:
- WordPress: плагины Yoast SEO, Rank Math или встроенная функция генерации sitemap в новых версиях
- Bitrix: модуль SEO генерирует sitemap из структуры сайта
- 1C-UMI, Tilda: встроенная генерация в настройках SEO
- Next.js, Nuxt: специальные пакеты или встроенная поддержка генерации sitemap при сборке
Автоматическая генерация предпочтительна для каталогов с часто меняющимся контентом: sitemap обновляется вместе с добавлением новых товаров или статей.
Вручную для небольших сайтов
Если на сайте несколько десятков страниц, можно создать XML-файл вручную в любом текстовом редакторе. Убедитесь, что файл сохранён в кодировке UTF-8 без BOM.
Через онлайн-генераторы
Существуют сервисы, которые обходят сайт по ссылкам и генерируют sitemap автоматически. Этот подход работает для небольших сайтов, но имеет ограничение: генератор обходит только страницы, доступные по ссылкам, и может пропустить страницы без внутренней перелинковки.
Индекс-sitemap для крупных сайтов
Один файл sitemap.xml может содержать максимум 50 000 URL и весить не более 50 МБ (без сжатия). Для крупных сайтов используют «индекс sitemap» — файл, который ссылается на несколько дочерних sitemap-файлов:
<sitemapindex xmlns='http://www.sitemaps.org/schemas/sitemap/0.9'>
<sitemap>
<loc>https://example.ru/sitemap-pages.xml</loc>
</sitemap>
<sitemap>
<loc>https://example.ru/sitemap-products.xml</loc>
</sitemap>
</sitemapindex>Разбивка по типам контента (страницы, товары, статьи, изображения) также облегчает диагностику проблем.
Проверка sitemap.xml на ошибки
После создания файл нужно проверить. Для этого используйте инструмент проверки sitemap на seotoolse.ru: он анализирует структуру XML, корректность тегов, доступность URL и типичные ошибки конфигурации.
Что проверяется:
- Валидность XML-структуры — некорректный XML поисковик не сможет прочитать
- Доступность каждого URL (нет 404, 301, 5xx)
- Соответствие URL в sitemap и канонических URL на страницах
- Наличие URL в sitemap, закрытых в robots.txt (противоречие)
- Корректность формата дат в <lastmod>
- Размер файла и количество URL
Типичные ошибки в sitemap.xml
Ошибка 1: URL в sitemap не совпадают с каноническими
Если на странице указан canonical URL с www, а в sitemap тот же URL без www — это противоречие. Поисковики воспринимают их как разные страницы. Все URL в sitemap должны совпадать с тегом <link rel='canonical'> на соответствующих страницах.
Ошибка 2: Закрытые страницы в sitemap
Если URL присутствует в sitemap, но закрыт в robots.txt или имеет мета-тег noindex — это противоречие, которое сбивает поисковики. Либо откройте страницу, либо уберите её из sitemap.
Ошибка 3: Нерабочие URL (404)
Удалённые страницы, оставшиеся в sitemap — частая проблема после редизайна. Робот тратит краулинговый бюджет на несуществующие страницы. Регулярно проверяйте sitemap на наличие битых ссылок.
Ошибка 4: Отсутствие в robots.txt ссылки на sitemap
Добавьте в конец robots.txt строку: Sitemap: https://ваш-домен.ru/sitemap.xml. Это помогает роботам найти файл без необходимости ручной отправки.
Ошибка 5: Устаревшие данные в <lastmod>
Некоторые CMS указывают в <lastmod> дату генерации sitemap вместо реальной даты изменения страницы. Если все страницы имеют одинаковый lastmod, поисковик перестаёт доверять этому тегу.
Ошибка 6: Отсутствие сжатия для больших файлов
Файлы sitemap больше нескольких мегабайт можно и нужно сжимать с помощью gzip. Поисковики поддерживают формат sitemap.xml.gz. Это ускоряет загрузку файла роботом.
Отправка sitemap в Яндекс и Google
После создания и проверки файла сообщите поисковикам о его существовании:
- Яндекс.Вебмастер: раздел «Индексирование» → «Файлы Sitemap» → добавьте URL файла. Яндекс покажет статистику: сколько URL в файле и сколько из них уже в индексе.
- Google Search Console: раздел «Индексирование» → «Файлы Sitemap» → «Добавить новый файл Sitemap». Google также показывает статус обработки.
- Robots.txt: добавьте директиву Sitemap — это дополнительный канал обнаружения для всех роботов.
Как часто обновлять sitemap
Если ваш сайт генерирует sitemap автоматически — он обновляется при каждом изменении. Если вы ведёте файл вручную — обновляйте при добавлении новых страниц и при изменении существующих. Не забывайте обновлять <lastmod>.
После обновления перепоставьте файл в Яндекс.Вебмастер и Search Console — они начнут переобход изменившихся страниц быстрее.
Зарегистрируйтесь на seotoolse.ru — 1000 токенов бесплатно, без карты.