Зачем нужен sitemap.xml
Sitemap — это XML-файл, который перечисляет все важные страницы сайта и подсказывает поисковикам, что и когда обходить. Без sitemap робот находит страницы только через ссылки — а это значит, что:
- новые страницы попадают в индекс долго (от недели до месяцев);
- глубокие страницы (например, товар в 4-м уровне категории) могут вообще не найти;
- изолированные страницы без внутренних ссылок остаются «потерянными».
Sitemap решает эти проблемы за один файл.
Стандарт sitemaps.org
Формат XML утвердили Google, Яндекс и Bing совместно. Минимальный sitemap:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>https://example.com/</loc>
<lastmod>2026-05-01</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://example.com/about</loc>
<lastmod>2026-04-15</lastmod>
</url>
</urlset>
Что обязательно: <loc> — абсолютный URL. Всё остальное — опционально.
Что про теги priority и changefreq: Google официально объявил, что игнорирует их с 2017 года. Яндекс тоже использует слабо. Единственный по-настоящему полезный тег после <loc> — это <lastmod> (последняя модификация). Google его читает и решает, стоит ли заново обходить страницу.
Ограничения
Стандарт фиксирует жёсткие лимиты:
- 50 000 URL на один sitemap-файл;
- 50 МБ в распакованном виде (
.xml) или 10 МБ в.xml.gz.
Если сайт больше — используйте sitemap-index:
<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<sitemap>
<loc>https://example.com/sitemap-pages.xml</loc>
<lastmod>2026-05-01</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-products.xml</loc>
<lastmod>2026-05-01</lastmod>
</sitemap>
<sitemap>
<loc>https://example.com/sitemap-blog.xml</loc>
<lastmod>2026-05-01</lastmod>
</sitemap>
</sitemapindex>
Sitemap-index сам ограничен теми же 50 000 ссылок. Этого хватает на сайты до 2,5 миллиардов страниц — Amazon уровня.
Типы sitemap
URL sitemap
Самый распространённый. Включаются HTML-страницы, открытые для индексации.
Image sitemap
Расширение для картинок:
<url>
<loc>https://example.com/catalog/iphone</loc>
<image:image>
<image:loc>https://example.com/img/iphone-15.jpg</image:loc>
<image:title>iPhone 15 Pro Max</image:title>
</image:image>
</url>
Помогает индексации в Google Картинках и Яндекс.Картинках — важно для интернет-магазинов и фотобанков.
Video sitemap
Аналогично — для страниц с видео. Особенно важно для образовательных платформ, YouTube-альтернатив.
News sitemap
Для новостных сайтов в Google News. Включает только статьи за последние 48 часов.
Как создать sitemap
WordPress
Плагины Yoast SEO и Rank Math генерируют sitemap-index автоматически: /sitemap_index.xml. Включите в настройках, проверьте что плагин не дублирует ссылок с noindex-страниц.
Bitrix
Встроенный модуль «Карта сайта» в админке. Запускается по cron — настройте раз в сутки.
OpenCart / WooCommerce
Стандартные модули или специализированные SEO-плагины. Главное — чтобы товары out of stock не попадали без noindex дисциплины.
Кастомный сайт
Любой sitemap-генератор скрипт: пройтись по БД, выгрузить URL, посчитать lastmod, записать в XML. Запускать по cron каждый день / каждый час для активных сайтов.
Онлайн без программирования
Сервис генерации sitemap обходит сайт краулером и формирует XML за минуты — для статичных сайтов без CMS.
Где прописать sitemap
Sitemap указывают в двух местах одновременно:
- В robots.txt:
Sitemap: https://example.com/sitemap.xml - В Google Search Console и Яндекс.Вебмастере — раздел «Карта сайта» / «Файлы sitemap», вручную добавить URL и нажать «Отправить».
Search Console показывает: сколько URL найдено, сколько проиндексировано, есть ли ошибки. Это самый точный индикатор индексации.
Типичные ошибки
1. URL с http, а сайт на https
После переезда на HTTPS забыли обновить sitemap-генератор. Все ссылки http://example.com/... поисковик считает «другим сайтом» и индексирует через 301-редирект, теряя время.
2. В sitemap есть страницы с noindex
Сайт говорит роботу «обойди эту страницу» (sitemap), но при обходе встречает мета-тег noindex. Google ругается на «противоречие сигналов», страница пропускается, время потеряно. Уберите noindex-страницы из sitemap.
3. В sitemap есть страницы, закрытые robots.txt
То же противоречие. Robots.txt блокирует обход — sitemap «зовёт» обойти. Уберите из sitemap всё, что закрыто в robots.
4. Lastmod всегда сегодняшняя дата
Некоторые CMS при каждой генерации sitemap проставляют <lastmod> в текущую дату для всех URL. Поисковик быстро понимает, что lastmod ничего не значит, и перестаёт ему доверять. Lastmod должен быть реальной датой последнего изменения контента.
5. Sitemap не сжат, > 50 МБ
Сжимайте в .xml.gz для крупных файлов. Google и Яндекс отлично читают gzip.
6. Отсутствует mime-type application/xml
Если сервер отдаёт sitemap как text/html, некоторые краулеры могут не понять формат. Настройте Nginx/Apache на корректный Content-Type.
Что делать дальше
- Откройте
https://ваш-домен.ру/sitemap.xml— есть ли файл? - Проверьте sitemap онлайн — мы посчитаем URL, валидируем XML, найдём ошибки.
- Добавьте sitemap в Google Search Console и Яндекс.Вебмастер — без этого они о нём могут долго не узнать.
- Проверьте robots.txt — там должна быть строка
Sitemap:(онлайн-валидация). - Через 2-4 недели в Search Console посмотрите «Покрытие» — сколько страниц из sitemap проиндексировано. Норма — > 90% для коммерческих сайтов.
Без sitemap сайт продвигается, но медленнее. С хорошим sitemap новые страницы попадают в индекс за 1-3 дня, а не за неделю. Для блога и магазина это критичная разница.
Попробовать SEOAdmin бесплатно
30 SEO-инструментов в одном кабинете. 100 поинтов бесплатно при регистрации, без карты.

