|
Sitemap или так называемая Карта сайта – специально созданный файл, содержащий сведения о страницах веб-ресурса, которые необходимо проиндексировать.
Наличие этого файла подсказывает поисковым роботам, как именно организована структура сайта. Соответственно, Яндекс, Google, Bing и другие поисковики получают возможность более качественно индексировать Интернет-проект.
Зачем нужен файл Sitemap?
В большинстве случаев грамотной внешней и внутренней перелинковки страниц достаточно, чтобы поисковые роботы узнали о всем содержимом сайта. Вместе с тем использование Карты сайта может заметно ускорить процесс полной индексации, особенно если:
Интернет-ресурс создан относительно недавно и пока не может похвастаться богатым профилем внешних ссылок;
в структуре сайта присутствуют многочисленные архивы веб-документов, не связанных между собой;
проект располагает большим количеством страниц, разделов, подразделов;
в структуре ресурса преобладают динамические страницы.
Во всех этих случаях всеобъемлющая индексация сайта поисковыми системами может оказаться под вопросом, если своевременно не позаботиться о файле Sitemap.
Базовые критерии создания файла Sitemap
К созданию Карты сайта выдвигается несколько основных требований, о которых веб-мастер должен всегда помнить.
Во-первых, количество URL-адресов в файле Sitemap не должно превышать 50 тысяч единиц. Если их больше, то необходимо создать несколько отдельных Карт сайта, которые прописываются в файле индекса Sitemap.
Во-вторых, максимальный размер файла – 10 Мб. Если несжатый файл превышает этот размер, его можно уменьшить при помощи архиватора gzip.
В-третьих, файл Sitemap должен находиться на том же домене, что и веб-сайт, для которого он создан.
В-четвертых, составление Карты сайта предполагает использование кодировки UTF-8, а также латинских букв и цифр.
В-пятых, ответом сервера на обращение к файлу Sitemap должен быть HTTP-статус с кодом 200 OK.
Допустимые форматы Карты сайта
Особое требование предъявляется к формату файла Sitemap. Так, Карта сайта может быть создана в виде XML-файла, текстового файла или посредством RSS, mRSS и Atom 1.0. При этом наиболее распространенным форматом, который распознают все поисковые системы, считается XML-файл. С его помощью поисковикам можно сообщить не только о правильном местоположение страницы в иерархии сайта, но и:
о частоте обновления веб-документа в принципе (атрибут – changefreq);
о дате последнего обновления на странице (атрибут – lastmod);
о разной важности тех или иных страниц ресурса (атрибут – priority).
Пример Карты сайта в формате XML для PR-CY.ru, если бы он состоял из одной страницы и содержал упомянутые теги, мог бы выглядеть так:
Код: |
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
<url>
<loc>http://www.pr-cy.ru/</loc>
<lastmod>2016-03-21</lastmod>
<changefreq>daily</changefreq>
<priority>0.8</priority>
</url>
</urlset>
|
Как создать и где разместить файл Sitemap?
При желании составить Карту сайта можно самому (вручную), что, впрочем, выглядит весьма трудозатратной затеей. Поэтому лучше создавать файл Sitemap автоматически, обратившись к услугам бесплатных онлайн-сервисов таких, как этот или этот.
После того, как Карта сайта готова, файл необходимо определить в корневую директорию. В этом случае ссылка, указывающая поисковым системам путь к файлу Sitemap, может быть следующей: http://www.pr-cy.ru/sitemap.xml
Добавление Карты сайта в поисковые системы
Чтобы о новом файле Sitemap как можно быстрее узнали поисковые роботы, веб-мастеру необходимо внести изменения в файл robots.txt, прописав в нем особую директиву, указывающую точный маршрут к Карте сайта:
Код: |
Sitemap: http://www.pr-cy.ru/sitemap.xml
|
Кроме того, готовый файл Sitemap проверяется на наличие ошибок и добавляется в Яндекс или Гугл при помощи Яндекс.Вебмастера или Google Search Console.
Подводя итог, необходимо отметить, что наличие у веб-ресурса правильно составленной Карты сайта не является 100%-ной гарантией индексации абсолютно всех его страниц. Данный файл – всего-навсего серьезная подсказка поисковикам, как тщательнее просканировать ваш сайт. |
|
|
|
|