Sitemaps для поисковых систем

Вступление

Чтобы улучшить индексацию сайта существует такая замечательная вещь как Sitemaps.

Вкратце Sitemaps — xml-файл, содержащий информацию о страницах сайта подлежащих индексации в поисковых системах. При описании каждой страницы указывается: адрес страницы, дата последнего обновления, частота обновления и приоритет страницы. Обязательным является только адрес страницы.

Всеми любимые поисковики Google и Yandex принимают Sitemaps.

Структура

XML-файл должен быть обязательно в кодировке UTF-8.

Sitemap должен:

  • В начале поставьте открывающий тег <urlset>, а в конце поставьте закрывающий тег </urlset>;
  • Укажите область имен (стандарт протокола) в теге <urlset>;
  • Включите запись <url> для каждого URL-адреса как родительский тег XML;
  • Включите дочернюю запись <loc> для каждого родительского тега <url>.

XML-теги

Ниже в таблице представлено описание XML-тегов (более подробно см. описание протокола на sitemaps.org)

Атрибут   Описание
<urlset> обязательный Инкапсулирует этот файл и указывает стандарт текущего протокола.
<url> обязательный Родительский тег для каждой записи URL-адреса. Остальные теги являются дочерними для этого тега.
<loc> обязательный URL-адрес страницы. URL-адрес должен начинаться с префикса (например, HTTP) и заканчиваться косой чертой, если Ваш веб-сервер требует этого. Длина этого значения не должна превышать 2048 символов. Символы в адресе должны маскироваться:

Амперсанд & — &amp;
Одинарные кавычки ' — &apos;
Двойные кавычки " — &quot;
Больше > — &gt;
Меньше < — &lt;

Кириллица и прочие символы должны кодироваться, например PHP-функцией string urlencode(string $str)
<lastmod> необязательно Дата последнего изменения файла в формате ГГГГ-ММ-ДД.
<changefreq> необязательно Вероятная частота изменения этой страницы. Это значение предоставляет общую информацию для поисковых систем и может не соответствовать точно частоте сканирования этой страницы. Допустимые значения:

always | hourly | daily | weekly | monthly | yearly | never
<priority> необязательно Приоритетность URL относительно других URL на Вашем сайте. Допустимый диапазон значений — от 0.0 до 1.0. Это значение не влияет на процедуру сравнения Ваших страниц со страницами на других сайтах — оно только позволяет указать поисковым системам, какие страницы, по Вашему мнению, более важны для сканеров.

Приоритет страницы по умолчанию — 0.5.

Пример

На примере описана одна страница, со всеми необязательными параметрами.

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>http://expange.ru/</loc> <lastmod>2011-04-16</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>

Пример Sitemaps expange.ru

Пример показывает несколько страниц сайта expange.ru. Страницы описаны как со всеми параметрами, так и без.

<?xml version="1.0" encoding="UTF-8"?> <urlset> <url> <loc>http://expange.ru/</loc> <lastmod>2011-04-15</lastmod> <changefreq>weekly</changefreq> <priority>1.0</priority> </url> <url> <loc>http://expange.ru/e/%D0%9A%D0%B0%D0%BA+%D0%BF%D1%80%D0%BE%D0%B2%D0%B5%D1%80%D0%B8%D1%82%D1%8C+mod+rewrite</loc> <lastmod>2011-04-15</lastmod> <changefreq>yearly</changefreq> <priority>0.9</priority> </url> <url> <loc>http://expange.ru/news/</loc> <changefreq>weekly</changefreq> <priority>0.4</priority> </url> <url> <loc>http://expange.ru/news/2010/</loc> <changefreq>never</changefreq> <priority>0.3</priority> </url> <url> <loc>http://expange.ru/about.php</loc> </url> <url> <loc>http://expange.ru/faces.php</loc> </url> <url> <loc>http://expange.ru/internet.php</loc> </url> </urlset>

Google Sitemaps

Центр для веб-мастеров Google находится по адресу: http://www.google.com/intl/ru/webmasters/ Google Sitemaps

Yandex Sitemaps

Яндекс.Вебмастер находится по адресу: http://webmaster.yandex.ru/ Yandex Sitemaps

Категории

ИнтернетПоисковые системы

Читайте также

Комментарии