Rel=canonical (канонический URL) и дублирование контента в WordPress

Канонические URL для избежания дублирования контента

  Использование канонических ссылок

Какое-то время назад, а точнее 12 февраля 2009, поисковая система Google ввела поддержку т.н. канонических URL (тегов <link> с атрибутом rel=canonical).

После этого их стали поддерживать и несуществующий сейчас (как поисковик) Yahoo, а также Bing от Microsoft. Не отстаёт и Яндекс.

В чём суть канонических УРЛов и для чего они нужны?

Нередко бывает так, что страница с одним и тем же содержимым доступна по разным адресам – происходит дублирование контента.

В WordPress это особо хорошо видно если, например, перейти по адресам вида site.ru/category/name-of-category и site.ru/name-of-category, то будет ясно, что содержание этих страниц одинаковое. Сравните:

Как известно, поисковики не любят, когда один сайт ворует контент с другого сайта. Но также они не любят, когда страницы на одном и том же сайте абсолютно одинаковые – это заставляет их усомниться в качестве такого веб-ресурса.

Иными словами, если на сайте имеются абсолютно одинаковые страницы, то данный сайт будет пессимизирован (т.е. его ранжирование в поисковой выдаче будет специально ухудшено).

Даже Гугл особо заостряет на этом внимание в своём руководстве по продвижению сайта в Google.

Т.к. часто происходит так, что дублированный контент появляется не по вине пользователя, а по вине CMS, то для того, чтобы “сказать” поисковикам, где первоисточник или какая из страниц с одинаковым содержанием главнее, используются канонические URL, что буквально можно перевести как “образцовые ссылки”.

Код этих ссылок выглядит так: <link rel=”canonical” href=”http://site.ru/good-page” />.

Такая ссылка должна быть расположена в разделе <head> на “НЕ образцовой” странице (т.е. на той, которая “производит” дублирование контента) и указывать на “образцовую”, как бы говоря поисковым роботам “нужно взять в индекс не меня, а вот эту страницу и не применять к нашему сайту никаких санкций”.

Вот как выглядит канонический URL для примера из начала статьи:

Канонический URL

  Каноническим для http://web-ru.net/prodvizhenie-sajta/ является URL http://web-ru.net/category/prodvizhenie-sajta/

Требования к каноническим ссылкам

Основные требования для таких ссылок (чтоб они учитывались поисковиками), таковы:

  • “Образцовая” страница должна существовать
  • Для Яндекса: такая ссылка должна указывать на свой же домен (поддомен и другой домен не учитываются). Для Гугла можно указать ссылку и на другом домене.
  • Одна страница должна иметь только одну <link rel=”canonical” …> в своём коде.
  • “Образцовая” и “необразцовая” страницы должны иметь сходную тематику.
  • Не должно быть цепочек канонических УРЛ. Допустимо, если страница А указывает на страницу Б, а Б никуда не указывает или указывает на саму себя. Но нельзя такое: А=>Б=>C и т.д.

Стоит ещё отметить, что в справке Google написано, что наличие канонической ссылки является рекомендацией поисковому роботу. Для Яндекса наличие такого URL-адреса является правилом (скорей всего).

Само собой, что вручную проставлять такие ссылки весьма трудоёмко. Этот процесс должен производиться движком сайта.

Если сказать о сайтах на WordPress, то, к сожалению, изначально в этом движке нет канонических URL. Но, как всегда, в этом движке почти всё может быть “спасено” установкой разных WP-плагинов. В следующей статье я покажу, как можно это исправить и избежать дублирования контента в WordPress с помощью плагина All in One Seo Pack.

Посмотрите также видео от Google, где рассказывается об этих ссылках. Видео хоть и на английском, зато из первоисточника.

Презентация rel=canonical:

Интересно, что дата внедрения подобных УРЛ – 200 лет со дня рождения Ч. Дарвина.

web-ru.net - всё о продвижении сайтов
Случайные публикации:
  • Как узнать, сколько страниц проиндексировано? Страницы в индексе Яндекса, Google, BingКак узнать, сколько страниц проиндексировано? Страницы в индексе Яндекса, Google, BingПорой бывает нужным узнать, сколько документов того или иного сайта...
  • WordPress комментарии и их настройкаWordPress комментарии и их настройкаВ предыдущей статье написал про быстрое изменение размеров Грават...
  • Ближайшие изменения в Гугле - алгоритм Penguin 2.0Ближайшие изменения в Гугле - алгоритм Penguin 2.0В последнее время главные поисковики Рунета стали много говорить о своих будущих...
  • CPAtext - обзор нового CPA-сервиса от создателей AdmitadCPAtext - обзор нового CPA-сервиса от создателей Admitad...логии Admitad'a в контент вашего сайта. Но и не только это. Иными
  • Что такое анкор ссылки (anchor)? Текстовые и безанкорные ссылкиЧто такое анкор ссылки (anchor)? Текстовые и безанкорные ссылкиДанная статья будет на тему SEO-терминов. Тем более, что понятие ан...
Оставьте комментарий:
Отзывов всего: 17
Через сайт Через ВКонтакте Через Facebook
  1. Юрий пишет:

    Что делать, если одна и та жа страница доступна по разным адресам? Я понял, что атритут canonical используется на странице-дубле. А в Вашем примере страница указывает сама на себя.

    Ответить
    • Пётр пишет:

      Да, Юрий – этот атрибут прописывается на странице дубле и указывает на страницу-источник.
      В моём примере страница-дубль “http://web-ru.net/prodvizhenie-sajta/” указывает на источник “http://web-ru.net/category/prodvizhenie-sajta/”, а источник указывает сам на себя. Последнее – особенность плагина All-in-one-seo-pack и не является ошибкой.

      Ответить
  2. Anton пишет:

    Скажите пожалуйста, следует ли запрещать индексирование модуля аккордеон на Joomla 1.5.
    1, У меня есть сайт http://turinfonn.ru сделал для удобства справа меню по странам, но получается что один и тот же текст дублируется слева и справа, влияет ли это на веса страниц и на выдачу в поисковиках?
    2, И если я запрещу это меню к индексированию, как сделать, чтобы вес у них не сгорел, а перешел к их дублям? И вообще как сделать запрет этого меню?

    Ответить
    • Пётр пишет:

      Вообще, если сильно беспокоит данный вопрос – сделайте блок на AJAX’e.

      Можно многое сделать, насчёт весов тут есть: http://seo4all.web-ru.net/

      Ответить
      • Anton пишет:

        Ну да по фото видно, кто кого рекламирует…

        Ответить
        • Пётр пишет:

          Кто кого рекламирует, Anton?

          Ответить
          • Ubpont пишет:

            Я вот тоже заметил что All-in-one-seo-pack ставит ссылку “rel canonical” не только на страницах-дублях но и на оригинальных страницах, которые являются каноническими. Почему вы говорите что это не ошибка? Думаете гугл обращает внимание что это сделано каким то сраным плагином All-in-one-seo-pack и не стоит считать это ошибкой? Вряд ли соглашусь с вами.

            Ответить
            • Пётр пишет:

              Согласитесь с Гуглом – домотайте данное видео до 17-й минуты.

              Ответить
  3. zaytsev пишет:

    А как запретить индексировать ссылки с префиксом коментов например #comment-74 (web-ru.net/prodvizhenie-sajta/seo/relcanonical-kanonicheskij-url-i-dublirovanie-kontenta-v-wordpress.html#comment-74)

    Ответить
  4. Сергей пишет:

    Здравствуйте. А не проще ли запихнуть дубль в robots.txt?

    Ответить
  5. Сергей пишет:

    А еще я заметил, что вы не используете keywords на таких страницах web-ru.net/category/prodvizhenie-sajta/ , web-ru.net/category/prodvizhenie-sajta/page/2/ и т.д. Почему?

    Ответить
  6. Владимир пишет:

    У меня такая проблема. На моем сайте (WordPress 4.0) установлен плагин Platinum SEO. В его настройках есть пункт, который позволяет создавать канонические урлы.
    Однако когда просматриваешь страницы с помощью RDS bar видно, что в записях канонический урл дублируется (в исходном коде – и вордпресс его создает, и плагин).
    На главной странице и в рубриках такого нет – канонический урл создает только плагин.
    Подскажите как избавиться от дублей? Т.к. поисковые системы должны видеть только один такой урл.

    Ответить
    • Пётр пишет:

      Хм.. сейчас посмотрел на одном сайте с такой же версией WP и установленным All in One Seo Pack’ом – все канонические URL – только от данного плагина.

      Возможно, у вас тема такая, что добавляет подобные ссылки. Поищите настройки, отключите это дело.

      Ответить
      • Владимир пишет:

        Отключил в настройках плагина. CMS сама создает в постах канонические урлы

        Ответить
сайт web-ru.net
Я не спамлю...