Rel=canonical (канонический URL) и дублирование контента в WordPress

Канонические URL для избежания дублирования контента

  Использование канонических ссылок

Какое-то время назад, а точнее 12 февраля 2009, поисковая система Google ввела поддержку т.н. канонических URL (тегов <link> с атрибутом rel=canonical).

После этого их стали поддерживать и несуществующий сейчас (как поисковик) Yahoo, а также Bing от Microsoft. Не отстаёт и Яндекс.

В чём суть канонических УРЛов и для чего они нужны?

Нередко бывает так, что страница с одним и тем же содержимым доступна по разным адресам — происходит дублирование контента.

В WordPress это особо хорошо видно если, например, перейти по адресам вида site.ru/category/name-of-category и site.ru/name-of-category, то будет ясно, что содержание этих страниц одинаковое. Сравните:

Как известно, поисковики не любят, когда один сайт ворует контент с другого сайта. Но также они не любят, когда страницы на одном и том же сайте абсолютно одинаковые — это заставляет их усомниться в качестве такого веб-ресурса.

Иными словами, если на сайте имеются абсолютно одинаковые страницы, то данный сайт будет пессимизирован (т.е. его ранжирование в поисковой выдаче будет специально ухудшено).

Даже Гугл особо заостряет на этом внимание в своём руководстве по продвижению сайта в Google.

Т.к. часто происходит так, что дублированный контент появляется не по вине пользователя, а по вине CMS, то для того, чтобы «сказать» поисковикам, где первоисточник или какая из страниц с одинаковым содержанием главнее, используются канонические URL, что буквально можно перевести как «образцовые ссылки».

Код этих ссылок выглядит так: <link rel=»canonical» href=»http://site.ru/good-page» />.

Такая ссылка должна быть расположена в разделе <head> на «НЕ образцовой» странице (т.е. на той, которая «производит» дублирование контента) и указывать на «образцовую», как бы говоря поисковым роботам «нужно взять в индекс не меня, а вот эту страницу и не применять к нашему сайту никаких санкций».

Вот как выглядит канонический URL для примера из начала статьи:

Канонический URL

  Каноническим для http://web-ru.net/prodvizhenie-sajta/ является URL http://web-ru.net/category/prodvizhenie-sajta/

Требования к каноническим ссылкам

Основные требования для таких ссылок (чтоб они учитывались поисковиками), таковы:

  • «Образцовая» страница должна существовать
  • Для Яндекса: такая ссылка должна указывать на свой же домен (поддомен и другой домен не учитываются). Для Гугла можно указать ссылку и на другом домене.
  • Одна страница должна иметь только одну <link rel=»canonical» …> в своём коде.
  • «Образцовая» и «необразцовая» страницы должны иметь сходную тематику.
  • Не должно быть цепочек канонических УРЛ. Допустимо, если страница А указывает на страницу Б, а Б никуда не указывает или указывает на саму себя. Но нельзя такое: А=>Б=>C и т.д.

Стоит ещё отметить, что в справке Google написано, что наличие канонической ссылки является рекомендацией поисковому роботу. Для Яндекса наличие такого URL-адреса является правилом (скорей всего).

Само собой, что вручную проставлять такие ссылки весьма трудоёмко. Этот процесс должен производиться движком сайта.

Если сказать о сайтах на WordPress, то, к сожалению, изначально в этом движке нет канонических URL. Но, как всегда, в этом движке почти всё может быть «спасено» установкой разных WP-плагинов. В следующей статье я покажу, как можно это исправить и избежать дублирования контента в WordPress с помощью плагина All in One Seo Pack.

Посмотрите также видео от Google, где рассказывается об этих ссылках. Видео хоть и на английском, зато из первоисточника.

Презентация rel=canonical:

Интересно, что дата внедрения подобных УРЛ — 200 лет со дня рождения Ч. Дарвина.

web-ru.net - всё о продвижении сайтов
Случайные публикации:
  • Google делает это!Google делает это!Думаю, любой человек, кто более-менее "погружался" в SEO, задавался...
  • Как создать Граватар (Gravatar) для WordPress на Gravatar.com?Как создать Граватар (Gravatar) для WordPress на Gravatar.com?В последнее время в комментариях к сайтам на WordPress часто можно у...
  • Что такое внешние ссылки с сайта?Что такое внешние ссылки с сайта?В продолжение темы SEO-терминов (началась она статьёй о внутренних...
  • Как размещать ссылки в бесплатных каталогах статей? ВидеоурокКак размещать ссылки в бесплатных каталогах статей? Видеоурок...бесплатно? Вполне логично, что начинающие сайтовладельцы не очень хотят
  • Доменные зоны. Что такое полное (абсолютное) доменное имя, уровни доменов. Проверка на занятость и whois-сервисыДоменные зоны. Что такое полное (абсолютное) доменное имя, уровни доменов. Проверка на занятость и whois-сервисыВ одной из предыдущих статей разбиралось, что такое домен. Сейчас хотел...
Оставьте комментарий:
комментариев 17
Через сайт Через ВКонтакте Через Facebook
  1. Юрий:

    Что делать, если одна и та жа страница доступна по разным адресам? Я понял, что атритут canonical используется на странице-дубле. А в Вашем примере страница указывает сама на себя.

    Ответить
    • Пётр:

      Да, Юрий — этот атрибут прописывается на странице дубле и указывает на страницу-источник.
      В моём примере страница-дубль «http://web-ru.net/prodvizhenie-sajta/» указывает на источник «http://web-ru.net/category/prodvizhenie-sajta/», а источник указывает сам на себя. Последнее — особенность плагина All-in-one-seo-pack и не является ошибкой.

      Ответить
  2. Anton:

    Скажите пожалуйста, следует ли запрещать индексирование модуля аккордеон на Joomla 1.5.
    1, У меня есть сайт http://turinfonn.ru сделал для удобства справа меню по странам, но получается что один и тот же текст дублируется слева и справа, влияет ли это на веса страниц и на выдачу в поисковиках?
    2, И если я запрещу это меню к индексированию, как сделать, чтобы вес у них не сгорел, а перешел к их дублям? И вообще как сделать запрет этого меню?

    Ответить
    • Пётр:

      Вообще, если сильно беспокоит данный вопрос — сделайте блок на AJAX’e.

      Можно многое сделать, насчёт весов тут есть: http://seo4all.web-ru.net/

      Ответить
      • Anton:

        Ну да по фото видно, кто кого рекламирует…

        Ответить
        • Пётр:

          Кто кого рекламирует, Anton?

          Ответить
          • Ubpont:

            Я вот тоже заметил что All-in-one-seo-pack ставит ссылку «rel canonical» не только на страницах-дублях но и на оригинальных страницах, которые являются каноническими. Почему вы говорите что это не ошибка? Думаете гугл обращает внимание что это сделано каким то сраным плагином All-in-one-seo-pack и не стоит считать это ошибкой? Вряд ли соглашусь с вами.

            Ответить
            • Пётр:

              Согласитесь с Гуглом — домотайте данное видео до 17-й минуты.

              Ответить
  3. zaytsev:

    А как запретить индексировать ссылки с префиксом коментов например #comment-74 (web-ru.net/prodvizhenie-sajta/seo/relcanonical-kanonicheskij-url-i-dublirovanie-kontenta-v-wordpress.html#comment-74)

    Ответить
  4. Сергей:

    Здравствуйте. А не проще ли запихнуть дубль в robots.txt?

    Ответить
  5. Сергей:

    А еще я заметил, что вы не используете keywords на таких страницах web-ru.net/category/prodvizhenie-sajta/ , web-ru.net/category/prodvizhenie-sajta/page/2/ и т.д. Почему?

    Ответить
  6. Владимир:

    У меня такая проблема. На моем сайте (WordPress 4.0) установлен плагин Platinum SEO. В его настройках есть пункт, который позволяет создавать канонические урлы.
    Однако когда просматриваешь страницы с помощью RDS bar видно, что в записях канонический урл дублируется (в исходном коде — и вордпресс его создает, и плагин).
    На главной странице и в рубриках такого нет — канонический урл создает только плагин.
    Подскажите как избавиться от дублей? Т.к. поисковые системы должны видеть только один такой урл.

    Ответить
    • Пётр:

      Хм.. сейчас посмотрел на одном сайте с такой же версией WP и установленным All in One Seo Pack’ом — все канонические URL — только от данного плагина.

      Возможно, у вас тема такая, что добавляет подобные ссылки. Поищите настройки, отключите это дело.

      Ответить
      • Владимир:

        Отключил в настройках плагина. CMS сама создает в постах канонические урлы

        Ответить
сайт web-ru.net
Я не спамлю...