Rel=canonical (канонический URL) и дублирование контента в WordPress

Канонические URL для избежания дублирования контента

  Использование канонических ссылок

Какое-то время назад, а точнее 12 февраля 2009, поисковая система Google ввела поддержку т.н. канонических URL (тегов <link> с атрибутом rel=canonical).

После этого их стали поддерживать и несуществующий сейчас (как поисковик) Yahoo, а также Bing от Microsoft. Не отстаёт и Яндекс.

В чём суть канонических УРЛов и для чего они нужны?

Нередко бывает так, что страница с одним и тем же содержимым доступна по разным адресам — происходит дублирование контента.

В WordPress это особо хорошо видно если, например, перейти по адресам вида site.ru/category/name-of-category и site.ru/name-of-category, то будет ясно, что содержание этих страниц одинаковое. Сравните:

Как известно, поисковики не любят, когда один сайт ворует контент с другого сайта. Но также они не любят, когда страницы на одном и том же сайте абсолютно одинаковые — это заставляет их усомниться в качестве такого веб-ресурса.

Иными словами, если на сайте имеются абсолютно одинаковые страницы, то данный сайт будет пессимизирован (т.е. его ранжирование в поисковой выдаче будет специально ухудшено).

Даже Гугл особо заостряет на этом внимание в своём руководстве по продвижению сайта в Google.

Т.к. часто происходит так, что дублированный контент появляется не по вине пользователя, а по вине CMS, то для того, чтобы «сказать» поисковикам, где первоисточник или какая из страниц с одинаковым содержанием главнее, используются канонические URL, что буквально можно перевести как «образцовые ссылки».

Код этих ссылок выглядит так: <link rel=»canonical» href=»http://site.ru/good-page» />.

Такая ссылка должна быть расположена в разделе <head> на «НЕ образцовой» странице (т.е. на той, которая «производит» дублирование контента) и указывать на «образцовую», как бы говоря поисковым роботам «нужно взять в индекс не меня, а вот эту страницу и не применять к нашему сайту никаких санкций».

Вот как выглядит канонический URL для примера из начала статьи:

Канонический URL

  Каноническим для http://web-ru.net/prodvizhenie-sajta/ является URL http://web-ru.net/category/prodvizhenie-sajta/

Требования к каноническим ссылкам

Основные требования для таких ссылок (чтоб они учитывались поисковиками), таковы:

  • «Образцовая» страница должна существовать
  • Для Яндекса: такая ссылка должна указывать на свой же домен (поддомен и другой домен не учитываются). Для Гугла можно указать ссылку и на другом домене.
  • Одна страница должна иметь только одну <link rel=»canonical» …> в своём коде.
  • «Образцовая» и «необразцовая» страницы должны иметь сходную тематику.
  • Не должно быть цепочек канонических УРЛ. Допустимо, если страница А указывает на страницу Б, а Б никуда не указывает или указывает на саму себя. Но нельзя такое: А=>Б=>C и т.д.

Стоит ещё отметить, что в справке Google написано, что наличие канонической ссылки является рекомендацией поисковому роботу. Для Яндекса наличие такого URL-адреса является правилом (скорей всего).

Само собой, что вручную проставлять такие ссылки весьма трудоёмко. Этот процесс должен производиться движком сайта.

Если сказать о сайтах на WordPress, то, к сожалению, изначально в этом движке нет канонических URL. Но, как всегда, в этом движке почти всё может быть «спасено» установкой разных WP-плагинов. В следующей статье я покажу, как можно это исправить и избежать дублирования контента в WordPress с помощью плагина All in One Seo Pack.

Посмотрите также видео от Google, где рассказывается об этих ссылках. Видео хоть и на английском, зато из первоисточника.

Презентация rel=canonical:

Интересно, что дата внедрения подобных УРЛ — 200 лет со дня рождения Ч. Дарвина.

web-ru.net - всё о продвижении сайтов
Случайные публикации:
  • Где взять уникальный контент для сайтов за деньги?Где взять уникальный контент для сайтов за деньги?В данной статье продолжу тему уникальных текстов на сайте. Вообще, кому-...
  • Необходимые плагины для SEO-оптимизации WordPress-сайтовНеобходимые плагины для SEO-оптимизации WordPress-сайтовЭто статьёй начинаю рубрику, посвящённую движку WordPress. Давно пора....
  • Как повысить кликабельность сайта в выдаче Яндекса?Как повысить кликабельность сайта в выдаче Яндекса?Простейший способ повышения кликабельности сайта (CTR), о котором многие п...
  • Какой хостинг выбрать? На что обратить внимание, выбирая хостинг для сайта (мощность сервера, технологии, цены, uptime...)Какой хостинг выбрать? На что обратить внимание, выбирая хостинг для сайта (мощность сервера, технологии, цены, uptime...)Выбирая хостинг для своего будущего проекта в Интернете, желательно определить...
  • Хештег в твиттере. Что это и как это использовать?Хештег в твиттере. Что это и как это использовать?Когда вы начнете пользоваться Твитттером, вам не понадобится много врем...
Оставьте комментарий:
комментариев 17
Через сайт Через ВКонтакте Через Facebook
  1. Юрий:

    Что делать, если одна и та жа страница доступна по разным адресам? Я понял, что атритут canonical используется на странице-дубле. А в Вашем примере страница указывает сама на себя.

    Ответить
    • Пётр:

      Да, Юрий — этот атрибут прописывается на странице дубле и указывает на страницу-источник.
      В моём примере страница-дубль «http://web-ru.net/prodvizhenie-sajta/» указывает на источник «http://web-ru.net/category/prodvizhenie-sajta/», а источник указывает сам на себя. Последнее — особенность плагина All-in-one-seo-pack и не является ошибкой.

      Ответить
  2. Anton:

    Скажите пожалуйста, следует ли запрещать индексирование модуля аккордеон на Joomla 1.5.
    1, У меня есть сайт http://turinfonn.ru сделал для удобства справа меню по странам, но получается что один и тот же текст дублируется слева и справа, влияет ли это на веса страниц и на выдачу в поисковиках?
    2, И если я запрещу это меню к индексированию, как сделать, чтобы вес у них не сгорел, а перешел к их дублям? И вообще как сделать запрет этого меню?

    Ответить
    • Пётр:

      Вообще, если сильно беспокоит данный вопрос — сделайте блок на AJAX’e.

      Можно многое сделать, насчёт весов тут есть: http://seo4all.web-ru.net/

      Ответить
      • Anton:

        Ну да по фото видно, кто кого рекламирует…

        Ответить
        • Пётр:

          Кто кого рекламирует, Anton?

          Ответить
          • Ubpont:

            Я вот тоже заметил что All-in-one-seo-pack ставит ссылку «rel canonical» не только на страницах-дублях но и на оригинальных страницах, которые являются каноническими. Почему вы говорите что это не ошибка? Думаете гугл обращает внимание что это сделано каким то сраным плагином All-in-one-seo-pack и не стоит считать это ошибкой? Вряд ли соглашусь с вами.

            Ответить
            • Пётр:

              Согласитесь с Гуглом — домотайте данное видео до 17-й минуты.

              Ответить
  3. zaytsev:

    А как запретить индексировать ссылки с префиксом коментов например #comment-74 (web-ru.net/prodvizhenie-sajta/seo/relcanonical-kanonicheskij-url-i-dublirovanie-kontenta-v-wordpress.html#comment-74)

    Ответить
  4. Сергей:

    Здравствуйте. А не проще ли запихнуть дубль в robots.txt?

    Ответить
  5. Сергей:

    А еще я заметил, что вы не используете keywords на таких страницах web-ru.net/category/prodvizhenie-sajta/ , web-ru.net/category/prodvizhenie-sajta/page/2/ и т.д. Почему?

    Ответить
  6. Владимир:

    У меня такая проблема. На моем сайте (WordPress 4.0) установлен плагин Platinum SEO. В его настройках есть пункт, который позволяет создавать канонические урлы.
    Однако когда просматриваешь страницы с помощью RDS bar видно, что в записях канонический урл дублируется (в исходном коде — и вордпресс его создает, и плагин).
    На главной странице и в рубриках такого нет — канонический урл создает только плагин.
    Подскажите как избавиться от дублей? Т.к. поисковые системы должны видеть только один такой урл.

    Ответить
    • Пётр:

      Хм.. сейчас посмотрел на одном сайте с такой же версией WP и установленным All in One Seo Pack’ом — все канонические URL — только от данного плагина.

      Возможно, у вас тема такая, что добавляет подобные ссылки. Поищите настройки, отключите это дело.

      Ответить
      • Владимир:

        Отключил в настройках плагина. CMS сама создает в постах канонические урлы

        Ответить
сайт web-ru.net
Я не спамлю...