Rel=canonical (канонический URL) и дублирование контента в WordPress

Канонические URL для избежания дублирования контента

  Использование канонических ссылок

Какое-то время назад, а точнее 12 февраля 2009, поисковая система Google ввела поддержку т.н. канонических URL (тегов <link> с атрибутом rel=canonical).

После этого их стали поддерживать и несуществующий сейчас (как поисковик) Yahoo, а также Bing от Microsoft. Не отстаёт и Яндекс.

В чём суть канонических УРЛов и для чего они нужны?

Нередко бывает так, что страница с одним и тем же содержимым доступна по разным адресам — происходит дублирование контента.

В WordPress это особо хорошо видно если, например, перейти по адресам вида site.ru/category/name-of-category и site.ru/name-of-category, то будет ясно, что содержание этих страниц одинаковое. Сравните:

Как известно, поисковики не любят, когда один сайт ворует контент с другого сайта. Но также они не любят, когда страницы на одном и том же сайте абсолютно одинаковые — это заставляет их усомниться в качестве такого веб-ресурса.

Иными словами, если на сайте имеются абсолютно одинаковые страницы, то данный сайт будет пессимизирован (т.е. его ранжирование в поисковой выдаче будет специально ухудшено).

Даже Гугл особо заостряет на этом внимание в своём руководстве по продвижению сайта в Google.

Т.к. часто происходит так, что дублированный контент появляется не по вине пользователя, а по вине CMS, то для того, чтобы «сказать» поисковикам, где первоисточник или какая из страниц с одинаковым содержанием главнее, используются канонические URL, что буквально можно перевести как «образцовые ссылки».

Код этих ссылок выглядит так: <link rel=»canonical» href=»http://site.ru/good-page» />.

Такая ссылка должна быть расположена в разделе <head> на «НЕ образцовой» странице (т.е. на той, которая «производит» дублирование контента) и указывать на «образцовую», как бы говоря поисковым роботам «нужно взять в индекс не меня, а вот эту страницу и не применять к нашему сайту никаких санкций».

Вот как выглядит канонический URL для примера из начала статьи:

Канонический URL

  Каноническим для http://web-ru.net/prodvizhenie-sajta/ является URL http://web-ru.net/category/prodvizhenie-sajta/

Требования к каноническим ссылкам

Основные требования для таких ссылок (чтоб они учитывались поисковиками), таковы:

  • «Образцовая» страница должна существовать
  • Для Яндекса: такая ссылка должна указывать на свой же домен (поддомен и другой домен не учитываются). Для Гугла можно указать ссылку и на другом домене.
  • Одна страница должна иметь только одну <link rel=»canonical» …> в своём коде.
  • «Образцовая» и «необразцовая» страницы должны иметь сходную тематику.
  • Не должно быть цепочек канонических УРЛ. Допустимо, если страница А указывает на страницу Б, а Б никуда не указывает или указывает на саму себя. Но нельзя такое: А=>Б=>C и т.д.

Стоит ещё отметить, что в справке Google написано, что наличие канонической ссылки является рекомендацией поисковому роботу. Для Яндекса наличие такого URL-адреса является правилом (скорей всего).

Само собой, что вручную проставлять такие ссылки весьма трудоёмко. Этот процесс должен производиться движком сайта.

Если сказать о сайтах на WordPress, то, к сожалению, изначально в этом движке нет канонических URL. Но, как всегда, в этом движке почти всё может быть «спасено» установкой разных WP-плагинов. В следующей статье я покажу, как можно это исправить и избежать дублирования контента в WordPress с помощью плагина All in One Seo Pack.

Посмотрите также видео от Google, где рассказывается об этих ссылках. Видео хоть и на английском, зато из первоисточника.

Презентация rel=canonical:

Интересно, что дата внедрения подобных УРЛ — 200 лет со дня рождения Ч. Дарвина.

1 Star2 Stars3 Stars4 Stars5 Stars (1 оценок, среднее: 5,00 из 5)
Loading...
Случайные публикации:
  • Как узнать цену клика по рекламе РСЯ до создания сайта или её размещения?Как узнать цену клика по рекламе РСЯ до создания сайта или её размещения?Данный материал посвящён прежде всего тем, кто никак не может "проб...
  • Яндекс запустил Баден Баден.Яндекс запустил Баден Баден....кста "Баден-Баден". Что это значит? Что раньше яндекс не занимался этим вопросом? Занимался
  • Что такое склейка доменов и главное зеркало сайта?Что такое склейка доменов и главное зеркало сайта?...своего существования A.ru приобрёл какие-либо внешние ссылки. А возможно ещё и
  • Как проверять купленный текст на рерайт и зачем? Используем eTXT АнтиплагиатКак проверять купленный текст на рерайт и зачем? Используем eTXT Антиплагиат...2013 там появилась возможность проверить текст на рерайт. Вообще, не очень ясно, как
  • Монетизация мобильного трафика на сайте - оплата за клики в Google AdsenseМонетизация мобильного трафика на сайте - оплата за клики в Google Adsense...вности ничего не скажу. Что вы думаете по поводу мобильных объявлений от Гугла? Есть ли
Оставьте комментарий:
комментариев 17
  1. Юрий:

    Что делать, если одна и та жа страница доступна по разным адресам? Я понял, что атритут canonical используется на странице-дубле. А в Вашем примере страница указывает сама на себя.

    Ответить
    • Пётр:

      Да, Юрий — этот атрибут прописывается на странице дубле и указывает на страницу-источник.
      В моём примере страница-дубль «http://web-ru.net/prodvizhenie-sajta/» указывает на источник «http://web-ru.net/category/prodvizhenie-sajta/», а источник указывает сам на себя. Последнее — особенность плагина All-in-one-seo-pack и не является ошибкой.

      Ответить
  2. Anton:

    Скажите пожалуйста, следует ли запрещать индексирование модуля аккордеон на Joomla 1.5.
    1, У меня есть сайт сделал для удобства справа меню по странам, но получается что один и тот же текст дублируется слева и справа, влияет ли это на веса страниц и на выдачу в поисковиках?
    2, И если я запрещу это меню к индексированию, как сделать, чтобы вес у них не сгорел, а перешел к их дублям? И вообще как сделать запрет этого меню?

    Ответить
    • Пётр:

      Вообще, если сильно беспокоит данный вопрос — сделайте блок на AJAX’e.

      Можно многое сделать

      Ответить
      • Anton:

        Ну да по фото видно, кто кого рекламирует…

        Ответить
        • Пётр:

          Кто кого рекламирует, Anton?

          Ответить
          • Ubpont:

            Я вот тоже заметил что All-in-one-seo-pack ставит ссылку «rel canonical» не только на страницах-дублях но и на оригинальных страницах, которые являются каноническими. Почему вы говорите что это не ошибка? Думаете гугл обращает внимание что это сделано каким то сраным плагином All-in-one-seo-pack и не стоит считать это ошибкой? Вряд ли соглашусь с вами.

            Ответить
            • Пётр:

              Согласитесь с Гуглом — домотайте данное видео до 17-й минуты.

              Ответить
  3. zaytsev:

    А как запретить индексировать ссылки с префиксом коментов например #comment-74 (web-ru.net/prodvizhenie-sajta/seo/relcanonical-kanonicheskij-url-i-dublirovanie-kontenta-v-wordpress.html#comment-74)

    Ответить
  4. Сергей:

    Здравствуйте. А не проще ли запихнуть дубль в robots.txt?

    Ответить
  5. Сергей:

    А еще я заметил, что вы не используете keywords на таких страницах web-ru.net/category/prodvizhenie-sajta/ , web-ru.net/category/prodvizhenie-sajta/page/2/ и т.д. Почему?

    Ответить
  6. Владимир:

    У меня такая проблема. На моем сайте (WordPress 4.0) установлен плагин Platinum SEO. В его настройках есть пункт, который позволяет создавать канонические урлы.
    Однако когда просматриваешь страницы с помощью RDS bar видно, что в записях канонический урл дублируется (в исходном коде — и вордпресс его создает, и плагин).
    На главной странице и в рубриках такого нет — канонический урл создает только плагин.
    Подскажите как избавиться от дублей? Т.к. поисковые системы должны видеть только один такой урл.

    Ответить
    • Пётр:

      Хм.. сейчас посмотрел на одном сайте с такой же версией WP и установленным All in One Seo Pack’ом — все канонические URL — только от данного плагина.

      Возможно, у вас тема такая, что добавляет подобные ссылки. Поищите настройки, отключите это дело.

      Ответить
      • Владимир:

        Отключил в настройках плагина. CMS сама создает в постах канонические урлы

        Ответить
Я не спамлю...