Categories: seo

Rel=canonical (канонический URL) и дублирование контента в WordPress

Какое-то время назад, а точнее 12 февраля 2009, поисковая система Google ввела поддержку т.н. канонических URL (тегов link с атрибутом rel=canonical).

После этого их стали поддерживать и несуществующий сейчас (как поисковик) Yahoo, а также Bing от Microsoft. Не отстаёт и Яндекс.

В чём суть канонических УРЛов и для чего они нужны?

Нередко бывает так, что страница с одним и тем же содержимым доступна по разным адресам — происходит дублирование контента.

В WordPress это особо хорошо видно если, например, перейти по адресам вида site.ru/category/name-of-category и site.ru/name-of-category, то будет ясно, что содержание этих страниц одинаковое. Сравните:

Как известно, поисковики не любят, когда один сайт ворует контент с другого сайта. Но также они не любят, когда страницы на одном и том же сайте абсолютно одинаковые — это заставляет их усомниться в качестве такого веб-ресурса.

Иными словами, если на сайте имеются абсолютно одинаковые страницы, то данный сайт будет пессимизирован (т.е. его ранжирование в поисковой выдаче будет специально ухудшено).

Даже Гугл особо заостряет на этом внимание в своём руководстве по продвижению сайта в Google.

Т.к. часто происходит так, что дублированный контент появляется не по вине пользователя, а по вине CMS, то для того, чтобы «сказать» поисковикам, где первоисточник или какая из страниц с одинаковым содержанием главнее, используются канонические URL, что буквально можно перевести как «образцовые ссылки».

Код этих ссылок выглядит так: link rel=»canonical» href=»http://site.ru/good-page».

Такая ссылка должна быть расположена в разделе head на «НЕ образцовой» странице (т.е. на той, которая «производит» дублирование контента) и указывать на «образцовую», как бы говоря поисковым роботам «нужно взять в индекс не меня, а вот эту страницу и не применять к нашему сайту никаких санкций».

Вот как выглядит канонический URL для примера из начала статьи:

  Каноническим для http://web-ru.net/prodvizhenie-sajta/ является URL http://web-ru.net/category/prodvizhenie-sajta/

Требования к каноническим ссылкам

Основные требования для таких ссылок (чтоб они учитывались поисковиками), таковы:

  • «Образцовая» страница должна существовать
  • Для Яндекса: такая ссылка должна указывать на свой же домен (поддомен и другой домен не учитываются). Для Гугла можно указать ссылку и на другом домене.
  • Одна страница должна иметь только одну link rel=»canonical» в своём коде.
  • «Образцовая» и «необразцовая» страницы должны иметь сходную тематику.
  • Не должно быть цепочек канонических УРЛ. Допустимо, если страница А указывает на страницу Б, а Б никуда не указывает или указывает на саму себя. Но нельзя такое: А — Б — C и т.д.

Стоит ещё отметить, что в справке Google написано, что наличие канонической ссылки является рекомендацией поисковому роботу. Для Яндекса наличие такого URL-адреса является правилом (скорей всего).

Само собой, что вручную проставлять такие ссылки весьма трудоёмко. Этот процесс должен производиться движком сайта.

Если сказать о сайтах на WordPress, то, к сожалению, изначально в этом движке нет канонических URL. Но, как всегда, в этом движке почти всё может быть «спасено» установкой разных WP-плагинов. В следующей статье я покажу, как можно это исправить и избежать дублирования контента в WordPress с помощью плагина All in One Seo Pack.

Посмотрите также видео от Google, где рассказывается об этих ссылках. Видео хоть и на английском, зато из первоисточника.

Презентация rel=canonical:

Интересно, что дата внедрения подобных УРЛ — 200 лет со дня рождения Ч. Дарвина.
Пётр

View Comments

  • Что делать, если одна и та жа страница доступна по разным адресам? Я понял, что атритут canonical используется на странице-дубле. А в Вашем примере страница указывает сама на себя.

    • Да, Юрий - этот атрибут прописывается на странице дубле и указывает на страницу-источник.
      В моём примере страница-дубль "http://web-ru.net/prodvizhenie-sajta/" указывает на источник "http://web-ru.net/category/prodvizhenie-sajta/", а источник указывает сам на себя. Последнее - особенность плагина All-in-one-seo-pack и не является ошибкой.

  • Скажите пожалуйста, следует ли запрещать индексирование модуля аккордеон на Joomla 1.5.
    1, У меня есть сайт сделал для удобства справа меню по странам, но получается что один и тот же текст дублируется слева и справа, влияет ли это на веса страниц и на выдачу в поисковиках?
    2, И если я запрещу это меню к индексированию, как сделать, чтобы вес у них не сгорел, а перешел к их дублям? И вообще как сделать запрет этого меню?

    • Вообще, если сильно беспокоит данный вопрос - сделайте блок на AJAX'e.

      Можно многое сделать

          • Я вот тоже заметил что All-in-one-seo-pack ставит ссылку "rel canonical" не только на страницах-дублях но и на оригинальных страницах, которые являются каноническими. Почему вы говорите что это не ошибка? Думаете гугл обращает внимание что это сделано каким то сраным плагином All-in-one-seo-pack и не стоит считать это ошибкой? Вряд ли соглашусь с вами.

          • Согласитесь с Гуглом - домотайте данное видео до 17-й минуты.

  • А как запретить индексировать ссылки с префиксом коментов например #comment-74 (web-ru.net/prodvizhenie-sajta/seo/relcanonical-kanonicheskij-url-i-dublirovanie-kontenta-v-wordpress.html#comment-74)

  • А еще я заметил, что вы не используете keywords на таких страницах web-ru.net/category/prodvizhenie-sajta/ , web-ru.net/category/prodvizhenie-sajta/page/2/ и т.д. Почему?

  • У меня такая проблема. На моем сайте (WordPress 4.0) установлен плагин Platinum SEO. В его настройках есть пункт, который позволяет создавать канонические урлы.
    Однако когда просматриваешь страницы с помощью RDS bar видно, что в записях канонический урл дублируется (в исходном коде - и вордпресс его создает, и плагин).
    На главной странице и в рубриках такого нет - канонический урл создает только плагин.
    Подскажите как избавиться от дублей? Т.к. поисковые системы должны видеть только один такой урл.

    • Хм.. сейчас посмотрел на одном сайте с такой же версией WP и установленным All in One Seo Pack'ом - все канонические URL - только от данного плагина.

      Возможно, у вас тема такая, что добавляет подобные ссылки. Поищите настройки, отключите это дело.

      • Отключил в настройках плагина. CMS сама создает в постах канонические урлы

Recent Posts

  • Заработок в Интернет

Рейтинг интернет казино: ТОП заведений с высокими оценками экспертов

Начинающие геймеры часто недооценивают опасности, связанные с беспечным отношением к выбору онлайн казино. (далее…)

2 года ago
  • Заработок в Интернет

Рейтинг лучших казино для игры на реальные деньги: как начать играть в игровые автоматы?

Онлайн казино - место где уместна игра на реальные деньги, что является главной причиной интереса большинства людей. (далее…)

2 года ago
  • Браузеры

Ферма stealth аккаунтов. Как быстро начать и главное зачем?

В данном топике описан процесс создания и управления большим количеством аккаунтов (или stealth ферма), предназначенных для работы с репутацией и…

2 года ago
  • Браузеры

Gologin — антидетект приложение для масштабирования ферм stealth аккаунтов

Ключевая задача антидетект браузера - обеспечить пользователя функционалом, позволяющим выглядеть в глазах поисковых и антифрод систем реальным пользователем, а не…

2 года ago
  • Заработок в Интернет

Лучшие покер румы: как выбрать надёжную комнату по рейтингу

Подбор площадки для азартных игр должен быть объективным и осознанным. Если пользователь хочет сократить время на поиск, то рискует попасть…

2 года ago
  • Заработок в Интернет

Рейтинг казино: как выбрать лучший бренд для игры на деньги

Большинство игроков выбирают для ставок на реальные деньги первое понравившееся интернет-казино. Однако скоропалительные решения часто приводят к негативным последствиям. (далее…)

2 года ago