Воровство контента — как найти ворованный контент и что делать в этом случае? Видеоурок

Воровство контента, как найти ворованный контент

  Ищем сворованный content

После того, как вашему сайту или блогу исполнится несколько месяцев (при условии, что вы регулярно делаете новые публикации), то часть текстов с него будут воровать. Это практически так же неизбежно, как и появление спама в комментариях. И часто очень неприятно :).

Неприятно не из-за того, что продукт вашего интеллектуального труда — статья — стала доступна к прочтению на других ресурсах, а из-за того, что вашему сайту от этого будет не очень хорошо. Особенно, если поисковые системы решат, что ваш сайт не является первоисточником данного текста.

Как я писал в статье про важность уникальных текстов на сайте, поисковики заботятся о своих ресурсах и удобстве для пользователей, поэтому «откровенные» копии контента они стараются выкидывать из своего индекса. Ну а если ваша статья была кем-то сворована и размещена на ещё каком-то ресурсе, но страница с нею проиндексирована раньше, чем на вашем, то у поисковой системы есть полная уверенность считать, что ваш ресурс разместил у себя копию (или, как говорят, плагиат).

В общем, если сказать короче: плохо, когда ваш контент воруют, а ещё хуже — когда копия оказывается в индексе поисковика раньше оригинала.

Воровство контента с сайтов и его виды

Думаю, можно выделить 4 вида этого явления.

1. Автоматическое копирование всего сайта

В этом случае специальными программами (т.н. грабберами) сайт полностью скачивается с сервера со всем его содержимым, структурой и оформлением. Т.е. создаётся практически не отличимая от источника копия (но, конечно, с другим доменным именем).

2. Вручную ворованный контент

Это наиболее распространённый вариант. Например, какой-нибудь сайтовладелец хочет наполнить свой проект по-быстрому статьями — идёт в поиск, вводит запрос, получает поисковую выдачу, из неё выбирает сайт, копирует тексты и размещает у себя. Обычно этим занимаются начинающие вебмастера, которые просто не знают, что делать так не надо.

3. Спарсенный контент

От английского слова «parsing» — «разбор». Имеется в виду, что специальный серверный скрипт с сайта (или вообще десктопное приложение с компьютера) обращается к URL-адресу вашего сайта, «вытягивает» всё, что там есть и получает текст статьи (т.е. отбрасываются блоки меню, сайдбар, футер и т.п.). В принципе, это просто автоматизация ручного воровства контента.

Кстати, в этом случае ваши статьи может «спасти» внутренняя перелинковка, т.к. при автоматическом парсинге скачиваются все ссылки внутри статьи — т.е. ссылки на другие материалы вашего ресурса. Конечно, данная особенность не решает все последствия копирования текста, но добавляет бэклинки — внешние ссылки на ваш сайт, а также может навести поисковых роботов на некоторые размышления.

4. Копирование статей с указанием авторства

На мой взгляд, это уже не нужно относить к ворованному контенту, потому как указана ссылка-источник. Правда, крайне желательно, чтобы такая ссылка не была закрыта от индексации поисковыми роботами, а иначе мы:

Но тут есть и обратный эффект: если очень некачественный сайт сошлётся на наш (оставив открытую ссылку), то нашему станет хуже. И наоборот — если трастовый сайт укажет на наш — то и нам хорошо.

В общем, в любом случае, от воровства контента больше вреда, чем пользы.

Как найти ворованный контент?

Осуществить данный процесс весьма просто — достаточно проверить уникальность текста на сайте любым способом. Думаю, проще всего сделать это через специальные программы от крупных бирж копирайтинга. Достаточно произвести проверку всей своей статьи (или её части) на копии в Интернете. Посмотрите моё видео, где я это делаю программой eTXT Антиплагиат:

Видео: поиск скопированного контента в eTXT Антиплагиат:

Скачать это видео (22 мб)

Таким образом, если на вашем сайте есть качественная, написанная вами статья, «заточенная» под не слишком высокочастотный или конкурентный запрос и, в то же время, она находится на 100+ позиции поисковой выдачи, то велика вероятность, что её кто-нибудь своровал, и поисковики за источник контента принимают не ваш сайт.

Что делать?

Если удалось обнаружить сайт, своровавший вашу статью, то можно:

Мне лично ничего из перечисленного выше делать не приходилось, хотя надо бы.. К счастью, как показано в видео, страница со статьёй про контекстную рекламу в интернете перестала существовать без «моей помощи», уж не знаю почему — угрызения совести вебмастера помогли или что-нибудь более банальное. Но, тем не менее, она ещё есть в кэше Яндекса и Google.

А недавно обнаружил ещё один ресурс, который появился около 2-х месяцев назад и который своровал у меня уже 3 статьи. Например, вот моя статья про срезы в РСЯhttp://adnice.net/stat/startweb/107-kak-zadat-srezy-dlya-obyavleniy-rsya-i-zachem-eto-nuzhno.html. Как ни странно, у обеих статей (и моей, и копии) всё нормально с индексацией в Яндексе и Гугле.

Весьма любопытно то, что на Adnice.net запрещено выделить текст мышкой и скопировать его вручную. Видимо, вебмастер заботится о сохранности контента :). Наверное, придётся в этот раз что-нибудь делать с этим..

Сталкивались ли вы с воровством контента с ваших сайтов? И если да, то что делали в этом случае?

1 Star2 Stars3 Stars4 Stars5 Stars (4 оценок, среднее: 2,00 из 5)
Loading...
Случайные публикации:
  • Как добавить Яндекс Карты на сайтКак добавить Яндекс Карты на сайт...ктор карт выдаст код карты, который останется просто добавить на свой
  • Telegram начал тестировать шифруемые звонкиTelegram начал тестировать шифруемые звонкиВ бета-версии мессенджера Telegram появилась функция звонков. Они доступны в тесто...
  • ASCII-коды символовASCII-коды символовОчень часто вебмастерам приходится пользоваться специальными символа...
  • Google Analytics - как зарегистрироваться и добавить код на сайт.Google Analytics - как зарегистрироваться и добавить код на сайт....к описано выше: выбираете Веб, вводите данные о сайте и так далее, и в
  • Бесплатная раскрутка сайта (блога) в поисковых системахБесплатная раскрутка сайта (блога) в поисковых системахВ нескольких предыдущих статьях я уже писал о платных и беспла...
Оставьте комментарий:
комментария 34
  1. Алексей:

    Спасибо, Петр!
    Полезная статья, а главное — ты показал конкретное решение проблемы. Я пробовал закрывать контент на своем блоге специальным плагином, но он блокировал мышь полностью, а значит не давал нажимать на ссылки. Поэтому я отказался от данного метода.
    Скорее всего, кроме постоянного анализа и разборок с воришками пока ничего эффективнее нет(((

    Ответить
    • Пётр:

      Алексей, да, здесь остаются только анализ и разборки :)

      Все подобные плагины теряют смысл, если в браузере отключить JavaScript.

      Ответить
  2. Сергей:

    Интересная статья Петр. Но на мой взгляд особенно ничего с этим не поделаешь. Вебмастеров в интернете много и все со своими тараканами в голове. Пока в интернете ничего реального для защиты не придумано. Хотя попытки делаются. Мне пока переживать нечего у меня только начало начал. Только начинаю наполнять сайт статьями. Но вероятно об этом надо думать сейчас. Спасибо за статью. Мысли изложенны интересные, возьмем на вооружение.

    Ответить
    • Пётр:

      Но вероятно об этом надо думать сейчас

      Сергей, всё так, только не переусердствуйте — создавайте больше нового, не «держитесь» сильно за старое 8)

      Хотя на новичках подобные воры часто и наживаются — пользуются их неосведомлённостью о том, что такое вообще может быть.

      Ответить
  3. Alex:

    Тоже самое можно делать и в Advego Plagiatus. А если честно то правильно подмечено, что Воров контента надо наказывать.

    Ответить
    • Пётр:

      Да. Вот если бы не SEO.. то можно было бы и не наказывать)))
      А так придётся..

      Ответить
  4. Владислав:

    Благодарю, Петр! Невесело осознавать, что кто-то пользуется результатами моего труда. Учту Ваши рекомендации.

    Ответить
    • Пётр:

      Не за что, Владислав
      Да пусть пользуются, только за своё не выдают :)

      Ответить
  5. Лариса:

    Ой воровали-и-и…Причем мы это обнаружили случайно. Обратились дважды к админу сайта, безответно. Обратились на хостинг, там среагировали очень оперативно, тот сайт был заблокирован. Все сворованное они удалили. К сожалению, пока только такой способ борьбы с ворами.

    Ответить
    • Пётр:

      Да, способ известный и резкий.
      Скоро тоже перейду к такому =)

      Ответить
  6. Диана:

    Есть такой сервис Зарегистрировавшись там, можно поставить скрипт на свой сайт, который автоматически вставляет в скопированный текст ссылку на источник. Может, и мало от этого толку, но я поставила недавно. Искала в интернете скрипт, который вставляет скрытую ссылку на источник, но так и не нашла. Скрипты есть, но на практике они не работают.
    На старом сайте у меня очень много ворованных текстов. До сих пор никому не писала. А недавно обнаружила, что газеты внаглую копируют текст с сайта, даже не проставив авторство и источник. А на газеты кому жаловаться?

    Ответить
    • Пётр:

      Диана, чтобы «нейтрализовать» такой скрипт, копирующему статью достаточно отключить JS в своём браузере.

      А на газеты кому жаловаться?

      (сначала сайты копировали с газет, а теперь…:))
      Жаловаться можно редактору, наверное.

      Вообще, предполагаю, но точно не знаю, что в этом случае (при должном усердии, конечно), можно требовать и компенсацию какую-нибудь.
      Всё-таки нарушение прав собственности на интеллектуальный труд…
      Если в Сети копирование происходит повсюду и с этим законно никак почти не борются, то в оффлайне дела обстоят иначе.

      Ответить
      • Диана:

        Диана, чтобы “нейтрализовать” такой скрипт, копирующему статью достаточно отключить JS в своём браузере.

        В случае скрытых ссылок надо сначала узнать, что такой скрипт вообще есть.
        Простые пользователи интернета часто копируют почти всю страницу и выкладывают на форумах. Ссылку на источник ставить забывают. Не знаю даже, кому в таких случаях жаловаться. А вот скрипт может помочь таким «забывчивым».

        Ответить
        • Пётр:

          Ну верно, скрипт только для «забывчивых».

          А от тех, кто нацеленно копирует чужие статьи, он не защитит :)

          Ответить
  7. Юлия Пономарева:

    Петр, огромное спасибо за статью и урок!

    А я-то не понимала, в чем дело — вроде статьи оптимизированы и поведенческий фактор нормальный, а не выходят даже на первые 50 позиций.

    Почти весь контент копируется.

    Скажите, а если моя статья написана и проиндексирована на месяцы раньше, то в любом случае она считается первоисточником?

    Ответить
    • Пётр:

      Юлия, не за что)

      а если моя статья написана и проиндексирована на месяцы раньше, то в любом случае она считается первоисточником?

      — ну в общем-то, да (если только ранее никто не написал точно такую же статью, что очень маловероятно :) )

      Ответить
  8. masterseo:

    Можно вот, что еще сделать, прописываем тег author, обновляем sitemap и загоняем в google, от туда бот быстро приходит. В яндексе добавляем новый URL сайта где размещена новая статья и конечно сразу в закладки, таких сервисов много и туда часто заходят боты, наша задача скормить статью первыми поисковикам. Извините за жаргоный сленг, удачи в борьбе с воришками! :)

    Ответить
    • Пётр:

      Да с Гуглом-то проще.
      Только тем, кто своровал ваш контент ничто не мешает тоже прописать тег author и обновить sitemap.

      А насчёт Яндекса: add url иногда помогает, иногда нет. Но обычно нет.

      Расхожее заблуждение. На самом деле то, что робот Яндекса увидит внешнюю ссылку на каком-то сайте, ещё НЕ значит, что он добавит документ, на который она указывает, в свой индекс.

      Удачи также ;)

      Ответить
  9. Александр:

    Извините ребята , немного не в тему , у меня получилось так : писал на сайт статьи , а потом решил эту тему перенести на другой свой же сайт ( статей 15) , так уже месяц как нет статей на старом сайте , а на новом не могу опубликовать , проверка показывает 100% неуникальности , ссылается на сохраненные копии . Не подскажите , как почистить эти копии ? В поддержке на хостинге говорят , что этим не занимаются . =-O

    Ответить
  10. Ильшат:

    Насчет обращения с жалобой к хостеру интересный момент. Чисто юридически, хостер не имеет права ничего блокировать без решения суда, ибо голословной жалобы не может быть достаточно. Так, можно было бы валить сайты конкурентов, обвиняя их в плагиате. Факт, что чей то контент попал в индекс первым не может быть однозначным доказательством авторства. Контент мог быть у истинного автора вне индекса, и быть сворованным.

    П.С. Яндексу, вообще плевать, кто истинный автор. Для него важно, что бы пользователю, который пришел с поиска была польза.

    Ответить
    • Пётр:

      Факт, что чей то контент попал в индекс первым не может быть однозначным доказательством авторства. Контент мог быть у истинного автора вне индекса, и быть сворованным.

      — верно. Только в Интернете, в частности, в отношении с поисковиками всё несколько иначе.

      Ответить
  11. Дмитрий:

    Видел есть скрипт,который делает так, что текста в коде нет, а в браузере есть и пользователь его отлично видит.
    Поэтому скопировать текст парсером не получится. Только не знаю нормально ли индексируется такой текст ПС. Сейчас вот ищу такой скрипт, может кто поподробнее знает о нем.

    Ответить
    • Пётр:

      делает так, что текста в коде нет, а в браузере есть

      — ну тогда и индексироваться нечему будет)

      Ответить
  12. Леонид:

    Все плагины, блокирующие контент против копирования не помогут против простой и всем доступной вещи: «Инструменты разработчика» из панели Настроек и управления ХРОМА. С помощью этих инструментов снимается любой сайт и полностью со всеми рисунками, файлами и скриптами. 8)

    Ответить
  13. hotstuff1988:

    Да, блокирование правой кнопки мыши на сайте — детский лепет. Если кто то захочет спереть контент, то у него это получится. Помнится мне, на яндексе пытались запустить сервис по защите контента. Смысл такой: перед публикацией статьи закинуть в форму яндекса тескт, а уж потом разместить его у себя на сайте. Вот линк http://help.yandex.ru/webmaster/?id=1120755&ncrnd=534

    Ответить
    • Пётр:

      Да, они уже более полугода как запустили этот сервис. Всё хорошо для тех сайтов, у которых ТИЦ>10.
      Зато «веселье» начинается, когда сайт с большим ТИЦ ворует контент с нулевых молодых сайтов и через этот инструмент выдаёт его за свой собственный. ;)

      Ответить
    • Ольга:

      hotstuff1988 И Вам это помогает??????????
      У меня, оказалось, почти все статьи плавно и переплывают в livejournal,потом они просто размножаются среди ливежурналовских дневников.Замучилась писать им (ворунам)гневные статьи, некоторые удаляют, но очень возмущаются, другие просто молчат, но статьи продолжают воровать! И мне уже никого из них не жалко. Куда писать жалобу?, пусть банят их сайты!

      Ответить
      • Пётр:

        Вам зато можно порадоваться, что пишете статьи хорошо ;)

        Ответить
  14. Яков:

    Доброе время суток!
    Вот и я столкнулся с такой ситуацией. В наглую воруют статьи с сайта. Не успеваешь добавлять, а они уже на другом сайте. Пробовал писать всем Яндексу, Гуглу, хостеру и админу сайта толку не от кого нет. Админы на связь не идут.
    Так и воруют. Пока нашёл два сайта которые воруют. Воруют не только у меня, но и с других сайтов, Один хоть ссылку обратную ставит, а второй нет.
    Вот ГС: vkusnij-recept.ru/, recapes.ru/
    И что с этим делать не знаю.

    Ответить
    • Пётр:

      Здравствуйте,
      да, тут особо ничего не поделаешь.

      Рекомендую перед публикацией все новые статьи отправлять в «Оригинальные тексты» от Яндекса (об этом тут)
      а после — добавлять URL статьи в Google.

      Ответить
  15. Галина:

    Ситуация была не с воровством контента, а с воровством названия раскрученного и известного в определенных кругах сайта. Писали владельцу сайта с таким же названием — менять не хотели ни в какую. Тогда зарегистрировали авторское право на одном из специализированных сайтов, позволяющих это сделать, и отправила свидетельство о авторском праве на название сайта хостеру, где располагался сайт-двойник. В итоге сайт заставили изменить название. А через месяц он и вовсе закрылся, что показало, что сайт изначально создавался, как дубль нашего сайта. Так что обращение к хостеру помогает.
    Сейчас новая проблема уже с другим сайтом. Воруют материалы, причем, практически дублируя наш сайт, рерайтят и выставляют, Но это пол беды, сворованы даже названия рубрик. Но самое главное мы издаем журнал и размещаем на своем сайте. Журнал тоже сворован с предваряющим его текстом «Наш портал начал издавать журнал…» И выходит сайт-вор издает журнал, а не мы. С этим мириться мы не будем. Вновь обратились к хостеру. Посмотрим, что они ответят. Но будем бороться до конца. Нельзя оставлять такое безнаказанно. Потому что борзеют в интернете все больше и больше.

    Ответить
Я не спамлю...