Рубрика // Сайтостроение 12.01.11

Воровство контента. Методы защиты сайта.

Ой, как же много в сети плохих людей, которые не уважают чужой труд. Для того чтобы заработать копейки, они ухитряются и начинают копировать материалы чужих людей себе на сайт, дабы увеличить количество страниц для продажи ссылок.

Читая разнообразные форумы, порой начинаешь поражаться, сколько же воров существует в интернете. Не успеешь обернуться, как ваша новая опубликованная статья уже на чужом ресурсе. А это в свою очередь не только обидно, но и может принести ущерб вашему сайту. Ведь поисковые системы еще не научились определять первоисточник контента, что очень плохо. Далее мы рассмотрим, какие же бывают воришки, и чем они пользуются для копирования материалов с вашего сайта.

Виды воровства контента с сайта.

Ну таких людей существуют 2 вида. Это масштабные и профессиональные воры, а так же мелочные воры.

Что касается первой группы, скажу одно. Это самые опасные люди в интернете. Они берут специальные программы или скрипты, и с помощью их, просто напросто копируют ваш сайт «под корень». Далее они могут разделить ваши статьи на несколько сайтов, и разбавляя таким образом их, размещать на нескольких сайтах. Поэтому если вы увидели несколько источников вашего контента на разных сайтах, то это может быть один человек скопировал ваш сайт, и разместил статьи на разных ресурсах.

Второй вид воришек контента, это простые и начинающие копипастеры. Они могут вручную копировать ваш материал, и потихоньку размещать статьи на своих ресурсах. Я встречал такое. У меня не раз копировали материалы с сайта. Но как же я их нашел? Да все просто. Ниже я расскажу некоторые хитрости которые помогут вам по крайней мере не только защититься от воровства материалов, а даже извлечь выгоду из этого.

Почему нельзя полностью защитить сайт от воровства контента?

Как я говорил выше, что самым опасным является то, что ваш сайт могут скопировать от начала и до конца. Против таких людей нет приема. Сейчас объясню почему.

Многие поисковые системы, а так же другие роботы (например «Sape»)приходят к нам на сайт сканировать новые и существующие материалы. Представьте себе, приходит робот яндекса например с ip 231.45.96.145 . Начинает его агрессивно сканировать, и тут если настроить скрипт блокировки по ip может произойти самое грустное, что можно себе представить. Робота Яндекса забанили, — и в следующий раз, когда он придет к вам на сайт, — его не пустят проиндексировать материалы. Адреса роботов могут меняться и мы не можем угадать, какой из них именно принадлежит поисковой системе. Таким образом, мы, не пустив определенного посетителя (вдруг окажется какой то поисковик), не дадим себя проиндексировать ему. А затем, начинаются проблемы. Лучше на этом не зацикливаться и двигаться дальше.

Методы защиты контента от воровства.

1. Установить плагин для WordPress. Если у вас движок WordPress, то не составить большого труда установить плагин «WP-CopyProtect». Что он делает? При активации его в админке, он запрещает выделять текст на вашей странице, а так же отключает выпадающее меню при нажатии правой кнопкой мыши.

Такой способ защиты, способствует отсеву начинающих копипастеров, которые на знакомы с HTML. Но знающий вебмастер без проблем, если захочет – скопирует материал, несмотря на такую хитрость. Но у этого плагина етсь небольшой минус. А состоит он в том, что если у вас хороший и посещаемый сайт, то это может создать некоторое неудобство пользователям. Подумайте сами, если у вас опубликована статья с какими-то символами или кодами. Как их пользователь скопирует?

2.Написать огромными буквами – Не копируйте мои материалы. Конечно, это банально, и не остановит ярого копипастера. Но все же, напишите внизу блога, что сайт авторский, и копировать материал можно только с активной ссылкой на вашу статью. Есть такая тенденция, что если скопировать статью, и поставить ссылку на источник, — в плане получения злого фильтра от яндекса, или занижение позиций в поисковике отпадает. К тому же говорят, что скопированный материал с ссылкой на первоисточник держится в индексе намного лучше, нежели просто без ссылки.

3. Вставить ссылки и другие напоминания об авторе. Когда вы пишите статью, не забывайте ставить ссылки на внутренние страницы вашего сайта. Это даст огромный плюс не только в плане перелинковки сайта, но и в случае кражи статьи автоматической программой, — шанс, что ссылка останется активной. А это дополнительный бек вашему сайту.

Так же можно подписаться в конце статьи, что я автор статьи, тем самым дать людям знать, что вы существуете. Можно вставлять в конце статьи ссылку на этот пост. Только делайте ее не активную, потому как многие программы сбора контента обрубуют теги <a>. Для этого, разместите ссылку в виде http:// и она останется в статье не тронутой.

4. Защита картинок. Как ни банально звучит, но картинки тоже можно защитить с помощью водяного знака. Это даст нам не только дополнительный трафик, если у нас украли статью с картинкой, но и даст знать, что мы являемся хозяинами материала. Для WordPress существует отличный плагин, который ставить водяные знаки на ваши фотографии «NextGEN Gallery».

5. Уникализация шаблона сайта. Как известно, все программы для сбора контента работают по одному принципу. Они ищут в тексте страницы одинаково повторяющиеся границы. Например, это может быть <div id=»content»> … Тут тело статьи <!—end—> . Программы с легкостью вычисляют такие повторяющиеся границы, и выдирают только текст статьи.

Чтобы защититься от неприятности встречи со сборщиком контента, нужно уникализировать эти теги. Но это не всегда помогает. Программы умеют вычислять измененные вами теги. Для этого нужен специальный скрипт, который бы генерировал уникальный шаблон на лету, чтобы не было повторяющихся границ. Таких скриптов я не встречал, увы. Их я думаю можно заказать программисту. Но все равно, изменив стандартные теги, мы избавимся от 50% авто сборщиков контента.

6. Защита картинок и других файлов. Если у вас часто воруют картинки с сайта, при этом взяв только ссылку на картинку, то можно воспользоваться защитой самого хостинга.

Как известно, если у вас много различных материалов, картинок, видео файлов, архивов и других файлов, — и на них просто ссылаются другие сайты (в их статьях прямая ссылка на скачку вашего файла), то производительность вашего сайта (хостинга) снижается. В этом случае можно запретить прямые ссылки на эти файлы. Делается это в Cpanel => Защита от прямых ссылок.

Не нужно сразу рваться и запрещать другим пользоваться вашими файлами. В большинстве случаев это даже нам на руку. Для малых сайтов, например с картинками, полезным будет то, что пользователи иногда размещают ссылки на картинки в форумах. Иногда это может быть вебмастер, опубликовав статью с вашей картинкой он оставляет линк на ваш сайт. Ведь ссылка на картинку <img src — тоже передает вес.

По другому обстоят дела с сайтами  на которых присутствует много собственного видео материала. Я видел многое. Например взять тот же «Youtube». Он сам предлагает взять ссылки на видео. Поэтому у него большой ТИЦ и посещаемость. Но а подумать о производительности. У вас хватит денег купить 10.000 серверов?

Если вы решили что сможете раздавать видео другим сайтам, то для маленьких проектов, это может пагубно повлиять на скорость работы сайта. Чем больше у вас будут отнимать полосы пропускания, тем медленнее будет работать ваш сайт. Чтобы защитить себя от подобной ситуации, можно в списке запрета написать flv.
7. Обнаружение. Случается такое, что можно вычислить вора вашего контента. И узнав его ip адрес, можно его забанить. Делается это с помощью хитрого файла .htaccess, который лежит в корне вашего сайта. Отредактируем его.

Написав такую строчку, он уже не сможет зайти к вам на сайт, а так же воспользоваться программами сбора контента. Конечно, такой способ эффективен, и он позволяет на 80% защитить кражу материалов с вашего сайта. Просто существуют пути обхода, вашего запрета на вход злоумышленника. Но о них я говорить не буду.

В заключение пару слов о обнаружении воров контента с вашего сайта. Первым моим обнаружением кражи статей было в яндекс панели. Там я увидел беки на мой сайт. Благодаря тому, что я размещал картинки и ссылки на внутренние страницы своего сайта, воришка скопировал контент, и даже поленился почистить ссылки, тем самым наградив меня парочкой обратных ссылок.

Но есть и другой способ обнаружения таких людей. Воспользуйтесь сервисом поиска дублированного контента «Advego». Откройте на своем сайте запись 2-х недельной давности и проверьте текст на уникальность этим сервисом. Если найдется совпадение, вы узнаете адрес скопированного материала.

Напишите администратору сайта, пускай поставить ссылки на вашу статью, или попросите удалить ее. Если он согласится, будет хорошо, а если нет, то идем в .htaccess и блокируем негодяя навсегда, лишив его доступа к вашему сайту.

  • Facebook
  • Memori
  • Twitter

Теги:    , , ,

9 Комментариев к " Воровство контента. Методы защиты сайта. "

  1. + еще есть такой ресурс как Tynt.com. Я не пользовался им и не уточнял, но принцип его в следующем: воришка копирует текст статьи и вставляет его на свой сайт. Вроде все по его мнению прошло плавно, НО! он не замечает сквозную ссылку на сайт пита sait.ru/post.html, где взял эту статью. Ресурс Tynt.com просто навязывает ссылку на домен, где была взят контент, даже если кипировать на комп в любой текстовый документ.

  2. Виктор, вы правильно заметили, что можно и таким не хитрым способом получить хоть какую-то выгоду от сворованного у вас контента.

    В данном случае владелец текста просто получает нужный ему бэклинк для своего сайта…

  3. Данная статья полезна для многих в наше время. Так как всем известно, что сейчас кол-во сайтов с ворованным контентом превышает сайты со статьями, написанными администрацией или журналистами.

  4. Alex:

    Есть еще один примитивный, но действенный метод: Убираем функцию выделения текста и отключаем правую и левую кнопку мыши.
    Для этого вставляем в заголовок — между тегом и следующую
    строчку:

    • Очень интересный метод. Но я не поняла куда именно вставлять в заголовок знак тире. В сам заголовок статьи, например «Статья — о зайчиках»? Или в адресную строку url?
      Объясните поподробнее, пожалуйста, потому что тема действительно очень актуальна.

  5. А вот что-то новенькое… наткнулся на сайт nocopypaste.com обещают защищать текстовый контент и отдаваться ПС. у кого какие мнения на сей счет? p.s. зарегистрировался там.. вроде все красиво, текст отдается на флеше но флэш зашифрован и разрабы божатся что текста в флеше нет… какой-то у них там технология 🙂

  6. Предлагаю простой способ защиты от копирования. Профи не остановит, да они этим и не занимаются, а от новичка вполне…

  7. хтмл не возможно защитить — ничем и никак, ну разве что только от не продвинутых юзеров, которым это воровство и подавно не нужно.

Написать комментарий

Copyright © 2010-2011 Как создать сайт и заработать.. Все права защищены.
интернет