У нас была подобная проблема тоже. Писали статьи сутками с уникальным текстом, потом оказывалось что другие сайты их просто крали и публиковали у себя. Это окончательно достало когда Яндекс поставил в выдаче вора выше нас, а наш сайт (более старый, чем тот что завел вор) исключил из результатов поиска по причине «слишком одинакового контента» (точную формулировку не помню). Обращались к Яндексу за помощью, ответ был лишь такой: «обсуждать это не будем, менять ничего не станем, поисковая выдача дело робота, в работу которого мы не лезем. Спасибо за ваше обращение, мы учтем эту ситуацию и попытаемся улучшить сервис в дальнейшем».
Дальше мы писали владельцу сайта чтобы он убрал ворованный контент - ответ не последовал. Обращались к владельцам хостинга, со ссылкой на закон об авторском праве. Это помогло, ворованный контент был убран.
Но со временем оказалось что случаи воровства настолько увеличиваются, что мы уже не может вручную всех за рукав дергать. Потом появился сервис яндекс уникальные статьи, которым пользуемся с тех пор. Каждый раз перед публикацией на сайте добавляем текст туда. Вроде благодаря этому воришек они перестали ставить выше нас - хоть на этом спасибо.
Дальше мы разработали скрипт, который заносит в базу IP того кто копирует более 70% текст на странице. Дальше у нас есть специальный счетчик, который считает какое количество раз была сделана копия к количеству заходов на сайт. Если почти каждая наша статья копируется с определенного IP мы вносим его в черный список и не даем просто заходить на сайт. Проверка на уникальность воришки производилась также с помощью cookies, чтобы исключить ошибку по одному IP. Кроме того можно сделать более гуманный вариант: не блoкировать заход под IP, а блoкировать возможность копирования текста, если пользователь был замечен в воровстве. Конечно он может отключить JS в браузере, но так как ни один современный сайт без JS уже не работает - есть надежда что воришку просто достанет включать/выключать его. Но это чревато тем, что без JS нам уже не узнать копировал ли он что-то с сайта или нет.
Но потом мы и от этого способа отказались, когда сайт подрос в ТИЦ и в популярности и посещаемости. Потому что решили - пусть уж лучше заходят, чем мы будем резать трафик и нагружать систему.