Проверка уникальности текста

Автор Тема: Проверка уникальности текста  (Прочитано 12009 раз)

Оффлайн qazar

  • Бизнес оценка: (0)
  • Постоялец
  • ***
  • СПАСИБО: 1
  • Сообщений: 172
  • Карма: 7
  • Пол: Мужской
  • познаваемость мира
    • Червончик

Оффлайн qazar

  • Постоялец
  • ***
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 1
    • Сообщений: 172
    • Карма: 7
    • Пол: Мужской
    • познаваемость мира
      • Червончик
Re: Проверка уникальности текста
« Ответ #10 : 29-10-2010, 08:58:19 »
Ну как-то об расходовании трафика через Advego я не задумывался, хотя конечно и на работе интернет бесплатный и из дома безлимитный. Главное по-моему, все-таки результат работы, чтобы четко показывались уникальность, частота "ключевиков", и "тошнота" переписанного текста. Мне,как зарабатывающему именно на этой бирже, вполне хватает предоставляемых ей инструментов.


Оффлайн zenner

  • Бизнес оценка: (0)
  • Пользователь
  • **
  • СПАСИБО: 0
  • Сообщений: 82
  • Карма: 11
  • Пол: Мужской
  • Бухгалтерия есть триумф разума над математикой!

Оффлайн zenner

  • Пользователь
  • **
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 0
    • Сообщений: 82
    • Карма: 11
    • Пол: Мужской
    • Бухгалтерия есть триумф разума над математикой!
Re: Проверка уникальности текста
« Ответ #11 : 21-11-2010, 05:56:46 »
Не все так осчастливлены безлимитом, поэтому приходится учитывать также расходывание трафика. Особенно когда еще и торрент "працюе" почти на полную катушку... А на работе еще есть тошнопротивное начальство, да и нет смысл там ночевать))))

Согласно изысканиям народа в Сети имеем такой общий результат:
основной список сервисов, для проверки текста (на уникальность!)  выглядит следующим образом:

1. www.miratools.ru

2. www.copy-scape.ru

3. www.copyscape.com

4. www.advego.ru/plagiatus/

Кстати, также не забываем о фаерволе!
Он тоже может блoкировать или сильно тормозить работу сервиса.

Еще также люди советуют 15 основных инструментов для мониторинга популярности сайта. Может и пригодится, "нехай жыве и пасеться!".
 Вот оно:
1. Yahoo! Site Explorer
2. Compete
3. Quantcast
4. Alexa
5. Feed Compare
6. Popuri.us
7. Socialmeter
8. TweetVolume
9. Quarkbase
10. BlogPulse Profiles
11. Technorati Blogging Central
12. Statbrain.com
13. Cubestat
14. DnScoop
15. WebsiteOutlook

А теперь вернемся к нашим баранам, то есть к проверке уникальности текста...
наилучшие способы, вероятнее всего - копирайт и перевод (Америку открыл!))))) :))
Неплохо также скан+программа синонимайзер.

А вообще-то работать надо! И еще...
Список для переваривания на ночь:
законы Зипфа (Джордж Кингсли Зипф)
стоп-слова, алгоритм шинглов («чешуйки» - цепочки из определенного количества слов), рассчет контрольной суммы (сигнатуры); сложность выделения из общего текста фразеологизмов.

Спокойной ночи! :)

Луну первыми покорили викинги.

Оффлайн Sevab

  • Администратор
  • Бизнес оценка: (6, 100%)
  • *****
  • СПАСИБО: 9916
  • Сообщений: 14533
  • Карма: 665
  • Пол: Мужской
    • Trust Directory Project

Оффлайн Sevab

  • Администратор
  • *****
Re: Проверка уникальности текста
« Ответ #12 : 21-11-2010, 06:31:26 »
zenner, спасибо за ссылки  :)

Оффлайн zenner

  • Бизнес оценка: (0)
  • Пользователь
  • **
  • СПАСИБО: 0
  • Сообщений: 82
  • Карма: 11
  • Пол: Мужской
  • Бухгалтерия есть триумф разума над математикой!

Оффлайн zenner

  • Пользователь
  • **
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 0
    • Сообщений: 82
    • Карма: 11
    • Пол: Мужской
    • Бухгалтерия есть триумф разума над математикой!
Re: Проверка уникальности текста
« Ответ #13 : 21-11-2010, 11:13:15 »
Доброе утро!
Или как говорили великие и ужасные Бивис и Батхэд: - Ми вернулись!
Да именно так, с буквой "и" вместо "ы".

По поводу законов Зипфа (Джорджа Кингсли Зипфа).
Этот самый Зипф есть не танкист или летчик, а гарвардский профессор-лингвист. Более 60 лет назад йон обнаружил эмпирические закономерности частоты употребления слов человеческого языка в любом тексте.

Согласно первому закону Зипфа, произведение вероятности обнаружения слова в тексте на его ранг частоты - величина постоянная (константа). Ранг частоты наиболее часто употребляемого слова принимается как единица.

Второй закон Зипфа гласит, что для всех текстов форма кривой зависимости частоты и количества слов, входящих в текст с этой частотой, одинакова.

При проверке уникальности текста вышеуказанные законы Зипфа позволяют учитывать только полезные слова (несущие смысловую нагрузку) и не учитывать знаки препинания, союзы, предлоги, междометия. Избавление текста от этих «лишних» слов (так называемые стоп-слова и случайные слова) является процессом "канонизации текста". Фактически говоря этими полезными словами есть ключевые слова.

Вот, в сжатой форме пока и все.
Луну первыми покорили викинги.

Оффлайн armid

  • Бизнес оценка: (0)
  • Ветеран
  • *****
  • СПАСИБО: 60
  • Сообщений: 1246
  • Карма: 122
  • Зануда
  • Награды КМС поисковой оптимизации Почетный гражданин нашего форума
    • Студент КПИ

Оффлайн armid

  • Ветеран
  • *****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 60
    • Сообщений: 1246
    • Карма: 122
    • Зануда
    • Награды КМС поисковой оптимизации Почетный гражданин нашего форума
      • Студент КПИ
Re: Проверка уникальности текста
« Ответ #14 : 21-11-2010, 11:50:43 »
Очень позновательно. Спасибо.


Оффлайн Teresa

  • Бизнес оценка: (11, 100%)
  • Гроссмейстер
  • *****
  • СПАСИБО: 5785
  • Сообщений: 21706
  • Карма: 606
  • Пол: Женский
  • Интернет, как и смерть - забирает лучших. Sveta я
  • Награды Лучший блог года Более трех тысяч спасибо Почетный гражданин нашего форума Мастер оптимизма За качественный ролик Лучший редактор TDP Более 100 спасибо
    • Видео на заказ

Оффлайн Teresa

  • Гроссмейстер
  • *****
  • Доп. информация
    • Бизнес оценка: (11, 100%)
    • СПАСИБО: 5785
    • Сообщений: 21706
    • Карма: 606
    • Пол: Женский
    • Интернет, как и смерть - забирает лучших. Sveta я
    • Награды Лучший блог года Более трех тысяч спасибо Почетный гражданин нашего форума Мастер оптимизма За качественный ролик Лучший редактор TDP Более 100 спасибо
      • Видео на заказ
Re: Проверка уникальности текста
« Ответ #15 : 21-11-2010, 16:57:24 »
Я пользуюсь Адвего и Etxt. Делайте глубокий анализ или настройки поменяйте. Хотя на вкус и цвет...


Оффлайн zenner

  • Бизнес оценка: (0)
  • Пользователь
  • **
  • СПАСИБО: 0
  • Сообщений: 82
  • Карма: 11
  • Пол: Мужской
  • Бухгалтерия есть триумф разума над математикой!

Оффлайн zenner

  • Пользователь
  • **
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 0
    • Сообщений: 82
    • Карма: 11
    • Пол: Мужской
    • Бухгалтерия есть триумф разума над математикой!
Re: Проверка уникальности текста
« Ответ #16 : 21-11-2010, 22:55:41 »
Сапасиба! Итоги подведем...
ПС проверяет уникальность текстов на основе различных алгоритмов. Один из таковых - "чешуйчатый" алгоритм (от английского shingle – чешуйка, откуда и пошло название "алгоритм шинглов).
Так, значит текст разбивается на небольшие «чешуйки» - цепочки из определенного количества слов (длина шингла). Второе слово первого шингла является первым словом для второго, второе слово второго – первым для третьего и т.д. Благодаря таком принципу построения цепочек ни единое слово не останется непроверенным.

Для каждой чешуйки определяется сигнатура – уникальное число, которое ставится в соответствие некоторому участку текста (в данном случае шингла). Процесс расчета сигнатуры происходит по одному из заранее известных алгоритмов.

У двух разных кусочков текста не может быть одинаковой контрольной суммы - в этом и заключается суть алгоритма шинглов. Из множества сигнатур всего текста (их число равно количеству слов в тексте за вычетом длины чешуйки, уменьшенной на единицу) выбираются только те, которые отвечают некоему критерию.

Сигнатуры двух текстов сравниваются. Все определенные совпадения означают неуникальность текста. Чем больше совпадений, тем выше вероятность, что тексты являются копиями. Очевидно, что при таком способе проверки уникальности текста точность результатов возрастает при уменьшении длины чешуек.
Пока хватит, самому надо переварить что написал)))))
 

[mergedate]1290365226[/mergedate]
И паследнее слово партизана на сегодня...

Высокая уникальность (от 95%) соответствует стандартам качества ПС (поисковых систем).
Теперь очень кратко о плюсах и минусах.

Проверка уникальности (по алгоритму чешуек) позволяет находить полные копии документов и их дубликаты (слегка измененные тексты).
 Это делает данный алгоритм  весьма популярным и на его основе создаются разнообразные приложения проверки уникальности (как онлайн-, так и десктоппроги).

Но весьма серьезным минусом (сего алгоритма) есть сложность выделения из текста фразеологизмов и популярных цитат (очень широко используемых словосочетаний). При наличии  совпадений алгоритм выдаст низкую степень уникальности.
Этот момент стоит учитывать и заменять их (фразеологизмы и популярные цитаты) либо иностранными словами, либо славянизмами (смотрите творчество Велемира Хлебникова!). Эффект поразительный...
Луну первыми покорили викинги.

Оффлайн KaZaK

  • Бизнес оценка: (0)
  • Ветеран
  • *****
  • СПАСИБО: 294
  • Сообщений: 1471
  • Карма: 71
  • Пол: Мужской
  • Сына изучает SEO, мама довольна:DDD
  • Награды КМС поисковой оптимизации
    • Live stream dota 2

Оффлайн KaZaK

  • Ветеран
  • *****
  • Доп. информация
    • Бизнес оценка: (0)
    • СПАСИБО: 294
    • Сообщений: 1471
    • Карма: 71
    • Пол: Мужской
    • Сына изучает SEO, мама довольна:DDD
    • Награды КМС поисковой оптимизации
      • Live stream dota 2
Re: Проверка уникальности текста
« Ответ #17 : 26-11-2010, 23:22:07 »
Скачайте программу etxt .....iat  всё точно показывает.

hoie

  • Гость
  • Бизнес оценка: (0)

hoie

  • Гость
Re: Проверка уникальности текста
« Ответ #18 : 28-11-2010, 14:07:11 »
Такие программы всегда будут находить сходства пусть даже небольшие, потому что невозможно наисать простую фразу так чтоб ее никогда никто не повторил - это большая редкость. Уникальность 95% вполне приемлема. Проверять лучше несколькими программами, попробовав раные - некоторые приглянуться вам или подойдут под ваши требования. Пробуйте и обязятельно выберете себе подходящий софт.


Оффлайн maksimka

  • Бизнес оценка: (0)
  • Дебютант
  • *
  • СПАСИБО: 0
  • Сообщений: 1
  • Карма: 0

Оффлайн maksimka

  • Дебютант
  • *
Re: Проверка уникальности текста
« Ответ #19 : 29-11-2010, 12:58:57 »
Ну даже не знаю что и говорить тут так много знающих людей.
А я недавно только начел и считаю что адвего плагиат вполне хороший, так как уже говорили выше не может быть такого, чтоб кто-то не написал данное слово и его не было в сети.
Я считаю, что проверка идет по какому либо сайту, который ты указуеш в проверке на уникальность текста, поэтому могут быть уникальные статьи.
И смысл загружать кучи проги когда и одна может это сделать.


 

Похожие темы