ТВОРЧЕСКАЯ
ЛАБОРАТОРИЯ
АНТОНА НИКОЛАЕВА

главная
Блог
Проекты
SEO
Дизайны
Пресса и выступления
карта сайта
Контакты

Сервис и скрипт проверки текста на уникальность (2007)

главная > SEO > 2007. Бесплатный сервис и скрипт проверки текста на уникальность.

бесплатный сервис здесь: copysearch.c-laboratory.ru
скачать скрипт: copysearch.zip

Исключение копий из выдачи, по видимому, сейчас является для Яндекса более важной задачей, чем повышение релевантности. Действительно, создание контента своего сайта путем воровства или упрощенного переписывания чужого - массовая болезнь, особенно при создании сео-сайтов под продажу рекламы или размещение ссылок.

На что может ориентироваться Яндекс при выявлении копий? Сразу приходит мысль о методе шинглов, который Илья Сегалович с любовью упоминул в статье "Как работают поисковые системы".

Однако, представляется, что для выявления полных копий или поверхностных ре-райтов под SEO-задачи (сводимых, чаще всего, к перестановке местами предложений и компиляции из нескольких текстов), метод шинглов будет излишне ресурсоёмок. 

Поэтому я решил взять из текста страницы случайным образом десяток длинных предложений и поискать их поиском по фразе Гуглем (поиск по фразе у Яндекса совсем никуда не годен).

По результатам поиска оценивается уникальность текста. 
Коэффициент уникальности изменяется от 0 до 1.
Коэффициент уникальности вычисляется по формуле: K = 1 / (S/P), где:
P - количество предложений исходного текста найденных в гугле.
S - сумма всех найденных в гугле предложений.
Таким образом, если каждое из выбранных предложений найдено только по одному разу - текст абсолютно уникален и его коэффициент уникальности равен 1.
Чем чаще отдельные предложения текста найдены в других текстах - тем ниже будет его коэффициент уникальности.

Пример 1:
В исходном тексте найдено 10 предложений длина которых более 50 символов.
Для всех предложений найдено только по 1 копии.

Вычисляем коэффициент уникальности:
P = 10;
S = 10 * 1 = 10;
K = 1 / ( 10 / 10 ) = 1

Пример 2:
В исходном тексте найдено 7 предложений длина которых более 50 символов.
Для первого предложения в гугле найдено 6 копий. Для второго предложения копий не найдено (гугль не знает такой цитаты). Для остальных предложений по 2 копии.

Вычисляем коэффициент уникальности:
P = 7 - 1 = 6;
S = 6 + 0 + 2 + 2 + 2 + 2 + 2 = 16;
K = 1 / ( 11 / 6 ) = 0,38

написано: Fri, 04 Dec 2009 16:51:18 +0300



»SEO
    2015. Почему Яндекс не индексирует статью?
    2014. Закладки вместо ссылок?
    Продаются seotools.ru и seotest.ru
    2010. Оценка рисков поискового продвижения
    2010. Истинное ранжирование Яндекса
  »2007. Бесплатный сервис и скрипт проверки текста на уникальность.
    2007. Уникальность, как статический фактор при ранжировании
    2007. Бесплатный скрипт для перелинковки группы сайтов
    2006. Нелинейная выдача на Яндексе
    2006. Текстоптимайзер - оптимизация текста под поисковые системы
    2005. Удаляем конкурентов из Яндекса
    2000. Набор инструментов для поисковой оптимизации
    Статьи по SEO




СВИДЕТЕЛЬСТВА:








ПРЕССА И ВЫСТУПЛЕНИЯ:



Выступление на конференции "Интернет и Бизнес", Москва, 2008


Выступление на Санкт-Петербургской Интернет конференции СПИК 2008


Выступление на конференции по юзабилити "User Expirience 2007", Москва


Статьи для рассылки "Продвижение сайта. Профессиональные советы экспертов"


Публикации в "Деловом Петербурге"


Бан Яндекса, оптимизация текста по методу Остапа Бендера.


Критерии для постановки задачи и оценки результатов поискового продвижения (2002)