ТВОРЧЕСКАЯ
ЛАБОРАТОРИЯ
АНТОНА НИКОЛАЕВА

главная
Блог
Проекты
SEO
Дизайны
Пресса и выступления
карта сайта
Контакты

Гипотеза об уникальности текстов и изображений на странице, как статический фактор при ранжировании

главная > SEO > 2007. Уникальность, как статический фактор при ранжировании

Авторитетность страницы сайта (PageRank по Гуглю) - первый статичный фактор, влияющий на ранжирование выдачи.

Потом заговорили о новом статичном факторе - TrustRank - значении доверия поисковой системы документу.

Далее появились намеки на наличие у Яндекса статичного значения, оценивающего отношение некоторого документа к некоторой теме.

Очередной сюжет - уникальность информации, как фактор ранжирования. Может ли поисковая система присвоить каждому документу некоторое статичное числовое значение, показывающее уникальность документа? Чтобы поднимать уникальные документы и понижать копии?
Может, и не только текст страницы, но и уникальность имеющихся на странице изображений, что в совокупности может давать статичный индекс уникальности документа.

1. Уникальность текста на странице. Одна из возможных методик определения уникальности текста - метод шинглов - упомянута в статье Ильи Сегаловича "Как работают поисковые системы". Но возможно, поисковые системы могут обойтись и более примитивными решениями. Здесь я публикую скрипт и сервис, дающий каждому тексту значение уникальности, расчитываемое на основе выявления повторов целых предложений (помнится, в Яндексе, в расширенном поиске, есть возможность искать слова в рамках одного предложения - значит, предложение, как единица уникального контента вполне подходит). Как аргумент - написанный мной скриптец вполне эффективно выявляет грубо рерайченные оптимизаторами тексты.

2. Уникальность изображении на странице. Имеющиеся на Яндексе инструменты поиска по изображениям показывают, что Яндекс легко находит копии изображений с измененными размерами. А значит, Яндекс может присвоить каждому документу статичное числовое значение - показатель уникальности размещенных на странице изображений, а не только текста.
скачать php скрипт проверки двух изображений на подобие

Например, как может работать технология, выявляющая копии изображения независимо от их размера (тестируемые изображения - портреты В.В.Путина - внизу этой страницы):



Первые три окошка фотошопа содержат три портрета В.В.Путина (полные изображения внизу этой страницы), сжатые в фотошопе до размера 5х10 пикселей.
Окошко во втором ряду - те же три изображения, но все 50 пикселов в них расположены в одну строку. Как вы видите - три строки, практически, идентичны.
Последнее окошко - те же строки, из которых убран цвет. Идентичность не исчезла. Теперь можно каждому серому пикселу присвоить цифровое значение. И представить любое изображение в виде короткого цифрового кода с одинаковым количеством цифр. Далее сравниваем коды между собой для выявления копий.

Считаем коэффициент уникальности изображений на странице:
- из 3 изображений на странице только 1 уникальное - коэффициент уникальности 33%;
- из 3 изображений на странице 2 уникальных - коэффициент уникальности 66%;
и т.д. Уникальным документам даем бонусы в выдаче.

Вывод для вебмастеров: блюсти не только уникальность текста, но и картинок. Для этого картинки, взятые с другого сайта - кропировать.

P.S. Использованные выше три изображения, идентифицированные Яндексом как копии:

   

написано: Thu, 14 Jan 2010 21:14:27 +0300



»SEO
    2015. Почему Яндекс не индексирует статью?
    2014. Закладки вместо ссылок?
    Продаются seotools.ru и seotest.ru
    2010. Оценка рисков поискового продвижения
    2010. Истинное ранжирование Яндекса
    2007. Бесплатный сервис и скрипт проверки текста на уникальность.
  »2007. Уникальность, как статический фактор при ранжировании
    2007. Бесплатный скрипт для перелинковки группы сайтов
    2006. Нелинейная выдача на Яндексе
    2006. Текстоптимайзер - оптимизация текста под поисковые системы
    2005. Удаляем конкурентов из Яндекса
    2000. Набор инструментов для поисковой оптимизации
    Статьи по SEO




СВИДЕТЕЛЬСТВА:








ПРЕССА И ВЫСТУПЛЕНИЯ:



Выступление на конференции "Интернет и Бизнес", Москва, 2008


Выступление на Санкт-Петербургской Интернет конференции СПИК 2008


Выступление на конференции по юзабилити "User Expirience 2007", Москва


Статьи для рассылки "Продвижение сайта. Профессиональные советы экспертов"


Публикации в "Деловом Петербурге"


Бан Яндекса, оптимизация текста по методу Остапа Бендера.


Критерии для постановки задачи и оценки результатов поискового продвижения (2002)