Определение продажных ссылок.


Поиск по сайту:



Алгоритм HITS

В этой статье я постараюсь как можно подробнее рассказать Вам про алгоритм HITS, как один из новых алгоритмов поискового ранжирования.

Именно этот алгоритм лег в основу определения покупных ссылок, и многим из вас наверняка интересно узнать, как Яндекс отличает платные ссылки от бесплатных.

Постараемся разобраться по порядку.

Алгоритм Hyperlink Induced Topic Distillation (сокращенно HITS), по другому также называется алгоритм Клейнберга на самом деле уже довольно давно взят на вооружение множеством поисковых систем, в частности например, с помощью этого алгоритма можно распознать спам.

Но конкретно для определения естественная ссылка или покупная. Суть алгоритма сводится к нижеследующему: в общей массе страниц ищутся страницы, которые поисковая система определяет как первоисточник, а также есть страницы, которые поисковая система определяет как посредник текстов, но это только что касается ссылок. Это факт, что если страница является первоисточником, то ее частенько цитируют посредники. И соответственно наоборот, если страница является добротным посредником, в ней имеются ссылки на первоисточники.

Применение модифицированной версии алгоритма HITS является всего лишь частью набора инструментов поисковой машины для определения «продажности» ссылки, также она использует самообучающуюся выборку а-ля Матрикснет.

В упрощенном варианте, непосредственно алгоритм HITS подразумевает лишь расчет показателей страниц первоисточников и посредников на основе некой матрицы, элемент ее равен 1, если некий документ содержит ссылку, и соответственно равен 0, если этот документ ссылки не содержит. Модифицированный алгоритм HITS в свою очередь позволяет построить двухсторонние графы.

Яндекс признается, что иногда использует модифицированную версию алгоритм HITS, но лишь для определения самих платных ссылок, а не сайтов, осуществляющих их продажу или покупку.

В процессе эволюции этого алгоритма, такие классификаторы как SEO-out, SEO-link, SEO-in конечно же изменились, так что актуальность информации об их использовании весьма сомнительна в настоящее время, однако факты свидетельствуют о том, что эти классификаторы имели место быть.

В результате всех операций мы получаем лишь вероятность того, является ли ссылка покупной или же нет.

В этом алгоритме также используются некоторые другие идентификаторы продажности ссылки:

  1. Документ, указывающий на целевые страницы сайтов различных тематик
  2. Участвует ли страница в «ссылочном взрыве».
  3. Перемещаются ли ссылки вместе с контентом
  4. Большое количество внешних ссылок, но не обязательно «продажных»
  5. История ссылок, а также мигание ссылок
  6. Анализ посещаемости сайта
  7. Нехорошее местоположение ссылок.
  8. Кучность ссылок
  9. Ссылки, появляющиеся в индексе после текста
  10. Как непрямой показатель естественности ссылки – переходы по ней
  11. Так как для покупных ссылок срок их жизни достаточно мал – срок жизни ссылки
  12. Отсутствие связи тематики ссылки, с текстом на странице
  13. Отсутствие связи ссылки с тематикой сайта

На самом деле, это уже получается не модифицированный алгоритм HITS, а довольно сложная структура алгоритма принятия решения о продажности ссылки. При этом окончательное решение о платности ссылки принимается на основе не одного, а группы фактов, что довольно значимо снижает погрешность при определении платности (продажности) ссылки.


 
Рунв
http://wmr1000.ru/
Запрещено копировать без ссылки на сайт

 
Сделать закладку: