Определение уникальности методом пассажа
Пассаж – это определенная последовательность слов в предложении. Поисковые системы используют его для определения уникальности и релевантности исследуемого текста. Обычно используются пассажи длиной от 5 до 10 слов.
При определении степени уникальности, метод пассажа может быть дополнен методом шинглов. Но, в отличие от последнего, текст в пассаже не подвергается канонизации. В нем сохраняются все знаки препинания, союзы и морфология, присущие тексту-исходнику.
В общих чертах определение уникальности методом пассажа выглядит следующим образом:
- Текст делится на пассажи заданной длины.
- Далее каждый пассаж проверяется на наличие дубликатов в сети. Возможно как полное совпадение, тогда можно говорить о том, что текст не уникален на 100%. Иногда в сети встречаются более короткие словосочетания из семи, шести, четырех слов. Тогда можно говорить о частичной уникальности.
- После анализа пассажей делается вывод об общей уникальности текста. И, в случае его низкого качества, применяются соответствующие меры (вплоть до отказа от индексации проверенного текста)
Таким образом поисковые системы выявляют тексты, подвергшиеся частичному рерайтингу, сгенерированные из одного шаблона тексты.
Вывод прост – если вебмастеру важно, чтобы страницы крепко сидели в индексе, необходимо писать хорошие, реально уникальные статьи. А на все новые, только что опубликованные материалы проставлять ссылки с других сайтов с анкором в виде пассажа из статьи. Подобный прием поможет немного защитить контент от последствий копирования недобросовестными вебмастерами.
Конечно для достаточно крупных сайтов тексты пишутся на заказ и количество журналистов может быть достаточно большим. При этом необходимо подбирать хороших журналистов, плюс проверять текст. Это функция редактора, который проверяет грамматические и стилистические ошибки. Затем проверяет уникальность несколькими программами и с различными установками шага проверки. При этом полученные программами небольшие совпадения в 2-4% просматриваются, на предмет выявления скопированных оттуда и немного отрерайченных фрагментов текста.
Если текст прошел все проверки то желательно добавить текс в Яндекс Вебмастер, а затем уже опубликовать на сайт.
Авторы: Vellte и Алекс
https://wmr1000.ru/
Сделать закладку: