Тошнота слов на документе – это группа слов, которые очень часто
встречается в тексте. Иными словами, тошнящее слово – это самое частое
слово документа.
Понятие «тошнота» ввели оптимизаторы, но образованные люди называют
это понятие как «нормировка» слов в документе. Но так как мы
оптимизаторы, будем называть это явление тошнотой.
В чем суть явления, или учения о тошноте? Поисковая система, берет
самое популярное слово в документе, т.е. самое часто встречающееся слово
документа и делают таким образом: осуществляет ранжирование и
построение релевантности, что по этому слову документ на сайте, или сайт
в целом, документ продвигать проще всего, а по всем остальным –
сложнее. И тем сложнее, чем это слово отстает от всех остальных слов на
документе. К примеру, самое популярное слово в документе – кондиционеры,
оно встречается 28 раз, следующее слов – сплит системы, оно встречается
в документе 8 раз, следующее слово сайт, оно встречается в документе 6
раз и так далее.
Таким образом, по запросу вашего документа «кондиционеры» Вам будет
продвигаться легко, а по запросу «спилт системы» - очень трудно, и тем
труднее, чем больше разницы между тем, чем больше раз встречается самое
популярное слово в документе и сколько раз встречается слово сплит
системы. Отсюда можно сделать несколько выводов:
- Использование словоформ. Повышение частоты с сохранением процента слов за счет увеличение текста.
- Самыми частотными словами документа, или как говорят самыми
«тошнящими» должны быть ключевые слова под который вы продвигаете этот
документ. Для проверки тошноты страницы можно воспользоваться онлайн
инструментом www.tekto.biz/sick/ns.php.
- Если Вы планируете продвигаться по нескольким ключевым словам сразу,
то они должны примерно одинаковое количество раз встречаться в
документе, т.е. иметь одинаковую «тошноту».
Поисковые системы определяют частоту употребления слов в документе
благодаря алгоритмам закона Ципфа (Zipf). Коэффициент спамности
документа определяется как Tfmax, где Tfmax – частота самого частого
слова в документе и Tfmax> 7. Самое частое слово подавляет
релевантность документа по всем остальным словам, тем больше, чем больше
разрыв между частотой.