| ДВА ВЕКТОРА ОБЕСПЕЧЕНИЯ ХОРОШЕГО РАНЖИРОВАНИЯ - ТЕКСТЫ И ССЫЛКИ | [17.05.2012 07:40] |
|
Google столкнулся с данной проблемой пораньше, поэтому успел разработать два алгоритма, обход которых с целью спама - или учет с целью оптимизации - теперь это уже не так просто. Это идеи TrustRank и PhraseRank. В какой стадии внедрения находится каждый из этих алгоритмов, сказать сложно, Гугл, как и другие поисковые системы, не особо стремится полностью выложить все свои секреты оптимизаторам. Но пейзаж нашего "алгоритмического будущего" вырисовуется уже более отчетливо. Очевидно, что работы в данном направлении будут идти, если уже не идут полным ходом, и в других поисковиках. Вопрос на заметку. Как определить, какие слова и фразы веб-страницы поисковая система сочтет значимыми?.. Для выделения терминов используется ассоциативная информация об их общей встречаемости. Значимыми являются только те термины, у которых имеются овольно крепкие ассоциативные связи с другими терминами. По этой причине в ходе отбора весомых терминов строятся ассоциативные отношения между ними, т.е. фактически создается ассоциативный словарь из слов и фраз. Вопрос на заметку. На основании какого каркаса текстов поисковик формирует ассоциативный словарь из слов и фраз?.. С помощью ассоциативного словаря обнаруживают и спам - вернее, ту его разновидность, при которой текст страницы составляется из многих терминов (например, названий товаров, услуг), относящихся к одной тематике. Все эти термины вместе встречаются в различных вариациях и сочетаниях, но не все сразу. Обнаружение спама происходит таким образом. Из страницы выделяются термины (слова и словосочетания). Если довольно много таких терминов связано ассоциативными отношениями со многими другими терминами страницы, то такая страница относится к спаму. Для нормальной страницы число ассоциативных отношений между ее терминами и фразами намного меньше, чем для спам-страницы. На этом предположении и основывается обнаружение спама. Вопрос на заметку. Проще говоря, будут автоматически отфильтрованы "речитативные" страницы, с текстами, подобными заклинаниям, типа "если вы желаете сменить свою кухонную утварь и мебель в прихожей, то наша кухонная мебель - идеальное решение, а мебель для прихожей - абсолютно идеальное; кухня - понятие неотьемлимое от кухонной мебели, а красивая гостиная мебель украсит вашу гостиную комнату точно так же, как наша кухонная мебель украсит вашу кухню... От чтения таких "произведений SEO-копирайтеров" в больших количествах в голове остается сплошное "бу... бу... бу... хня... хней... хню..." Еще один вид спама отслеживается неявно - подозрительные страницы просто получают пониженный вес при ранжировании. Достигается это таким образом. При вычислении веса данной страницы используется метод под названием PhraseRank. |