Для каждого не секрет, что Яндекс умеет определять тематику сайтов. Но только криво пока он это делает. Так как же Яндекс определяет тематику сайта? Точно этого не знает никто, потому я хочу провести небольшой эксперимент по этому поводу.
У меня есть несколько предположений о том, как Яша это делает:
1. Анализирует контент главной страницы сайта и относит его в какую-то из рубрик ЯК.
Реализировать такой алгоритм не ложно, но это потребует много ресурсов. Определить плотность слов на главной странице, проанализировать метатеги, и сопоставить с наработанной базой.
2. Анализирует контент каждой страницы сайта при подсчете тематичности ссылок и т. д.
На мой взгляд, это очень много ресурсов потребует, но с чем черт не шутит. Может у Яндекса их хватает. Допустим стоит со страницы сайта ссылка с анкором «прокат автомобилей», Яша смотрит на наличие ключевой фразы и слов этой фразы в метатегах и контенте страницы. Вот пример. После этого относит такую ссылку к тематической (если есть ключики на странице), или же не к тематической. Эта реализация более похожа на правду. Как-то я подал один сайт в директ. Как известно, на сайт будет смотреть сотрудник Яндекса, и отнесет сайт к какой-то из рубрик, чтобы определять, какую рекламу показывать. У сайта после следующего апа тИЦ, этот показатель упал с 40 до 10-ки. До этого Яндекс и не знал, какой тематики сайт, потому он смотрел на соответствие анкоров, контенту страницы донора. Это все ИМХО, но хочу проверить.
Хочу услишать ваши пожелания, по поводу реализации эксперимента, ведь нужно его провести максимально чисто, чтобы сделать какой-то вывод.