Книга: Яндекс для всех

9.1. Как ранжировать сайты

9.1. Как ранжировать сайты

Когда Интернет был еще "маленьким", для ранжирования сайтов (и документов, размещенных на них) в первую очередь использовались текстовые критерии. Основная задача разработчиков сайтов и тех, кто наполнял их контентом, состояла в правильной расстановке в различных частях кода ключевых слов. Способы находили разные — как размещение в коде невидимого для посетителя текста, так и написание текстов по специально разработанным методикам, учитывавшим специально рассчитанные "весовые" значения слов. С ростом Сети в дополнение к текстовым критериям добавлялись и так называемые ссылочные. Вот что об этом говорит в статье "Как работают поисковые системы" Илья Сегалович:

Прежде всего, стало очевидно, что поиск в вебе не может быть сколько-нибудь корректно выполнен, будучи основан на анализе (пусть даже сколь угодно глубоком, семантическом и т. п.) одного лишь текста документа. Ведь внетекстовые (off-page) факторы играют не меньшую, а порой и большую роль, чем текст самой страницы. Положение на сайте, посещаемость, авторитетность источника, частота обновления, цитируемость страницы и ее авторов — все эти факторы невозможно сбрасывать со счета.

Появились эти критерии не на пустом месте. Для научных трудов вопрос значимости был давно решен за счет применения индекса цитирования (ИЦ). Индекс цитирования для научного труда определяется как количество ссылок на этот труд в других изданиях (иногда вместо ссылок на конкретный труд считают упоминания фамилии автора). Этот принцип определения значимости был перенесен и на веб-страницы, для которых ИЦ подсчитывается по количеству ссылок на нее с других веб-ресурсов. Для веб-сайта индекс цитирования определяется по ИЦ его страниц. Главная особенность такого ранжирования заключается в том, что значимость сайта определяется не его владельцем, а тем, как его оценивают другие — чем больше ссылок ведет на сайт, тем ценнее размещенная на нем информация.

Однако индекс цитирования в том виде, как он здесь описан, не дает корректной оценки значимости. Хотя бы потому, что зачастую одна ссылка с известного и уважаемого сайта может значить намного больше, чем сотня ссылок с никому не известных страниц. Поэтому был предложен более сложный вариант индекса цитирования — взвешенный (вИЦ). При его подсчете для каждой ссылки вычисляется вес в зависимости от того, на каком сайте она размещена. Чем авторитетнее сайт, тем выше вес ссылки, на нем размещенной. При подсчете взвешенного индекса цитирования почти все поисковые системы исключают из подсчета ссылки, размещенные на сайтах с бесплатного хостинга, на немодерируемых форумах, ряде иных ресурсов. Также не берутся в расчет внутренние ссылки (переходы со страницы на страницу в рамках одного сайта).

Оглавление книги


Генерация: 1.542. Запросов К БД/Cache: 3 / 1
поделиться
Вверх Вниз