Книга: Яндекс для всех

9.3. Тематический индекс цитирования

9.3. Тематический индекс цитирования

На Яндексе показатель, аналогичный PageRank, был введен в обращение в 2001 году и получил название взвешенный индекс цитирования — вИЦ. Он рассчитывался на основе классического алгоритма PageRank с точностью, как отмечали сами разработчики, "до деталей реализации". Хотя, безусловно, доскональной точности расчета показателей быть не могло — ни одна поисковая система не раскрывает всех нюансов своих расчетов. В дальнейшем в расчет вИЦ были включены дополнительные факторы, отсутствующие в классическом алгоритме определения ссылочного ранга страницы. Но продержался вИЦ в качестве главного показателя, доступного для посетителей, недолго. Через полтора года его сменил новый индекс, тематический (тИЦ).

Это еще одна разновидность индекса цитирования. Отличается от взвешенного тем, что вес ссылок, учитываемых при подсчете показателя, зависит не только от значимости ссылающегося сайта, но также от его тематики. Чем ближе тематика ссылающегося сайта к рассматриваемому, тем больший вес может быть придан ссылке, ведущей с него. Тематика сайтов определяется по каталогам веб-проектов. Чаще всего поисковая система использует собственный или сотрудничающий с ней каталог, а качество ссылок из таких каталогов на сайт учитывается как ссылки авторитетных сайтов.

Тематический индекс цитирования (рис. 9.2) определяет значимость вебресурсов с учетом качественных характеристик ссылок на них с других сайтов. Эта значимость рассчитывается по специальному алгоритму, в котором существенную роль играет тематическая близость ресурса и ссылающихся сайтов. Значение тИЦ определяется в первую очередь не количеством ссылок, а суммой их собственных качественных характеристик ("весов").


Значение тИЦ не является постоянным. Оно пересчитывается еженедельно. Рассчитывается тИЦ либо для всего ресурса, либо для его разделов, если они зарегистрированы в каталоге Яндекса как самостоятельные ресурсы. При расчете тИЦ учитываются только внешние ссылки, поэтому сколько бы ни было проставлено перекрестных ссылок между страницами одного сайта, они никакого влияния на значение тИЦ не окажут. При расчете тИЦ одного из разделов сайта, ссылки на раздел сайта из других разделов этого сайта будут считаться внутренними и, следовательно, не будут увеличивать его тИЦ.

Не будут учитываться ссылки и с тех ресурсов, которые не проиндексированы Яндексом. Поэтому ссылки, размещенные на ресурсах, расположенных вне доменов su и ru учитываться не будут. Не будут учитываться и ссылки, размещенные на форумах, немодерируемых каталогах, иных ресурсах, в которые может добавить ссылки любой посетитель без контроля со стороны владельца ресурса. Также не учитываются ссылки с сайтов, расположенных на бесплатных хостингах, если эти сайты не описаны в каталоге Яндекса.

Эти особенности необходимо учитывать в первую очередь владельцам новых сайтов. То, что вы разместили в Сети свою работу, еще не означает, что Яндекс сразу ее увидит и проиндексирует. До тех пор, пока на каком-либо известном Яндексу ресурсе не будет размещена ссылка на ваш сайт, робот Яндекса о нем не узнает. Размещение же ссылки на сайтах, значимость которых Яндекс игнорирует, ситуацию не исправит. Одним из наиболее корректных вариантов "подсказать" Яндексу, где находится ваш сайт, является подача заявки на регистрацию сайта в Яндекс. Каталоге. Даже в том случае, если ваш сайт не будет принят для бесплатной регистрации, поисковый робот проверит указанную вами ссылку и проиндексирует размещенный там сайт.

Значение тИЦ для сайтов, внесенных в каталог Яндекса, можно увидеть рядом с описанием ресурса.

Примечание

Индекс цитирования Яндекса очень удобно просматривать с помощью плагина Яндекс. Бар. При посещении какого-либо сайта вы будете видеть в панели плагина значок, отражающий величину тИЦ данного сайта, независимо на какой из его страниц вы находитесь. А используя меню, вы можете вывести страницу с точным значением индекса и списком ссылающихся на просматриваемый ресурс сайтов.

До недавнего времени существовала ситуация, когда сайты, не включенные в каталог Яндекса, считались Яндекс. Баром неотъемлемой частью своего головного ресурса (например, так обстояло дело с доменами третьего уровня). Соответственно, для таких ресурсов наследовалась тематика головного ресурса и тИЦ. На сегодняшний день эта ошибка работы Бара уже исправлена.

Алгоритм подсчета индексов цитирования у поисковиков не является чем-то постоянным. Не составляет исключения и Яндекс. Причин для этого существует множество, но из них можно выделить наиболее важные. Первая — желание поисковиков улучшить результаты ранжирования сайтов в соответствии с индексами цитирования. Вторая причина заключается в том, что поисковику приходится постоянно бороться с поисковым спамом, паразитирующим на найденных оптимизаторами способах продвижения сайтов с учетом текущей реализации алгоритма расчета индекса цитирования. Точнее — даже не самого алгоритма, а тех составляющих, которые учитываются при его расчете.

Яндекс никогда не объявлял заранее о предстоящем изменении принципов расчета ИЦ. Как правило, о нововведениях становилось известно по изменению численных значений индексов у наблюдаемых сайтов. Причем, это бывали не колебания в пределах допустимых значений, а резкие, в разы, подъемы или спады значений индекса. И первым таким серьезным испытанием для оптимизаторов был год 2004-й, когда произошло первое существенное изменение алгоритма ранжирования. В результате тех изменений значения тИЦ в течение недели изменялись скачкообразно, часто без следования какой-либо логике.

Изменения алгоритма ранжирования происходили и в дальнейшем, внося напряженность в ряды оптимизаторов. Зачастую им приходилось полностью изменять стратегию продвижения сайтов в поисковой выдаче Яндекса. Но для этого требовалось понять, какие же изменения были внесены в алгоритм, и как они сказались на ранжировании. Примером такого анализа можно назвать статью, опубликованную на проекте "Черный квадрат" (http://www.rukv.ru/ analytics-20070107.html), в которой было проанализировано изменение индекса более чем 200 тыс. сайтов российского Интернета.

Самое последнее обновление алгоритма происходит в дни, когда пишутся эти строки. Отличие ситуации в том, что на этот раз руководство Яндекса в лице руководителя отдела веб-поиска Александра Садовского официально объявило о смене алгоритма. Объявление было опубликовано на трех ведущих форумах, где встречаются и обмениваются информацией оптимизаторы. Это форумы порталов Searchengines, Mastertalk и Seochase. Вот что там было сказано:

Уважаемые веб-мастера!

Сегодня ночью на поиске в одном из дата-центров Яндекса обновится алгоритм ранжирования. В течение нескольких дней по одному и тому же запросу результаты у разных пользователей могут заметно отличаться, это нормально. Как только во всех дата-центрах будет работать одинаковый поиск, разница станет незначительной.

Мы надеемся, что по ряду запросов улучшение релевантности поиска будет заметно невооруженным глазом. Если вы все-таки обнаружите запросы, где есть явное ухудшение, напишите нам, пожалуйста, с указанием запроса исчезнувших сайтов и пояснением, почему вы считаете их релевантнее сайтов, которые продолжают находиться: http://feedback.yandex.ru/?from=webmaster.

Чтобы узнать, какой алгоритм ранжирования отработал ваш запрос, зайдите после получения результатов поиска на страницу http://www.yandex.ru/ cgi-bin/hostname, где показывается имя сервера, который вас обслужил. Если оно выглядит как sfront??.yandex.ru или ludi.yandex.ru, значит, вам выпал счастливый билет и возможность потестировать новый поиск. Если имя выглядит как sfront2-???.yandex.ru, значит, счастливый билет выпадет вам на днях.

Заранее спасибо!

Надеюсь, изменения для вас и пользователей будут только приятными.

С уважением, Александр Садовский.

Результаты изменения алгоритма ранжирования будут пристально рассматриваться в течение ближайших двух-трех месяцев, прежде чем общество оптимизаторов вынесет свой вердикт — стали ли результаты лучше или нет. Но в любом случае тем, кто занимается продвижением сайтов, придется изучать внесенные изменения и подстраивать методики продвижения под них. А если учесть, что алгоритмы ранжирования и внесенные изменения ни один поисковик никогда не публикует, то изучение будет вестись по косвенным признакам, досконально разбираемым сообществом оптимизаторов. Например так, как разбиралась несколько лет назад статья Ильи Сегаловича на сайте http://blog.promosite.ru/comments.php7201.

Алгоритм Яндекса для подсчета релевантности сайтов и их последующего ранжирования, по сути, — закрытая система, требующая комплексного подхода к изучению. Однако серьезные исследования если и проводятся, то результаты их не публикуются открыто. Публикуются в основном исследования локального характера, которые предоставляют неполную информацию. Кроме того, при чтении таких статей необходимо обращать внимание, о каких поисковых системах в них идет речь — алгоритмы и, главное, реализация расчета релевантности, а также факторы, влияющие на нее, для каждой поисковой системы различны.

Индекс цитирования является внешним фактором по отношению к сайту, влияющим на ранжирование результатов поиска. Он зависим лишь от имеющихся ссылок, ведущих как на рассматриваемый сайт, так и с него. Поэтому повлиять на его значение можно, работая в трех направлениях:

? выбирая страницы, с которых вы хотели бы получить ссылки на свой сайт;

? выбирая страницы, на которые вы хотите разместить ссылки у себя;

? оптимизируя внутреннюю структуру связей своих страниц для увеличения обратной связи при расчете индекса цитирования.

В частности, при расстановке ссылок на внешние сайты можно следовать такой рекомендации:

…вам нужно будет ссылаться наружу только со страницы вашего сайта, которая имеет низкий вес PageRank и которая также содержит значительное число внутренних ссылок (т. е. ссылок, указывающих на другие страницы вашего сайта).

Chris Ridings, www.searchenginesystems.net.

Им же приводятся и такие рекомендации относительно структуры внутренних связей страниц на сайте:

? там, где группа страниц может содержать внешние ссылки, используйте иерархическую структуру;

? там, где группа страниц не содержит внешних ссылок, используйте структуру с обширными связями, расширив ее добавлением ссылки на главную страницу;

? если конкретная страница особенно важна, помещайте ее выше в иерархической структуре.

Но сколько бы ни приводилось рекомендаций, лучше понять механизм индекса цитирования удастся тогда, когда вы на практике будете пробовать различные варианты воздействия на него. Сделать это легче всего на моделях, а не на реальных объектах. Для этого можно воспользоваться моделью Александра Садовского (http://digits.ru/promotion/articles/pagerank.xls) или Марка Хоррэла (http://www.nri-ltd.com/pagerank.asp).

Оглавление книги


Генерация: 5.509. Запросов К БД/Cache: 3 / 0
поделиться
Вверх Вниз