Что такое PageRank Google'а и как получить его по максимуму

Автор статьи: Фил Крэйвен
Сайт Автора: bdbd.ru
E-mail Автора: нет
Дата публикации: 27.05.2006

Причина, по которой появилась эта статья


Не так давно мне попалась на глаза одна широко известная статья «Что такое ПэйджРанк», к которой большинство людей обращается, когда хочет уяснить для себя вопрос — что такое ПэйджРанк, и как он работает. Если честно, то я и сам ей пользовался. Однако, когда я писал Калькулятор ПэйджРанка, мне пришло в голову, что эта статья неверна с точки зрения производимых вычислений. В ней используется своя собственная форма ПэйджРанка, которую автор называет «мини-ранк». Мини-ранк, по непонятным причинам, использует формулу, отличную от Гугловского ПэйджРанка, из-за чего результаты вычислений становятся неверными.

Несмотря на то, что в результате написания этой и последующей статей автор отрицает мини-ранк, оригинальная статья о мини-ранке остается в интернете. Поэтому, если вам известна статья «Что такое ПэйджРанк», то лучше о ней забыть.

Что же такое ПэйджРанк?


ПэйджРанк представляет собой численное значение, которое отражает, насколько значима данная страница в интернете. Гугл полагает, что когда одна страница ссылается на другую, она словно «отдает свой голос» за другую страницу. Тогда, чем больше голосов отдано за страницу, тем важнее эта страница должна быть. Кроме того, — и это важно! — «отданные голоса» отличаются по значимости в зависимости от того, «кто» голосует. Гугл подсчитывает важность оцениваемой страницы, исходя из «голосов», отданных за нее. При этом в процессе производства расчетов Гугл учитывает, насколько важен (весом) каждый из отданных «голосов».

Таким образом, ПэйджРанк Гугла — это его собственный способ определения важности оцениваемой страницы. Это весьма важно, потому что ПэйджРанк является одним из факторов, определяющих порядок вывода результатов поиска. Это не единственный фактор, который Гугл использует для оценки страниц, но один из важнейших.

Начиная с этого момента, мы будем использовать термин «ПэйджРанк» в сокращенной форме как «PR».

Примечания:


Далеко не все ссылки учитываются Гуглом. Так, Гугл жестко отфильтровывает ссылки, имеющиеся на известных «фермах ссылок» (специально созданных совокупностях веб-документов, искусственно созданных для увеличения «веса» тех или иных веб-ресурсов). Некоторые ссылки даже приводят к «наказанию» страницы, на которую они ведут, со стороны Гугла. Понятно, что вебмастера не могут контролировать, какие сайты ссылаются на их сайты, но они должны понимать, какие ссылки они сами проставляют на другие сайты. По этой причине, ссылки, проставленные внутри одного отдельно взятого сайта, не могут ему навредить, тогда как ссылки, ведущие вовне сайта, могут быть «вредными», если они ведут на «наказанные» сайты. Поэтому будьте осторожны, когда ставите ссылки на внешние ресурсы. Если PR сайта составляет 0, то это обычно следует в результате наказания, и будет недальновидно проставлять ссылку на такой сайт.

Расстановка внутренних ссылок


Факт: Веб-сайт имеет максимальное значение ПэйджРанка, которое распространяется по его страницам с помощью внутренних ссылок.

Максимальное значение ПэйджРанка сайта эквивалентно количеству страниц на сайте, умноженному на единицу. Оно увеличивается входящими извне ссылками с других сайтов и снижается уходящими вовне ссылками на другие сайты. Сейчас мы говорим о значении ПэйджРанка для всего сайта и не затрагиваем ПэйджРанк каждой индивидуальной страницы. Вы не должны принимать мои доводы на веру, вы и сами можете прийти к тому же самому заключению, взяв карандаш и лист бумаги, и произведя небольшие расчеты.

Факт: Максимальное значение ПэйджРанка сайта тем выше, чем больше количество страниц на этом сайте.

Чем больше страниц имеет сайт, тем выше его ПэйджРанк. И снова — вы можете прийти к такому же заключению с карандашом и листом бумаги. При этом помните, что во внимание берутся только те страницы, о существовании которых Гугл знает.

Факт: Неграмотная расстановка внутренних ссылок ведет к снижению ПэйджРанка сайта, но сверхграмотная расстановка внутренних ссылок не способна его повысить.

Плохая постановка внутренних ссылок снижает ПэйджРанк сайта, но не существует способа повысить ПэйджРанк с помощью внутренних ссылок. Единственный путь повышения ПэйджРанка — это получение большего числа входящих извне ссылок и/или увеличение количества страниц на сайте.

Предостережение: Хотя я настоятельно рекомендую создавать новые страницы и добавлять их на сайт, тем не менее, существуют определенные виды страниц, которые создавать и добавлять категорически нельзя. Это страницы, полностью или частично попадающие под определение «cookie-cutters» («обрезчики куков»). Гугл распознает их как спам, что включает его внутреннюю систему тревоги не только по отношению к самим этим страницам, но и к сайту в целом. А заканчивается все «наказанием» сайта в целом. Новые страницы должны содержать только качественный контент — это основное и важнейшее требование.

Что мы будем делать с этим «всеобщим» ПэйджРанком?


Теперь рассмотрим некоторые примеры вычислений, чтобы понять, каким образом можно манипулировать ПэйджРанком сайта. Однако, прежде чем сделать это, следует обратить внимание на тот факт, что веб-страница включается в индекс Гугла только тогда, когда существует хотя бы одна другая страница в интернете, которая на нее ссылается. Так заявляет сам Гугл. Если страницы нет в индексе Гугла, то никакие ссылки с нее не учитываются при производстве расчетов.

На самом деле, мы можем пренебречь этим фактом, в основном потому что другие документы на тему «Объяснение ПэйджРанка» также им пренебрегают. Так, вот этот калькулятор работает в двух режимах: «простом» и «реальном». В «простом» режиме подразумевается, что вычисления производятся для страниц, все из которых находятся в индексе Гугла, вне зависимости от того, ссылаются ли на них какие-либо другие страницы. В «реальном» режиме расчеты для страниц, не находящихся в индексе Гугла, не принимаются во внимание. Следующие ниже примеры относятся к результатам, получаемым в «простом» режиме.

Давайте представим себе сайт, состоящий из трех страниц (страницы A, B и C), на которые не проставлены ссылки извне этого сайта. Мы присвоим каждой странице изначальное значение ПэйджРанка в 1, хотя, на самом деле, неважно, с какого значения мы начнем — с 1, с 0 или с 99. Даже если назначить эту цифру в несколько миллионов, после ряда последовательных вычислительных итераций конечный результат будет тем же самым. Просто, стартуя с 1, нам понадобится меньшее количество итераций, нежели начиная отсчет с 0 или любого другого значения. Вы можете следить за расчетами с помощью карандаша и бумаги, или использовать калькулятор.

Максимальный ПэйджРанк сайта — это количество ПэйджРанка внутри сайта. Мы имеем три страницы, значит, максимальный ПэйджРанк для него равняется 3.

На текущий момент, ни на одной из страниц нет ссылки на любую другую, и никакие другие страницы не ссылаются на эти три. Если вы однократно произведете вычисления для каждой страницы, вы получите значение ПэйджРанка для каждой из них, равное 0.15. Совершенно неважно, какое количество вычислительных итераций вы пройдете — ПэйджРанк каждой страницы будет оставаться равным 0.15. Общий ПэйджРанк сайта будет составлять 0.45. хотя в идеале может равняться 3. Сайт серьезнейшим образом теряет большую часть своего потенциально возможного ПэйджРанка.

Пример 1

Теперь начнем снова с каждой страницы, которой присвоен PR 1. Поставим ссылку со страницы A на страницу B и произведем вычисления вновь для каждой из страниц. Вот что мы получим:

Страница A = 0.15
Страница B = 1
Страница C = 0.15

Страница A «проголосовала» за страницу B и, в результате, ПэйджРанк страницы B увеличился. Это неплохо смотрится для страницы B, но лишь в первой итерации — мы ведь не приняли во внимание описанную выше ситуацию из «Уловки-22». А теперь посмотрим, как изменятся цифры после большего количества вычислительных итераций.

После 100 итераций имеем:

Страница A = 0.15
Страница B = 0.2775
Страница C = 0.15

Этот результат остается неплохим для страницы B, но уже не настолько хорошим, каким он был ранее. Полученные результаты теперь выглядят более реалистично. Таким образом, общий ПэйджРанк сайта теперь составляет 0.5775, что немного лучше, но все же только небольшая часть того значения, которое может иметь место.

Примечание:

С технической точки зрения, эти результаты неверны в связи со специфическим отношением Гугла к так называемым «dangling links» («свисающим ссылкам»), но их можно использовать в качестве примера расчетов.

Пример 2

Попробуем другую структуру ссылок. Разместим на каждой из страниц ссылки на все оставшиеся страницы. Снова присвоим каждой из страниц PR, равный 1:

Страница A = 1
Страница B = 1
Страница C = 1

Теперь мы достигли максимума. Неважно, сколько вычислительных итераций будет произведено, — для каждой страницы PR будет составлять 1. Те же самые результаты мы получим при создании цикличной ссылочной структуры (то есть когда A ссылается на B, B ссылается на C, and C ссылается на D). Посмотрите, как это выглядит на калькуляторе.

Полученный нами результат свидетельствует, что, благодаря плохой структуре ссылок, очень легко потерять ПэйджРанк, тогда как при разумной простановке ссылок мы можем достичь его максимально возможной величины. Но мы не ставим себе целью достичь ситуации, когда каждая страница на сайте будет иметь одинаковую долю ПэйджРанка. Мы желаем, чтобы одна или несколько страниц имели большую долю ПэйджРанка за счет других страниц. К таким страницам мы относим индексную страницу, центральные смысловые страницы («hub pages») и страницы, которые оптимизированы под определенные поисковые запросы. Сейчас мы располагаем всего тремя страницами, поэтому мы наращиваем ПэйджРанк индексной страницы — страницы A. Это прекрасно иллюстрирует идею перераспределения ПэйджРанка.

Пример 3

Теперь попробуем поступить следующим образом. Разместим на странице A ссылки на B и C. Также на страницах B и C разместим ссылку на страницу A. Начнем расчеты со значения PR, равного 1 для каждой из страниц. После первой итерации получаем:

Страница A = 1.85
Страница B = 0.575
Страница C = 0.575

А после 100 итераций результат трансформируется в:

Страница A = 1.459459
Страница B = 0.7702703
Страница C = 0.7702703

В обоих случаях, общее значение ПэйджРанка сайта составляет 3 (это максимум), то есть ничего не теряется. Кроме того, в обоих случаях наглядно видно, что страница A имеет гораздо большую долю ПэйджРанка, чем две другие страницы. Так происходит потому, что страницы B и C передают свои доли ПэйджРанка только странице A и никаким другим страницам. Иными словами, мы получили управляемый механизм передачи доли ПэйджРанка в ту область сайта, в какую мы хотим.

Пример 4

В заключение, сохраним предшествующую ссылочную структуру, и добавим ссылку со страницы C на страницу B. Вновь начнем с PR, равного 1 для всех страниц. После первой итерации получим:

Страница A = 1.425
Страница B = 1
Страница C = 0.575

По сравнению с результатами первой итерации из предыдущего примера, страница A потеряла некоторую долю ПэйджРанка, страница B немного приобрела, а страница C осталась на том же самом уровне. Страница C теперь делит свои «голоса» между страницами A и B. Ранее же страница A получала все «голоса». Именно поэтому страница A потеряла, а страница B — приобрела. По результатам 100 вычислительных итераций получаем:

Страница A = 1.298245
Страница B = 0.9999999
Страница C = 0.7017543

Когда пыль наконец осела, страница C потеряла немного в своем ПэйджРанке, поскольку, деля теперь «голоса» между A иB, вместо того чтобы отдавать их все на A, страница A отдает странице C через ссылку с A на C. Таким образом, добавление дополнительной выходящей вовне ссылки со страницы вызывает потерю части ПэйджРанка этой страницы непрямым образом, если любая из страниц, на которую поставлена ссылка, возвращает ссылку назад. Если же страницы, на которые проставлены ссылки, не возвращают ссылки назад, то потери ПэйджРанка страницы не происходит. Если представить себе более жизненную ситуацию, когда ссылка возвращается непрямым образом (страница ссылается на другую страницу, другая — на третью, и так далее, пока N-ная страница не возвратит ссылку на первую), то потери ПэйджРанка первой страницы незначительны. Это не так важно, если речь идет о внутренних ссылках на сайте, но приобретает особое значение, когда ссылки ведут вовне сайта.

Пример 5: новые страницы

Добавление новых страниц на сайт представляет собой важный механизм повышения общего ПэйджРанка сайта, поскольку каждая новая страница добавляет в среднем PR 1 к общему значению. Когда мы занимаемся добавлением новых страниц, их новый ПэйджРанк может передаваться уже существующим важным страницам. Воспользуемся калькулятором для демонстрации.

Давайте добавим три новых страницы к структуре, описанной нами в примере 3 [смотрим]. Итак, есть три новые страницы, но они пока особо не влияют на ситуацию. Небольшое увеличение общего ПэйджРанка, и по 0.15 на новую страницу — это все что мы видим. А теперь давайте проставим с них ссылки на сайт.

Поставим ссылки с каждой из новых страниц на важную страницу, в нашем случае — на страницу A [смотрим]. При этом мы видим, что суммарный ПэйджРанк удвоился, с 3 (когда не было новых страниц) до 6. Кроме того, и ПэйджРанк страницы A также практически удвоился.

Одна-единственная вещь неправильна в нашей модели. Новые страницы — это «сироты». Они не могут попасть в индекс Гугла, и поэтому не могут добавить никакого ПэйджРанка сайту, и не могут передать никакой доли ПэйджРанка странице A. Каждая из них нуждается в том, чтобы получить ссылку хотя бы с одной из других страниц. Если страница A — это важная страница, то лучшая страница для размещения таких ссылок, это, конечно же, страница A [смотрим]. Вы можете сколь угодно долго развлекаться подбором вариантов расстановки ссылок, но, с «точки зрения» страницы A, она не считает себя самым лучшим местом для размещения ссылок.

Таким образом, постановка ссылок с одной страницы на большое количество страниц, в случае, если вы заводите сразу много новых страниц, не является хорошей идеей. В этом случае вы получаете распыление ПэйджРанка этой важной страницы. Высока вероятность, что на сайте присутствует более одной важной страницы, поэтому можно использовать простановку прямых и обратных ссылок между важными и новыми страницами. Вы можете воспользоваться калькулятором, чтобы испробовать несколько различных мини-моделей сайта с тем, чтобы найти лучшее размещение ссылок, которое обеспечивает наилучшие результаты с точки зрения уровня ПэйджРанка для важных страниц.

Заключение по примерам

Вы наглядно видите, что, благодаря организации внутренней ссылочной структуры сайта, возможно обеспечить передачу ПэйджРанка отдельным его страницам. Внутренние страницы сайта следует создавать с учетом перераспределения ПэйджРанка, но это работает лишь в том случае, когда Гугл знает об их существовании. Поэтому следует строить политику таким образом, чтобы роботы Гугла своевременно их индексировали.

Входящие и выходящие ссылки


Можно дать определенные примеры, но гораздо лучше почитать о них ниже, и немного побаловаться с моделями, опять же используя уже знакомый нам калькулятор.

Вопросы


Когда одна страница содержит множество ссылок на другую страницу, все ли ссылки учитываются?

Иными словами, если страница A однократно ссылается на страницу B и 3 раза на страницу C, получает ли страница C 3/4 доли делимого ПэйджРанка от страницы A?

Концепция ПэйджРанка заключается в том, что страница «отдает голос» за одну или более других страниц. В оригинальном документе от Гугла, описывающем ПэйджРанк, ничего не говорится о «голосовании» более чем одной ссылкой за одну страницу. Такая идея подрывает концепцию ПэйджРанка, и вполне определенно, если допустить, что она справедлива, открывает простор для манипуляций в области изменения пропорций передачи «голосов» для ряда страниц. Коль скоро вам нужна ссылка на не важную страницу, добавьте с нее несколько ссылок на важную страницу для минимизации негативного эффекта.

Поскольку нам не удалось получить от Гугла определенного ответа на эту тему, разумно предполагать, что страница может передать другой странице только один «голос», и что дополнительные «голоса», исходящие с одной страницы, не учитываются.

Когда страница ссылается сама на себя, учитывается ли такая ссылка?

Вернемся снова к основной концепции. Она заключается в том, что страница может «голосовать» за другие страницы. В оригинальном документе от Гугла ничего не сказано о том, что страницы могут отдавать свои «голоса» сами за себя. Поэтому такая идея противоречит концепции и, опять же, открывает простор для недобросовестных манипуляций результатами. По этим причинам, разумно считать, что страница не может голосовать сама за себя, и что такие ссылки не учитываются.

«Свисающие ссылки представляют собой такие ссылки, которые ведут на страницу, с которой нет ни одной выходящей ссылки. Они приносят ущерб модели, поскольку непонятно, каким образом перераспределяется их вес. А таких ссылок — великое множество. Часто эти свисающие ссылки ведут на страницы, которые мы никогда еще не загружали. Поскольку свисающие ссылки не влияют на оценку ПэйджРанка других страниц непосредственным образом, мы просто удаляем их из системы до тех пор, пока все расчеты ПэйджРанка не будут произведены. Когда же расчеты завершены, все величины ПэйджРанка известны, эти ссылки снова добавляются в базу и уже не влияют на порядок вещей существенным образом», — так звучит выдержка из оригинального документа о ПэйджРанке, написанного основателями Гугла Сергеем Брином и Лоренсом Пэйджем.

Итак, свисающая ссылка — это ссылка, ведущая на страницу, которая не имеет выходящих с нее ссылок, или ссылка на страницу, которую Гугл не индексирует. В обоих случаях, Гугл удаляет такую ссылку из базы сразу после начала процесса расчетов ПэйджРанка, и возвращает ее незадолго до того, как расчет заканчивается. Тогда влияние таких ссылок на результаты расчета ПэйджРанка минимально.

Возможно, в целях повышения функциональности конкретного сайта, можно проставлять ссылки на страницы, которые не имеют выходных ссылок, причем делать это без потерь ПэйджРанка, но это опасно с точки зрения снижения потенциального ПэйджРанка. Потенциальное значение для этого сайта составляет 5, поскольку он содержит 5 страниц, но без вовлечения страницы E, сайт достигает лишь значения 4.15.

А теперь проставим ссылку со страницы A на страницу E и нажмем Calculate. Отметим, что суммарное значение снижается весьма достоверно. Однако, поскольку новая ссылка является свисающей, и будет удалена из расчетов, мы можем пренебречь новым суммарным значением и считать предшествующее 4.15 правдой. Таково влияние полезных с точки зрения функциональности свисающих ссылок. Они не влекут за собой потери суммарного ПэйджРанка.

Однако, кое-что, тем не менее, теряется, поэтому поставим ссылку со страницы E назад на страницу A и нажмем Calculate. Теперь мы имеем максимальное значение ПэйджРанка, которое возможно для 5 страниц. Ничего не потеряно.

Несмотря на то, что с точки зрения удобства функционала неплохо ставить ссылки на страницы внутри сайта без их возврата, это опасно с точки зрения падения ПэйджРанка. Именно поэтому всегда следите за тем, чтобы каждая страница внутри сайта ссылалась по меньшей мере на одну страницу в пределах того же самого сайта.