О Google PageRank. Как работает и почему по прежнему важен в 2018

Автор #vikup34, 17-02-2018, 01:31:11

« назад - далее »

#vikup34Topic starter

На днях получил по e-mail статью,
Beginner's Guide to Google PageRank: How It Works & Why It Still Matters in 2018, опубликованную на SEO PowerSuite (оригинал). Автор Valerie Niechai.

Прочёл, понравилась. Решил сделать перевод.
В процессе - где-то постарался объяснить более понятно чем было, где-то уточнил, где-то добавил.
Получилось что-то вроде расширенной и дополненной версии оригинала.

Итак:

Google PageRank. Пособие для начинающих. Как он работает, и почему по прежнему важен в 2018 году


ЦитироватьКогда малыш только родился, у них были грандиозные планы на его будущее!
Но уже вскоре они поняли, что их ребенок не собирается ни играть на скрипке, ни рыбачить с семьёй...
Вместо этого он увлекся тату, тяжёлым роком, прыжками с парашютом, начал водится с плохой компанией...

Что-то подобное произошло и с Page Rank, замечательным детищем Larry Page (который дал свою фамилию алгоритму) и Сергея Брина. Этот алгоритм с одной стороны - позволил Google стать поисковым гигантом, который диктует всему мира свои правила, а с другой - создал целую массу проблем, которые на определённом этапе вышли из под контроля его создателей.

Page Rank
Математический алгоритм, который оценивает качество и количество входящих на страницу ссылок. Этот алгоритм позволяет оценить относительную авторитетность и важность каждой страницы в сети, присваивая ей "ранг".

В соответствии с этим алгоритмом каждая ссылка со страницы а) на страницу б) - что-то вроде "голосования". Значимость отдаваемого "голоса" пропорциональна Page Rank страниц, которые ссылаются на "голосующую" страницу (т.е. голосуют за неё). Page Rank ссылающихся страниц, в свою очередь, зависят от Page Rank страниц, ссылающихся на них, итд. Вычисление PageRank подобным способом может показаться крайне ресурсоёмким, но к этому вопросу мы вернемся позже.

Google Toolbar
Гугл изначально сделал "ранги страниц" публично доступными с помощью своего плагина Google Toolbar, хоть эти "ранги" и отображались лишь приблизительно. Градация рангов была всего лишь от 0 до 10, но, судя по всему, это была логарифмичная шкала. Её реальные значения были следующими:



Публичный доступ к PR привел к ряду сложностей, и я (Valerie Niechai) понимаю, почему сотрудники Google избегают прямых высказываний в отношении всего, что касается сигналов, используемых Google при ранжировании.

Со временем, Гугл прекратил поддержку тулбара. А затем, 15 апреля 2016 работа плагина была окончательно прекращена, что сделало PageRank "засекреченным" фактором ранжирования.

И хотя Page Rank и недоступен публично - он всё еще существует. А потому, я хочу рассказать, как он работает, что делает, и почему он по прежнему важен.


Расчёт PageRank
Каждому вебмастеру следует в общих чертах понимать, как работает PageRank. Эти знания важны в SEO для того, чтобы понимать, что именно нужно делать, чтобы добиться заметного результата. А так же для того, чтобы понять, что именно "пошло не так" в случае, если у сайта упали позиции.

Расчёт PR выглядит невыполнимой задачей, ведь (как сказано выше) Ранг страницы зависит от Рангов страниц, которые на неё ссылаются.
Но ведь мы не можем знать Ранги и этих страниц до тех пор, пока не вычислим. В результате получается циклическая зависимость, и произвести расчёт PR как будто бы и вовсе невозможно.

Но не всё так плохо. PR может быть высчитан с помощью "Метода итерации" и имеет отношение к собственному вектору нормализованной ссылочной матрицы сети интернет.
Этот математический метод позволяет узнать "вес"(PageRank) любой страницы не зная "весов"(PageRank) страниц, которые на неё ссылаются.

Каким образом?
За счёт того, что каждый раз, производя расчёты (с каждой итерацией) мы приближаемся к окончательным точным значениям. Всё что требуется - повторять итерации расчёта PR запоминая предыдущие найденные значения до тех пор, пока новые найденные значения почти не перестанут отличаться от предыдущих.

Гугл пересчитывает PR после каждого переобхода сети. С ростом количества страниц в интексе Google базовый PR для каждой из отдельных страниц снижается.
Считается (по заявлению автора), что PR имеет некоторые предпочтения в отношении более старых страниц, а новая страница, какой бы хорошей не была, не может иметь множества качественных обратных ссылок, потому получает более низкий PR.

Формула PageRank так же имеет демпинг-фактор (d). В соответствии с теорией PR, можно считать что есть некий воображаемый сёрфер, который рандомно переходит по ссылкам, но на определённом этапе ему это надоедает. Вероятность того, что сёрферу надоест кликать дальше для каждой из страниц называется "демпинг-фактором". Этот фактор введён для того, чтобы не возникло ситуаций, когда отдельные страницы имели бы чересчур большой вес.

В результате демпинг-фактора суммарный "вес голоса", отдаваемый страницей, умножается на понижающий коэффициент 0.85 (предполагаемое значение)

Предполагается, что среднестатистический вес страницы в сети берётся за 1. А формула PageRank предполагает, что даже если на страницу нет внешних ссылок, её "вес" всё равно равен 0.15 (1 - демпинг-фактор 0.85)

Одна из лучших статей по вопросу расчёта PR - вот эта (англ), написанная Ian Rogers.
Он приводит кое-какие примеры, и сопровождает их своими наблюдениями и описанием общих принципов.

Наиболее важные из описанных там моментов:

  • Обратные ссылки.
    Главная страница как правило имеет самый высокий PR, т.к. на неё ведёт больше всего входящих ссылок. Если на страницах, куда ведут исходящие ссылки нет обратных, то PR страницы с исходящими ссылками уменьшается. Есть смысл в том, чтобы страницы по внешним ссылкам ссылались обратно на главную, и таким образом её вес не уменьшался.



    Тем не менее
    Создание структуры сайта, при которой большая часть "веса" сконцентрировано на главной странице не просто не будет работать, но ещё и навредит. С другой стороны - сконцентрировав внимание на главной вы можете сделать опыт её посещения настолько приятным для пользователей, что это в результате принесёт вам куда больше PR, чем тот, который вы "потеряли", сделав на ней чересчур сильный акцент.
  • По поводу иерархии
    Иерархия концентрирует "голоса" и PR на более высокой странице в иерархии.


  • По поводу структуры
    Грамотная и продуманная структура сайта усиливает эффект входящих внешних ссылок


  • По поводу внутренней перелинковки
    Внутренняя перелинковка снижает вес, теряемый в результате размещения внешних ссылок

    Тем не менее
    При отсутствии внешних ссылок количество внутренних ссылок никак не влияет на суммарный PR сайта

  • По поводу спамных ссылок
    Тысячи спамных страниц, указывающих на главную страницу сайта способны дать неплохой прирост к PR. Но если гугл обнаружит это (а он это хорошо умеет) - сайт может навсегда покинуть выдачу. С другой стороны - тысячи страниц (ну или хотя бы несколько) с уникальным контентом, указывающих на главную страницу сайта - самый лучший способ получить высокий PR.


Противоречия PageRank

PR - гениальное изобретение, которое сделало Google столь эффективным и авторитетным. Но любое изобретение можно использовать как во благо, так и и во вред. В случае с PR -  им начать манипулировать и использовать так, как не было предусмотрено разработчиками.

Давайте поговорим о причинах, по которым публичный доступ к PageRank наносил ущерб сети интернет, и почему PR был и остаётся таким важным.


Критерий авторитетности

Гугл сделал PR публично доступным, чтобы показать, что поисковый робот способен

  • находить и показывать страницы, которые лучше всего удовлетворят запрос пользователя
  • определять, какие именно страницы - лучшие и самые безопасные
В дальнейшем Гугл разработал Тулбар для Internet Explorer (в дальнейшем поддерживаемый FireFox). Тулбар, будучи активирован, показывал PageRank.
Обычные пользователи были не слишком заинтересованы значениями PR, а вот специалисты по SEO посчитали его превосходной метрикой, которую можно было использовать в работе с клиентами. Мир SEO начал "крутиться вокруг PR", и это сделало его в глазах многих едва ли не единственным фактором ранжирования, к которому стоило стремиться. Даже несмотря на то, что страницы с более низким PR имеют возможность обходить в выдаче страницы с более высоким.

И к чему это привело?

Фермы ссылок.
Рынок тут же подстроился под изменившиеся условия, и началась эпоха манипулирования PageRank. Началась эра "ссылочных ферм".

Конечно же Google не понравилась сложившаяся ситуация, и он начал с этим бороться.
Самые известные меры были приняты в отношении сети searchking.com, в отношении которой были введены пенальти и которая была полностью убрана из поисковой выдачи Google (на данный момент этот сайт снова доступен в Google, т.к. алгоритмы стали совершеннее).

В дальнейшем - продажа ссылок стала "подпольной". Гугл находил и блoкировал сети, продающие ссылки, но это не приносило должного эффекта. Как только закрывалась одна сеть, продающая ссылки - тут же появлялась другая. И до тех пор, пока были клиенты, готовые платить за увеличение PR - продолжали появляться и предложения.

Ссылочный спам
Публичный доступ к PR так же запустил волну ссылочного спама. Спамные комментарии начали появляться в каждом мало-мальски значимом месте, которое позволяло эти комментарии оставлять. Технически было возможным оставлять сотни, даже тысячи спамных комментариев, и каждый из них имел ссылку на целевой сайт. И ведь каждая из этих ссылок имела "вес". Такой способ - просто мечта в плане быстрого увеличения PR, не правда ли?

... Не совсем. Это было серьезной проблемой, в отношении которой Гуглу было необходимо принять какое-то серьёзное решение. И был введён новый атрибут ссылок "rel=nofollow". Это был способ не позволить ссылкам передавать PR странице, на которую они указывали.
К сожалению, это не остановило ссылочный спам, хотя данный атрибут и сейчас используется многими сайтами и социальными сетями.

Итог
Даже когда Google сделал свой PageRank "секретным", было очевидно, что это уже не вернёт "мир и покой" мировой сети. До тех пор, пока люди понимают, что Google использует в своём механизме ранжирования ссылки как фактор, их будут продолжать покупать и продавать.


Важность PageRank
Вопроса о том, важен ли PR - нет. Конечно же PR важен! Google и не отрицает, что PageRank по прежнему имеет значение,  помогая поисковой системе определить самые авторитетные и надежные источники информации по каждому поисковому запросу. PR всего лишь перестал быть доступным публично.

В конце концов, вы всё еще можете понять, что формула для более высокого PageRank вашего сайта:
Цитироватькачество (но не количество!) входящих ссылок + эффект от внутренней перелинковки

Это значит, что оптимизируя сайт мы неизбежно следуем рекомендациям по увеличению PR.
Более того, механизм PR универсален, и может быть применён в любой области. На данный момент этот алгоритм применяется в целом ряде научно-практических областей, связанных с анализом и структурированием информации.

Увеличение PageRank

1. Качественные входящие ссылки
Не смотря на то, что PageRank более недоступен публично, существуют альтернативные способы его оценки.

  • Сервис megaindex.ru позволяет просматривать LinkRank обратных ссылок на любой домен (здесь)
  • Сервис majestic.com позволяет просматривать "Доверие" и "Известность" каждой из входящих ссылок для подтвержденных в аккаунте доменов совершенно бесплатно (здесь)
  • Программа seo spyglass позволяет в бесплатном режиме проводить оценку LinkRank входящих ссылок по любому домену
  • Сервис megaindex.com позволяет определить значимость некоторого количества входящих ссылок в бесплатном режиме.
    Используя кнопки "сортировки" на megaindex.com можно определить ранг и вес нескольких десятков обратных ссылок для каждого домена.
  • Сервис SEOprofiler позволяет бесплатно оценить "значимость" любой ссылки или домена (здесь)
  • Сервис cognitiveseo.com позволяет бесплатно оценить "значимость" любой ссылки или домена
  • Сервис www.sbup.com позволяет бесплатно оценить "Real PageRank" любого домена
  • Сервис extlinks.com позволяет оценить "Ранг" любого домена
  • Сервис seokicks.de позволяет оценить "Domainpop"(популярность) любого домена, и DomainRank ссылающихся доменов
  • Сервис хtool.ru позволяет оценить "XTrust" домена, который отражает "доверие" данного сервиса с домену
  • а так же некоторые другие, не имеющие бесплатных режимов

2. Внутренняя перелинковка
В то время, как внешние ссылки могут от вас и не зависеть, внутренняя перелинковка всегда находится под Вашим полным контролем. Она позволяет сделать путешествие по сайту одинаково приятным как для пользователей, так и для поисковых роботов.

По возможности, старайтесь следовать следующим рекомендациям:

  • Структура сайта не должна быть слишком глубокой
    Считается оптимальным, чтобы страницы находились на расстоянии 2-3 кликов от стартовой страницы. Мало кому захочется кликать 10 раз, чтобы наконец попасть на нужную страницу сайта. На слишком сложных сайтах эта цель может быть достигнута за счёт хлебных крошек (breadcrumbs), наборов #тэгов или поиска по сайту.
  • Структура сайта не должна быть слишком сложной
    Время, необходимое пользователю на то, чтобы найти ссылку, ведущую в направлении "искомой" информации должно быть небольшим. Ссылочная структура сайта должна стремиться к тому, чтобы быть интуитивной, ожидаемой и понятной.
  • На важные страницы должно быть легко попасть
    Если на страницу сайта не ведут внутренние ссылки, она может оказаться совершенно невидимой и для пользователей, и для поисковых роботов. А из алгоритмов расчёта PR следует, что чем больше внутренних ссылок ведет на отдельную страницу, тем более она значима в рамках сайта и тем больший PR имеет. А следовательно - у неё и более высокие шансы появиться в поисковой выдаче по сравнению с остальными страницами того же сайта.
    Инструментами, которые могут помочь проанализировать ссылочную структуру сайта могут выступить

    • https://www.link-assistant.com/website-auditor/
    • https://explorer.cognitiveseo.com

  • Правильно используйте атрибут nofollow
    В 2005 гугл ввёл ссылочный атрибут "nofollow", который препятствовал передаче "веса" (PR) по исходящим ссылкам. После этого началось повальное "оптимизирование внутренних ссылок под PageRank". Это выражалось в том, что ряду внутренних ссылок специально выставлялся атрибут "rel=nofollow" с целью аккумулирования большей части PageRank на отдельных ключевых страницах сайта.
    В настоящее время этот прием не работает, т.к. ссылочный вес распределяется между всеми исходящими ссылками, включая "nofollow". Но особенность "nofollow" ссылок в том, что они, забирая у страницы вес, не передают его дальше. Таким образом внутренние ссылки с атрибутом "nofollow" лишь вредят сайту, и в случае с внутренними ссылками - лучше полностью удалить ссылку, чем делать её nofollow.

Будущее PageRank

Одним из последствий введения PageRank и злоупотреблений алгоритмами его расчёта оказалось то, что любые внешние ссылки начали восприниматься как "созданные в первую очередь для поисковых роботов". В результате, не только у Google возникли проблемы со своим детищем. Даже такие мега-сайты, как Википедия, The Next Web, Форбс и многие другие начали автоматически присваивать "nofollow" атрибут всем исходящим ссылкам, а это означало всё меньше и меньше передаваемых по ссылкам "голосов", даже от сайтов, которые изначально должны были быть их главными, самыми доверенными источниками. Но если все начнут использовать "nofollow" и сайты перестанут передавать друг другу вес, что же тогда будет служить ориентиром для поисковых роботов при определении наиболее релевантных, надежных и авторитетных источников информации?

Очевидно, что что-то новое должно было появиться чтобы занять "пустоту", образовавшуюся в результате введения атрибута "nofollow". И во все в большем и большем количестве источников появляются мнения о том, что поисковые роботы могут использовать так называемые "предполагаемые ссылки" при ранжировании сайтов.
"Предполагаемые ссылки" это, к примеру, упоминания бренда компании. Как правило подобные упоминания происходят с каким-либо смысловым оттенком - положительным, нейтральным или отрицательным. И этот оттенок определяет репутацию сайта, которая, в свою очередь, является фактором ранжирования для поисковых систем.

Я не утверждаю, что эти "безссылочные ссылки" на 100% являются сигналами, используемыми при ранжировании. И нет никаких достоверных свидетельств того, что это так, за исключением того что Google и Bing делают в этом отношении намёки.
К примеру высказывание Gary Illyes (автора "Fred") по поводу того, что именно следует делать вебмастерам для того, чтобы "подстроиться" под новый алгоритм Fred (или, точнее, под изменения, произошедшие с общим алгоритмом ранжирования Google, которые по утверждению Gary Illyes не являются отдельным алгоритмом или фильтром)
ЦитироватьBasically, if you publish high quality content that is highly cited on the internet – and I'm not talking about just links, but also mentions on social networks and people talking about your branding, crap like that.
[audience laughter]
Then, I shouldn't have said that right? Then you are doing great
ЦитироватьВ общем случае, если вы публикуете качественные материалы, которые тут и там обсуждают в интернете - и я не говорю только об одних ссылках, но так же и об упоминаниях в соц. сетях,  людях, обсуждающих ваш бренд и прочей подобной ерунде
[смех в аудитории]
Тогда ... наверное мне не стоило говорить об этом, правда? Тогда это значит, что у вас всё получается просто отлично

Так же патент на алгоритм Google Panda говорит о том, что "подразумеваемые ссылки" могут иметь такой же ссылочный вес, как и обычные.

И хотя обычные ссылки по прежнему имеют огромное значение, вы можете попробовать новую "безссылочную" технику. И даже в случае, если работоспособность этой техники не подтверждена, это всё равно техника по наращиванию репутации Вашего бренда и известности Вашей компании.

====================
Теперь, я надеюсь, алгоритм ранжирования PageRank не кажется Вам таким же запутанным и сложным, как прежде. Но я хочу обратить Ваше внимание - хоть это и первый алгоритм ранжирования, реализованный Google, он далеко не единственный. На сегодняшний день есть множество факторов ранжирования, и каждый из них имеет значение при определении того, какая именно страница находится выше в поисковой выдаче.
Самым важным фактором считается содержимое сайта. Ну.. вы же знаете - "контент - король сайта", без этого никак. А "удобство пользования сайтом" (user experience) - новый "чёрный ход", который становится особенно значимым с вводом нового Скоростного Апдейта от Google (здесь о влиянии Speed Update на выдачу)

А что о PageRank думаете Вы? Делитесь со мной в комментариях!



Автор текста: Valerie Niechai
Автор ru перевода, редактор: ErrorNeo


Примечание редактора:
Текст переписан своими словами с сохранением смысла и содержит больше материалов, чем оригинал.
Убран навязчивый акцент на продуктах компании SEO Powersuite.
Публикуется в двух источниках: searchengines и sbup


windakolit

#1
Интересная статья и перевод хороший.
Странно, что никак не упоминается о том, что базой для PR была система библиотечных цитирований материалов по авторитетности их источника. А то подается так, будто бы Ларри Пейдж просто придумал идею из воздуха ну и конечно чувствуется преклонение перед гуглом определенное)
Хорошо что в статье указывается бессмысленность игр с весами страницы через атрибуты nofollow и не от лица гугл, а от лица сео специалиста. А то знаю что и сейчас это практикуется многими сеошниками по старой памяти.

"В конце концов, вы всё еще можете понять, что формула для более высокого PageRank вашего сайта:
Цитировать
качество (но не количество!) входящих ссылок + эффект от внутренней перелинковки" - не могу понять, чем плохо количество. Большее количество качественных ссылок на сайт лучше меньшего количества качественных ссылок на сайт, я так понимаю

Насчет бессылочных ссылок я читал несколько материалов в англоязычных источниках что citations, цитирования домена и названия компании являются фактором ранжирования при локальном сео. В отечественном сео я считаю что также уже имеет влияние, и для яндекса тоже


neo666

Что-то подобное я и предполагал. Не мог же алгоритм просто так взять и убрать фактор ранжирования, который долгое время был чуть ли не одним из основных. Хорошая и полезная статья. Спасибо за перевод

Владимир75

По заявлению гугла пр просто не показывается, а так он есть и никуда наделся и также важен при продвижении.
Услуги: Сайты в топ за две неделм Мобильный, WatsApp., Viber +79964788889, telegram @xiceer.
  •  

Drondo124

PR гугла уже не обновлялся бог его знает сколько а значит умер.... король умер да здравствует король...
https://servicekomp.com.ua/
  •  


beesyst

Спасибо. Хорошая статья. Спасибо за перевод.

Izten2

Цитата: Drondo124 от 22-02-2018, 09:21:44
PR гугла уже не обновлялся бог его знает сколько а значит умер.... король умер да здравствует король...


Если точнее, то вывод парметров PR для вебмастеров прекращен.
  •  

vienas

Те кто реально что-то двигают не могут не чувствовать существование PR
Никто не видит черные дыры - мы видим то, что вокруг них творится
Тьфу на карму, на мне завязана куча довольных клиентов в US, AU & KZ  8)
Cпортивные тренжеры Gorilla Sports
  •  


O.S.

Видишь суслика? Не видишь?! А он есть!  >:D
спасибо за статью
  •  


evikMaks

Отличная статья, но было бы интересно почитать более обновленные данные для 2022 года
https://www.evacuator24.by/ (ftp://www.evacuator24.by/)
  •