О рангах в поисковых системах
Категории: Техника » Интернет
Ранги в поисковиках
Как ни странно, но среди веб-сайтов тоже есть свои советники, асессоры и даже канцлеры. Поисковые машины ранжируют веб-сайты в зависимости от их значимости. Информация на крупных сайтах (Яндекс, МГУ и т.д.) является более важной, чем информация сайтах, которые только недавно появились в сети. На ранг сайта влияет мнение поисковой машины и количество внешних ссылок установленное на сайт. Поисковые машины иногда отдают предпочтение веб-сайтам участвующим в каталоге, ведь сайты зарегистрированные в каталоге проверяются модераторами. Существуют несколько видов открытого рейтинга ранга сайтов: Google Page Rank , ИЦ (Индекс Цитирования, Яндекс), СИЦ (Средний Индекс Цитирования). Попробуем разобраться в данных рейтингах более подробно.Категории и теги: Техника » Интернет » Яндекс, Google, Рангах, Поисковых, Системах, Веб-Сайтов, Поисковые Машины, Page Rank, Цитирования, Ранга.
Google Page Rank
Что такое PageRank? PageRank - это числовая величина, характеризующая "важность" страницы в Google. Чем больше ссылок на страницу, тем она становится "важнее". Также, вес страницы А определяется весом ссылки, передаваемой страницей B. В итоге, PageRank - это метод вычисления веса страницы путем подсчета важности ссылок не страницу. PageRank является одним из вспомогательных факторов при ранжировании сайтов в результатах поиска. PageRank не единственный, но очень важный способ определения положения сайта в Google. Для упрощения далее PageRank будет упоминать как PR. Численное значение PR можно получить через Google Toolbar ( http://toolbar.google.com/).
Примечания:
Google учитывает не все ссылки. Поисковая система отфильтровывает ссылки с Free For All (FFA) сайтов, т.е. сайтов, предназначенных для скопления ссылок.
Как вычисляется PageRank? При расчете PR страницы учитывается все входящие ссылки. Это ссылки как с самого сайта, так и с других сайтов в сети.
PR(A) = (1-d) + d(PR(t1)/C(t1) + ... + PR(tn)/C(tn))
Вот это и есть формула PageRank. Изначальная формула, утвержденная еще при разработке алгоритма. Скорее всего, в Google практикуются измененные варианты формулы, но это не столь важно. Данное выражение достаточно хорошо показывает суть PageRank.
Значение переменных:
t1-tn - страницы, ссылающиеся на страницу A
C - число исходящих ссылок, которые есть на странице
d - коэффициент затухания, обычно его выставляют 0.85
Можно смотреть на это проще -
PageRank страницы = 0.15 + 0.85 * (Доля PageRank каждой страницы, которая ссылается на нее)
"Доля" это PageRank страницы, разделенный на число исходящих ссылок на странице.
Ссылающаяся страница передает часть своего веса каждой странице, на которую ссылается. При передаче веса существует так называемый коэффициент затухания (равен примерно 0,85) Коэффициент применяется к каждой ссылке.
Отсюда кажется верным вывод, что ссылка со страницы c A и на которой 5 исходящих ссылок будет весомее, чем ссылка со страницы B со 100 исходящими ссылками. Безусловно, PageRank ссылающейся страницы важен, но и число исходящих ссылок на данной странице также имеет значение. Однако многие считают, что значения между PR1 и PR10(максимальное) выставляются по логарифмической шкале. Для таких предположений есть основания.
Никто вне Google не знает наверняка, так это или не так, но велики шансы, что шкала действительно логарифмическая. Но если шкала логарифмическая, то это означает, что необходимо гораздо больше дополнительного PageRank, чтобы страница передвинулась на следующий уровень PageRank, чем то, что потребовалось на предыдущем уровне. И тогда получается, что ссылка со страницы с PR8, имеющая много исходящих ссылок, гораздо ценнее чем ссылка со страницы, имеющей PR4 и лишь несколько исходящих ссылок.
Пример :
Тематический индекс цитирования (тИЦ)
Тематический индекс цитирования (тИЦ) — в поисковой системе Яндекс определяет "авторитетность" Интернет ресурсов с учетом качественной характеристики ссылок на них с других сайтов. Качественную характеристику называют "весом" ссылки. Рассчитывается она по специально разработанному алгоритму. Большую роль играет тематическая близость ресурса и ссылающихся на него сайтов. Значение тИЦ можно получить используя http://bar.yandex.ru/ или каталог Яндекса http://yaca.yandex.ru/.
Тематический Индекс Цитирования, как средство определения авторитетности ресурсов призван обеспечить релевантность расположения ресурсов в рубриках каталога Яндекса. тИЦ не является строго количественной характеристикой. Он дает лишь некоторые округленные значения, которые помогают определиться в "значимости" ("авторитетности") ресурсов в каждой тематической области.
Пример :
Средний индекс цитирования (СИЦ)
Достаточно смелое решение совсем недавно продемонстрировала компания AddWeb . Ru , разработав свой собственный взгляд на ранжирование в сети. Суть идеи заключается в соединение двух рейтингов ( Page Rank и тИЦ) в один Средний Индекс Цитирования (СИЦ, адрес проекта : http://pr.addweb.ru/, здесь можно получить СИЦ ). В данном случае речь идет о логарифмической шкале (1-100), соединяющей Page Rank и тИЦ. Удобство это подхода заключается в том, что пользователь видит общую картину рейтинга того или иного сайта. Это очень удобно для принятия решения о перспективах сотрудничества с тем или иным проектом, ведь кроме СИЦ счетчик выводит и значения PR и тИЦ.
Пример :
Заключение
В заключение можно сказать, что поисковые машины отлично развиваются. И даже используют вполне известную поговорку : "Скажи мне кто твой друг и я скажу кто ты !". Поисковики смотрят на друзей Интернет-проекта и принимают решение о его важности в сети. Поэтому надо серьезно отнестись к вопросу поиска дружественных сайтов в сети Интернет.
Автор: Морозов Роман Леонидович ( mroman @ inbox . ru )
Теги: Яндекс, Google, Рангах, Поисковых, Системах, Веб-Сайтов, Поисковые Машины, Page Rank, Цитирования, Ранга
Категория: Техника » Интернет
| 14-08-2005, 15:03 | Просмотров: 4 875 | Комментарии (0)