klondike

Методология

WWWRating - интерактивный рейтинг сайтов на основе BIG DATA. Рейтинг строиться полностью автоматически на основе собранных данных о сайте и компании из открытых источников в сети интернет (цифровой след компании). Индекс значимости сайта выводится в таблице рейтинга около доменного имени и меняется автоматически после обхода сайта роботом.

В качестве определяющих характеристик для больших данных мы считаем: объём (1,3 млн. сайтов и 10 млн. компаний), скорость (1000+ сайтов в сутки), многообразие типов структурированных и полуструктурированных данных (200+ параметров).

В сутки обрабатываем 200000 параметров сайтов. Всего за месяц обрабатываем 260млн. параметров

Формула индекса

РЕЙТИНГ = ∑ МЕТРИКА n * КОЭФФИЦИЕНТ

Михаил Болдырев Идеолог проекта

Данные для расчета рейтинга

Основные метрики

  • Яндекс ИКС
  • Яндекс Знаки
  • Индексация в Яндекс
  • Индексация в Гугл
  • Реестр запрещённых сайтов
  • Вирусы от Yandex
  • Вирусы от Google

Трафик

  • Открытая посещаемость
  • Рейтинг Alexa
  • Карта посещаемости
  • Гендер
  • Похожие сайты по версии Alexa
  • Системы статистики на сайте
  • Источники трафика (примерно)
  • Количество страниц за посещение (примерно)
  • Время на сайте (примерно)
  • Отказы (примерно)

Соц.сети

  • Ссылки
  • Социальная активность
  • Социальный трафик
  • Активность в Facebook
  • Активность в ВКонтакте
  • Активность в Twitter

Оптимизация (SEO)

  • Размер HTML-страницы
  • Скорость загрузки страницы
  • Внутренние ссылки
  • Внешние ссылки
  • Битые ссылки
  • Ошибки HTML-кода
  • Тошнота текста
  • Уровень доверия к сайту
  • Микроразметка Shema.Org
  • Микроразметка OpenGraph
  • Наличие файла robots.txt
  • Наличие SiteMap
  • Поисковые фразы в Яндекс
  • Поисковые фразы в Google

Технологии

  • IP сайта
  • Страна, где находится сервер
  • Дата центр
  • Возраст домена
  • Доступность SSL-сертификата
  • Наличие редиректа c WWW
  • Кодировка сайта
  • Технологии, которые используются на сайте

Юзабилити

  • Наличие фавикона
  • Код ответа несуществующей страницы 404
  • Ссылка со страницы 404
  • Тест на кэш браузера
  • Время ответа сервера
  • Сжатие изображений
  • Область экрана на мобильном устройстве

Как все работает

Интегральные вычисления

На проекте делаются сложные интегральные вычисления значимости параметров по каждой категории рейтинга. Некоторые из них выводятся на странице отраслевых рейтингов. Пример:

интегральные диаграммы

Рейтинг студий и агентств

Методология построения рейтинга сайтов студий и агентств Рунета аналогична методологии оценки других отраслей, хотя немного отличается

Чтобы заполнить карточку компании, нужно зарегистрироваться

РЕЙТИНГ = ∑ МЕТРИКА n * КОЭФФИЦИЕНТ

Пример: Рейтинг = K1*J1 + K2*J2 + K3*J3 + K4*J4 + K5*J5

За сайты, на которых стоит копирайт студии, начисляется J1 = 0.3 балла.
Коэффициент J1 умножается на соответствующее количество сайтов (K1);
Если сайт был разработан для известного российского бренда, то начисляется J2 = 0.5 балла. Коэффициент J2 умножается на соответствующее количество сайтов (K2);
Если сайт был разработан для известного иностранного бренда, то начисляется J3 = 0.7 балла. Коэффициент J3 умножается на соответствующее количество сайтов (K3);

Pr1 - количество баллов за рейтинг для сайта из портфолио

(Pr2+Tc2)*2 - слагаемое рассчитывается при условии, что сайт сделан для известной российской компании. Pr2 и Tc2 рассчитываются аналогично Pr1 и Tc1.

Известность компании определяется из открытых источников, аналогичных Википедии, Fortune500 и Forbes:
(Pr3+Tc3)*1.5 - слагаемое рассчитывается при условии, что сайт сделан для обычной (неизвестной) иностранной компании. Pr3 и Tc3 рассчитываются аналогично Pr1 и Tc1.

(Pr4+Tc4)*3 - слагаемое рассчитывается при условии, что сайт сделан для известной иностранной компании. Pr4 и Tc4 рассчитываются аналогично Pr1 и Tc1.

Если студия клиентоориентирована и способствует тому, чтобы повысить качество сервиса для заказчиков сайтов, то применяется параметр Y. Параметр Y- количество клиентов с количеством проектов 2 и больше. Данный параметр рассчитывается путем умножения на коэффициент 1.5;

M - слагаемое, которое характеризует показатель CMS. Рассчитывается по формуле M = m1+m2+m3+m4, где m1 = 3 балла, если студия имеет собственную CMS;
m2 = 1 балл, если на сайте студии есть информация, что CMS была модернизирована (улучшена) за последний год;
m3 = 1 балл, если на сайте студии есть информация, что CMS была несколько раз модернизирована (улучшена) за последний год;
m4 = 1 балл за работу с каждой из сторонних CMS;

S - слагаемое, которое характеризует показатель Social Media. Рассчитывается по формуле S = s1+s2+s3+s4+s5, где s1 = 0,5 балла, если студия ведет аккаунт в facebook, что также помогает клиентам понять, кому вверяется бюджет на сайт, получая доп.сведения о студии из данного источника;
s2 = 0.4 балла за аккаунт в twitter’e;
s3 = 0,2 балла за LJ;
s4 = 0,6 балла за стэндэлон;

O - слагаемое, которое характеризует показатель «Офис». Рассчитывается по формуле:
O = o1+ o2, где:
o1 = 1 балл, если у студии есть офис в стране рейтинга;
o2 = 2 балла, если студия имеет собственный продакшен непосредственно в офисе;

AIA = 1 балл российским студиям начисляется за членство в АИА;

nr - слагаемое, которое характеризует наличие наград в российских конкурсах. 1 награда = nr = 1 балл;

nw - слагаемое, которое характеризует наличие наград в международных конкурсах. 1 награда = nw = 2 балла;

E и Z - показатели голосований зарегистрированных пользователей. Динамическая характеристика, результат которой изменяется во времени следующим образом:
E = количеству лайков народного голосования
Z = Q*1, где Q = количеству лайков владельцев студий
Z = Q*1 + W*3, где W = количеству лайков жюри
Z = Q*1 + W*3 + R*5, где R = коэффициенту, назначенному организаторами WWWRating

В том случае, если студия самостоятельно предоставляла все необходимые данные в полном объеме, то общая сумма умножается на 1.2
Ф=(N+$+AGE+Pr+Tc+(Pr1+Tc1)+(Pr2+Tc2)*2+(Pr3+Tc3)*1.5+(Pr4+Tc4)*3+Y*1.5+M+S+O+AIA+nr+nw+E*0.01+Z)*1.5
Ф = итоговый балл студии.


Web-студии и агенства, размещающие данные о себе через процедуру регистрации на сайте, подтверждают тем самым согласие на использование данных.

У вас есть интересный проект и вы хотите организовать тендер?