Работа без ошибок

С осени 2012 года группа по вебометрике Института прикладных математических исследований Карельского научного центра РАН при поддержке Российского гуманитарного научного фонда выполняет проект “Вебометрический рейтинг научных учреждений России”. По мнению специалистов ИПМИ, существующий международный рейтинг Webometrics испанской исследовательской группы Cybermetrics Lab (о нем неоднократно писалось в “Поиске”) обладает рядом недостатков.


Как отмечают авторы проекта, стоило бы поговорить, по крайней мере, о двух моментах: “измерительных устройствах” и единицах анализа.
Рассказывает ведущий научный сотрудник лаборатории телекоммуникационных систем ИПМИ КарНЦ РАН Андрей Печников:
— Для измерения значений вебометрических индикаторов (количество страниц, количество внешних ссылок и др.) в качестве измерительных устройств, как правило, используются наиболее популярные поисковые системы. Понятно, что для испанцев из Cybermetrics Lab “Яндекс” к ним не относится. Хотя достаточно очевидно, что при измерении индикаторов веб-сайтов конкретной страны необходимо использовать поисковые системы, как наиболее распространенные в мире (Google), так и наиболее распространенные в этой стране (для России — “Яндекс”).
В качестве единиц анализа практически всегда принимаются доменные имена официальных веб-сайтов учреждений, участвующих в рейтинге. Но измерения по доменному имени в ряде поисковых систем ведут к тому, что, например, к страницам сайта Карельского научного центра РАН (www.krc.karelia.ru) могут быть отнесены и страницы сайта Института прикладных математических исследований КарНЦ РАН, доменное имя которого mathem.krc.karelia.ru является поддоменом krc.karelia.ru. А это неверно, так как речь идет о веб-сайтах двух самостоятельных научных учреждений.
В то же время существуют веб-ресурсы институтов, не ассоциируемых по доменному имени с их головным сайтом. Например, Институт проблем управления РАН (официальный сайт — www.ipu.ru) имеет крупный сайт “Теория управления организационными системами” (доменное имя — www.mtas.ru), который не учитывается при измерениях индикаторов поисковыми системами как веб-ресурс института.
В проекте “Вебометрический рейтинг научных учреждений России” прорабатываются эти моменты, а также ряд других, в некотором смысле существенно развивающих подходы, сформулированные испанскими коллегами. В частности, в качестве единицы анализа предлагается принимать не доменное имя официального сайта, а множество всех доменных имен сайтов, составляющих веб-пространство научного учреждения. Отсюда возникают такие далеко не последние вопросы: как сформировать перечень сайтов веб-пространства учреждения в некотором автоматизированном режиме, а не путем просмотра сайтов в браузере? И все ли сайты перечня, сформированного разработчиками проекта, на самом деле принадлежат данному учреждению? Например, входит ли сайт Карельского отделения Профсоюза работников РАН profcom.krc.karelia.ru в веб-пространство Карельского научного центра или нет?
Есть и другие темы, представляющиеся авторам проекта весьма важными. Одна из них — исправление ошибок поисковых систем и разработка и обоснование критериев ранжирования применительно к веб-ресурсам научных учреждений России.

Белла СВЕТИНА

Нет комментариев