Вчера, во время некоторого простоя в офисе, мой коллега обнаружил, что в настоящее время я нахожусь на 20-й позиции в мировом рейтинге Microsoft Academic Search по моей подобласти с точки зрения влияния за последние 5 лет. Хотя этот рейтинг, безусловно, лестен, он также явно фальшивый, поскольку многие гораздо более выдающиеся ученые занимают в этом списке далеко позади меня.
Объяснение бритвы Оккама о том, что в моей области просто есть еще один исследователь с моим именем, можно отбросить, поскольку в академическом профиле Microsoft действительно перечислены мои и только мои публикации (а также фотография профиля, которую они, похоже, взяли из старого сайт университета).
Итак, мой вопрос заключается в следующем: как Microsoft Academic Search на самом деле создает рейтинги (отдельных ученых, но есть также рейтинги журналов)? Кажется очевидным, что не все цитаты и публикации считаются равными (иначе я не оказался бы так далеко впереди со сравнительно скудным набором статей и цитат), но как они решают, что «стоит» сколько?
Я в основном ищу ответы, которые относятся к документам или веб-ссылкам, исходящим от инсайдеров MS, об их алгоритмах ранжирования. За исключением этого, некоторые хорошо продуманные предположения от посторонних также в порядке :)
Редактировать:
Я только что обнаружил, что Microsoft Academic Search, кажется, использует понятие рейтинга полей для конференций и журналов, а рейтинг некоторых мест, которые мы предпочитаем, кажется неоправданно высоким. Однако это все еще не полностью объясняет мой любопытный случай (и все еще оставляет открытым вопрос о том, как эти рейтинги полей генерируются в первую очередь).
как Microsoft Academic Search формирует рейтинги?
Поскольку Microsoft Academic Search, как и Google Scholar, является проприетарной вертикальной поисковой системой, а ее алгоритмы и системы ранжирования не являются открытым исходным кодом, вы вряд ли получите подробный ответ «как», если только недовольный бывший сотрудник Microsoft не решит вмешаться.
Однако Microsoft Academic Search предоставляет некоторые сведения о своей системе рейтингов и результатов. Эта страница предлагает базовое объяснение подхода поисковой системы. Как для Microsoft, так и для Google цитирование играет важную роль в рейтинге результатов поиска, что в прошлом подвергало академические поисковые системы критике . Как указано на странице академического поиска выше,
информация, связанная с профилями авторов Microsoft Academic Search, получена из десятков миллионов научных публикаций, которые в настоящее время индексируются Microsoft Academic Search. Большинство этих публикаций имеют списки ссылок, которые обрабатывает Microsoft. Проиндексированные публикации и списки ссылок помогают составить представление об истории публикаций отдельных авторов, их продуктивности и влиянии. Чем больше контента индексируется в Microsoft Academic Search, тем выше точность и полнота данных профиля автора.
Поскольку ранжирование в академическом поиске может быть искажено такими факторами, как количество цитирований, неполные индексы публикаций и упомянутая вами система рейтинга полей, это неизбежно приведет к некоторым неточным результатам.
Предупреждение о предположениях : мне кажется, что львиная доля ранжирования достигается за счет автоматического анализа списка цитирования, что не обязательно является хорошим показателем
Наконец, Academic Search все еще находится в стадии бета-тестирования, и я подозреваю, что их быстро растущий индекс не всегда может идеально соответствовать их алгоритмам ранжирования — по моему личному опыту работы с поисковой системой, похоже, были случаи, когда ученые с высоким рейтингом или статьи внезапно резко падают, а затем снова появляются, что, как я полагаю, является следствием переделки алгоритма ранжирования.
Марк Клазен
Геррит
Джонатан Э. Ландрам
фомит