Как Microsoft Academic Search формирует свои рейтинги?

Вчера, во время некоторого простоя в офисе, мой коллега обнаружил, что в настоящее время я нахожусь на 20-й позиции в мировом рейтинге Microsoft Academic Search по моей подобласти с точки зрения влияния за последние 5 лет. Хотя этот рейтинг, безусловно, лестен, он также явно фальшивый, поскольку многие гораздо более выдающиеся ученые занимают в этом списке далеко позади меня.

Объяснение бритвы Оккама о том, что в моей области просто есть еще один исследователь с моим именем, можно отбросить, поскольку в академическом профиле Microsoft действительно перечислены мои и только мои публикации (а также фотография профиля, которую они, похоже, взяли из старого сайт университета).

Итак, мой вопрос заключается в следующем: как Microsoft Academic Search на самом деле создает рейтинги (отдельных ученых, но есть также рейтинги журналов)? Кажется очевидным, что не все цитаты и публикации считаются равными (иначе я не оказался бы так далеко впереди со сравнительно скудным набором статей и цитат), но как они решают, что «стоит» сколько?

Я в основном ищу ответы, которые относятся к документам или веб-ссылкам, исходящим от инсайдеров MS, об их алгоритмах ранжирования. За исключением этого, некоторые хорошо продуманные предположения от посторонних также в порядке :)

Редактировать:

Я только что обнаружил, что Microsoft Academic Search, кажется, использует понятие рейтинга полей для конференций и журналов, а рейтинг некоторых мест, которые мы предпочитаем, кажется неоправданно высоким. Однако это все еще не полностью объясняет мой любопытный случай (и все еще оставляет открытым вопрос о том, как эти рейтинги полей генерируются в первую очередь).

+1 Интересный вопрос. Возможно, Microsoft отправила сотрудников из будущего и поэтому знает, что вы будущий звездный ученый, который изменит мир, каким мы его знаем?
Для первого имени, которое я проверил, университет совершенно неправильный, многие публикации отсутствуют, многие перечислены более одного раза, а многие ошибочны и принадлежат кому-то другому в совершенно другой области (скажем, физика против экономики ) .
Хотелось бы, чтобы кто-нибудь отписался об этом.
Покопавшись в своей собственной записи в Microsoft Academic Search, я несколько опасаюсь, что ответ будет «катастрофически плохой».

Ответы (1)

как Microsoft Academic Search формирует рейтинги?

Поскольку Microsoft Academic Search, как и Google Scholar, является проприетарной вертикальной поисковой системой, а ее алгоритмы и системы ранжирования не являются открытым исходным кодом, вы вряд ли получите подробный ответ «как», если только недовольный бывший сотрудник Microsoft не решит вмешаться.

Однако Microsoft Academic Search предоставляет некоторые сведения о своей системе рейтингов и результатов. Эта страница предлагает базовое объяснение подхода поисковой системы. Как для Microsoft, так и для Google цитирование играет важную роль в рейтинге результатов поиска, что в прошлом подвергало академические поисковые системы критике . Как указано на странице академического поиска выше,

информация, связанная с профилями авторов Microsoft Academic Search, получена из десятков миллионов научных публикаций, которые в настоящее время индексируются Microsoft Academic Search. Большинство этих публикаций имеют списки ссылок, которые обрабатывает Microsoft. Проиндексированные публикации и списки ссылок помогают составить представление об истории публикаций отдельных авторов, их продуктивности и влиянии. Чем больше контента индексируется в Microsoft Academic Search, тем выше точность и полнота данных профиля автора.

Поскольку ранжирование в академическом поиске может быть искажено такими факторами, как количество цитирований, неполные индексы публикаций и упомянутая вами система рейтинга полей, это неизбежно приведет к некоторым неточным результатам.

Предупреждение о предположениях : мне кажется, что львиная доля ранжирования достигается за счет автоматического анализа списка цитирования, что не обязательно является хорошим показателем

  • Известность в своей сфере,
  • Количество публикаций (вместо этого, кажется, подчеркивается, как часто публикация цитируется в другом месте).

Наконец, Academic Search все еще находится в стадии бета-тестирования, и я подозреваю, что их быстро растущий индекс не всегда может идеально соответствовать их алгоритмам ранжирования — по моему личному опыту работы с поисковой системой, похоже, были случаи, когда ученые с высоким рейтингом или статьи внезапно резко падают, а затем снова появляются, что, как я полагаю, является следствием переделки алгоритма ранжирования.