Почему рейтинги Эло для го выше, чем для шахмат?

Если мы сравним рейтинги Эло (подобные) в шахматах и ​​в го, мы увидим, что самые высокие рейтинги, опубликованные для го (3621 для Кэ Цзе по состоянию на 13 марта 2016 г. на goratings.org ), выше, чем в шахматах (2851 для Магнус Карлсен по состоянию на 01 марта 2016 г. на сайте FIDE.com ).

Является ли лучшее объяснение одним из следующих предложений или чем-то другим?

  • В некотором смысле в го играют лучше, чем в шахматы. В то время как многие на Западе считают шахматы главной интеллектуальной игрой, я считаю, что го изучают более интенсивно, пользуются большей поддержкой в ​​восточной культуре, чем шахматы там, где в них играют, и приносят больше финансового вознаграждения.
  • Го лучше различает небольшие различия в силе, например, потому что игры длиннее или потому что ничьи случаются редко (я думаю, примерно 1 игра из 50).
  • Существует некоторая произвольная разница в том, как подход Эло применяется к го и шахматам, например, произвольная базовая линия или коэффициент масштабирования.

В любом случае, чтобы сделать ответ полным, необходимо объяснение того, как работает рейтинговая система и, если это уместно, как она взаимодействует с характером игр. Если это показательно, сравнение с другими играми также приветствуется — например, что будет с рейтингами для такой тривиальной игры, как крестики-нолики ?

Я понимаю, что системы не предназначены для прямого сравнения, но надеюсь, что они позволяют сделать какой-то вывод. Ведь они основаны на одних и тех же принципах, хотя разные параметры могут быть заданы по-разному.

Стоит отметить, что в этих двух системах используются разные значения K, и кажется, что го менее сильно бьет по игрокам с более высоким рейтингом при проигрыше. У меня нет времени вдаваться в подробности, но стоит учитывать, что математика, используемая для создания рейтинга на высших уровнях в каждой игре, отличается.
@SocioMatt: Боюсь, я чувствовал то же самое, узнав достаточно о том, как работают системы (подозреваю, я знаю меньше, чем вы), но я надеялся, что здесь найдется кто-то, кто знает больше!
Не стоит слишком много думать об этом. На данный момент goratings.org является частной инициативой и не поддерживается какой-либо официальной го-организацией. Возможно, вы захотите оставить сообщение автору для получения дополнительных объяснений (контактная информация внизу страницы).
Также обратите внимание, что Реми Кулон является автором GoRating, а также автором предыдущего топового ИИ: CrazyStones!
@Christophe: Я также думал о рейтингах, опубликованных для Alpha Go, по -видимому, основанных на Coulom, R. Рейтинг всей истории: байесовская рейтинговая система для игроков с изменяющейся во времени силой. На Международной конференции по компьютерам и играм, 113–124 (2008 г.). , где они сообщили о силе до 3186 для распределенной версии, «вычисленной BayesElo » примерно во время матча Fan Hui. Боюсь, я не проверял, использует ли это goratings.
Вот запись сенсея о PRO ELO в Китае: senseis.xmp.net/?ChineseProRatings
(исправление не 3186 а 3168)
PJTraill Как сказал @Kii, Реми Куломб является автором goratings.org (его контактная информация находится внизу страницы), так что это замкнутый круг.

Ответы (6)

В го нет рейтинга ELO. И даже никакого официального международного рейтинга. Обычный вопрос на го-форумах: «Как мой рейтинг в [любой стране или онлайн-сервере] сравнивается с [другой страной или онлайн-сервером]».

Европейская федерация го поддерживает международную рейтинговую систему, в которой Ке Цзе имеет рейтинг 2956.

goratings.org является личной инициативой Реми Кулома . Она стала популярной, потому что дала журналистам возможность присвоить Фань Хуэю мировой рейтинг, но это не официальная рейтинговая система.

Суть в вашем ответе 3, есть некоторая произвольная разница в том, как подход применяется к игре и шахматам.

Есть три определяющих фактора того, насколько высоким будет самый высокий рейтинг Эло для данной игры:

  • Внутренние аспекты рейтинговой системы: прежде всего то, как инициализируются рейтинги. Если вы начнете с того, что все получат рейтинг 2000, цифры останутся выше, чем если бы все получили 1800. А также К-фактор (насколько сильно колеблются рейтинги) и другие детали, которые могут привести к инфляции или дефляции. Итак, это ваша произвольная разностная часть ответа.

  • Уровень, на котором ведется игра, т. е. насколько лучшие игроки близки к максимальной игровой силе человека. Это во многом зависит от того, сколько игроков играет в игру, как она поддерживается финансово и какие ресурсы есть, чтобы стать действительно сильным. Мне кажется весьма вероятным, что в шахматы играют на более высоком уровне, чем в го, потому что шахматисты пользуются сверхчеловеческими помощниками уже по крайней мере 15 лет.

  • Глубина игры, то есть насколько велика будет разница между новичком и лучшим (возможным) игроком-человеком. Здесь ход явно опережает шахматы, но я сомневаюсь, что это сильно связано со сложностью игрового дерева. Скорее это эффект широкого диапазона розыгрыша в шахматах. Если вы уменьшите дальность розыгрыша в шахматах, например, сократив контроль времени, вы получите рейтинг Эло в шахматах, похожий на ходовой. На шахматных серверах с быстрым контролем времени рейтинги выше 3600 не являются чем-то необычным.

У меня нет понимания рейтингов Го, но я думаю, что вы сравниваете яблоки с апельсинами, т.е. рейтинги Эло Го не предназначены для сравнения с рейтингами Эло Шахмат.

Эта цитата из сравнения рейтинга го с шахматным рейтингом.

Это не возможно. Вы можете использовать европейскую систему GoR для приблизительного сравнения, но проблема в том, что она не привязана таким же образом.

Конечно, их не следует сравнивать; мой вопрос спрашивает, можем ли мы, тем не менее, сделать интересные выводы. Однако спасибо за вашу ссылку, которая интересна и идет намного дальше, чем ваша первая отрицательная цитата; некоторые из комментариев наивны, но многие информативны, и мне нужно больше времени, чтобы их изучить.

Система ELO, как она была первоначально разработана, имеет среднее значение 1500 и стандартное отклонение 400 баллов.

Центральная предельная теорема определяет, сколько людей может существовать по этой модели в зависимости от их расстояния от среднего. Например, рейтинг 3100 — это 4 стандартных отклонения от среднего (1500 + 4 x 400 = 3100). Согласно центральной предельной теореме, 99,993666% будут находиться в пределах 4 стандартных отклонений, или только 1 из 16 000 игроков будет вне этого диапазона. Конечно, мы знаем, что нет игроков с рейтингом выше 3100, поэтому мы сразу видим, что система ELO работает некорректно. Если бы игроки следовали нормальному распределению, то мы ожидали бы, что из 1 миллиона или около того игроков будет около 80 с рейтингом выше 3100, но это не так.

Теперь, что касается igo-игрока с рейтингом выше 3600, то это на 5,25 стандартных отклонения выше среднего (1500 + 5,25 x 400). Согласно центральной предельной теореме, такой рейтинг должен быть у одного человека из 10 миллионов. Если мы предположим, что есть 10 миллионов игроков в го с рейтингом и есть один игрок с рейтингом выше 3600, то это соответствует модели.

Есть две проблемы со сравнением двух рейтингов чемпионов. Во-первых, распределение игроков, особенно в шахматах и, возможно, в igo, не является нормальным гауссовым распределением, поэтому система ELO всегда будет в какой-то степени ошибочной. Во-вторых, многие рейтинговые системы, особенно шахматная система ФИДЕ, не используют чистое ЭЛО, а манипулируют рейтингом различными способами. Кроме того, в системе ФИДЕ нет установленного среднего значения, и в ней участвует лишь небольшое количество игроков, а не все шахматисты мира. Поэтому трудно извлечь какой-либо смысл из сравнения.

Если у вас есть две игры, каждая из которых ранжирует игроков с помощью рейтинговой системы ELO , то игра с более высоким рейтингом обычно рассматривается как «более сложная», чем игра с более низким рейтингом. В том смысле, что есть более дискретные уровни обучения мастерству. Мне не ясно, какие системы ранжирования используются в вашем заявлении, но для того, чтобы сделать вывод, используемые системы ранжирования должны быть идентичными.

Все это говорит о том, что го определенно более сложная игра , чем шахматы, и широко известна как таковая. Неподтвержденное свидетельство в поддержку этого утверждения: компьютеры уже некоторое время проигрывают людям в шахматах, го, по-видимому, происходит только сегодня.

«Лучше» — неподходящее слово для использования в данном контексте, так как это довольно субъективный термин. «Сложность» обычно используется в такого рода разговорах.

Интересно отметить, что самый высокий рейтинг ELO для League of Legends, который я смог найти, составляет 3069 .

В этой ветке LoL также упоминаются рейтинги 3156 и 3160!
Я чувствую, что сложность — это не совсем то же самое, поскольку она является мерой «размера» проблемы или, лучше сказать, алгоритма; Я думаю о том, насколько хорошо люди освоили игру, но я полагаю, что вы могли бы довольно аккуратно связать их, взглянув на сложность используемых людьми алгоритмов (которые, конечно, недоступны) или алгоритмов эквивалентной силы (таких как Alpha Go ). !). Однако сложность зависит от абстрактной машины, используемой алгоритмом, а человеческие знания сравнимы с расширением алфавита или таблицы инструкций.
@PJTraill Справедливая точка зрения. Я использую термин «сложность» для описания как комбинаторной сложности, так и сложности «человеческого мастерства» в играх. Но, как я использовал выше, это немного двусмысленно.
Любая ссылка в поддержку вашего первого предложения? Основываясь на том, что я читал, Эло больше связан с разницей в баллах, тогда как абсолютные значения зависят от того, как система закреплена. Диапазон (от новичка до вершины) может быть лучшим показателем.
Я голосую против этого ответа по причине, по которой @Christophe (и я) упоминаем. Значения, которые вы подставляете в уравнение ELO, могут довольно сильно изменить результат. Это не имеет ничего общего со сложностью игры, и все, что связано с предположениями, встроенными в значение K.

Есть несколько хороших ответов на главный вопрос, и это только ответ на подвопрос, связанный с тривиальными играми, такими как крестики-нолики (потому что я думаю, что это потрясающий вопрос;)

  • Предполагая взрослую соревновательную игру, в которой каждый участник знает решение, тогда результатом каждой игры будет пат, и все игроки будут иметь одинаковый рейтинг.

Но это приводит к очень интересному вопросу: как бы выглядело распределение ELO, если бы среди маленьких детей существовала формальная соревновательная игра?

Я упоминаю об этом, потому что в этой ветке обсуждалось отношение сложности игры (размера задачи) к распределению рейтинга.