Насколько успех AlphaGo обусловлен новизной?

Одна из постоянных тем в комментариях, которые я читал к играм AlphaGo, заключается в том, что время от времени ИИ давал звуковую игру, которая, тем не менее, была совершенно незнакома его противнику (и зрителям). Следовательно, противник не смог в полной мере оценить ход и эффективно противостоять ему. (или даже были полностью выброшены из игры на несколько ходов)

Это заставляет меня задуматься; насколько важен этот эффект для успеха AlphaGo? Или, другими словами, когда люди извлекут уроки из новых видов игр, которые они видели в игре AlphaGo, будет ли AlphaGo по-прежнему пользоваться успехом, близким к нынешнему уровню?

Кроме того, умение находить новые, здравые тактики по-прежнему является большой удачей для команды AlphaGo, даже если окажется, что ее победы связаны скорее с новизной, чем с мастерством, и я не хочу умалять этого подвига.
Одна из вещей, о которой Кэ Джи и Deep Mind упомянули после второго матча на саммите Future of Go , заключалась в том, что это была самая близкая игра, которую кто-либо играл против AlphaGo до сих пор, для первых 100 ходов. Первые 50 ходов он сыграл идеально по AlphaGo. Затем Ке Цзе упоминает позже , что он был взволнован тем, насколько хорошо он играл, и это могло привести к тому, что он сделал некоторые ошибки или не идеальные ходы ...
... Короче говоря, было бы интересно посмотреть, насколько хорошо мог бы сыграть Ке Цзе, если бы он не был слишком взволнован во втором матче, по крайней мере, согласно AlphaGo :)

Ответы (2)

Я бы сказал, что преимущество AlphaGo не может быть в значительной степени связано с новизной его ходов.

Первоначальные публичные игры AlphaGo проводились против Ли Седоля, второго игрока в мире, в марте 2016 года. В то время, как уже упоминалось, некоторые ходы AlphaGo были новыми и неожиданными для Ли Седоля и наблюдателей.

Затем, после того как у игроков было девять месяцев для изучения стиля игры AlphaGo, в декабре 2016 года она сыграла в 59 неофициальных онлайн-игр под именами «Магистр» и «Мастер», в том числе против нескольких игроков с самым высоким рейтингом. Он выигрывал каждую игру. Я не видел много комментариев к этим играм, но насколько я понимаю, некоторые игроки использовали ходы, которые впервые наблюдались в оригинальных играх AlphaGo. Итак, на данный момент я думаю, что они были менее новыми, потому что они становились частью стратегий игроков-людей.

Наконец, в мае 2017 года AlphaGo сыграла в различные игры на Wuzhen Future of Go Summit, включая матч против Кэ Цзе, лучшего игрока в мире. Комментарии к этим играм не указывали на то, что AlphaGo сделала значительное количество неожиданных или трудных для ответа ходов, а скорее на то, что ее значительное преимущество было связано с ее способностью точно определять ценность ходов, разменов и территории, а также ее способностью играть по всей доске вместо того, чтобы слишком сильно концентрироваться на активной в данный момент области.

В интересах улучшения этого ответа для будущих пользователей Майкл Редмонд и Крис Гарлок делают много обзоров серии Master здесь, на YouTube AGA . Кроме того, эти игры были очень быстрыми, поэтому у ИИ есть небольшое преимущество :) Я согласен с тем, что будущее саммита Го продемонстрировало силу AlphaGo, и Майкл и Крис начали еще одну серию обзоров некоторых из выпущенных матчей AlphaGo против AlphaGo. после саммита.
На самом деле я не думаю, что имел в виду улучшение, поскольку этот ответ мог бы быть лучше , а скорее вот ссылка, если будущие пользователи (или оп) заинтересованы в комментариях к основной серии . Это хороший ответ, как есть :)

AlphaGo использует «новаторские» приемы, и это ключ, но не причина ее успеха.

Причина, по которой ходы считаются «новыми», заключается в том, что они были проверены и отвергнуты игроками-людьми. Итак, вопрос в том, доказывают ли последующие фильмы Alpha Go (и вариации) правильность движений или нет? Почти неизменный ответ: ходы Alpha Go правильны, и что игроки-люди пропустили правильные последующие действия, некоторые из которых нелогичны. Например, ретроспективно стало понятно, что AlphaGo прерывает последовательности на ход раньше или на ход позже, чем игрок-человек, тем самым максимизируя ценность последовательностей и выбивая альтернативные линии, используемые игроками-людьми. Иными словами, AlphaGo могла рассчитывать глубже, чем игроки-люди.

У программы, кажется, есть несколько сбоев, которые иногда заставляют ее воспроизводить ходы, которые (слегка) несостоятельны в ретроспективе. Люди изучали эти сбои, пытаясь победить их, но пока безуспешно. Причина в том, что хотя эти ходы могут быть ошибочными на очко или два, AlphaGo в ходе игры будет улучшать игру человека, скажем, на пять очков в одном или нескольких случаях.