Одна из постоянных тем в комментариях, которые я читал к играм AlphaGo, заключается в том, что время от времени ИИ давал звуковую игру, которая, тем не менее, была совершенно незнакома его противнику (и зрителям). Следовательно, противник не смог в полной мере оценить ход и эффективно противостоять ему. (или даже были полностью выброшены из игры на несколько ходов)
Это заставляет меня задуматься; насколько важен этот эффект для успеха AlphaGo? Или, другими словами, когда люди извлекут уроки из новых видов игр, которые они видели в игре AlphaGo, будет ли AlphaGo по-прежнему пользоваться успехом, близким к нынешнему уровню?
Я бы сказал, что преимущество AlphaGo не может быть в значительной степени связано с новизной его ходов.
Первоначальные публичные игры AlphaGo проводились против Ли Седоля, второго игрока в мире, в марте 2016 года. В то время, как уже упоминалось, некоторые ходы AlphaGo были новыми и неожиданными для Ли Седоля и наблюдателей.
Затем, после того как у игроков было девять месяцев для изучения стиля игры AlphaGo, в декабре 2016 года она сыграла в 59 неофициальных онлайн-игр под именами «Магистр» и «Мастер», в том числе против нескольких игроков с самым высоким рейтингом. Он выигрывал каждую игру. Я не видел много комментариев к этим играм, но насколько я понимаю, некоторые игроки использовали ходы, которые впервые наблюдались в оригинальных играх AlphaGo. Итак, на данный момент я думаю, что они были менее новыми, потому что они становились частью стратегий игроков-людей.
Наконец, в мае 2017 года AlphaGo сыграла в различные игры на Wuzhen Future of Go Summit, включая матч против Кэ Цзе, лучшего игрока в мире. Комментарии к этим играм не указывали на то, что AlphaGo сделала значительное количество неожиданных или трудных для ответа ходов, а скорее на то, что ее значительное преимущество было связано с ее способностью точно определять ценность ходов, разменов и территории, а также ее способностью играть по всей доске вместо того, чтобы слишком сильно концентрироваться на активной в данный момент области.
AlphaGo использует «новаторские» приемы, и это ключ, но не причина ее успеха.
Причина, по которой ходы считаются «новыми», заключается в том, что они были проверены и отвергнуты игроками-людьми. Итак, вопрос в том, доказывают ли последующие фильмы Alpha Go (и вариации) правильность движений или нет? Почти неизменный ответ: ходы Alpha Go правильны, и что игроки-люди пропустили правильные последующие действия, некоторые из которых нелогичны. Например, ретроспективно стало понятно, что AlphaGo прерывает последовательности на ход раньше или на ход позже, чем игрок-человек, тем самым максимизируя ценность последовательностей и выбивая альтернативные линии, используемые игроками-людьми. Иными словами, AlphaGo могла рассчитывать глубже, чем игроки-люди.
У программы, кажется, есть несколько сбоев, которые иногда заставляют ее воспроизводить ходы, которые (слегка) несостоятельны в ретроспективе. Люди изучали эти сбои, пытаясь победить их, но пока безуспешно. Причина в том, что хотя эти ходы могут быть ошибочными на очко или два, AlphaGo в ходе игры будет улучшать игру человека, скажем, на пять очков в одном или нескольких случаях.
пользователь7583
угрюмый
угрюмый