Разумно ли это двойное ко играет AlphaGo Zero и AlphaGo Lee?

В 8-й партии серии 1 между AlphaGo Zero и AlphaGo Lee возникает следующая позиция с двойным ко при {A,C}×{13,14}: Позиция в начале двойной ко-игрыНа следующем ходу AlphaGo Lee (черные) играет двойной ко размен A14 -С13 перед своим следующим эффективным ходом на Т15 и последующими тремя эффективными ходами; затем AlphaGo Zero присоединяется к веселью, а также делает двойные обмены ко перед своими эффективными ходами. Так продолжается до 272-го хода; после 276 черных уходит в отставку.

Я не вижу преимущества в этих обменах по сравнению с немедленной игрой на Т15 и т. д. Полезны ли эти обмены или просто то, чему их не научили их соответствующие тренировки? Если они полезны, то какой цели они служат?

1 См. статью в журнале Nature по адресу https://www.nature.com/articles/nature24270#t1 ; полный текст платный, но избранные игровые записи доступны для загрузки по адресу https://media.nature.com/original/nature-assets/nature/journal/v550/n7676/extref/nature24270-s2.zip .

Ответы (1)

Между двумя полустабильными позициями двойного ко есть разница, хотя и довольно небольшая. C14 уменьшает непосредственное количество вольностей ноги G13. Это означает, что у черных будет свободный темп, когда у G13 закончатся свободы, если мы предположим, что черные могут найти достаточно большую ко-угрозу, чтобы ответить на взятие C13 ходом C14, чтобы форсировать готэ B15.

Предполагая, что у черных все еще есть достаточно большая ко-угроза, когда G13 исчерпает все свободы, ценность сохранения заполненной свободы в C14, скорее всего, составляет 1 очко (превращая сенте в одно очко для белых в обратное сенте, как мы можем сделать вывод из что происходит позже в игре), поэтому двухходовая последовательность взятия двойного ко в C13/C14 с последующим ответом A13/A14 имеет (связанное с ко) значение miai, равное 1, для обоих игроков. Это объясняет, почему оба игрока пользуются возможностью, чтобы захватить это двойное ко всякий раз, когда они могут.

Другой способ выразить это - приписать группе G13 в среднем 4,5 свободы (чередуя между 4 и 5), при этом белые могут форсировать ее, когда им это нужно, если черные не могут найти достаточно большую ко-угрозу.

Спасибо, вы немного прояснили мне некоторые вещи, хотя я еще многого не понимаю, я боюсь, не в последнюю очередь почему черные сдаются, когда они это делают, но также и почему черные находятся в лучшем положении после 239@A14, 240@C13, 241@T15, чем было бы с 239@T15 – ведь это (временно) дает белым дополнительную свободу на C14. Замечу, что белые, взяв половину двойного ко, грозят снять очко на B12 и заработать очки на A14, C14 и B15, а черные угрожают сделать обратное. Конечно, если черные соединятся на A13 или C13, B15 в любом случае не является точкой для белых.
Хорошо, я понимаю, что не обращал пристального внимания на то, что происходит в игре. Играть в 247 и отменять его на 251 действительно кажется бесполезным, хотя и не вредит. Но B5, который идет сразу после этого, теряет ко-угрозу. Так что, думаю, черные уже поняли, что ситуация безвыходная, и просто оттягивали конец партии, ибо все остальные ходы казались ближе к поражению.