Покерная программа, рассказывающая о самых известных мультистратегиях в лимитном холдеме

Следуя статье, которую я прочитал в NY Times , я узнал, что лучшие боты для лимитного холдема лучше, чем лучшие люди. Насколько я понимаю, для каждого игрового состояния, которого они достигают, эти боты должны вычислять набор весов, суммирующихся с единицей, для набора доступных действий, подмножество {чек, колл, ставка, рейз, фолд}. Мой вопрос заключается в том, существует ли достаточно мощная компьютерная программа, с которой я могу играть в покер и запрашивать у нее мультистратегии, которые она будет использовать на моем месте? Меня воодушевила статья в NY Times, в которой говорится, что бот, о котором они пишут, является выигрышным игроком в видеопокер, даже не адаптируясь к тенденциям своего противника.

Здесь есть хорошая информация , но она предназначена для людей, которые хотят писать своих собственных ботов, а не учиться у них.

См. мой ответ ниже — усилия Альберты отстают на световые годы от того факта, что в казино есть машины, на которых вы можете играть сегодня с ИИ, который не может победить большинство людей.

Ответы (4)

Меня зовут Майк Йохансон, я один из авторов недавней статьи «HULHE решен», и я написал немало кода для Cepheus.

Ссылка kuzzooroo была правильной. По ссылке, которую он дал (здесь не воспроизводится — новая учетная запись, у меня нет репутации, чтобы публиковать > 2 ссылки), вы можете запросить любую часть стратегии Цефея или сыграть против нее — по крайней мере, вы сможете трафик уменьшается, нам пришлось временно отключить страницу play-Cepheus. Но служба запросов работает нормально.

Если вы хотите прочитать научную статью, вы можете найти ссылку на нее на моей личной веб-странице . Мои предыдущие статьи также содержат более подробную информацию об алгоритме, на котором он основан, который называется CFR.

Если вам нужен исходный код, он тоже доступен — лицензия BSD. соединять

Что касается других программ и групп, а также истории нашей деятельности... Исследовательская группа по компьютерному покеру Университета Альберты начала свою деятельность в 1994 году, и с 2001 года мы уделяем значительное внимание лимитному холдему один на один. В 2003 году мы создал первую достойную теоретико-игровую стратегию для игры, названную PsOpti (vlzvl упомянул Sparbot — это та же стратегия, переименованная в Poker Academy). В 2007 и 2008 годах наша программа Polaris соревновалась с профессионалами-людьми, с небольшим проигрышем в 2007 году и с небольшим перевесом в 2008 году, что стало первым случаем, когда компьютер победил покерных профессионалов-людей в значимом матче. В 2011 году мы разработали первый управляемый алгоритм для HULHE, который позволяет нам вычислять оптимальную контрстратегию для победы над данной стратегией и измерять, насколько эта стратегия проигрывает контрстратегии. Это позволяет нам измерить, насколько мы близки к непобедимой игре. С тех пор мы приближаемся все ближе и ближе к идеальной игре (то есть к наихудшему проигрышу 0) и публикуем наши успехи на протяжении многих лет в открытых, общедоступных научных статьях.

В этой статье, после 13 лет сосредоточения внимания на HULHE, от нашей первой достойной теоретико-игровой стратегии до этой, мы объявляем, что наконец-то по существу решили игру. Цефей максимально обыгран менее чем за 0,000986 больших блайндов за игру или менее чем за 0,05 больших ставок / 100, если вы предпочитаете эти единицы. Потребуется более 60 миллионов раздач с использованием идеальной контрстратегии, чтобы иметь 95-процентную уверенность в победе над Цефеем, поэтому мы говорим, что проблема, по сути, решена: потребуется больше, чем человеческая жизнь, чтобы статистически определить разница между Cepheus и точной оптимальной стратегией. Мы более подробно остановимся на этом в статье.

Так что, что касается заявления Джима Бима о том, что мы приписываем себе то, что уже сделали другие... Я не согласен. Мы работаем в этой области уже 20 лет, первыми достигли важных результатов в HULHE (первая неужасная стратегия, первая программа, позволяющая победить людей, первое измерение потерь в наихудшем случае), и продвинули науку, полностью публикуя нашу работу на каждом этапе пути. По сути, решение игры — это последний шаг в долгом исследовании этой игры.

Не так много известно о PokerSnowie и игре в казино - они не публикуют статистику о том, насколько они близки к оптимальным, или какие-либо полезные подробности о том, какие алгоритмы они используют или как работают их программы. PokerSnowie утверждает, что близок к равновесию, но не предлагает никаких доказательств, а из обсуждений 2+2, где они также заявляют об оптимальной игре с 6 игроками и в безлимитном режиме, становится ясно, что они либо не знают, что такое игра, "теоретическая оптимальная" игра означает, или они преувеличивают: безлимитный безлимит непостижимо больше, чем хэдз-ап лимит, и заявлять об оптимальной игре там нонсенс, а "оптимальная" стратегия не будет иметь каких-либо теоретически полезных свойств в 6- игра игрока. На самом деле, в тредах 2+2 они признали это и удалили большую часть рекламы со своей веб-страницы, в которой упоминается «оптимальная игра».

Cepheus — это, по сути, оптимальная стратегия для лимитного холдема один на один, и она может играть против любой из них, против любого человека или другой программы и гарантированно не проигрывать. Мы @PolarisPoker в Твиттере — в основном мы используем его для публикации ссылок на новые статьи, которые мы публикуем.

Хедз-ап лимитный холдем теперь решен! . У AI есть отличный веб-сайт, который, среди прочего, подскажет вам оптимальную мультистратегию по адресу http://poker.srv.ualberta.ca/ .

Хороший. Я обновил свой ответ, чтобы указать людям на ваш.
Я не знаю об этом . «По существу непобедимый» алгоритм (возможно, так оно и есть), но Poker Academy Pro, безусловно, у меня есть очень мощный бот, специализирующийся на хедз-апе, который называется Sparbot . Хорошая вещь в том, что он не пытается изучить противника, поэтому его легче подражать. Хотя не пробовал.

Статья в NY Times меня поразила, потому что они полностью игнорировали тот факт, что Poker Snowie уже существует. Гуглите их и читайте о них. Они существуют уже некоторое время, и их принято считать очень и очень хорошими игроками в покер. Я не уверен, что они "решили" покер (что бы это ни значило!), но они существуют уже давно.

На самом деле, большинство людей даже не подозревают, что в казино уже есть машины LHE , против которых вы можете играть, которые также играют в очень, очень хороший покер (на основе работы Poker Snowie). Вы можете играть в них один на один, с различными ставками. Опять же, может у них и не получилось "решить" покер, но вы думаете они предлагали в казино, потому что на них проигрывают? Конечно нет. Так что все, что вам нужно сделать, это найти казино в вашем районе, которое предлагает это, и вы можете попробовать свои силы против очень хорошего покерного ИИ.

Вы работаете в Poker Snowie?
@WillCalderwood Нет, конечно нет. На самом деле, мне даже не обязательно нравятся все инструменты Snowie — мне нравится только реплейсер. Я просто не думаю, что справедливо видеть, как Альберта претендует на признание LHE, когда в казино уже есть автоматы. Это как если бы я вышел и сказал: «Эй, ребята, я изобрел кое-что, что я называю «машиной»! Вы можете в это поверить?!?!».
Пункт 1. Я предполагаю, что у автоматов казино есть рейк, поэтому им не нужна идеальная или даже почти идеальная стратегия для выигрыша. Им просто нужно играть на нормальном уровне. Пункт 2, вы не можете запросить их.
@WillCalderwood, делая здесь меньше , а не больше предположений, поможет вам :/ Вы исследовали что-нибудь, что я там опубликовал??? Нет у машин нет граблей и их можно запросить. Poker Snowie — это, по сути, единственный инструмент, который позволяет вам вводить раздачи в реплеер, и он позволяет вам запрашивать EV и действия по ходу игры. Когда вы играете против него, вы также можете получать обратную связь в режиме реального времени о правильных/неправильных ходах, также с EV.

Боюсь, нет общедоступных ИИ, с которыми можно было бы практиковаться и тренироваться на таком уровне. Если вы ищете ИИ для игры, вы можете заглянуть в Poker Academy, их сайт то поднимался, то опускался в последние годы, но он считается лучшим лимитным ИИ из общедоступных. Однако их безлимитные ИИ — ерунда.

Обновлять. Как указал kuzzoooroo, приведенный выше ответ теперь неверен. См. вместо этого ответ kuzzoooroo здесь .

К сожалению, похоже , что веб-страница Академии покера в настоящее время не работает. Тем не менее, он ссылается на Poker Genius , который утверждает, что предоставляет «частоту действий».
Покерная Академия находится в «нерабочем состоянии» в том смысле, что компания прекратила свою деятельность. Poker Genius претендует на то, чтобы заменить его де-факто, но я его не пробовал.
Это просто неправильно, вы МОЖЕТЕ играть. Пожалуйста, посмотрите мой ответ
@JimBeam На момент публикации этого ответа он был правильным. Ответ, который kuzzoooroo опубликовал несколько часов назад, более правильный, чем ваш ответ.
@WillCalderwood Нет, это правильно. Автоматы находятся в казино более 18 месяцев — ваш ответ был меньше года назад.
@JimBeam Вы прочитали вопрос? «Мой вопрос заключается в том, существует ли достаточно мощная компьютерная программа, с которой я могу играть в покер и запрашивать у нее мультистратегии, которые она использовала бы на моем месте?». Можете ли вы объяснить, как вы можете запросить у автоматов казино их стратегию?
@WillCalderwood машины основаны на Poker Snowie, который вы можете запрашивать в режиме реального времени через игру или проигрыватель. Это не сложно, вам просто лень пойти и получить эту информацию :/