Парадокс 100 монет [закрыто]

Мне было интересно, какие в литературе предлагаются решения следующего хорошо известного парадокса:

Скажем, два рациональных, умных игрока A и B стоят перед стопкой из 100 монет и играют в следующую игру: каждый ход игрок может взять одну монету, отдав другому игроку на следующем ходу или подняв 2 монеты. монеты и окончание игры тут же. И A, и B хотят максимизировать свою прибыль. Они не могут разговаривать друг с другом или каким-либо образом взаимодействовать (вне самой игры, разумеется).

А может рассуждать так: если у нас всего 2 монеты, я тут же возьму 2 монеты и закончу игру. Но B, который знает об этом, затем решит взять 2 монеты, когда останется 3 (потому что тогда у него будет 1 дополнительная монета). Продолжая эту индукцию, мы в конце концов приходим к заключению, что наиболее рациональным поведением будет взять две монеты на первом ходу A. Очевидно, очень необычный вывод.

Спасибо!

(Я пометил этот вопрос как «эпистемология» из-за связи с «Неожиданным парадоксом повешения».)

Добро пожаловать на сайт! :) Мой первый вопрос к вам: могут ли игроки разговаривать друг с другом? Два «рациональных» игрока просто сказали бы: «Эй, эта игра хромает. Как насчет того, чтобы мы просто доиграли ее до конца, и к тому времени мы разделим общую сумму». Это максимизирует прибыль обоих. Я думаю, что «вывод» в этом примере верен только в том случае, если они хотели максимизировать каждую из своих прибылей , исключая другого человека (т. е. цель состоит не в том, чтобы получить прибыль как таковую , а в том, чтобы заработать больше, чем другой человек).
Спасибо! В большинстве известных мне версий игроки не могут разговаривать друг с другом, и цель состоит в том, чтобы заработать максимально возможную прибыль для себя (прибыль другого игрока не имеет значения). Я отредактировал свой пост, включив в него первое предположение.
Если не имеет значения, как много получает другой человек, рациональная стратегия такова, как говорит стоикярость: всегда бери 1, и в итоге у тебя будет 50. В чем тогда парадокс?
Что ж, мой вопрос больше адресован людям, которые уже знакомы с этим парадоксом, но... короче, считайте, что монет всего две. Допустим, сейчас очередь А. Тогда самым рациональным было бы для А взять эти две монеты. Рассмотрим случай, когда есть 3 монеты, и настала очередь B - наиболее рационально для B взять 2 монеты. Рассмотрим случай, когда есть 4 монеты, и настала очередь A - A знает, что если он выберет одну монету, так что останется 3 монеты, B выберет две, и игра закончится с меньшей прибылью для A, поэтому A снова выберет две монеты. ..
@yorei: Никогда не слышал об этой игре или описании, поэтому неясно, каковы правила вашей игры. У вас есть онлайн ссылка?
К сожалению, у меня нет под рукой ссылки (я слышал об этом парадоксе когда-то от своего лектора, который упомянул, что он известен)... возможно, этот парадокс обычно носит другое название. Я расследую это и вернусь к вам, если что-нибудь найду (полагаю, мне следует расширить рамки вопроса до «есть ли известное имя для этого парадокса»).
Вы имеете в виду игру сороконожка ? Описанные правила не совсем то, что вы указали, но похожи...
Нам действительно нужно больше контекста по этой проблеме. Можете ли вы также рассказать нам, что могло побудить вас попросить объяснений по этому поводу? Что вы могли уже узнать?
Это напоминает мне дилемму заключенного .

Ответы (3)

Футляр с 4 монетами функционально эквивалентен футляру со 100 монетами или любой другой чеканке, кроме 3, если уж на то пошло.

Для простоты предположим, что A всегда идет первым.
PP = Личная прибыль

1 монета
A : берет 1 монету. PP = 1
B : (игра уже окончена)

2 монеты
A : выбирает 2 монеты. PP = 2
B : (игра уже окончена)

3 монеты
A : выбирает 2 монеты. PP = 2
B : (игра уже окончена)

Пока что с точки зрения максимизации прибыли А не может работать лучше. Как только вы достигаете 4 или более монет, вступает в действие новый фактор: производительность другого игрока и «то, что является рациональным», резко меняется. Если вы знаете, что этот человек такой же рациональный человек, как и вы, вы можете выбрать по одному и надеяться, что он сделает то же самое, максимизируя вашу прибыль. Если вы знаете, что это подлый и жадный человек , вы можете начать с 2 монетами, чтобы закончить игру. Если вы ничего не знаете о другом человеке, наиболее рациональным решением будет исходить из того, что сделал бы в такой ситуации средний игрок Б. Если средний человек на позиции игрока Б собирается просто закончить игру с двумя монетами, ваш самый рациональный ход (как игрокA ) было бы закончить его на первом ходу. В противном случае рациональнее всего принимать по 1 штуке.

4 монеты
A : берет 2 монеты. PP = 2
B : (игра уже окончена)

ИЛИ ЖЕ

A : берет 1 монету. PP = 1
B : берет 2 монеты.
Игра окончена.

ИЛИ ЖЕ

A : берет 1 монету. PP = 1 пока
B : берет 1 монету. PP = 1
A : берет 2 монеты. ПП = 3 всего

ИЛИ ЖЕ

A : берет 1 монету. PP = 1 пока
B : берет 1 монету. PP = 1
A : берет 1 монету. PP = 2 всего
B : берет 1 монету. ПП = 2 всего

В случае с четырьмя монетами вы всегда выберете две монеты в качестве A. Это происходит по следующей причине: поскольку все, о чем заботится B, — это максимизация своей прибыли, самый безопасный способ сделать это при 3 монетах — просто взять 2 монеты. Таким образом, если вы выберете 1 монету из 4, B выберет 2 монеты, и вы потеряете прибыль. Я полагаю, вы могли бы сказать, что парадокс предполагает, что оба игрока считают друг друга холодными, рациональными машинами.
Но хочу подчеркнуть: меня интересуют /уже известные/ литературные решения, а не оригинальные исследования. У вас может быть очень хорошая мысль, но ваш ответ не входит в рамки моего вопроса. Тем не менее, большое спасибо за ваши усилия!
Ну, как и Митч, я никогда не слышал об этой проблеме, поэтому я не могу вам помочь. По поводу 4-х монет: нет, из этого не следует, что при 4-х монетах самый рациональный выбор - 2 изначально. Всего можно получить 3; может быть, ваш оппонент плохо разбирается в стратегии, кто знает? Как только вы вводите в нее людей, это уже другая игра. Тем не менее, если бы вы утверждали в исходном посте «холодную, рациональную машину» вместо «человек», это изменило бы только эти два вывода (монеты 4 и 5). После 5 даже с "холодными, рациональными машинами" нет сценариев, где имеет смысл начинать с 2, чтобы закончить игру.
@stoicfury это неправильно. Если вы признаете для «холодных, рациональных машин», что правильный ход за 4 монеты состоит в том, чтобы взять 2, то игрок А должен открыться с 2 монетами в случае 5. В противном случае, если он возьмет 1, то логический выбор В состоит в том, чтобы взять 2. , в результате чего у игрока А на 1 PP меньше.
@zephyr: Ты прав, это была ошибка. Я хотел написать "После 5", а не 4. :) Я отредактирую, спасибо.

Мне это кажется очень похожим на дилемму заключенного, и логически правильное поведение зависит от того, будет ли это единичное столкновение с неизвестным противником или серия повторяющихся игр.

Ответ из теории игр: Да, это странно. Люди поступают так не потому, что они иррациональны. Давайте сделаем больше доказательств!

Эмпирический ответ: Глядя на исторические данные, люди обычно делятся до последних двух или трех. Они также очень сильно испытывают желание взаимности. Если P(они поделятся)*(оставшиеся монеты)-(P(они поделятся)-1)*2 > 0, то эмпирик поделится.

Теория вневременных решений : если предположить, что оба игрока заинтересованы только в собственной выгоде, и полностью логичны, и полностью уверены, что их противник в равной степени рационален и эгоистичен, оба понимают, что другой игрок будет делать то же самое, что и они. Учитывая это, оба человека понимают, что если они поделятся своим партнером, то тоже. Поэтому рациональным решением будет взять одну монету.

Относительно «эмпирического ответа»: средний человек стал бы скупиться на последние 2 или 3 (из 100) монет в конце игры? Я вообще не вижу этого эмпирически, хотя это полностью зависит от контекста. Я думаю, что большинство людей не будут заботиться о 3 монетах, когда у них уже есть 47, и будут преданно продолжать в духе сотрудничества, если монеты будут монетами в 1 цент. Если монеты по 5000 долларов, вы можете получить еще несколько подлых людей, которые возьмут последние 2, чтобы закончить игру, вместо того, чтобы разделить ее 50/50. Но все же, будет ли это средний человек? Я так не думаю.
Если предположить, что каждый игрок будет ожидать, что другой будет использовать стратегию, которую он сам использовал бы в данном месте, то после того, как будут взяты по крайней мере две монеты и останется ровно три, игрок подбросит монету до тех пор, пока не выпадет орёл, а затем возьмет одну монету. если бы для этого требовалось нечетное количество бросков и два, если четное, то игрок, который взял одну монету, когда осталось четыре, имел бы ожидаемое значение бесконечно мало больше 2 и, таким образом, выиграл бы от взятия только одной. Игрок с пятью или более монетами выиграет от принятия этой стратегии, соблазнив игрока с четырьмя монетами взять только одну.