Мне было интересно, какие в литературе предлагаются решения следующего хорошо известного парадокса:
Скажем, два рациональных, умных игрока A и B стоят перед стопкой из 100 монет и играют в следующую игру: каждый ход игрок может взять одну монету, отдав другому игроку на следующем ходу или подняв 2 монеты. монеты и окончание игры тут же. И A, и B хотят максимизировать свою прибыль. Они не могут разговаривать друг с другом или каким-либо образом взаимодействовать (вне самой игры, разумеется).
А может рассуждать так: если у нас всего 2 монеты, я тут же возьму 2 монеты и закончу игру. Но B, который знает об этом, затем решит взять 2 монеты, когда останется 3 (потому что тогда у него будет 1 дополнительная монета). Продолжая эту индукцию, мы в конце концов приходим к заключению, что наиболее рациональным поведением будет взять две монеты на первом ходу A. Очевидно, очень необычный вывод.
Спасибо!
(Я пометил этот вопрос как «эпистемология» из-за связи с «Неожиданным парадоксом повешения».)
Футляр с 4 монетами функционально эквивалентен футляру со 100 монетами или любой другой чеканке, кроме 3, если уж на то пошло.
Для простоты предположим, что A всегда идет первым.
PP = Личная прибыль
1 монета
A : берет 1 монету. PP = 1
B : (игра уже окончена)
2 монеты
A : выбирает 2 монеты. PP = 2
B : (игра уже окончена)
3 монеты
A : выбирает 2 монеты. PP = 2
B : (игра уже окончена)
Пока что с точки зрения максимизации прибыли А не может работать лучше. Как только вы достигаете 4 или более монет, вступает в действие новый фактор: производительность другого игрока и «то, что является рациональным», резко меняется. Если вы знаете, что этот человек такой же рациональный человек, как и вы, вы можете выбрать по одному и надеяться, что он сделает то же самое, максимизируя вашу прибыль. Если вы знаете, что это подлый и жадный человек , вы можете начать с 2 монетами, чтобы закончить игру. Если вы ничего не знаете о другом человеке, наиболее рациональным решением будет исходить из того, что сделал бы в такой ситуации средний игрок Б. Если средний человек на позиции игрока Б собирается просто закончить игру с двумя монетами, ваш самый рациональный ход (как игрокA ) было бы закончить его на первом ходу. В противном случае рациональнее всего принимать по 1 штуке.
4 монеты
A : берет 2 монеты. PP = 2
B : (игра уже окончена)
ИЛИ ЖЕ
A : берет 1 монету. PP = 1
B : берет 2 монеты.
Игра окончена.
ИЛИ ЖЕ
A : берет 1 монету. PP = 1 пока
B : берет 1 монету. PP = 1
A : берет 2 монеты. ПП = 3 всего
ИЛИ ЖЕ
A : берет 1 монету. PP = 1 пока
B : берет 1 монету. PP = 1
A : берет 1 монету. PP = 2 всего
B : берет 1 монету. ПП = 2 всего
Мне это кажется очень похожим на дилемму заключенного, и логически правильное поведение зависит от того, будет ли это единичное столкновение с неизвестным противником или серия повторяющихся игр.
Ответ из теории игр: Да, это странно. Люди поступают так не потому, что они иррациональны. Давайте сделаем больше доказательств!
Эмпирический ответ: Глядя на исторические данные, люди обычно делятся до последних двух или трех. Они также очень сильно испытывают желание взаимности. Если P(они поделятся)*(оставшиеся монеты)-(P(они поделятся)-1)*2 > 0, то эмпирик поделится.
Теория вневременных решений : если предположить, что оба игрока заинтересованы только в собственной выгоде, и полностью логичны, и полностью уверены, что их противник в равной степени рационален и эгоистичен, оба понимают, что другой игрок будет делать то же самое, что и они. Учитывая это, оба человека понимают, что если они поделятся своим партнером, то тоже. Поэтому рациональным решением будет взять одну монету.
стойкость
йорей
Митч
йорей
Митч
йорей
стойкость
Джозеф Вайсман
JMCF125