Что такое дилемма заключенного

18.04.202229.04.2022 admin 0 Comments

Дилемма заключённого

Если вы по роду своей деятельности сталкиваетесь с ведением переговоров, например, занимаетесь собственным бизнесом, являетесь руководителем крупной организации или занимаете какую-то иную должность, которая требует владения навыком ведения переговоров, то, вероятнее всего, вас время от времени одолевает вопрос на тему того, в какой ситуации следует быть «мягким и пушистым», а когда нужно проявить стойкость и показать твёрдость своих намерений.

Ответ на представленный вопрос способен многократно повысить эффективность любых переговоров, но это лишь одна сторона «медали». Другая же заключается в том, что найти этот ответ не так-то просто, что нередко ставит в тупик. Однако существенную помощь в этом деле может оказать любому человеку решение так называемой Дилеммы заключённого.

Дилемма заключённого

Дилемма заключённого представляет собой одну из самых популярных концепций, относящихся к теории игр. Кстати говоря, иногда её ещё называют Дилеммой бандита.

Основывается Дилемма заключённого на идее о том, что законодательство большинства стран предполагает для группы людей, совершивших преступление в сговоре, больший срок заключения, нежели для преступника, который совершил преступление в одиночку. Исходя из этого, в Дилемме бандита двум сообщникам, которые не имеют возможности взаимодействовать друг с другом, общаться и договариваться, приходится решать дилемму, подразумевающую два варианта поведения:

Если изобразить суть Дилеммы заключённого схематически, то выглядеть она будет следующим образом:

Несмотря на то, что речь идёт о совершении преступления и наказании за него, данная дилемма касается вовсе не реальных уголовников, а каждого из нас с вами, ведь в процессе своей жизнедеятельности, без разницы – на работе мы находимся или дома – мы сталкиваемся с ней буквально каждый день.

Примеры Дилеммы заключённого

В качестве первого примера Дилеммы заключённого можно привести один из знакомых многим анекдотов, когда два коммерсанта подписывают договор о совершении сделки по купле/продаже вагона помидоров. После того как договор подписан, первый коммерсант начинает искать товар, а второй отправляется на поиски денег. По сути, представленный пример Дилеммы заключённого является «классикой жанра».

Вот смотрите: договор подписан, но что, если один из коммерсантов сможет найти помидоры и отправить целый вагон, как и договорено, но второй не отыщет денег? А что делать, если ситуация сложится наоборот? Какова вероятность, что партнёр по бизнесу не подведёт и можно ли ему доверять? Какие усилия нужно предпринимать, чтобы защитить свои интересы? Да и нужно ли вообще собирать деньги? Пускай этот неудачник ищет свои помидоры и отправляет их, а второй просто не станет платить, но какая в таком случае будет репутация у обязавшегося произвести оплату партнёра? Захочет ли кто-то иметь в перспективе дела с таким недобросовестным человеком?

А вот второй пример: две крупные корпорации должны определить размер своего бюджета, предусмотренного на создание телевизионной рекламы в следующем году. Качественная реклама по телевидению – дело довольно затратное. Исходя из этого, чем большее количество рекламы будет запущено, тем меньшее количество чистой прибыли будет получено и, вполне вероятно, станет хуже качество товара, т.к. нужно экономить на формуле создаваемого продукта.

Однако в том случае, если один конкурент сможет разрекламироваться лучше, то второй потеряет репутацию, прибыль и часть потребителей. По этой причине обоим конкурентам необходимо, боясь друг другу не проиграть, каждый год вкладывать в рекламу невероятное количество средств. Результатом такой погони становится то, что продукт, предлагаемый компаниями, становится некачественным: газировкой можно очищать сковородки, зубная паста не отбеливает зубы, бытовая техника постоянно выходит из строя, а сами производители товаров кое-как умудряются сравнять к концу года доходы и расходы. Причём повторяется это снова и снова, из года в год.

Изучение Дилеммы заключённого

Американский политолог Роберт Аксельрод в своей работе «Эволюция кооперации» провёл многочисленные исследования повторяющейся раз за разом Дилеммы заключённого, беря во внимание то, что в жизни одни и те же люди встают перед необходимостью постоянно разрешать эту дилемму, учитывая свой прошлый опыт, ошибки и победы, действия и результаты.

Исследователь привлёк работе коллег из разных стран мира, чтобы совместно разработать специальные компьютерные стратегии, направленные на разрешение представленной дилеммы. В результате был организован целый чемпионат по повторяющейся Дилемме заключённого. Итоги этих соревнований показали, что стратегии, в которых превалирует жадность, исходя из расчёта на долгосрочную перспективу, давали результаты значительно хуже, нежели те стратегии, которые можно назвать альтруистическими. Также Аксельродом была показана эволюция «жадных» стратегий в альтруистические посредством естественного отбора. Говоря другими словами, максимальная отдача и выгода исходила от тех стратегий, в которых выгода не являлась абсолютным приоритетом.

Согласно дынным, полученным Робертом Аксельродом, чтобы стратегия переговоров была эффективной, необходимо соблюдать следующие условия:

В результате Роберт Аксельрод рекомендует всем, кто сталкивается с Дилеммой заключённого, если он действительно желает выстроить эффективную стратегию и иметь больше шансов на победу, следовать этим рекомендациям, которые существенно увеличивают шансы на победу для всех сторон.

Резюме

В процессе разработки своей собственной стратегий переговоров, действий и поведения, обязательно учитывайте те научные данные, которые мы только что озвучили. Всегда помните о том, что изначальный план необходимо выстраивать на предположении о том, что ваш оппонент (партнёр по бизнесу, руководитель или коллега на работе, товарищ или член семьи) так же, как и вы, настроен на долгосрочное, взаимовыгодное и честное сотрудничество.

Но не теряйте из вида и то, что ситуация может выйти из-под контроля и всё может пойти не так, как вы первоначально предполагали. По этой причине всегда нужно разрабатывать и иметь в запасе страховку – ещё один вариант, если вдруг действовать придётся в условиях форс-мажора. И если уж пришлось отвечать такими же действиями, какие предпринял против вас ваш оппонент, то сразу же после того как «дали сдачи» возвращайте стратегию в её прежнее состояние – предлагайте мир, становитесь «добренькими», будьте готовы пойти на уступки и т.д. Причём такое поведение может повторяться столько раз, сколько вообще необходимо для того чтобы прийти к какому-то общему знаменателю и обоюдовыгодному решению.

Желаем вам успешно овладевать искусством переговоров, ведь этот навык обязательно пригодится вам как в профессиональной сфере деятельности, так и в личной жизни.

Источник

Что такое дилемма заключенного

Дилемма заключенных в теории игр: от абстракций к конкретике

Дилемма заключенных относится к типу экономической игры, в которой равновесие Нэша таково, что оба игрока оказываются в худшем положении, даже если они оба выбирают свои оптимальные стратегии.

Дилемма заключенных — это классический пример игры, в которой участвуют два подозреваемых, скажем P и Q, арестованные полицией и которые должны решить, признаваться им или нет.

Если один сознается, а другой нет, то заключенный, который сознается, получает более легкий тюремный срок, скажем, 1 год, а заключенный, который не сознается, получает очень суровый срок, скажем, 8 лет.

Если ни один из них не признается, они оба получают более легкие сроки, скажем, по 2 года каждый; но если оба признаются, то оба получают строгий срок, скажем, по 4 года каждый.

Игра может быть визуализирована с помощью следующей матрицы выплат:

Выплаты в тюрьме		Заключенный Q
Выплаты в тюрьме		Признаться	Не признаться
Заключенный P	Признаться	-4, -4	-1, -8
Заключенный P	Не признаться	-8, -1	-2, -2

Комбинированная оптимальная стратегия для обоих заключенных — не признаваться в содеянном. Именно потому, что это привело бы к минимальному объединенному тюремному сроку для них.

Но поскольку они не могут общаться и сотрудничать, пытаясь сделать все возможное индивидуально, они выбирают стратегии, которые обрекают их обоих.

Давайте посмотрим на игру с точки зрения заключенного P. Если заключенный Q сознается, то заключенному Р тоже лучше признаться, потому что в противном случае он получил бы срок 8 лет вместо 4 лет.

Точно так же, если заключенный Q не сознается, то в интересах заключенного P сознаться, потому что, признавшись, он получит срок в 1 год вместо 2 лет. Следовательно, независимо от того, что делает заключенный Q, признание является доминирующей стратегией для заключенного P.

Теперь давайте рассмотрим точку зрения заключенного Q. Он знает, что признание является доминирующей стратегией заключенного P. Он не хочет не признаваться и получить 8-летний срок и признаться. Но когда он это делает, оба получают по 4 года тюремного заключения каждый.

В конечном счете и тот и другой находятся в худшем положении, потому что они получают по 4 года каждый вместо всего лишь 2 лет каждый.

Но они не могут избежать этого печального исхода, потому что не могут сотрудничать, и любая другая стратегия была бы худшей для каждого заключенного в отдельности.

Равновесие Нэша в дилемме заключенных

Результатом дилеммы заключенного является равновесие Нэша. Равновесие Нэша — это такая комбинация стратегий, при которой у фирмы-игрока есть какой-либо стимул в одностороннем порядке изменить свою стратегию.

Когда оба игрока в игре имеют доминирующие стратегии, результатом, который является пересечением доминирующих стратегий, является равновесие Нэша.

В дилемме заключенных, поскольку признание является доминирующей стратегией для каждого заключенного, равновесие Нэша возникает, когда оба признаются.

Это равновесие Нэша, потому что ни один заключенный не станет лучше, если в одностороннем порядке изменит свою стратегию.

Например, если заключенный Р решит не признаваться, в то время как заключенный Q действительно признается, то заключенный Р получит 8 лет вместо 4 лет. Следовательно, заключенному Р будет хуже, если он отойдет от равновесия Нэша.

Он не станет выбирать иной стратегии, кроме той, что диктует равновесие Нэша. Этот пример показывает, что равновесие Нэша является самоподкрепляющимся и стабильным.

Примеры

Хотя дилемма заключенных, рассмотренная выше, является абстрактной концепцией, многие реальные ситуации очень похожи на нее.

Пример 1. Фирмы знают, что если они не рекламируют, то могут сохранить свою существующую долю рынка и прикарманить сэкономленный рекламный бюджет в качестве дополнительной прибыли, но они все равно рекламируют, потому что каждая фирма боится, что если она не рекламирует, а другая фирма делает это, то она потеряет свою долю рынка.

Поскольку обе фирмы испытывают один и тот же страх, обе они рекламируют, обе имеют более низкую прибыль (из-за более высоких расходов на рекламу), и никто не получает никакой доли рынка.

Пример 2. Фирмы, принимающие решение о том, следует ли нанять адвоката, чтобы представлять их интересы в арбитраже, будут коллективно лучше, если они решат не нанимать адвоката.

Но каждая фирма нанимает адвоката из страха, что если другая фирма наймет адвоката, а они этого не сделают, вероятность того, что другая фирма выиграет в арбитраже, значительно возрастет.

Пример 3. Фирмы в олигополии находятся в лучшем положении, если они могут одновременно ограничивать свой выпуск и устанавливать монопольную цену.

Но так как сговор незаконен, то и то, и другое дает более высокую отдачу, что снижает отдачу каждой фирме. Модель Курно является иллюстрацией такой дилеммы заключенных.

Источник

Дилемма заключенного

В теории игр дилемма заключённого — некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

Ведя себя по отдельности рационально, вместе участники приходят к нерациональному решению: если оба предадут, они получат в сумме меньший выигрыш, чем если бы сотрудничали (единственное равновесие в этой игре не ведёт к Парето-оптимальному решению). В этом и заключается дилемма.
В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Kлассическая дилемма заключённого такова:

Двое подозреваемых, А и Б, арестованы. У полиции нет достаточных доказательств для обвинения, и изолировав их друг от друга, они предлагают им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается, а второй получает 10 лет. Если оба молчат, у полиции мало доказательств, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают по 2 года. Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:
Заключённый Б хранит молчание Заключённый Б даёт показания Заключённый А хранит молчание Оба получают полгода. А получает 10 лет
Б освобождается Заключённый А даёт показания А освобождается
Б получает 10 лет тюрьмы Оба получают 2 года тюрьмы

Дилемма появляется, если предположить, что оба заботятся только о минимизации собственного срока заключения.

Представим рассуждения одного из заключённых. Если партнёр молчит, то лучше его предать и выйти на свободу (иначе — полгода тюрьмы). Если партнёр свидетельствует, то лучше тоже свидетельствовать против него, чтобы получить 2 года (иначе — 10 лет). Стратегия «свидетельствовать» строго доминирует над стратегией «молчать». Аналогично другой заключённый приходит к тому же выводу.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесию Нэша.

Случай дилеммы заключённого может быть найден в бизнесе. Две конкурирующие фирмы должны определиться, сколько средств тратить на рекламу. Эффективность рекламы и прибыль каждой фирмы уменьшается с ростом расходов на рекламу у конкурента. Обе фирмы принимают решение увеличить расходы на рекламу, при этом их доли рынка и, возможно, объёмы продаж остаются неизменными, а прибыль сокращается. Предел гонки рекламных бюджетов — прибыль, впрочем, они могут пытаться некоторое время работать и в убыток. Фирмы могут пойти на соглашение о сокращении расходов на рекламу, но всегда есть стимул его нарушить.
В олигополистических рынках ценовая политика — это повторяющаяся ДЗ. Обычно олигополисты сотрудничают друг с другом и не доводят ситуацию до ценовой войны.

Уильям Паундстоун в книге о дилемме заключённого описывает ситуацию в Новой Зеландии, где газетные ящики оставляют открытыми. Газету можно взять, не заплатив за неё, но мало кто так делает, потому что большинство осознаёт вред, который был бы если бы все воровали газеты. Поскольку ДЗ в чистом виде одновременна для всех игроков (никто не может повлиять на решения других), эта распространённая линия рассуждений называется «магическое мышление»[3].

Теоретическое заключение ДЗ — одна из причин, почему во многих странах сделка о признании вины запрещена. Часто сценарий ДЗ повторяется очень точно: в интересах обоих подозреваемых сознаться и свидетельствовать против другого подозреваемого, даже если оба невиновны. Возможно, наихудший случай — когда только один виноват, в этом случае невиновный вряд ли сознаётся в чём либо, а виновный пойдёт на это и даст показания против невиновного.

Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Ардена можно рассматривать как обобщение ДЗ для множества игроков. Каждый житель общины выбирает — пасти ли скот на общем пастбище и получить выгоду, истощая его ресурсы, либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища — низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.

Источник

Дилемма заключенного

В теории игр дилемма заключённого (реже употребляется название «дилемма бандита») — некооперативная игра, в которой игроки стремятся получить выгоду, сотрудничая друг с другом или предавая. Как во всей теории игр, предполагается, что игрок («заключённый») максимизирует свой собственный выигрыш, не заботясь о выгоде других.

В дилемме заключённого предательство строго доминирует над сотрудничеством, поэтому единственное возможное равновесие — предательство обоих участников. Проще говоря, неважно, что сделает другой игрок, каждый выиграет больше, если предаст. Поскольку в любой ситуации предать выгоднее, чем сотрудничать, все рациональные игроки выберут предательство.

В повторяющейся дилемме заключённого игра происходит периодически, и каждый игрок может «наказать» другого за несотрудничество ранее. В такой игре сотрудничество может стать равновесием, а стимул предать может перевешиваться угрозой наказания (с ростом числа итераций равновесие Нэша стремится к Парето-оптимуму).

Содержание

Классическая дилемма заключённого

Во всех судебных системах кара за бандитизм (совершение преступлений в составе организованной группы) намного тяжелее, чем за те же преступления, совершённые в одиночку (отсюда альтернативное название — «дилемма бандита»).

Классическая формулировка дилеммы заключённого такова:

Двое преступников, А и Б, попались примерно в одно и то же время на сходных преступлениях. Есть основания полагать, что они действовали по сговору, и полиция, изолировав их друг от друга, предлагает им одну и ту же сделку: если один свидетельствует против другого, а тот хранит молчание, то первый освобождается за помощь следствию, а второй получает максимальный срок (10 лет). Если оба молчат, дело проходит по другой статье, и они приговариваются к 6 месяцам. Если оба свидетельствуют против друг друга, они получают минимальный срок (по 2 года). Каждый заключённый выбирает, молчать или свидетельствовать против другого. Однако ни один из них не знает точно, что сделает другой. Что произойдёт?

Игру можно представить в виде следующей таблицы:

Заключённый Б хранит молчание	Заключённый Б даёт показания
Заключённый А хранит молчание	Оба получают полгода.	А получает 10 лет, Б освобождается
Заключённый А даёт показания	А освобождается, Б получает 10 лет тюрьмы	Оба получают 2 года тюрьмы
«Дилемма заключённого» в нормальной форме.

С точки зрения группы (этих двух заключённых) лучше всего сотрудничать друг с другом, хранить молчание и получить по полгода, так как это уменьшит суммарный срок заключения. Любое другое решение будет менее выгодным. Это очень наглядно демонстрирует, что в игре с ненулевой суммой Парето-оптимум может быть противоположным равновесию Нэша.

Обобщённая форма

Сотрудничать	Предать
Сотрудничать	C, C	c, D
Предать	D, c	d, d
Каноническая матрица выигрышей ДЗ

Можно раскрыть скелет игры далее, абстрагировавшись от подтекста заключённых. Обобщённая форма игры часто используется в экспериментальной экономике. Следующие правила дают типичную реализацию игры.

Эти правила были установлены Дугласом Хофштадтером и образуют каноническое описание типичной дилеммы заключённого.

Похожая, но другая игра

Хофштадтер [2] предположил, что люди проще понимают задачи, как задача ДЗ, если она представлена в виде отдельной игры или процесса торговли. Один из примеров — «обмен закрытыми сумками»:

Два человека встречаются и обмениваются закрытыми сумками, понимая, что одна из них содержит деньги, другая — товар. Каждый игрок может уважать сделку и положить в сумку то, о чём договорились, либо обмануть партнёра, дав пустую сумку.

В этой игре обман всегда будет наилучшим решением, означая также, что рациональные игроки никогда не будут играть в неё, и что рынок обмена закрытыми сумками будет отсутствовать.

В вариации, популярной у программистов и хакеров, каждый агент этой игры помнит предыдущие результаты (или имеет доступ к общественному мнению, «коллективной памяти»), и множество обменов повторяются длительное время.

Как отмечено выше, без памяти эта игра имеет мало смысла, она мало что объясняет в поведении систем и групп людей, кроме описания взаимодействий, которые не будут происходить. Сложностей вводится больше, чем можно ожидать. Программист (особенно специализирующийся на функциональном программировании) сразу поймёт значимость времени и состояния (памяти). Но и без написания программ можно предположить, как поведут себя агенты. Насколько велика память каждого агента? Какова стратегия каждого из них? Как агенты с разными стратегиями распределены и что определяет, кто с кем взаимодействует и в каком порядке?

Сложность создания какой-то многозначной модели может обескураживать, но она поднимает некоторые интересные и ценные технические и философские вопросы.

Проделана некоторая работа по моделированию этого. Разные программисты и математики утверждают, что стратегия «око за око» (см. ниже) — наилучшая общая стратегия, однако не было сделано серьёзных академических усилий, чтобы классифицировать разные типы и распределения обучающихся агентов с разными стратегиями.

О потенциале этой задачи свидетельствует тот факт, что в этой дискуссии ещё не упоминались возможность формировать коалиции и рядиться коллективно. А как насчёт агентов, которые бы за плату организовывали переговоры? Или агентов, которые бы накапливали информацию о самих сделках?

Примеры из реальной жизни

Примеры с заключёнными, карточной игрой и обменом закрытыми сумками могут показаться надуманными, но на самом деле есть множество примеров взаимодействия людей и животных, имеющие такую же матрицу выигрышей. Поэтому ДЗ представляет интерес социальным наукам, таким как экономика, политика и социология, а также разделам биологии — этологии и эволюционной биологии. Многие природные процессы были обобщены в модели, в которых живые существа участвуют в бесконечных играх типа дилеммы заключённого. Такая широкая применимость ДЗ придаёт этой игре значительную важность.

В политологии, к примеру, сценарий ДЗ часто используется для иллюстрации проблемы двух стран, вовлечённых в гонку вооружений. Обе будут заявлять, что у них есть две возможности: либо увеличить расходы на военные нужды, либо сокращать вооружения. Ни одна из сторон не может быть уверена, что другая будет соблюдать договорённость, следовательно, обе будут стремиться к военной экспансии. Это можно считать теоретическим объяснением политики устрашения. Похожие явления наблюдаются и в автоспорте — «Формула-1», где последние 20 лет происходит гонка бюджетов команд. Из-за этого число машин-участников сократилось с 36 в 1990 году до 20 в 2003.

В велогонках дилемма заключённого возникает, когда два сильных гонщика оторвались от общей группы. Каждый из них может либо предоставить соседу слипстрим («сотрудничать»), либо ехать сзади («предать»). Для обоих идеалом будет, когда они по очереди «висят» друг у друга на хвосте — но всегда есть желание не дать соседу слипстрима (тогда тот постепенно устаёт и «скатывается» в пелотон, а ты финишируешь с большим отрывом).

В олигополистических рынках ценовая политика — это повторяющаяся ДЗ. Обычно олигополисты сотрудничают друг с другом и не доводят ситуацию до «ценовой войны».

Многие дилеммы в реальной жизни включают множество игроков. Хотя и метафорическую, «трагедию общин» Ардена можно рассматривать как обобщение ДЗ для множества игроков. Каждый житель общины выбирает — пасти ли скот на общем пастбище и получить выгоду, истощая его ресурсы, либо ограничить свой доход. Коллективный результат от всеобщего (или частого) максимального использования пастбища — низкий доход (ведущий к разрушению общины). Однако такая игра не является формальной, поскольку может быть разбита на последовательность классических игр с 2 участниками.

Повторяющаяся дилемма заключённого

В книге «Эволюция кооперации» (1984) Роберт Аксельрод en:Robert Axelrod исследовал расширение сценария ДЗ, которое он назвал повторяющаяся дилемма заключённого (ПДЗ). В ней участники делают выбор снова раз за разом и помнят предыдущие результаты. Аксельрод пригласил академических коллег со всего мира, чтобы разработать компьютерные стратегии, чтобы соревноваться в чемпионате по ПДЗ. Программы, вошедшие в него различались по алгоритмической сложности, начальной враждебности, способности к прощению и так далее.

Аксельрод открыл, что если игра повторялась долго среди множества игроков, каждый с разными стратегиями, «жадные» стратегии давали плохие результаты в долгосрочном периоде, тогда как более «альтруистические» стратегии работали лучше, с точки зрения собственного интереса. Он использовал это, чтобы показать возможный механизм эволюции альтруистического поведения из механизмов, которые изначально чисто эгоистические, через естественный отбор.

Лучшей детерминистской стратегией оказалась «Око за око» (англ. Tit for Tat ), которую разработал и выставил на чемпионат Анатолий Рапопорт. Она была простейшей из всех участвовавших программ, состояла всего из 4 строк кода на языке Бейсик. Стратегия проста: сотрудничать на первой итерации игры, после этого игрок делает то же самое, что делал оппонент на предыдущем шаге. Чуть лучше работает стратегия «Око за око с прощением». Когда оппонент предаёт, на следующем шаге игрок иногда в любом случае сотрудничает с небольшой вероятностью (1-5 %). Это позволяет случайным образом выйти из цикла взаимного предательства. Она лучше всего работает, когда в игру вводится недопонимание — когда решение одного игрока сообщается другому с ошибкой.

Анализируя стратегии, набравшие лучшие результаты, Аксельрод назвал несколько условий, необходимых, чтобы стратегия получила высокий результат:

Добрая важнейшее условие — стратегия должна быть «доброй», то есть не предавать, пока этого не сделает оппонент. Почти все стратегии-лидеры были добрыми. Поэтому чисто эгоистичная стратегия по чисто эгоистическим причинам не будет первой «бить» соперника. Мстительная успешная стратегия не должна быть слепым оптимистом. Она должна всегда мстить. Пример немстительной стратегии — всегда сотрудничать. Это очень плохой выбор, поскольку «подлые» стратегии воспользуются этим. Прощающая другое важное качество успешных стратегий — уметь прощать. Отомстив, они должны вернуться к сотрудничеству, если оппонент не продолжает предавать. Это предотвращает бесконечное мщение друг другу и максимизирует выигрыш. Не завистливая последнее качество — не быть завистливым, то есть не пытаться набрать больше очков, чем оппонент (что в принципе невозможно для «доброй» стратегии, то есть добрая стратегия никогда не может набрать больше очков, чем оппонент).

Таким образом, Аксельрод пришёл к утопично звучащему выводу, что эгоистичные индивиды во имя их же эгоистического блага будут стремиться быть добрыми и прощающими и не завистливыми.

Рассмотрим снова модель гонки вооружений. Был дан вывод, что единственная рациональная стратегия — вооружаться, даже если обе страны хотели бы тратить ВВП на масло, а не пушки [4] Интересно, что попытки продемонстрировать, что вывод ДЗ работает на практике (делая анализ «высоких» и «низких» военных расходов между периодами, на основе предположений ПДЗ), часто показывают, что такого поведения не происходит (например, греческие и турецкие военные расходы меняются не в соответствии со стратегией «око за око», а вероятнее всего следуют внутренней политике). Это может быть примером рационального поведения, отличающегося от одноразовой и многоходовой игр.

Если в одноходовой игре в любом случае доминирует стратегия предать, то в многоходовой оптимальная стратегия зависит от поведения других участников. К примеру, если среди населения все друг друга обманывают, а один ведёт себя по принципу «око за око», он оказывается в небольшом проигрыше из-за потери на первом ходе. В такой популяции оптимальная стратегия — всегда предавать. Если же число исповедующих принцип «око за око» больше, то результат уже зависит от их доли в обществе.

Определить оптимальную стратегию можно двумя путями:

Хотя стратегия «око за око» считалась самой удачной простой стратегией, команда Университета Саутгемптона из Англии (под руководством профессора Николаса Дженнингса [1]) представила новую стратегию на 20-ю годовщину Чемпионата по ПДЗ. Эта стратегия оказалась более успешной, чем «око за око». Она основывалась на взаимодействии между программами, чтобы получить максимальный счёт для одной из них. Университет выставил на чемпионат 60 программ, которые распознавали друг друга по ряду действий на первых 5-10 ходах. Узнав другую, одна программа всегда сотрудничала, а другая предавала, что давало максимум очков предателю. Если программа понимала, что оппонент — не саутгемптонский, она дальше всё время предавала его, чтобы минимизировать результат соперника. В результате [6] эта стратегия заняла первые три места в соревновании, как и несколько мест подряд ниже.

Хотя эта эволюционно стабильная стратегия оказалась более эффективной в соревновании, это было достигнуто за счёт того, что в этом конкретном соревновании команда могла участвовать несколькими агентами. Если игрок может контролировать только одного агента, «око за око» оказывается лучшей. Она также соблюдает правило запрета на коммуникации между игроками. То, что саутгемптонские программы исполняли «ритуальный танец» в первые 10 ходов, чтобы узнать друг друга, только подтверждает, насколько важна коммуникация в сдвиге баланса игры.

Если ПДЗ играется ровно N раз (некая известная константа N), есть ещё один интересный факт. Равновесие Нэша — всегда предавать. Доказываем по индукции: если оба сотрудничают, на последнем ходу выгодно предать, тогда у соперника не будет возможности отомстить. Поэтому оба предадут друг друга на последнем ходу. Раз соперник предаст на последнем ходу в любом случае, любой игрок захочет предать на предпоследнем ходу, и так далее. Чтобы сотрудничество оставалось выгодным, необходимо, чтобы будущее было неопределённым для обоих игроков. Одно из решений — делать число N случайным и подсчитывать результаты по среднему выигрышу за ход.

Дилемма заключённого — фундаментальная для некоторых теорий о взаимодействии людей и доверии. Из предположения модели ДЗ, что транзакция между двумя людьми требует доверия, доверительное поведение в популяциях может быть смоделировано при помощи многоигроковой повторяющейся версии игры. Это годами вдохновляло многих учёных. В 1975 году Грофман и Пул оценивали число работ, посвящённых этой теме, в количестве около 2000.

Психология обучения и теория игр

Если игроки могут оценивать возможность предательства со стороны других игроков, на их поведение влияет опыт. Простая статистика показывает, что неопытные игроки обычно ведут себя чрезмерно хорошо или плохо. Если они всё время будут действовать так, то проиграют из-за своей излишней агрессивности или излишней доброты. С получением большего опыта они реальнее оценивают вероятность предательства и добиваются лучших результатов. Ранние розыгрыши сильнее влияют на неопытных игроков, чем более поздние на опытных. Это пример, почему ранний опыт имеет такое влияние на молодых, и почему они особенно уязвимы к немотивированной агрессии, иногда сами становясь такими же.

Эти процессы — главное поле интереса взаимного альтруизма, группового отбора, семейного отбора и этики.

Восточная философия

В боевых искусствах изучается даосская пословица, которая говорит, что:

Второе и четвёртое утверждения кажутся спорными, особенно с позиций христианства, но дилемма заключённого объясняет их. В древнем Китае «добро» и «зло» считались непреложными истинами (например, их нельзя поменять местами), таким образом, эту пословицу можно прочитать ещё и как «плюс на минус даёт минус». Есть усиленный вариант этой пословицы, где в двух последних строках получается «двойное зло».

Генетика

Теория естественного отбора долго не публиковалась, так как в неё не укладывался генетический альтруизм, то есть генетически вложенная в организм программа заботиться о себе подобных даже в ущерб себе[2]. Так называемый ген любви.

Примечания

См. также

Ссылки

Литература

(источники, названные в английской статье)

Теория игрОпределенияНекооперативная игра · Кооперативная игра · Антагонистическая игра · Стохастическая игра · Дифференциальные игры · Игрок · Стратегия · Доминирование стратегийПринципы оптимальностиРавновесие Нэша · Эффективность по Парето · Равновесие в доминирующих стратегиях · Решение по доминированию · Равновесие дрожащей руки · Равновесие, совершенное по под-играм · Собственное равновесие · Сильное равновесие · Эпсилон-равновесие · Коррелированное равновесие · Секвенциальное равновесие · Доминирование по рискуПримеры игрДилемма заключённого · Трагедия общин · Модель Бертрана · Модель Курно · Модель Штакельберга

Мысленные эксперименты
Главные статьи	Мысленный эксперимент ·
Люди	Зенон Элейский · Шрёдингер · Эйнштейн ·
Персонажи	Демон Лапласа · Демон Максвелла · Кот Шрёдингера · Чайник Рассела · Ахиллес и черепаха ·
Физические мысленные эксперименты	Демон Лапласа · Демон Максвелла · Квантовое бессмертие · Квантовое самоубийство · Кот Шрёдингера · Парадокс Белла · Парадокс субмарины · Парадокс Эйнштейна — Подольского — Розена · Парадокс близнецов · Микроскоп Гейзенберга · Пушечное ядро Ньютона · Парадокс Эренфеста ·
Апории Зенона	Ахиллес и черепаха · Дихотомия · Стадион · Стрела Зенона ·
Кибернетические мысленные эксперименты	Задача двух генералов · Китайская комната · Имитация реальности · Мозг в колбе ·
Другие мысленные эксперименты	Теорема о бесконечных обезьянах · Парадокс Ньюкома · Парадокс заключённых · Комната Марии ·

Полезное

Смотреть что такое «Дилемма заключенного» в других словарях:

Дилемма заключенного — [prisoner s dilemma] объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности… … Экономико-математический словарь

дилемма заключенного — Объяснение того, что продавцы часто стремятся к сговору на рынке вместо конкуренции, которая была бы выгоднее для общества. Смысл ее в такой ситуации: двух заключенных А и Б обвинили в совместном убийстве, лишили возможности сговора и поставили… … Справочник технического переводчика

Дилемма Заключенного — метод, применяемый в теории игр, анализа задачи и определения результата ее решения путем его выбора двумя равноправными партнерами. Словарь бизнес терминов. Академик.ру. 2001 … Словарь бизнес-терминов

Дилемма заключенного — PRISONER’S DILEMMA Основополагающая концепция теории игр. Наилучшей иллюстрацией концепции является притча о двух заключенных, вместе совершивших преступление. Шериф помещает подозреваемых в разные камеры. Он предоставляет каждому из них… … Словарь-справочник по экономике

ДИЛЕММА ЗАКЛЮЧЕННОГО — в теории игр это метод анализа решений (выбора) и результатов, в ходе которого результат определяется выбором, осуществляемым двумя равноправными партнерами … Большой экономический словарь

ДИЛЕММА, ЗАКЛЮЧЕННОГО — Игра, основанная на классической детективной ситуации. В типичном варианте каждому игроку (заключенному) в отдельности сообщают, что, хотя имеются некоторые прямые доказательства его вины, у него есть два варианта: признаться или не признаться.… … Толковый словарь по психологии

Дилемма заключенного (prisoner’s dilemma) — Д. з. это название интерперсональной игры, широко использовавшейся в исследованиях соц. психологов, интересовавшихся природой и разрешением соц. конфликта. Под «игрой» в этом смысле понимается соц. ситуация с принятием взаимозависимых решений, т … Психологическая энциклопедия

ЗАКЛЮЧЕННОГО ДИЛЕММА — ЗАКЛЮЧЕННОГО ДИЛЕММА (дилемма узника; англ. prisoner s dilemma) интеллектуальная модель (предложенная А, У. Такером), позволяющая анализировать и демонстрировать различные варианты рациональности решений при необходимости кооперации частных… … Философская энциклопедия

ЗАКЛЮЧЕННОГО, ДИЛЕММА — См. дилемма заключенного … Толковый словарь по психологии

КОНФЛИКТ МЕЖЛИЧНОСТНЫЙ — – наиболее деструктивный способ развития и завершения значимых противоречий, возникающих в процессе межличностного взаимодействия. Для возникновения К. м. необходимо одновременное наличие трех условий: противоречия в межличностном взаимодействии … Энциклопедический словарь по психологии и педагогике

Источник

Интернет-портал linguist-school.ru

Что такое дилемма заключенного

Дилемма заключённого

Дилемма заключённого

Примеры Дилеммы заключённого

Изучение Дилеммы заключённого

Резюме

Что такое дилемма заключенного

Дилемма заключенных в теории игр: от абстракций к конкретике

Равновесие Нэша в дилемме заключенных

Примеры

Дилемма заключенного

Дилемма заключенного

Содержание

Классическая дилемма заключённого

Обобщённая форма

Похожая, но другая игра

Примеры из реальной жизни

Повторяющаяся дилемма заключённого

Психология обучения и теория игр

Восточная философия

Генетика

Примечания

См. также

Ссылки

Литература

Полезное

Смотреть что такое «Дилемма заключенного» в других словарях:

Добавить комментарий Отменить ответ

Дилемма заключённого

Дилемма заключённого

Примеры Дилеммы заключённого

Изучение Дилеммы заключённого

Резюме

Что такое дилемма заключенного

Дилемма заключенных в теории игр: от абстракций к конкретике

Равновесие Нэша в дилемме заключенных

Примеры

Дилемма заключенного

Дилемма заключенного

Содержание

Классическая дилемма заключённого

Обобщённая форма

Похожая, но другая игра

Примеры из реальной жизни

Повторяющаяся дилемма заключённого

Психология обучения и теория игр

Восточная философия

Генетика

Примечания

См. также

Ссылки

Литература

Полезное

Смотреть что такое «Дилемма заключенного» в других словарях:

Вам также понравится

Дисплазия тазобедренных суставов у собаки что это

Что такое биотики и для чего они нужны

Что такое доказательство в математике

Добавить комментарий Отменить ответ