Mahkumların İkilemi Nedir?

Oyunun kendisinde, cezalar (ve ilgiliyse ödüller) aşağıdakileri temsil eder: Yarar sayılar. Pozitif sayılar iyi sonuçları, negatif sayılar kötü sonuçları temsil eder ve bununla ilişkili sayı daha büyükse bir sonuç diğerinden daha iyidir. (Bununla birlikte, örneğin -5, -20'den büyük olduğu için bunun negatif sayılar için nasıl çalıştığına dikkat edin!)

Yukarıdaki tabloda, her bir kutudaki ilk sayı, oyuncu 1'in sonucunu ve ikinci sayı, oyuncu 2'nin sonucunu temsil eder. Bu sayılar, mahkumların ikilem düzeneğiyle tutarlı birçok sayı kümesinden sadece birini temsil etmektedir.

Bir oyun tanımlandıktan sonra, oyunu analiz etmenin bir sonraki adımı oyuncuların stratejilerini değerlendirmek ve oyuncuların nasıl davranacaklarını anlamaya çalışmaktır. Ekonomistler oyunları analiz ettiklerinde birkaç varsayım yaparlar - önce her iki oyuncunun da hem kendileri hem de diğer oyuncu için getiriler ve ikincisi, her iki oyuncunun da için rasyonel bir şekilde oyundan kendi getirilerini maksimize edin.

İlk kolay yaklaşımlardan biri,

instagram viewer
baskın stratejiler- diğer oyuncunun hangi stratejiyi seçtiğinden bağımsız olarak en iyi stratejiler. Yukarıdaki örnekte, itiraf etmeyi seçmek her iki oyuncu için de baskın bir stratejidir:

İtiraf etmenin her iki oyuncu için de en iyi olduğu göz önüne alındığında, her iki oyuncunun da itiraf ettiği sonucun oyunun bir denge sonucu olması şaşırtıcı değildir. Bununla birlikte, tanımımızla biraz daha kesin olmak önemlidir.

Bir kavramı Nash Dengesi matematikçi ve oyun teorisyeni John Nash tarafından kodlandı. Basitçe söylemek gerekirse, bir Nash Dengesi bir dizi en iyi tepki stratejisidir. İki oyunculu bir oyun için Nash dengesi, oyuncu 2'nin stratejisinin oyuncu 1'in stratejisine en iyi yanıt olduğu ve oyuncu 1'in stratejisinin oyuncu 2'nin stratejisine en iyi yanıt olduğu bir sonuçtur.

Nash dengesini bu prensip ile bulmak sonuçlar tablosunda gösterilebilir. Bu örnekte, oyuncu 2'nin birinci oyuncuya verdikleri en iyi yanıtlar yeşil renkte daire içine alınmıştır. Oyuncu 1 itiraf ederse, oyuncu 2'nin en iyi yanıtı itiraf etmektir, çünkü -6 -10'dan daha iyidir. Oyuncu 1 itiraf etmezse, oyuncu 2'nin en iyi yanıtı itiraf etmektir, çünkü 0 -1'den daha iyidir. (Bu akıl yürütmenin, baskın stratejileri tanımlamak için kullanılan akıl yürütmeye çok benzediğini unutmayın.)

Oyuncu 1'in en iyi yanıtları mavi renkte daire içine alınmıştır. Oyuncu 2 itiraf ederse, oyuncu 1'in en iyi yanıtı itiraf etmektir, çünkü -6 -10'dan daha iyidir. Oyuncu 2 itiraf etmezse, oyuncu 1'in en iyi yanıtı itiraf etmektir, çünkü 0 -1'den daha iyidir.

Nash dengesi hem yeşil çemberin hem de mavi çemberin olduğu sonuçtur, çünkü bu her iki oyuncu için de en iyi tepki stratejilerini temsil eder. Genel olarak, birden fazla Nash dengesine sahip olmak ya da hiç olmamak mümkündür (en azından burada açıklandığı gibi saf stratejilerde).

Bu örnekteki Nash dengesinin bir şekilde yetersiz göründüğünü fark etmiş olabilirsiniz. (özellikle, Pareto optimal olmadığı için) her iki oyuncunun da -1 kazanması mümkündür -6 yerine. Bu, oyun teorisinde mevcut etkileşimin doğal bir sonucudur, itiraf etmemek bir toplu olarak grup için en uygun strateji, ancak bireysel teşvikler bu sonucun elde etti. Örneğin, eğer oyuncu 1, oyuncu 2'nin sessiz kalacağını düşünürse, sessiz kalmaktan ziyade ona oy vermek için bir teşviği olacaktır ve bunun tersi de geçerlidir.

Bu nedenle, Nash dengesi, hiçbir oyuncunun bu sonuca götüren stratejiden tek taraflı olarak (yani kendi başına) sapma teşviki olmadığı bir sonuç olarak da düşünülebilir. Yukarıdaki örnekte, oyuncular itiraf etmeyi seçtiklerinde, hiçbir oyuncu kendi fikrini değiştirerek daha iyisini yapamaz.