Apa Dilema Tahanan?

Dalam game itu sendiri, hukuman (dan hadiah, jika relevan) diwakili oleh utilitas angka. Angka positif mewakili hasil yang baik, angka negatif mewakili hasil yang buruk, dan satu hasil lebih baik daripada yang lain jika jumlah yang terkait dengannya lebih besar. (Namun hati-hati, bagaimana ini bekerja untuk angka negatif, karena -5, misalnya, lebih besar dari -20!)

Dalam tabel di atas, angka pertama dalam setiap kotak mengacu pada hasil untuk pemain 1 dan angka kedua mewakili hasil untuk pemain 2. Angka-angka ini hanya mewakili satu dari sekian banyak angka yang konsisten dengan pengaturan dilema tahanan.

Setelah game didefinisikan, langkah selanjutnya dalam menganalisis game adalah menilai strategi para pemain dan mencoba memahami bagaimana para pemain cenderung berperilaku. Ekonom membuat beberapa asumsi ketika mereka menganalisis permainan - pertama, mereka menganggap bahwa kedua pemain sadar hadiah untuk diri mereka sendiri dan untuk pemain lain, dan, kedua, mereka menganggap bahwa kedua pemain sedang mencari untuk secara rasional memaksimalkan hasil mereka sendiri dari permainan.

instagram viewer

Salah satu pendekatan awal yang mudah adalah mencari apa yang disebut strategi dominan- Strategi yang terbaik terlepas dari strategi apa yang dipilih pemain lain. Dalam contoh di atas, memilih untuk mengaku adalah strategi dominan untuk kedua pemain:

Mengingat bahwa pengakuan adalah yang terbaik untuk kedua pemain, tidak mengherankan bahwa hasil di mana kedua pemain mengaku adalah hasil keseimbangan permainan. Yang mengatakan, penting untuk sedikit lebih tepat dengan definisi kita.

Konsep a Ekuilibrium Nash dikodifikasikan oleh ahli matematika dan teori permainan John Nash. Sederhananya, Ekuilibrium Nash adalah serangkaian strategi respons terbaik. Untuk permainan dua pemain, keseimbangan Nash adalah hasil di mana strategi pemain 2 adalah respons terbaik terhadap strategi pemain 1 dan strategi pemain 1 adalah respons terbaik terhadap strategi pemain 2.

Menemukan keseimbangan Nash melalui prinsip ini dapat diilustrasikan dalam tabel hasil. Dalam contoh ini, respons terbaik pemain 2 terhadap pemain satu dilingkari hijau. Jika pemain 1 mengaku, respons terbaik pemain 2 adalah mengaku, karena -6 lebih baik dari -10. Jika pemain 1 tidak mengaku, respons terbaik pemain 2 adalah mengaku, karena 0 lebih baik dari -1. (Perhatikan bahwa alasan ini sangat mirip dengan alasan yang digunakan untuk mengidentifikasi strategi dominan.)

Respons terbaik Player 1 dilingkari dengan warna biru. Jika pemain 2 mengaku, respons terbaik pemain 1 adalah mengaku, karena -6 lebih baik dari -10. Jika pemain 2 tidak mengaku, respons terbaik pemain 1 adalah mengaku, karena 0 lebih baik dari -1.

Ekuilibrium Nash adalah hasil di mana ada lingkaran hijau dan lingkaran biru karena ini mewakili serangkaian strategi respons terbaik untuk kedua pemain. Secara umum, adalah mungkin untuk memiliki banyak Nash equilibria atau tidak sama sekali (setidaknya dalam strategi murni seperti yang dijelaskan di sini).

Anda mungkin telah memperhatikan bahwa kesetimbangan Nash dalam contoh ini tampaknya suboptimal (khususnya, dalam hal itu bukan Pareto optimal) karena dimungkinkan bagi kedua pemain untuk mendapatkan -1 daripada -6. Ini adalah hasil alami dari interaksi yang ada dalam teori permainan-dalam, tidak mengaku akan menjadi strategi optimal untuk kelompok secara kolektif, tetapi insentif individu mencegah hasil ini tercapai. Misalnya, jika pemain 1 berpikir bahwa pemain 2 akan tetap diam, ia akan memiliki insentif untuk mengusirnya daripada tetap diam, dan sebaliknya.

Karena alasan ini, keseimbangan Nash juga dapat dianggap sebagai hasil di mana tidak ada pemain yang memiliki insentif untuk secara sepihak (yaitu sendiri) menyimpang dari strategi yang mengarah ke hasil itu. Dalam contoh di atas, begitu pemain memilih untuk mengaku, tidak ada pemain yang bisa melakukan lebih baik dengan mengubah pikirannya sendiri.