Čo je dilema väzňov?

click fraud protection

V samotnej hre sú tresty (a prípadne odmeny) reprezentované užitočnosť Čísla. Kladné čísla predstavujú dobré výsledky, záporné čísla predstavujú zlé výsledky a jeden výsledok je lepší ako iný, ak je s ním spojené väčšie číslo. (Dajte si pozor na to, ako to funguje pre záporné čísla, pretože napríklad -5 je väčšie ako -20!)

V tabuľke vyššie sa prvé číslo v každom políčku vzťahuje na výsledok hráča 1 a druhé číslo predstavuje výsledok hráča 2. Tieto čísla predstavujú iba jedno z mnohých čísel, ktoré sú v súlade s nastavením dilemy väzňov.

Akonáhle je hra definovaná, ďalším krokom pri analýze hry je vyhodnotenie stratégií hráčov a pokus o pochopenie toho, ako sa hráči pravdepodobne budú správať. Ekonómovia pri analýze hier robia niekoľko predpokladov - najprv predpokladajú, že obaja hráči sú si vedomí výplaty pre seba aj pre druhého hráča a po druhé, predpokladajú, že obaja hráči hľadajú na racionálne maximalizovať svoj vlastný výnos z hry.

Jeden jednoduchý počiatočný prístup je hľadať to, čo sa volá

instagram viewer
dominantné stratégie- stratégie, ktoré sú najlepšie bez ohľadu na to, ktorú stratégiu si hráč vyberie. Vo vyššie uvedenom príklade je výber priznania dominantnou stratégiou pre oboch hráčov:

Vzhľadom na to, že priznanie je pre oboch hráčov najlepšie, nie je prekvapujúce, že výsledok, keď sa priznajú obaja hráči, je vyváženým výsledkom hry. To znamená, že je dôležité byť trochu presnejší s našou definíciou.

Pojem a Nashova rovnováha bol kodifikovaný matematikom a teoretikom hry Johnom Nashom. Jednoducho povedané, Nashova rovnováha je súbor stratégií s najlepšou reakciou. V prípade hry pre dvoch hráčov je Nashova rovnováha výsledkom, keď stratégia hráča 2 je najlepšou reakciou na stratégiu hráča 1 a stratégia hráča 1 je najlepšou reakciou na stratégiu hráča 2.

Nájdenie Nashovej rovnováhy pomocou tohto princípu možno ilustrovať v tabuľke výsledkov. V tomto príklade sú najlepšie reakcie hráča 2 na hráča jedna zakrúžkované zelenou farbou. Ak sa hráč 1 prizná, najlepšou reakciou hráča 2 je priznať sa, pretože -6 je lepšie ako -10. Ak sa hráč 1 neprizná, najlepšou odpoveďou hráča 2 je priznať sa, pretože 0 je lepšie ako -1. (Všimnite si, že toto zdôvodnenie je veľmi podobné zdôvodneniu použitému na identifikáciu dominantných stratégií.)

Najlepšie odpovede hráča 1 sú zvýraznené modrou farbou. Ak sa hráč 2 prizná, najlepšou odpoveďou hráča 1 je priznať sa, pretože -6 je lepšie ako -10. Ak sa hráč 2 neprizná, najlepšou odpoveďou hráča 1 je priznať sa, pretože 0 je lepšie ako -1.

Nashova rovnováha je výsledkom, keď existuje zelený kruh aj modrý kruh, pretože to predstavuje súbor stratégií najlepšej reakcie pre oboch hráčov. Všeobecne je možné mať viac Nashových rovnováh alebo vôbec (aspoň v čistých stratégiách, ako sú tu opísané).

Možno ste si všimli, že Nashova rovnováha sa v tomto príklade javí ako suboptimálna (konkrétne v tom, že to nie je Pareto optimálne), pretože je možné, aby obaja hráči dostali -1 namiesto -6. Toto je prirodzený výsledok interakcie prítomnej v teórii hry - bez priznania by bolo optimálna stratégia pre skupinu kolektívne, ale individuálne stimuly bránia tomuto výsledku dosiahnuté. Napríklad, ak by si hráč 1 myslel, že hráč 2 bude mlčať, bude mať motiváciu ho radšej kryť, než mlčať, a naopak.

Z tohto dôvodu sa Nashova rovnováha môže tiež považovať za výsledok, keď žiadny hráč nemá motiváciu jednostranne (t. J. Sám) odchýliť sa od stratégie, ktorá viedla k tomuto výsledku. Vo vyššie uvedenom príklade, keď sa hráči rozhodnú priznať sa, žiadny hráč nemôže urobiť lepšie tým, že sám zmení svoju myseľ.

instagram story viewer