Nash equilibrium/cs

Jedním ze základních úkolů teorie her je popsání optimálních strategií jednotlivých hráčů, respektive výsledku hry (za předpokladu racionálního chování hráčů). Vhodným nástrojem je nalezení Nashovy rovnováhy.

=Definice= Nashova rovnováha je takové řešení, ve kterém platí, že pokud se jeden z hráčů nebude držet své strategie, zatímco ostatní hráč(i) ano, jeho výhra se sníží nebo v nejlepším případě zůstane stejná.

Vlastnosti Nashovy rovnováhy
Z definice vyplývají následující vlastnosti Nashovy rovnováhy, které jsou užitečné pro její nalezení a interpretaci:
 * Nashova rovnováha nikdy neleží v silně dominovaném sloupci.
 * Pokud má hra s konstantním součtem sedlový prvek (sedlové prvky), pak rovnováha leží v tomto prvku (těchto prvcích).
 * Nashova rovnováha není (automaticky) Pareto-efektivní. Klasickým případem je hra vězňovo dilema, ve které se hráči bez možnosti kooperace racionálně rozhodnou pro řešení, které je pro oba z hráčů horší, než jiný možný výsledek hry.
 * Každá hra s konstantním součtem má (právě jedno) rovnovážné řešení ve smíšených strategiích. (Ryzí strategie jsou podmnožinou smíšených strategií).
 * Každá hra dvou hráčů má alespoň jedno rovnovážné řešení

=Řešené příklady= V následujících kapitolách budou představeny metody hledání Nashovy rovnováhy, počínaje nejjednoduššími, použitelnými jen ve specifických případech, po lehce složitější univerzální metody.

Příklad 1: Vězňovo dilema, eliminace dominovaných strategií
Najděte Nashovu rovnováhu ve hře vězňovo dilema, jejíž výplatní matice je dána takto: Pokud se ani jeden z vězňů nepřizná, dostane každý trest 2 roky. Pokud se přizná jeden z vězňů, stráví ve vězení jen jeden rok, ale jeho spolupachatel 10. Pokud se přiznají oba hráči, stráví každý ve vězení 10 let. Využijeme znalosti, že rovnovážné řešení nikdy neleží v silně (ostře) dominovaném řádku či sloupci. Pro prvního hráče první řádek (přiznat) silně dominuje druhý řádek (nepřiznat). Tento řádek tedy můžeme vyškrtnout. (První řádek je pro prvního hráče lepší při každém možném rozhodnutí protihráče.) Obdobně pro druhého hráče je druhý sloupec dominován prvním. V šedě označených buňkách tabulky tedy Nashovo rovnovážné řešení ležet nemůže. Vzhledem k tomu, že každá hra má alespoň jedno rovnovážné řešení, toto řešení je dáno volbou "Přiznat" obou hráčů a tedy výplatní hodnotou (-5, -5).
 * Řešení

Ve hrách, které obsahují více nedominovaných řádků či sloupců tento postup k nalezení Nashovy rovnováhy nestačí. Neuvažování dominovaných prvků ale může ulehčit postup v případě dalších metod.

Příklad 2: Hledání sedlového bodu
Nalezněte optimální strategie obou hráčů a Nashovu rovnováhu pro následující jednomaticovou hru:

Prostor strategií prvního hráče je dán vektorem (a, b, c), prostoj strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem).

Žádný ze slouců ani řádků není dominován, řešení zkusíme nalézt pomocí sedlového bodu (maximum ve sloupci, minimum v řádku). Maximum ve sloupci budu značit červenou barvou, minimum v řádku zeleným rámečkem. V buňce, kde se řádkové minimum a sloupcové maximum setkají, leží sedlový bod, a tedy i Nashova rovnováha.
 * Řešení
 * Maximum v prvním sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii α) je 0, označím ji tedy červeně.
 * Maximum v druhém sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii β) je 3, označím ji tedy červeně.
 * Maximum ve třetím sloupci (optimální reakce prvního hráče, pokud druhý hráč zahraje strategii γ) je 5, označím ji tedy červeně.
 * Minimum v prvním řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii a) je 0, označím zeleným rámečkem.
 * Minimum v druhém řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii b) je -2, označím zeleným rámečkem.
 * Minimum v druhém řádku (optimální reakce druhého hráče, pokud první hráč zahraje strategii c) je -7, označím zeleným rámečkem.

Ve hře s konstantním součtem mohou nastat následující situace:
 * Existuje jeden sedlový bod, potom Nashova rovnováha leží v tomto sedlovém bodě.
 * Existuje více sedlových bodů o stejné hodnotě, potom Nashova rovnováha leží v každém z nich.
 * Neexistuje sedlový bod, v tomto případě existuje pouze smíšené řešení.

Příklad 3: Smíšené strategie
Nalezněte optimální strategie obou hráčů a Nashovu rovnováhu pro následující jednomaticovou hru:

Prostor strategií prvního hráče je dán vektorem (a, b, c), prostoj strategií druhého hráče vektorem (α, β, γ). Výplatní matice určuje výplaty prvního hráče, výplaty druhého hráče jsou opačné (jde o hru s nulovým součtem).

Na první pohled je patrné že řádek c je dominován řádkem b. (racionálně uvažující první hráč tuto možnost nikdy nezvolí, protože strategie b mu ve všech případech přinese větší užitek). Pro zjednodušení výpočtu tedy budeme brát v úvahu pouze první dva řádky, v nichž jistě leží řešení.
 * Řešení

Pokusíme se nalézt řešení pomocí sedlového bodu, postup je stejný jako u předchozího příkladu. Matice zjevně neobsahuje sedlový bod (žádný její prvek není zároveň řádkovým minimem a sloupcovým maximem) a nedy ani žádné řešení v ryzích strategiích.

Smíšené strategie je možné nalézt pomocí metod lineárního programování, a to buď ručně, například pomocí simplexového algoritmu nebo (v prípadě max 2 sloupců nebo řádků) graficky, nebo počítačovým programem (Lingo, MPL, Excel Solver, …). Většina metod vyžaduje na vstupu nezáporná čísla, proto matici upravíme přičtením konstanty (nejnižšího prvku, v tomto případě 8), což řešení nezmění (jde o strategicky ekvivalentní hry).
 * Nalezení řešení ve smíšených strategiích

Předpis pro účelovou funkci a omezující podmínky je dán následující tabulkou: Účelová funkce (minimalizovat) $$p_1+p_2+...+p_m$$
 * Nalezení Nashovy rovnováhy ve smíšených strategiích

Podmínky $$a_1_1p_1+a_2_1p_m+...+a_m_1p_m\ge0$$ $$...$$ $$a_1_np_1+a_2_np_m+...+a_m_np_m\ge0$$

$$p_i \ge 0$$  $$i=1,2,...m$$

nebo

Účelová funkce (maximalizovat) $$q_1+q_2+...+q_n$$

Podmínky $$a_1_1q_1+a_1_2q_n+...+a_1_nq_n\le0$$ $$...$$ $$a_m_1q_1+a_m_2q_2+...+a_m_nq_n\le0$$

$$q_j \ge 0$$  $$j=1,2,...n$$

Úlohy jsou duálně sdružené, takže stačí vypočítat pouze jednu z nich,proměnné z druhé úlohy jsou potom duální proměnné z první (a naopak).

Pro zjištění strategie je nutné proměnné p nebo q vydělit hodnotou účelové funkce. Pro náš příklad je výpočetně lepší zvolit druhou možnost, protože vede ke dvěma omezujícím podmínkám (+ jedné na nezápornost), zatímco první ke třem. Účelová funkce je potom: $$q_1+q_2+q_3$$ (minimalizovat) a omezující podmínky: $$11q_1+13q_2+0q_3\le0$$ $$11q_1+13q_2+0q_3\le0$$ $$q_j \ge 0$$  $$j=1,2,...n$$

Po vyřešení úlohy (například v doplňku Řešitel pro MS Excel 2010: ) dostáváme následující rovnovážné strategie: (a, b)=(52%, 48%) pro prvního hráče a (α, β, γ)=(32%, 27%, 41%) pro druhého hráče (první hráč by měl hrát v 52% případů a, v 48% případů b). Tyto strategie je možné zachytit i graficky: Cenu hry je možné určit jako součin pravděpodobností jednotlivých prvků s výplatní maticí. V tomto případě vychází 8,032. Od tohoto výsledku je nutné odečíst konstantu 8, kterou jsme k výplatní matici přičetli v prvním kroku. Výsledná cena hry je potom 0,032, což znamená, že hra je mírně nespravedlivá ve prospěch prvního hráče.

=Otázky a příklady k procvičení=
 * 1) Zajišťuje Nashova rovnováha automaticky pareto-optimální řešení?
 * 2) Kolik nashových rovnovážných řešení může existovat v maticové hře?  a. žádné  b. 0 - počet prvků  c. pouze 1  d. 1 - počet prvků
 * 3) Najděte Nashovo rovnovážné řešení v prvním příkladu (Vězňovo dilema) bez vyškrtávání dominovaných sloupců - pomocí sedlových bodů (tip: Je použita jiná notace než v druhém příkladu, je proto nutné hledat maxima ve sloupcích i řádcích, ale vždy ve výplatní funkci správného hráče)
 * 4) Ukažte, že při uvažování dominovaného řádku se řešení třetího příkladu nezmění.
 * 5) Najděte Nashova rovnovážná řešení pro následující hry:

Sestavte výplatní matici pro hru Kámen, nůžky, papír (diskutováno v infoboxu) a nalezněte Nashovo rovnovážné řešení hry. 

=Reference=

=Doplňující literatura=
 * Ben Polak, Game Theory (Yale University: Open Yale Courses), http://oyc.yale.edu/ (Accessed June 17, 2012). License: Creative Commons BY-NC-SA, lectures 4-8