Difference between revisions of "Extensive form/cs"

From Simulace.info
Jump to: navigation, search
(Zpětná indukce)
(imperfect information)
Line 52: Line 52:
  
 
== Hry s (ne)kompletními informacemi ==
 
== Hry s (ne)kompletními informacemi ==
 +
Vraťme se k příkladu uvedenému na začátku tohoto textu. Žák má možnost domácí úkol (ne)vypracovat a učitel (ne)zkontrolovat. Po tahu žáka učitel neví v jaké části stromu se nachází, jeho znalost předchozích akcí je nekompletní. Přerušovaná čára značí jeden informační set, tj. jeden rozhodovací uzel. Ať už se hráč nachází v jedné či druhé části, jeho rozhodnutí bude vždy stejné, protože neví v které části se nachází.
 +
 +
Z toho plyne, že hra s nekompletní informací musí splňovat tyto podmínky:
 +
* Hráč(i) nezná celou historii hry
 +
* Alespoň jeden informační set není jedináček (obsahuje alespoň dva uzly grafu)
 +
* Všechny uzly v rámci informačního setu musí vést ke stejným rozhodovacím možnostem (pokud jeden uzel vede k možnostem '''nahoru''', '''dolů''' a druhý k '''nahoru''' a '''doprava''', pak se jedná o dva různé informační sety)
 +
 +
=== Postup řešení ===
 +
Grafické znázornění je téměř stejné jako u hry s kompletní informací. Pouze se navíc přidá přerušovaná čára značící, že se jedná o jeden informační set a pravděpodobnost p a p-1, že se nacházíme v horní/dolní části stromu (viz níže).
 +
 +
[[File:imperfect information.jpg]]
  
 
== Příklady ==
 
== Příklady ==

Revision as of 16:02, 14 June 2015

Úvod

Klasická matice hry v normálním tvaru je vhodná pro grafické znázornění situací, kdy se hráči rozhodují ve stejný okamžik. V případě, kdy se hráči střídají v rozhodování, taková reprezentace již není dostačující, proto se používá tzv. rozšířená forma, která tyto situace zobrazuje pomocí rozhodovacího stromu.

Homework dilemma.jpg

Obrázek výše představuje jednoduchou "hru", kdy se žák rozhoduje, zda vypracovat či nevypracovat domácí úlohu zadanou učitelem. Užitky (vpravo v závorkách) se uvádějí vždy za posledním rozhodovacím krokem. Rozhodovací krok představuje každý uzel v grafu.

Akce vs. strategie

Akcí je právě jedno rozhodnutí. U statických her se rozhoduje zda je výhodnější provést to, či ono, což je samo o sobě výsledkem. Dynamické hry obsahují více uzlů, tedy více akcí ke kterým je nutné učinit rozhodnutí, a to ještě před zahájením samotné hry. Hovoříme tedy o strategii. Strategie je plán akcí pro veškeré situace, které mohou nastat.

Metody řešení

Nejčastěji se používá stejná metoda nejlepších reakcí jako v případě statických her s tím rozdílem, že se neporovnávají akce, nýbž strategie. Strategii lze vyjádřit zvýrazněním cesty od kořene grafu až k jednomu z jeho posledních potomků.

Strategie.jpg

V předešlém případě značíme červeně vyznačenou strategii takto: <Zadat úkol, Zkontrolovat úkol>; <Nevypracovat úkol> nebo zkráceně: <Z, Z>; <N>. Tato strategie však není kompletní, protože v ní nejsou zahrnuty veškeré situace, které mohou nastat, tj. pokud se žák rozhodne vypracovat úkol, učitel nebude mít pro tuto možnost stanovenou strategii. Pojďme si tedy ukázat, jak postupovat správně při hledání optimálního řešení dynamických her.


Zpětná indukce

Předchozí příklad je příkladem hry s nekompletní informací, tj. v situaci, kdy se učitel rozhoduje zda úkol zkontrolovat, či nikoliv, tak nemá informaci o tom, zda žák úkol vypracoval nebo ne. K tomuto typu příkladů se ještě vrátíme, ale pro začátek si vysvětlíme metodu zpětné indukce na příkladu tzv. Escalation game.

Dva státy se dostanou do sporu o území. Jeden ze států může buď pohrozit válkou nebo přenechat území druhému státu. Druhý stát se může nechat hrozbou zastrašit a území se vzdát nebo odporovat (také pohrozit válkou). První se může vzdát a nebo skutečně vyhlásit válku. Graficky lze hru znázornit takto:

Escalation game.jpg

Postupujeme od posledního rozhodovacího uzlu směrem ke kořenu stromu, přičemž můžeme daný rozhodovací uzel považovat za samostatnou "podhru" nezávislou na zbytku stromu a řešit ji stejně jako statickou hru.

Krok 1.jpg

Stát 2 se může v posledním kroku rozhodnout pro válku nebo mír, za cenu toho, že bude vypadat jako zbabělec a navíc přijde o území bez snahy ho získat. Užitek -1 je vyšší než -2, proto se stát 2 rozhodne pro válku. Nyní můžeme postoupit v rozhodovacím stromu o úroveň výše a opět řešit "podhru" jako statickou.

Krok 2.jpg

Stát 1 je na řadě a má možnost odporovat nebo ustoupit, když bude odporovat, tak již ví, že stát 2 mu vyhlásí válku a užitek obou států bude -1. Pokud Stát 1 ustoupí, jeho užitek bude -2, protože přijde o území bez snahy ho získat a bude vypadat jako zbabělec. Stát 1 tedy zvolí odpor.

Krok 3.jpg

Stejně postupujeme v posledním kroce: 0 je víc než -1, proto Stát 1 raději ustoupí. Sice přijde o území, ale alespoň ušetří životy lidí, kteří by padly v jinak nevyhnutelné válce.

Výsledek značíme jako strategii ve všech možných situacích: <Ustoupit, Vyhlásit válku>; <Odporovat>

Výsledek.jpg

Pomůcka: Strategie musí vždy obsahovat stejný počet akcí jako je počet uzlů v rozhodovacím stromu!


Vpředná indukce

Subgame perfect equilibrium

Hry s (ne)kompletními informacemi

Vraťme se k příkladu uvedenému na začátku tohoto textu. Žák má možnost domácí úkol (ne)vypracovat a učitel (ne)zkontrolovat. Po tahu žáka učitel neví v jaké části stromu se nachází, jeho znalost předchozích akcí je nekompletní. Přerušovaná čára značí jeden informační set, tj. jeden rozhodovací uzel. Ať už se hráč nachází v jedné či druhé části, jeho rozhodnutí bude vždy stejné, protože neví v které části se nachází.

Z toho plyne, že hra s nekompletní informací musí splňovat tyto podmínky:

  • Hráč(i) nezná celou historii hry
  • Alespoň jeden informační set není jedináček (obsahuje alespoň dva uzly grafu)
  • Všechny uzly v rámci informačního setu musí vést ke stejným rozhodovacím možnostem (pokud jeden uzel vede k možnostem nahoru, dolů a druhý k nahoru a doprava, pak se jedná o dva různé informační sety)

Postup řešení

Grafické znázornění je téměř stejné jako u hry s kompletní informací. Pouze se navíc přidá přerušovaná čára značící, že se jedná o jeden informační set a pravděpodobnost p a p-1, že se nacházíme v horní/dolní části stromu (viz níže).

Imperfect information.jpg

Příklady

The Centipede Game

Commitment Problems

Tying Hands (Burning Bridges)