Normální forma

From Simulace.info
Jump to: navigation, search

Normální forma vyjadřuje pomocí tabulky nebo matice užitky hráče v každé z kombinací akcí hráčů. Hráč může mít za cíl maximalizovat zisk nebo minimalizovat náklady. Namísto pojmu normální forma se může používat i pojem normální tvar.



Úvod

Partner, který právě prohrál bitvu pohlaví

Ukažme si nejprve, v jakém případě může být normální forma užitečná v teorii her a v běžném životě na každodenní situaci.

Každý z nás je dennodenně nucen udělat množství rozhodnutí. Některé z nich jsou jednoduché, některé mohou být docela složité. Vybrat si ráno, zda k snídani chcete chléb se šunkou nebo cereálie se sójovým mlékem může být docela jednoduché rozhodnutí. Každý může mít vlastní preference, na základě kterých se dokáže velmi rychle rozhodnout. Situace se může zkomplikovat, pokud chce partner připravit snídani pro sebe i pro svou partnerku, která místo maximalizace energetického příjmu a chuti ve vašem případě preferuje minimalizaci mastných kyselin, rafinovaného cukru a rizika srdečně-cévních problémů. Zároveň je však jednodušší připravit pro oba stejné snídaně, aby se minimalizovalo množství použitého kuchyňského náčiní. I na řešení takových rozhodovacích problémů zná účinné nástroje teorie her. Právě jsme popsali jednu z nejčastěji používaných modelových her - souboj pohlaví.



Základním předpokladem při teorii her je, že hráči jsou racionální, to znamená, že si jsou vědomi svých možností a svých preferencí. V našem případě to znamená, že vědí, které potraviny mají nakoupeny a které by právě k snídani upřednostnili. Teorii her je však možné použít i v mnohem komplexnějších rozhodovacích situacích, jako je výběr jídla k snídani.


Rozhodovací situace je charakterizována:

  • Možnými akcemi (snídání chleba se šunkou vs. snídání cereálií)
  • Užitkem jednotlivých akcí (vysoká energetická hodnota a chuť vs. nutriční hodnoty)
  • Preferencemi (partner preferujete chléb, partnerka cereálie)


Hry je možné zapsat ve dvou základních tvarech - normální formě a explicitní formě.

Hry v normální formě

Příklad: V našem případě snídaňové hry:

  • Množina hráčů je Failed to parse (MathML with SVG or PNG fallback (recommended for modern browsers and accessibility tools): Invalid response ("Math extension cannot connect to Restbase.") from server "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle Q = \{} partner, partnerkaFailed to parse (MathML with SVG or PNG fallback (recommended for modern browsers and accessibility tools): Invalid response ("Math extension cannot connect to Restbase.") from server "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \}}
  • Množina jejich tahů je Failed to parse (MathML with SVG or PNG fallback (recommended for modern browsers and accessibility tools): Invalid response ("Math extension cannot connect to Restbase.") from server "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle X = \{} chléb, cereálieFailed to parse (MathML with SVG or PNG fallback (recommended for modern browsers and accessibility tools): Invalid response ("Math extension cannot connect to Restbase.") from server "https://en.wikipedia.org/api/rest_v1/":): {\displaystyle \}}

Věnujme se nyní ohodnocení užitků jednotlivých strategií pro partnera a partnerku.


Užitky můžeme vyčíslit na základě preferencí následovně:

  • Partner nejvíce preferuje, aby oba snídali chléb, této možnosti přiřadí hodnotu 3. Druhá nejpreferovanější možnost v pořadí je ta, že partner i partnerka budou jíst cereálie. Partner sice nebude mít nejoblíbenější jídlo, alespoň však bude jednodušší mytí nádobí. Následuje možnost, že on bude jíst chléb a ona cereálie. Nejméně preferovaná možnost je, že on bude jíst cereálie a ona chléb.
  • Partnerka nejvíce preferuje, aby oba snídali cereálie, hodnota pro ní v tomto případě bude 3. Následují možnosti, že by oba snídali chléb (2), partner chléb a ona cereálie (1) a naopak, on cereálie a ona chléb (0).


Tabulka normální formy. Modrou barvou jsou vyznačené zisky partnera, červenou barvou zisky partnerky v jednoltivých případech kombinací akcí.
Tabulka normální formy antagonistické hry. V případě, že zisk jednoho hráče znamená ztrátu hráče druhého, neuvádíme v tabulce dvě hodnoty pro úžitkové funkce ale jenom jednu hodnotu pro každou kombinaci strategií. Jeden hráč se přitom snaží dosáhnout maximálních hodnot úžitkové funkce, druhý hráč minimálních hodnot.

Hru v normální formě můžeme zapsat pomocí matice nebo tabulky. Jelikož se v našem případě jedná o hru neantagonistickú (zisk jednoho hráče nejde na úkor hráče druhého), zapíšeme ji jako dvojmatici nebo tabulku se dvěma hodnotami v každé buňce. Tyto hodnoty budou vyjadřovat hodnoty užitkových funkcí obou hráčů pro všechny možnosti použitých strategií.


Poznámka: Při zápisu do tabulky se používá konvence, že hráč 1 vybírá řádky, hráč 2 vybírá sloupce a případný hráč 3 vybírá tabulku. V našem případě zisky partnera jsou označeny modrou barvou a zisky partnerky červenou barvou.


V modelu normální hry není přítomný čas. Každý hráč vybírá své akcie pouze jednou (v případě jednokolových her) a současně s ostatními hráči tak, že žádný z hráčů není informován o akci jiných hráčů v momentě, kdy vybírá svou vlastní akci.

Použití normální formy

Pomocí zápisu v normální formě vidíme, respektive víme vyvodit různé závěry o dané hře.



Jaké je tedy řešení souboje pohlaví?


Dominantní a bezpečná strategie

Partneři mohou při řešení postupovat pomocí dvou základních strategií, které lze vyčíst z normální formy:

  • Dominantní strategie je ta, při které je zisk daného hráče maximální, bez ohledu na to, jak se zachová partnerka. Pokud se partnerka rozhodne pro chléb, partner by se měl rozhodnout také pro chléb, protože dosáhne užitek 3, naproti nulovému užitku v případě, že by se rozhodl pro cereálie. Pokud se partnerka naopak rozhodne pro cereálie, měl by se i partner rozhodnout pro cereálie, protože v tomto případě by byl jeho užitek 2 naproti užitku 1 v případě, že by se partner rozhodl pro chléb. Pro partnera tedy dominantní strategie neexistuje. Podobně je to i v případě partnerky.
Dominantní strategie: V tabulkách je modrým pozadím vyznačen první krok partnera a červeným pozadím první krok partnerky. Kroužkem jsou pak označeny nejvýhodnější akce druhého protihráče. Jelikož jsou tyto zakroužkované políčka v různých sloupcích v prvním případě a v různých řádcích v druhém případě, v této hře neexistuje žádná dominantní strategie.
  • Bezpečná strategie, jejímž cílem je maximalizovat užitek v nejnepříznivějším případě. Při jejím stanovení hráč postupuje tak, že z minim užitků vybere maximum. V případě partnera, pokud by si vybral chléb, minimální hodnota užitku je 1. Pokud by si vybral cereálie, minimum by bylo 0. Maximum z těchto dvou hodnot je 1, bezpečná strategie pro něj tedy je vybrat si chléb. V případě partnerky, pokud by si vybrala chléb, minimální užitek by měla 0, v případě cereálií 1. Její bezpečná strategie je tedy vybrat si cereálie. Platí tedy, že pro oba je bezpečná strategie vybrat si kombinaci, kdy on bude snídat chléb a ona cereálie.
Bezpečná strategie: V tabulkách jsou zakroužkované minimální hodnoty užitků. Hrubým orámováním jsou pak vyznačeny bezpečné strategie parnera (vlevo) a partnerky (vpravo).


Je to ale optimální řešení? Kdyby partner změnil své rozhodnutí a snědl by místo chleba cereálie, zvýšil by se jeho zisk z 1 na 2. A kdyby partnerka změnila své rozhodnutí, přineslo by jí to také zisk 2 místo 1.

Nashovo equilibrium

Pokud se partneři rozhodli pro některou ze strategií, otázkou může být, zda se jednomu z nich v dané situaci vyplatí změnit rozhodnutí. Například, pokud se rozhodli pro možnost, že oba budou jíst k snídani chléb, partnerka se může zamýšlet nad tím, zda se jí nevyplatí místo chleba sníst cereálie. Z tabulky normální formy vidíme, že v takovém případě by se jeho zisk snížil z hodnoty 2 na hodnotu 1. Také partner se může zamýšlet, zda-li změní své rozhodnutí, nezvýší užitek. V tomto případě se ale i jeho užitek sníží, a to konkrétně ze 3 na 0. Znamená to tedy, že se jim nevyplatí změnit rozhodnutí. Analogicky by to platilo pro případ, že by se na začátku rozhodli pro možnost chléb, chléb. Říkáme, že tato hra má v těchto dvou možnostech Nashovo equilibrium.

Nashovo equilibrium

Ověřme ještě opačnou situaci. Řekněme, že se partner rozhodne sníst cereálie a partnerka chléb. V takovém případě bude užitek partnerky 0. Vyplatí se jí tedy změnit rozhodnutí a sníst chléb, protože tak dosáhne zisk 2. A naopak, pokud se partner rozhodne sníst chléb a partnerka cereálie, partnerčin zisk bude 1, vyplatí se jí tedy změnit rozhodnutí a sníst chléb, protože takto by dosáhla zisku 2. V těchto dvou možnostech tedy nenastává rovnováha.



Čistá a smíšená strategie

Pokud hráč volí svou strategii bez jakékoliv náhodnosti, říkáme, že jde o čistou strategii. Pokud by se partner rozhodl namísto racionálního rozhodnutí hodit si mincí, mluvili bychom o smíšené strategii, čili takové, v níž vystupuje prvek náhody. Nemusí však jít přímo o házení mincí. Partner se může rozhodnout vybrat náhodně, pokud si není jistý výběrem partnerky. Smíšené strategie nám však mohou přinést představu o tom, co by se mohlo stát, pokud by se jednalo o opakující se hru[5]. Čili pokud by se partneři před každým večerem rozhodovali znovu a znovu. I pro takový případ dokážeme vypočítat Nashovo equilibrium na základě zápisu v normální formě.

Nashovo equilibrium v smíšené strategii

Náš příklad má však ještě jedno Nashovo equilibrium. Nahoru jsme si ukázali dvě čisté Nashove equilibria. Nicméně existuje ještě jedno equilibrium ve smíšené strategii[1].

Řekněme, že partneři vybírají ze snídaňových možností náhodně. Partnerčina strategie je vybrat si chléb s pravděpodobností p a cereálie s pravděpodobností 1-p. Partner musí být indiferentní k libovolné ze svých možností. Jinak by se mu více vyplatilo vybrat některou z čistých strategií.

T5.png

Poté platí vztah:


Upartner(chléb) = Upartner(cereálie)

1 + 2p = 2 - 2p

p = 1/4


Partner bude tedy ochoten použít náhodný výběr, pokud si partnerka ve čtvrtině případů bude vybírat chléb a ve třech čtvrtinách cereálie.

Analogicky, partnerova strategie je vybrat si chléb s pravděpodobností q a cereálie s pravděpodobností 1-q. Partnerka musí být indiferentní k libovolné ze svých možností, jinak by se jí více vyplatilo vybrat některou z čistých strategií.

Platí tedy:


Upartnerka(chléb) = Upartnerka(cereálie)

2q + 0(1 – q) = 1q + 3(1-q)

2q = 3 – 2q

q = 3/4


Partnerka bude ochotna použít náhodný výběr, pokud si partner ve třech čtvrtinách případů bude vybírat chléb a v jedné čtvrtině případů cereálie.

Převod mezi normální a explicitní formou

Explicitní forma hry bývá používána k formalizaci her, ve kterých hraje roli pořadí tahů. Hry jsou reprezentovány jako stromy. Každý uzel zde reprezentuje místo, ve kterém některý z hráčů vybírá tah, každá hrana odpovídá možnému tahu[3].

Explicitní i normální forma mohou popisovat stejnou hru. Ukažme si, jak je možné pro hru v normální formě najít její ekvivalent v explicitní formě. Pokud chceme zapsat hru Souboj pohlaví v explicitní formě, zapíšeme ji, jakoby jeden z hráčů provedl tah první a druhý hráč nemá možnost pozorovat tah prvního hráče. Tím zachováme stejnou míru informovanosti ale změníme tahy na sekvenční[2].


E1.png

Pokud chceme naopak pro hru v explicitní formě najít ekvivalentní hru v normální formě, postupujeme tak, že si vypíšeme všechny čisté strategie pro každého hráče. Hráč 1 má k dispozici strategie chléb a cereálie. Hráč 2 má k dispozici strategie chléb a cereálie. Do tabulky pak vpíšeme hodnoty ziskových funkcí z listů stromu explicitní formy. Na základě čistých strategií hráčů víme zapsat hru v normální formě:

E1n.png

Normální forma poskytuje minimální množství informací potřebných pro popis hry. Dokážeme z ní identifikovat hráče, strategie jednotlivých hráčů a jejich výsledné zisky. Explicitní forma navíc poskytuje informaci o hře co se týče časového pořadí rozhodnutí a množství informací, které je pro hráče k dispozici, když provádějí své akcie. Platí, že každou hru v explicitní formě je možné převést na právě jednu ekvivalentní hru v noromálné formě. Naopak však pro každou hru v normální formě můžeme najít několik možných zápisů v explicitní formě[4]. Například souboj pohlaví bychom v hru explicitní formě mohli zapsat i následovně:

E2.png

Explicitní forma totiž popisuje i pořadí, v jakém hráči své akcie provádějí. Proto zaměnění partnera za partnerku v prvním uzlu popisujeme již odlišnou hru. Na druhé straně vyměněnu řádků za sloupce v tabulce normální formy ke změně informace nepřichází.


Příklady k řešení

Konkurence na trhu

Přebrané z [6].


Řekněme, že IBM a Dell Computer mají k dispozici velké množství počítačů, které by chtěli prodat dříve, kterak bude představena nová generace rychlejších a levnějších počítačů. Otázka, jejíž oba konkurenti čelí, je zda mají investovat do výprodejové reklamní kampaně, nebo jen nechat, aby se zásoby postupně vyprodali samy v průběhu několika následujících měsíců. Pokud budou oba agresivně propagovat jejich produkty v celonárodní reklamní kampani, každý z nich vydělá 5 milionů dolarů. Pokud bude jeden propagovat a ne, ten, který bude propagovat, vydělá 20 milionů, zatímco ten, který propagovat nebude, vydělá 2 miliony. Pokud nebude propagovat žádný z konkurentů, oba vydělají po 10 milionů. Cílem obou je maximalizovat zisk v této jednokolové hře[6].

Otázky:

  • Jaká je dominantní strategie obou konkurentů?
  • Jaká je bezpečná strategie obou konkurentů?

Koncepty teorie her

Přebrané z [6].


Posuďte, zda jsou následující tvrzení správné nebo ne. Zdůvodněte[6].

A. Množina strategií je Nashových Equilibrio pokud žádný z hráčů nemůže vylepšit svou pozici za předpokladu, že strategie protihráčů se nezmění.   B. Bezpečná strategie je velmi konzervatínva a hráč by ji měl zvážit pouze v případě, že je identická s protihráčova optimální strategií.   C. Dominantní strategie je současně bezpečnou strategií, ale ne každá bezpečná strategie je nezbytně dominantní strategií.

D. Pokud hráč nemá žádnou dominantní strategii, vyplatí se podívat se na hru z pohledu protihráče a předpokládat, že protihráč využije jeho dominantní strategii.

Reference

[1] SHOHAM, Yoav a LEYTON-BROWN, Kevin. Introduction to Noncooperative Game Theory: Games in Normal Form. Strana 63. 2008. Dostupné online na http://www.eecs.harvard.edu/~parkes/cs700/gt_chapter.pdf.
[2] ZHENG, Bingyong. Extensive form game. Strana 2. SHUFE Spring, 2011. Dostupné online na http://bb.shufe.edu.cn/bbcswebdav/institution/%E7%BB%8F%E6%B5%8E%E5%AD%A6%E9%99%A2/teacherweb/2006000057/lecture2.pdf.
[3] BERKA , Petr. Inteligentní systémy. Sekce 3.1.3. Oeconomica Praha, 2008. Dostupné online na http://sorry.vse.cz/~berka/docs/4iz430/P03-Teorie%20her.pdf.
[4] ROMP, Graham. Game Theory: Introduction and Applications. Strana 12. Oxford University Press. New York, 1997.
[5] SHOHAM, Yoav a LEYTON-BROWN, Kevin, JACKSON Mathew. Game Theory Course: Computing Mixed Nash Equilibrium (1). Strana 12. Dostupné online na http://www.cs.ubc.ca/~kevinlb/teaching/cs532l%20-%202012-13/lectures/week2.pdf.
[6] Suong Jian a Liu Yan. Game Theory and Competitive Strategy . Guangdong University of Finance. Strana 420 - 422. Dostupné online na http://bm.gduf.edu.cn/kcpt/gljjxsj/%E5%88%86%E7%AB%A0%E8%AF%BE%E5%90%8E%E7%BB%83%E4%B9%A0(%E9%99%84%E7%AD%94%E6%A1%88-PDF%E7%89%88)/Chapter%2014.pdf