Meta-strategie

From Simulace.info
Revision as of 22:58, 5 June 2019 by Xreij15 (talk | contribs) (Téma je tímto dosti vyčerpané. Na 14000 bytů byto dostalo už jen lorem ipsum)
(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)
Jump to: navigation, search


Meta-strategie jsou různé strategie v teorii her, kterými se hráči řídí v rámci opakovaných her. Meta-strategie se z pravidla uvažují u opakovaného vězňova dilema, tedy u vícekolové hry dvou hráčů, ve kterých může každý z hráčů buďto spolupracovat, nebo zradit druhého hráče.

U opakovaných her se předpokládá, že je hráči opakovaně řešena stejná úloha se stejnými možnými výsledky. Meta-strategie se potom obvykle berou v úvahu u nekonečně opakovaných her a u konečně opakovaných her s neznámým koncem. Hráči také znají předchozí kroky spoluhráče a mohou se na jejich základě řídit. V takovém případě si mohou hráči vybrat v průběhu hry, nebo již na jejím začátku optimální plán, kterým se budou ve svém rozhodování řídit - meta-strategii.

Jednoduché strategie

Existují tři jednoduché meta-strategie, které určují rozhodnutí hráče, ale ve svém principu neberou v potaz předchozí ani budoucí možné rozhodnutí protihráče.

  • Vždy zrazuj (Always Deflect) - Jedná se o strategii, kdy hráč za každých okolností zradí druhého hráče.
  • Vždy spolupracuj(Always Cooperate) - Jedná se o strategii, kdy hráč za každých okolností spolupracuje s druhým hráčem.
  • Náhodné rozhodování - V tomto případě se hráč rozhoduje vždy náhodně a

pravděpodobnost jednotlivých rozhodnutí je stejná, tedy vždy 50 na 50.

  • Střídavá strategie - Hráč se střídavou strategií střídá pravidelně zradu a spolupráci, ať se děje co se děje.
  • Periodické strategie - U periodických strategií hráč opět nebere v úvahu strategii druhého hráče. Tentokrát se v jeho chování opakují předem určené sekvence. Například Spolupráce - Spolupráce - Zrada nebo Zrada - Zrada - Spolupráce a tak podobně.
  • Lepší a lepší (Better and Better) - Hráč zradí s pravděpodobností (1000 - pořadí kola) / 1000. Tedy se stále menší pravděpodobností. Tento princip lze kombinovat i s ostatními strategiemi.
  • Horší a horší (Worse and Worse) - Hráč zradí s pravděpodobností (pořadí kola) / 1000). Tedy se stále větší pravděpodobností. Tento princip lze zakombinovat i do ostatních strategií.


Složité strategie

Existuje také řada složitějších strategií, které berou v úvahu předchozí rozhodnutí druhého hráče a na jejich základě vybírá akci, kterou provede v kole následujícím. Tato rozhodnutí mohou v závislosti na strategii ovlivňovat jedno následující kolo, několik následujících kol, nebo dokonce všechna následující kola.

Oko za oko

Oko za oko (Tit for Tat) Je nejznámější a pravděpodobně také nejčastěji volenou strategií. Jedná se o strategii založenou na reciprocitě - hráč se vždy snaží spolupracovat, ale každou zradu oplatí právě jednou. Proffesor Robert Axelrod z Univerzity v Michiganu uspořádal v osmdesátých letech dva "turnaje" za účelem zkoumání strategií u opakovaných her. Strategie Tit for Tat se vždy ukázala jako vítězná. Existují také další varianty strategie Oko za oko.

  • Naivní pokušitel (Naive Prober) - Stejné jako základní strategie, ale občas pokusí protihráče a občas zradí.
  • Lítostivý pokušitel (Remorseful Prober) - Taktéž občas náhodně zradí, na oplátku druhého hráče však již neodpovídá další zradou - snaží se vyhnout následnému cyklu střídajícího zradu a spolupráci.
  • Stupňující se Oko za oko (Gradual TFT) - U této strategie hráč spolupracuje, dokud druhý hráč nezradí. Po první zradě jednou zradí a alespoň dvakrát spolupracuje. Po druhé zradě dvakrát zradí a dvakrát spolupracuje. Po n-té zradě n-krát zradí a dvakrát spolupracuje, a tak dále.
  • Oko za dvě oči (Tit for 2 Tats) - Hráč, který si zvolil tuto variantu vždy spolupracuje, vyjma případů, kdy druhý hráč zradí dvakrát po sobě.
  • Tvrdý Joss (Hard Joss) - S touto strategií hráč hraje stejně jako standardní Oko za oko, ale spolupracuje poze s 90% pravděpodobností na spolupráci.
  • Něžná Joss (Soft Joss) - Tato strategie se opět hraje jako Oko za oko, ale zrazuje na oplátku pouze s 90% pravděpodobností.


Postupný zabiják

Další možnou strategií je Gradual Killer. Hráš s touto strategií v prvních pěti kolech zradí, a pak ve dvou kolech spolupracuje. Pokud druhý hráč v šestém a sedmém kole zradí, pak do konce hry vždy volí zradu. V opačném případě navždy spolupracuje.

Většinová strategie

Pokud hráč využívá tuto meta-strategii, vybírá takové rozhodnutí, které protihráč vybral ve všech předchozích kolech nejčastěji. Tato strategie se může dále dělit na tvrdou a jemnou. Pokud druhý hráč zradil a spolupracoval se stejnou četností, u tvrdé většinové strategie hráč zradí. U jemné pak naopak spolupracuje.

Pavlov

Meta-strategie s názvem Pavlov volí spolupráci, pokud v předchozím kole oba hráči zvolili stejně (v případě spolupráce i zrady). V opačném případě hráč volí zradu.

Nevraživá strategie

V případě nevraživé strategie (Grudgeful strategy) hráč spolupracuje do té doby, dokud druhý hráč nezradí. V takovém případě již neodpouští a vždy volí zradu.


Kategorizace strategií

Strategie se podle Axelroda mohou dělit do osmi kategorií, a to vždy do jedné ze dvou možných.

  • Milá vs. Podlá strategie. Milá strategie nikdy nezvolí zradu jako první, vždy poze na oplátku. Za to podlá strategie alespoň někdy tvolí zradu jako první. V Axelrodově turnajích milé strategie z pravidla získávali více bodů, než strategie podlé.
  • Odpouštějící avs.í se odpustit a začít znovu spolupracovat. V případě neodpouštějící strategie hráč zrady druhého hráče nezapomíná a buďto pokračuje v neustálem cyklu oplácení, nebo přímo volí zradu za jakýchkoliv podmínek.
  • Nezávistivá vs. Závistivá strategie. Nezávistivá strategie se nesnažý zbytečně poškodit soupeře. Snaží se naopak maximalizovat vlastní užitek (který obvykle plyne z kooperace obou). Naopak hráč se závistivou strategií činí takové volby, aby co nejvíce poškodil soupeře.
  • Vyprovokovatelná vs. Nevyprovokovatelná strategie. Nevyprovokovatelná strategie se drží stálé struktury a stejným způsobem provádí spolupráci nebo zradu na základě chování soupeře. Popřípadě jeho chování vůbec nebere v úvahu. Oproti tomu vyprovokovatelná strategie na základě chování druhého hráče může své chování eskalovat, obvykle stále častější volbou zrady na úkor vzájemné spolupráce.

Použité zdroje

AXELROD, Robert M. The evolution of cooperation. New York: Basic Books, c1984. ISBN 0-465-02122-0.

OSBORNE, Martin J. a Ariel RUBINSTEIN. A course in game theory. Cambridge, Mass.: MIT Press, c1994. ISBN 0-262-15041-7.

AXELROD, Robert. “Effective Choice in the Prisoner's Dilemma.” The Journal of Conflict Resolution, vol. 24, no. 1, 1980, pp. 3–25.

HYŠKOVÁ, Magdalena (2011). Přednášky - Teorie her 6. Opakované hry. FD ČVÚT v Praze.