http://www.simulace.info/api.php?action=feedcontributions&user=Xmolm00&feedformat=atomSimulace.info - User contributions [en]2024-03-29T15:54:56ZUser contributionsMediaWiki 1.31.1http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12299Metods for interpretation of MC simulation results/cs2016-06-12T19:24:51Z<p>Xmolm00: </p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek, je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnot nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' je uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není matematicky konstruována a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomenou tyto hrozby, což může vést ke špatné dedukci. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď počasí v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulace se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnost jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příhodné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly", je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se zde rozumí simulace, která vychází podle představ zadavetele problému, nicméně díky zkreslenému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci, je zárověň se zvyšujícím se příjmem, také zvyšující se hrozba krachu. Pro příklad čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím jej nelze matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12297Metods for interpretation of MC simulation results/cs2016-06-12T19:24:30Z<p>Xmolm00: </p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek, je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnot nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' je uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není matematicky konstruována a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomenou tyto hrozby, což může vést ke špatné dedukci. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď počasí v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulace se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnost jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příhodné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly", je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se zde rozumí simulace, která vychází podle představ zadavetele problému, nicméně díky zkreslenému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci, je zárověň se zvyšujícím se příjmem, také zvyšující se hrozba krachu. Pro příklad čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím jej nelze matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12295Metods for interpretation of MC simulation results/cs2016-06-12T19:19:31Z<p>Xmolm00: /* Rizika špatné interpretace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek, je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnot nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' je uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není matematicky konstruována a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomenou tyto hrozby, což může vést ke špatné dedukci. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď počasí v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulace se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnost jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příhodné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly", je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se zde rozumí simulace, která vychází podle představ zadavetele problému, nicméně díky zkreslenému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci, je zárověň se zvyšujícím se příjmem, také zvyšující se hrozba krachu. Pro příklad čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím jej nelze matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12290Metods for interpretation of MC simulation results/cs2016-06-12T19:03:18Z<p>Xmolm00: </p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek, je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnot nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' je uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12289Metods for interpretation of MC simulation results/cs2016-06-12T19:02:13Z<p>Xmolm00: /* Rozhodování o výsledku */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek, je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnot nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' je uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12287Metods for interpretation of MC simulation results/cs2016-06-12T18:57:24Z<p>Xmolm00: /* Interval spolehlivosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <math><-1000; 3000></math> $. V intervalu <math>(0; 3000></math> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě z druhé strany není zisk nijak omezen. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí teploty. To znamená, že kotel nemůže být vždy vypnutý, a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12284Metods for interpretation of MC simulation results/cs2016-06-12T18:53:23Z<p>Xmolm00: /* Metoda maximální věrohodnosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu je dostatečné množství dat klíčové.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12283Metods for interpretation of MC simulation results/cs2016-06-12T18:52:18Z<p>Xmolm00: /* Metoda maximální věrohodnosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.(DUPAČ,HRUŠKOVÁ, 2004)<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu klíčové mít dostatečné množství dat.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12281Metods for interpretation of MC simulation results/cs2016-06-12T18:50:52Z<p>Xmolm00: /* Metoda maximální věrohodnosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''. Následující definice je citována.<br />
<br />
Nechť <math>X = (X_{1},...,X_{n})</math> je náhodný výběr a <math>x = (x_{1},...,x_{n})</math> je jeho realizace. Nechť je<br />
dále popsána populace pomocí regulární hustoty <math>f(x,\Theta)</math> , kde <math>\Theta</math> je neznámý parametr. Potom<br />
funkci <math>L(x,\Theta) = L(x_{1},...,x_{n},\Theta) = f(x_{1},\Theta) * f(x_{2},\Theta)......f(x_{n},\Theta)</math> <br />
budeme nazývat '''věrohodnostní funkcí'''.<br />
<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Funkce je označovaná L jako likelihood z anglického věrohodnost. Metoda maximální věrohodnosti spočívá v tom , že se za odhad neznámého parametru (neznámých parametrů) zvolí hodnota <math>{\hat {\theta }}</math>, která při daných hodnotách maximalizuje funkci<br />
věrohodnosti.''<br />
}}<br />
<br />
<br />
Jestliže existuje bod <math>{\hat {\theta }}</math> z parametrického prostoru ,takový že pro všechny hodnoty<br />
parametru <math>\theta</math> z parametrického prostoru platí<br />
<math>L(X,\theta) \leq L(X,{\hat {\theta }})</math><br />
<br />
potom nazveme tento bod '''maximálně věrohodným odhadem''' neznámé hodnoty parametru <math>\theta</math>.<br />
Pokud je funkce maximální věrohodnosti dostatečně hladká, pak je možné hledání<br />
maximálních hodnot zjednodušit na prosté hledání maxim pomocí parciálních derivací. <br />
V mnoha případech nemusíme pracovat přímo s věrohodnostní funkcí <math> L(x_{1},...,x_{n},\Theta)</math>, ale<br />
s jejím logaritmem (součin hustot bude nulový jen na míře nula, proto můžeme použít<br />
logaritmus). Protože je funkce logaritmus prostá a rostoucí, budou všechny maximální<br />
hodnoty funkce <math>ln(L(x_{1}....,x_{n},\Theta))</math> stejné jako funkce <math>L(x_{1}....,x_{n},\Theta)</math>.<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10.3.1. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. '''Pro tuto metodu klíčové mít dostatečné množství dat.'''<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12278Metods for interpretation of MC simulation results/cs2016-06-12T18:08:06Z<p>Xmolm00: /* Metoda maximální věrohodnosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
'''Popis metody'''<br />
<br />
Metoda maximální věrohodnosti umožňuje počítat velmi dobré odhady jednotlivých parametrů. Centrální výpočetní formulí je tzv. '''věrohodnostní funkce'''.<br />
<br />
<ref>KOHOUT, Václav. <i>Teorie odhadu, Skriptum ZCU</i> [online]. ZČU Plzeň: 22.04.2004. Kapitola 10. [http://www.kmt.zcu.cz/person/Kohout/info_soubory/letnisem/zs/stat10.pdf Dostupné online]. (česky)</ref><br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad '''věrohodnosti''' dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<ref>DUPAČ, Václav; HUŠKOVÁ, Marie. <i>Pravděpodobnost a matematická statistika.</i> Praha : Nakladatelství Karolinum, 2005. 162 s. ISBN 80-246-0009-9.</ref><br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12277Metods for interpretation of MC simulation results/cs2016-06-12T17:56:08Z<p>Xmolm00: /* Histogram */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky převedeny tak, aby měl každý sloupec x vyobrazenou reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12275Metods for interpretation of MC simulation results/cs2016-06-12T17:54:50Z<p>Xmolm00: /* Histogram */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst [http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html zde]. Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že zde existuje mnoho parametrů předem neznámých, které působí jako nejistota velikosti trhu, náklady společnosti, její výnosy, konkurenci a jiné. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků. Pro ilustraci je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, je třeba se spíše zajímat o hodnoty. Ty jsou statisticky převoditelné, jak se může čtenář přesvědčit v následujících kapitolách. Jednoduše lze pak také vyvodit, zda je výsledek vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz naformulován tak, aby odpovědí byl jasný trend profitu. <br />
<br />
Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby měl každý sloupec x reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12270Metods for interpretation of MC simulation results/cs2016-06-12T17:45:12Z<p>Xmolm00: /* Proces sestrojení simulace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Grafické znázornění cituje B.Boehma: "Are we building the product right?" Vztaženo na model simulace zde představuje hodnotu takovéhoto vyjádření: "Navrhujeme model správně?"''<br />
}}<br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
{{ambox<br />
| type = notice<br />
| text = ''Obdobnou změnou u validace dochází k volnému překladu citace "Are we building the right product?" jako "Navrhujeme správný model?" ''<br />
}}<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12246Metods for interpretation of MC simulation results/cs2016-06-12T16:29:46Z<p>Xmolm00: /* Proces sestrojení simulace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: https://www.google.gr/url?sa=i&rct=j&q=&esrc=s&source=images&cd=&ved=0ahUKEwjfz5j286LNAhWIyRQKHV_SB7sQjBwIBA&url=http%3A%2F%2Fimg.docstoccdn.com%2Fthumb%2Forig%2F36524659.png&bvm=bv.124272578,d.d24&psig=AFQjCNHAyBlzsN7_GLUnYSCaqp-vXkts9g&ust=1465835218294858</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=File:Vvsv.png&diff=12245File:Vvsv.png2016-06-12T16:28:57Z<p>Xmolm00: Xmolm00 načetl novou verzi File:Vvsv.png</p>
<hr />
<div></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12243Metods for interpretation of MC simulation results/cs2016-06-12T16:25:29Z<p>Xmolm00: /* Proces sestrojení simulace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs. validace <ref>Obr. ze zdroje: http://rdn-consulting.com/blog/2009/03/26/software-verification-vs-validation/</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Validací se rozumí procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupu i v modelu. Taková data, jejichž interval musí v hodnotách kopírovat "hodnoty" reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12241Metods for interpretation of MC simulation results/cs2016-06-12T16:23:11Z<p>Xmolm00: /* Proces sestrojení simulace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Také se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Pomocí vytvořeného modelu je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci zobrazí pravděpodobnou variantu výsledku. Aby byly výsledky simulace relevantní, je třeba ji spustit několikrát za sebou se stejným nastavením parametrů. Výsledky/výstupy se vkládají do tabulky, ze které lze pak vytvářet rozhodovací tabulky, statistické výpočty či konstruovat grafy. O tomto tématu bude pojednáno v kapitole o metodách interpretace výsledků.<br />
<br />
==Verifikace==<br />
[[File:Vvsv.png|thumb|right|Verifikace vs validace <ref>Obr. ze zdroje: http://rdn-consulting.com/blog/2009/03/26/software-verification-vs-validation/</ref>]]<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
<br />
==Metody interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=File:Vvsv.png&diff=12240File:Vvsv.png2016-06-12T16:21:44Z<p>Xmolm00: </p>
<hr />
<div></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12233Metods for interpretation of MC simulation results/cs2016-06-12T16:14:22Z<p>Xmolm00: /* Úvod */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme poštovní holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě způsob interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12121Metods for interpretation of MC simulation results/cs2016-06-12T13:02:10Z<p>Xmolm00: /* Interpretace výsledků */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12117Metods for interpretation of MC simulation results/cs2016-06-12T12:58:41Z<p>Xmolm00: /* Rizika špatné interpretace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. Tato problematika je zahrnuta v kapitole ''Verifikace''.<br />
<br />
==Nesprávná data==<br />
Tento problém je jednoduše pochopitelný. Když se na vstup dostanou chybná data, dá se předpokládat, že simulace nasimuluje ve výstupu výsledky relevatní vstupním parametrům. Kontrola vstupních dat je nutná a v tomto učebním textu již byla zmíněna termínem ''Validace''. Ověřování dat je stejně, ne-li více důležité, než samotný proces simulace.<br />
<br />
==Málo spuštěných simulací==<br />
Statistika dokáže být silný nástroj, ale pouze tehdy, když disponuje dostatečným množstvím dat. Proto je nutné simulaci spustit několikrát po sobě, i se stejnými parametry, aby se mohly výsledky statisticky interpretovat. S malou datovou základnou nelze vyvodit správný závěr.<br />
<br />
==Špatná interpretace dat==<br />
Výše zmíněné metody pro interpretaci statistických výsledků, nejsou samozřejmě alfou omegou pro každou simulaci. Vhodnot jejich použití je klíčová. Lidský přístup velí k rychlému porozumění výsledkům, a tím se rozhodně řídí i skupina histogramů a jiné graficky příjemné diagramy. Výzkumné zprávy vyžatují tvrdá data a tabukou jasně definované hranice výsledků. Rozhodování o financích bude kombinací vhodných grafů a zodpovězenou otázkou.<br />
<br />
==Výsledek není stoprocentní==<br />
Ačkoliv může být model sebelepší, data ověřená, počet spuštěných testů bude dostatečný a zpracování výsledků "user-friendly" je třeba brát v potaz, že model nikdy není dokonalý. Dochází totiž i k extrémním případům chování, zaviněného náhodnými veličinami, které model nemusel ve výsledku zahrnout. Pro interval spolehlivosti 99% je vždy jednoprocentní šance, že se systém bude chovat úplně jinak. To je třeba brát v potaz.<br />
<br />
==Skrytá nástraha==<br />
Skrytou nástrahou se rozumí simulace, která vychází podle představ autora, nicméně díky jinému pohledu je výsledek klamný. Typickým příkladem je příjem společnosti, který se zvyšuje. Co ale není zahrnuto v simulaci je zárověň s příjmem svyčující se hrozba krachu. Čím je firma na trhu viditelnější, stává se terčem silnější konkurence, která může společnost zničit. Toto riziko se špatně odhaluje a tím nelze jej matematicky jakkoliv vyloučit. Samozřejmě pokud je simulace komplexnější, a zahrnuje i vzestupy konkurencí a další faktory trhu, mohou být tyto hrozby minimalizovány.<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12092Metods for interpretation of MC simulation results/cs2016-06-12T12:17:44Z<p>Xmolm00: /* Jiný pohled */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Rizika špatné interpretace=<br />
Tato kapitola není konstruována matematikou a má za úkol čtenáře seznámit s možným úskalím při vyhodnocování výsledků, ať už jakoukoliv metodou. Velmi lehce se ale opomene na tyto hrozby, což může vést ke špatné dedukce. Následkem mylného pochopení dat, či chybě v modelu se pak vytváří neprávná rozhodnutí.<br />
<br />
==Nevhodný model reality==<br />
Snadno se stane, že zkonstruovaná simulace, která je vytvořena třetí stranou, může být chybná nebo použita pro úzké praktické využití, do kterého úplně nezapadá žádaný příklad. Simulace předpovědi počasí na horách bude mít nejspíše specifické vlastnosti, které se nehodí například pro předpověď v nížinách, na pouštích či nad oceány. Vždy je vhodné si přečíst dokumentaci k vydané simulaci a zjistit, jestli je simulace použitelná pro zadaný příklad. <br />
<br />
==Vágní simulace==<br />
Vytváření správných simulací je nelehký úkol. Vždy se postupuje od sestavení kostry simulace. Následně se simulace zesložiťuje a nabírá na komplexitě. Samozřejmě, že při majoritním rozšiřování komplexity je nutné simulaci řádně testovat, neboť počet chyb v chování simulace roste s přibývající složitostí. Řídit se ale výsledky z nedokončené nebo příliš jednoduché simulaci se nemusí vyplatit. <br />
<br />
==Nesprávná data==<br />
<br />
==Málo spuštěných simulací==<br />
<br />
==Výsledek není stoprocentní==<br />
<br />
==Skrytá nástraha==<br />
<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=12082Metods for interpretation of MC simulation results/cs2016-06-12T11:47:27Z<p>Xmolm00: /* Forma výsledků */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Rozhodování o výsledku=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke reprezentaci výsledků simulace. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro zadanou hodnotu platí, že výsledek simulace se srovnává pomocí operátorů větší, rovno a menší než. Typickým příkladem mmůže být simulace pro výpočet růstu mzdy. Růst mzdy se vypočítává podle ohodnocení zaměstnance, fixního procenta a také podle profitu firmy. Jednotlivec si rozhodne, podle svého užitku, o jakou minimální část chce svoji výplatu rozšiřovat. Tu pak porovnává s výsledekm simulace. Je-li ve vetšině případů (interval spolehlivosti) růst stejný nebo vyšší, pak ve firmě zůstává. Shledá-li svůj užitek vyšší než předpokládaný růst mzdy, pak si může například hledat nové pracovní místo.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11872Metods for interpretation of MC simulation results/cs2016-06-11T15:15:31Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11871Metods for interpretation of MC simulation results/cs2016-06-11T15:14:34Z<p>Xmolm00: </p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11870Metods for interpretation of MC simulation results/cs2016-06-11T15:14:04Z<p>Xmolm00: /* Reference */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11869Metods for interpretation of MC simulation results/cs2016-06-11T15:09:43Z<p>Xmolm00: /* Histogram */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.<ref name="vertex">Wittwer, J.W., <i>Monte Carlo Simulation Basics</i> From Vertex42.com, June 1, 2004, http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html</ref> Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11868Metods for interpretation of MC simulation results/cs2016-06-11T15:04:29Z<p>Xmolm00: /* Interval spolehlivosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg|thumb|right|95% interval spolehlivosti<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=File:Est.jpg&diff=11867File:Est.jpg2016-06-11T15:03:25Z<p>Xmolm00: </p>
<hr />
<div></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11866Metods for interpretation of MC simulation results/cs2016-06-11T15:02:22Z<p>Xmolm00: /* Interval spolehlivosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
<br />
[[File:est.jpg||||<ref>Obr. ze zdroje http://www.kean.edu/~fosborne/bstat/06amean.html</ref>]]<br />
<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
<br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? Protože ne vždy je výsledek aplikovatelný k pouze jedné hodnotě nebo je tolerance problému omezena. <br />
<br />
Například pro firmu je důležité utržit zisk, proto musí být profit větší než 0 a samozřejmě není nijak omezena. Ale pro rozhodnutí, na kolik minut je puštěn kotel k udržování zadané teploty (úloha pro termostat - možný námět na simulaci) musí být hodnota v rozmezí. TO znamená že kotel nemůže být vždy vypnutý a zároveň nikdy neběží donekonečna.<br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11865Metods for interpretation of MC simulation results/cs2016-06-11T14:47:29Z<p>Xmolm00: /* Metoda maximální věrohodnosti */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. <br />
<br />
Jakým způsobem jsou data zpracována, může čtenář naleznout [http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf zde]. Důležité ovšem je, že tato metoda pomáhá vytvořit odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat.<br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11864Metods for interpretation of MC simulation results/cs2016-06-11T14:41:16Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable" cellpadding="10"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable" <br />
!α !!<math>D_{2max}</math><br />
|-<br />
|style="width:100px;"|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11863Metods for interpretation of MC simulation results/cs2016-06-11T14:36:54Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
{| class="wikitable"<br />
!α !!<math>D_{1max}</math><br />
|-<br />
|0,2 ||<math>{\frac {1.07}{\sqrt {n}}}</math><br />
|-<br />
|0,1 ||<math> {\frac {1.22}{\sqrt {n}}}</math><br />
|-<br />
|0,05 ||<math> {\frac {1.36}{\sqrt {n}}}</math><br />
|-<br />
|0,02 ||<math> {\frac {1.52}{\sqrt {n}}}</math><br />
|-<br />
|0,01 ||<math> {\frac {1.63}{\sqrt {n}}}</math><br />
|}<br />
<br />
'''Test pro 2 výběry'''<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
{| class="wikitable"<br />
!α !!<math>D_{2max}</math><br />
|-<br />
|0,2 ||<math>1.07{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,1 ||<math>1.22{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,05 ||<math>1.36{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,02 ||<math>1.52{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|-<br />
|0,01 ||<math>1.63{\sqrt {\frac {n_{1}+n_{2}}{n_{1}n_{2}}}}</math><br />
|}<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11862Metods for interpretation of MC simulation results/cs2016-06-11T14:11:57Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem, jehož výslledek představuje hodnocené kritérium: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
Test pro 2 výběry slouží ke srovnávání 2 výběrů rozdělení náhodných veličin.<br />
<br />
V hypotéze <math>H_{0}</math> je uvedeno, že u obou výběrů dochází ke stejnému rozdělení. Srovnávání probíhá podobným způdobem jako u testu s jedním výběrem. V testu pro 2 výběry se porovnává rozdíl buď kumulativních četností, a to pro ( <math> n\leq 40</math> ) anebo se srovnává rozdíl 2 výběrů relativních kumulativních četností pro ( <math> n>40</math> ). Přitom platí, že <math> n_{1},n_{2}</math> představují sumy počtu elementů z výběru. výpočet kumulativních četností je uveden v kapitole Test pro 1 výběr. Pro relativní kumulativní četnosti platí následující formule: <math> F_{1i}={\frac {1}{n}}N_{1i}</math> , <math> F_{2i}={\frac {1}{n}}N_{2i}</math> . Hodnoceným kritérium je <math>D_{2}</math> :<br />
<br />
<math> D_{2}=\max _{i}|N_{1i}-N_{2i}|\</math> , <math> D_{2}=\max _{i}|F_{1i}-F_{2i}|\</math> .<br />
<br />
<math>D_{2max}</math> se vypočítá k vybrané hladině významnosti podle tabulky:<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11856Metods for interpretation of MC simulation results/cs2016-06-11T13:49:23Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Tato metoda <ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref>, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11855Metods for interpretation of MC simulation results/cs2016-06-11T13:48:26Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref><br />
<br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11854Metods for interpretation of MC simulation results/cs2016-06-11T13:48:00Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích.<br />
<br />
<br />
'''Test pro 1 výběr'''<br />
<br />
<br />
<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref><br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11853Metods for interpretation of MC simulation results/cs2016-06-11T13:47:24Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<ref name="pavlik">Pavlík J.: <i>Aplikovaná statistika.</i> Vysoká škola chemicko-technologická v Praze, Praha 2005.<br />
ISBN 80-7080-569-2</ref><br />
<br />
Testo test ověřuje druh hypotéz, které zkoumají, zda má výsledek testu (proměnná) určité rozdělení (např. normální). <br />
<br />
Výběr dat, určený k testování teoretického rozdělení, se uvede hypotézou <math>H_{0}</math>. Ke vstupu je nutné zasadit k tříd výběru <math>k</math> testování a jaký je druh teoretického rozdělení ke každé třídě. Všechny tyto třídy testovaného výběru pak musí mít spočteny četnosti <math> n_{1i}</math> a stejně tak se spočítají četnosti i pro teoretické rozdělení <math> n_{2i}</math>. Vzorec pro četnost: <math>f_{i}={\frac {n_{i}}{N}}={\frac {n_{i}}{\sum _{i}n_{i}}}</math>. <br />
<br />
Poté je třeba aplikovat kumulativní rozdíl četností pro <math> N_{1i}</math> a <math> N_{2i}</math>. Pro znázornění jak vypočítat <math> N_{ai}=\sum _{j=1}^{i}n_{aj}</math>, kde <math>a</math> představuje 1 nebo 2 v závislosti k hodnocení třídy výběru nebo k hodnocení třídy teoretického rozdělení.<br />
<br />
Rozdíl je pak formulován následujícím vzorcem: <br />
<br />
<math> D_{1}={\frac {1}{n}}\max _{i}|N_{1i}-N_{2i}|\</math> , kde <math>n</math> zastupuje celkový počet prvků výběru.<br />
<br />
<br />
Výsledná hodnota <math>D_{1}</math> je srovnána s <math>D_{1max}</math>, což je krajní hodnota pro hladinu význmnosti, značená α.<br />
Pro celkový počet výběru <math>n\leq 40</math> je rozdělení k dispozici [http://dlc.erieri.com/onlinetextbook/index.cfm?fuseaction=textbook.appendix&FileName=Table7 zde]. Pokud je <math>n>40</math>, <math>D_{1max}</math> je nutné spočítat. K tomuto účelu se podle níže uvedené tabulky tato hodnota dopočítá. <br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11852Metods for interpretation of MC simulation results/cs2016-06-11T12:45:27Z<p>Xmolm00: /* Reference */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<br />
<br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
<references/><br />
<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11851Metods for interpretation of MC simulation results/cs2016-06-11T12:44:42Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr <ref name=kst1>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref> ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry <ref name=kst2>Obr. dostupný z http://telliott99.blogspot.gr/2012/04/ks-test.html</ref>]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<br />
<br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html<br />
<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11850Metods for interpretation of MC simulation results/cs2016-06-11T12:41:39Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name="bastinec"> Jaromír Baštinec: <i>Statistika, operační výzkum, stochastické procesy.</i> Skripta FEKT VUT v Brně, Brno 2009</ref><br />
<br />
<br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html<br />
<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11849Metods for interpretation of MC simulation results/cs2016-06-11T12:37:21Z<p>Xmolm00: /* Reference */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name = blogspot></ref><br />
<br />
<br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html<br />
<br />
<references/></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11848Metods for interpretation of MC simulation results/cs2016-06-11T12:36:41Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
<br />
'''Test pro 1 výběr'''<br />
<ref name = blogspot></ref><br />
<br />
<br />
<br />
<br />
'''Test pro 2 výběry'''<br />
<br />
<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11847Metods for interpretation of MC simulation results/cs2016-06-11T12:13:08Z<p>Xmolm00: /* Proces sestrojení simulace */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže je nazelena simulace, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. <br />
<br />
Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v kapitole o interpretaci výsledků.<br />
<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Bez verifikace není možné považovat výsledky testů za spolehlivé. Provádí se pomocí skupiny logických oprací, jejichž cílem je ověření nebo vyvrácení navrženého modelu. <br />
<br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. Zjednodušeně řečeno se ověřují data, která jsou použitá na vstupi i v modelu. Taková data, jejichž interval musí být v hodnotách reálného chování. Pokud projde model validací, pak se může říci, že je jeho datová základna správná.<br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11838Metods for interpretation of MC simulation results/cs2016-06-10T19:03:29Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže nalezneme simulaci, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v Interpretaci výsledků.<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Příkladem: <br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. <br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11837Metods for interpretation of MC simulation results/cs2016-06-10T19:03:14Z<p>Xmolm00: /* Hodnota */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže nalezneme simulaci, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v Interpretaci výsledků.<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Příkladem: <br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. <br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
Pro hodnotu platí , že výsledek simulace se srovnává operátory větší a menší než.<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11836Metods for interpretation of MC simulation results/cs2016-06-10T19:01:31Z<p>Xmolm00: /* Forma výsledků */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže nalezneme simulaci, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v Interpretaci výsledků.<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Příkladem: <br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. <br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Porovnávání výsledků s intervaly, a rozhodování na základě zvolených podmínek je kritické ke konečnému rozhodnutí. Každá simulace musí ve výsledku zodpovědět určitou otázku. Je však nejisté, které hodnoty lze považovat za splněné a které nikoliv. Proto je třeba volit interval hodnotu nebo jednu hodnotu, se kterou se výsledek porovnává, obezřetně. <br />
<br />
==Interval==<br />
V kapitole ''Interval spolehlivosti'' bylo uvedeno, pro jaký interval je výsledek z dané spolehlivosti relevantní. Avšak lze vyhodnocovat i obráceným způsobem. Pokud je zadán interval, je třeba vypočíat, na kolik pravděpodobný bude je i výsledek ze simulace, tzn. na kolik bude pravděpodobné chování v realitě.<br />
<br />
==Hodnota==<br />
<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11835Metods for interpretation of MC simulation results/cs2016-06-10T18:48:39Z<p>Xmolm00: /* Reference */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže nalezneme simulaci, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v Interpretaci výsledků.<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Příkladem: <br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. <br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Výsledek z intervalu … jak je interval velký, blablabla<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html<br />
<br />
4 http://www.physics.csbsju.edu/stats/KS-test.html</div>Xmolm00http://www.simulace.info/index.php?title=File:KS.gif&diff=11834File:KS.gif2016-06-10T18:47:06Z<p>Xmolm00: Xmolm00 načetl novou verzi File:KS.gif</p>
<hr />
<div></div>Xmolm00http://www.simulace.info/index.php?title=Metods_for_interpretation_of_MC_simulation_results/cs&diff=11833Metods for interpretation of MC simulation results/cs2016-06-10T18:45:07Z<p>Xmolm00: /* Kolmogorovův-Smirnovův test */</p>
<hr />
<div>{{DISPLAYTITLE:Metody pro interpretaci výsledků simulacích založených na Monte Carlu}}<br />
<br />
<br />
{{Ambox<br />
| type = content<br />
| text = <br />
Učební text není připraven k odevzdání.<br />
<br />
| date = 10. 6. 2016<br />
}}<br />
<br />
<br />
=Úvod=<br />
Metoda Monte Carlo je nástrojem pro vytváření kvalifikovaných odhadů na základě předchozích dat. Odhaduje s určitou pravděpodobností vývoj událostí, který nelze určit přímým výpočtem a pracuje s nahodilými proměnnými, kterým se říká '''pseudonáhodná čísla'''. Podstatou nástroje není fyzická aplikace, nýbrž metodika jak dosáhnout omezeného počtu odpovědí na jasně danou otázku. Příklad takových otázek může být následující formu: „Bude zítra pršet?“, „Je potřeba se na zítřejší prověrku učit?“ anebo „Zvýší se, a popřípadě o kolik, marže logistického podniku, pokud nahradíme holuby samořízenými vzdušnými droidy?“ Ačkoliv se můžou zdát některé otázky trochu zvláštní, jedná se o typ otázek, na kterou není možno nalézt jednoznačnou odpověď. Na dotaz, zdali bude zítra pršet, lze odpovědět: „S pravděpodobností 78% pršet nebude.“ Na dotaz lajdáckého studenta může simulace odpovědět, že pokud bude test vypsán kantorem A, s pravděpodobností 99% neuspěje. A právě interpretace výsledků je klíčová pro správné zacházení s rozhodnutím, které bylo simulací nalezeno jako nejvhodnější.<br />
<br />
=Proces sestrojení simulace=<br />
Vytváření simulace začíná otázkou, na kterou nelze přímo odpovědět. Tato otázka by měla být obsahově významná. Pokud toto platí, pak je třeba zjistit, zdali tento problém už nějaká simulace neřešila. Jestliže nalezneme simulaci, která je schopna tuto otázku replikovat, pak není třeba simulaci modelovat. Pokud ovšem žádná taková simulace neexistuje, je třeba ji navrhnout a vytvořit. Dále je nutno ověřit, zdali vytvořený model koresponduje s realitou. Toto je blíže popsáno v kapitole ''Validace''. Dále se provádí kontrola verifikací. Verifikací se realizuje kontrola modelu na bázi vnitřní struktury, neboli zda se chování a operace v modelu shoduje s naší představou o chování navrhovaného modelu. Poté je třeba simulovat danou problematiku dosazením vstupních parametrů. Simulace na konci vypočte pravděpodobný výsledek. Aby byly výsledky simulace více relevantní, je třeba ji spustit vícekrát. Výsledky se zapisují a lze z nich pak vytvářet rozhodovací tabulky či grafy. O tomto tématu bude pojednáno v Interpretaci výsledků.<br />
==Verifikace==<br />
Jak bylo v úvodu kapitoly zmíněno, jedná se o proces kontroly metod simulace vzhledem k formální specifikaci simulace. Příkladem: <br />
==Validace==<br />
Je procedura, při které se kontroluje chování simulace vzhledem reálnému chování modelovaného příkladu. <br />
==Interpretace výsledků==<br />
===Histogram===<br />
<br />
[[File:Historam1.png|thumb|right|Rozdělení výše profitu]]<br />
<br />
Tato metoda je pro interpretaci výsledků jednou z nejrychlejších pohledů na vývoj ze simulace Monte Carlo. Opakované testy, které jsou zapisovány do tabulkového editoru (např. Excel), lze jednoduše statisticky převést na graf. Aby byl graf co možná nejvhodnější, je třeba se držet následujících pravidel:<br />
<br />
[[File:Historam2.png|thumb|right|Osa x je převedena na konkrétní hodnoty]]<br />
<br />
* Data, která se zde zobrazují, jsou reprezentovány svislou osou y<br />
* Vodorovná osa x slouží pro jednotku parametru, kterou simulace sleduje<br />
* Měřítko je třeba uzpůsobit, aby se výsledky nejevili příliš stejné, a aby byl vidět trend grafu <br />
<br />
Následující příklad je výsledkem simulace metodou Monte Carlo.Zdroj 1 Zadání úlohy se týká zjednodušené předpovědi prodejů, kde každý krok simulace bude zaznamenáván do tabulky. Celé zadání si lze přečíst zde.) Společnost XYZ by chtěla vědět, jak bude na trhu výnosná s jejich novým produktem. Zároveň si uvědomuje, že je zde spousta parametrů předem neznámých jako nejistota velikosti trhu, náklady společnosti a její výnosy. <br />
Po namodelování této simulace jsou provedeny testy, jejichž výsledky ústějí v tabulku, která má 5000 řádků a je dostupná ke stažení na adrese http://www.vertex42.com/ExcelArticles/mc/SalesForecast.html. Z této tabulky je pak profit převeden do grafu.<br />
<br />
<br />
Z histogramu lze vyčíst následující informace:<br />
<br />
* Zdá se, že výnos bude většinou pozitivní<br />
* Nejistota je poměrně velká a to v rozmezí -1000 až 3400<br />
* Rozdělení neodpovídá dokonalému Normálnímu rozdělení<br />
* V grafu nejsou extrémní hodnoty, výjimky apod.<br />
<br />
Jak je v úvodu uvedeno, ačkoliv lze histogram použít pro takto zevrubná pozorování, spíše je třeba se zajímat o hodnotu. Obecně o to, jestli je vyšší nebo nižší než stanovená hodnota anebo se nachází v/mimo rozmezí ze stanoveného intervalu. V tomto případě byl dotaz formulován tak, že odpověď musí vypadat. Předchozí diagram zobrazoval na ose x jakési bary, které zastupují pouze „slepé“ pravítko. V následujícím obrázku jsou výsledky vyobrazeny tak, aby každý sloupec x měl reálnou hodnotu.<br />
<br />
<br />
===Metoda maximální věrohodnosti===<br />
Tato metoda se používá obecně v matematické statistice k odhadu neznámých veličin. Tyto odhady jsou založeny na již pozorovaných datech. Metoda maximální věrohodnosti <br />
Metoda maximální věrohodnosti označuje jednu z centrálních metod matematické statistiky. Úlohou matematické statistiky je, zjednodušeně řečeno, odhad neznámých veličin v závislosti na pozorovaných (experimentálních) datech. K odhadu je zapotřebí vytvořit pravděpodobnostní model skutečné situace a ověřit, zdali je tento model aplikovatelný ve skutečnosti. Jakým způsobem jsou data zpracována, může čtenář naleznout zde Zdroj 2. Důležité ovšem je, že tato metoda pomáhá naleznout odhad věrohodnosti dat, které jsou výsledkem simulace Monte Carlo. <br />
Aby však tato metoda fungovala, musí být model simulace a pravděpodobnostní model odrazem reality. Pokud je vágní či zkreslený, pak je odhadovaný vývoj odhadu nesoudržný s výslednými daty simulace. Dále je pro tuto metodu klíčové mít dostatečné množství dat. <br />
<br />
===Souhrnná statistika===<br />
===Interval spolehlivosti===<br />
Intervaly spolehlivosti jsou spíše nástrojem než metodou statistické analýzy. Definují, s jakou pravděpodobností se vyzkoumaný jev objeví. Tímto se samozřejmě řídí i výsledné hodnoty MC simulace. Příkladem bude 95% interval spolehlivosti. Pokud je vybráno 100 náhodně zvolených hodnot, 95% z nich bude v definovaném intervalu. Aplikováno na výše uvedený příklad z byznysu. <br />
Pro 95% výsledků bude profit ležet v intervalu <-1000; 3000> $. V intervalu (0; 3000> bude ležet 70% výsledků. Dále už je rozhodování na odpovědné osobě, zdali chce připustit pro svou firmu 30% riziko nenávratnosti při uvedení nového produktu na trh. <br />
Proč využívat interval spolehlivosti v interpretaci výsledků metody Monte Carlo? <br />
<br />
=== Kolmogorovův-Smirnovův test ===<br />
<br />
[[File:Example.png|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 1 výběr ]]<br />
<br />
[[File:KS.gif|thumb|right|Příklad Kolmogorovův-Smirnova testu pro 2 výběry ]]<br />
<br />
<br />
ZDROJ 4<br />
<br />
Tato metoda, která je také součástí matematické statistiky, testuje, jestli 2 proměnné pramení ze stejného rozdělení pravděpodobnosti. Pro výsledky z metody Monte Carlo může být tato interpretace klíčová. Dále testuje, zda má jedna hodnota předpokládané rozdělení. <br />
ZDROJ 3<br />
Test existuje ve 2 verzích:<br />
* Test pro 1 výběr<br />
* Test pro 2 výběry<br />
Pro účely vyhodnocení výsledků a srovnávání s naměřenými hodnotami je vhodnější použít test pro 2 výběry proměnných a zobrazit je trendem vůči bodovému grafu. Pro ukázku jak může vypadat srovnání v testu pro 1 a 2 výběry na obrázku vpravo.<br />
<br />
=Forma výsledků=<br />
<br />
Výsledek z intervalu … jak je interval velký, blablabla<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Jiný pohled=<br />
Jakože výnosy porostou, ale realita bude spíše, pravděpodobnost že to krachne<br />
==Příklad 1==<br />
==Příklad 2==<br />
=Příklady ke cvičení=<br />
=Reference=<br />
http://www.kgs.ku.edu/Conferences/IAMG//Sessions/L/Papers/makino.pdf<br />
1 http://www.vertex42.com/ExcelArticles/mc/MonteCarloSimulation.html<br />
2 http://www.webpages.uidaho.edu/~stevel/565/literature/em.pdf<br />
3 http://telliott99.blogspot.gr/2012/04/ks-test.html</div>Xmolm00