Probability distributions/cs

From Simulace.info
Jump to: navigation, search

Úvod

Pravděpodobnost nějakého náhodného jevu nám říká, jakou máme šanci, že daný jev nastane. Při řešení úloh z oblasti pravděpodobnosti nahrazujeme náhodné jevy určitými hodnotami proměnlivé veličiny [1]

Abychom si mohli popsat, co že to vlastně pravděpodobnostní rozdělení je, pojďme se nejdříve podívat na pojem Náhodná veličina.

Náhodná veličina

Některé pokusy mají výsledek (elementární jev) vyjádřený přímo číselně – například, že padne číslo 6. U jiných jevů tomu tak být nemusí – například, že na minci padne orel. Nicméně i těmto jevům je výhodné přiřadit čísla. Čísla přiřazená elementárním jevům tvoří obor hodnot M proměnné, kterou nazýváme náhodná veličina (označujeme X, Y, Z, …). [2]
Herm10 obr1.PNG
Podle oboru hodnot M rozdělujeme náhodné veličiny na:
•   Diskrétní -> obor hodnot M je konečná nebo nekonečná posloupnost
•   Spojité -> obor hodnot M je otevřený nebo uzavřený interval

Diskrétní a spojité náhodné veličiny

Nahoře diskrétná náhodná veličina, dole pak spojitá náhodná veličina[3].

Diskrétní náhodné veličiny: mohou nabývat nanejvýš spočetně mnoha hodnot. Výsledkem jednoho náhodného pokusu je to, že náhodná veličina bude mít právě jednu hodnotu. [4]
Příklady:
•   Počet šestek při deseti hodech kostkou
•   Na kolikátý pokus se podaří vyvolat studenta, který něco umí
•   Počet procent vadných součástek v balíku s 25-ti kusy


Spojité náhodné veličiny: (zjednodušeně) mohou nabývat všech hodnot z určitého intervalu. Rozdělení spojité náhodné veličiny nelze popsat pravděpodobnostní funkcí v určitém bodě. [4]
Příklady:
•   Naměřená hodnota napětí
•   Délka časového intervalu mezi dvěma událostmi

Pravděpodobnostní rozdělení

Vraťme se nyní k pravděpodobnostnímu rozdělení.
Pravděpodobnostní rozdělení nebo rozdělení pravděpodobnosti náhodné veličiny je pravidlo, díky kterému se každému jevu, který tato veličina popisuje, přiřazuje určitá pravděpodobnost. Pravděpodobnostní rozdělené můžeme chápat také jako zobrazení, které každému elementárnímu jevu přiřazuje určité reálné číslo – takové číslo charakterizuje pravděpodobnost tohoto jevu. Rozdělení pravděpodobnosti náhodné veličiny vznikne, pokud je každé hodnotě diskrétní náhodné veličiny nebo intervalu hodnot spojité náhodné veličiny přiřazena pravděpodobnost.[5]


Základní pojmy

K pochopení pravděpodobnosti a jejího rozdělení je nutné znát základní pojmy, které si nyní představíme:

Distribuční funkce

Distribuční funkce F()[6].

Jedním z prostředků pro popis náhodné veličiny (spojité i diskrétní) je distribuční funkce. Tato funkce každému reálnému číslu přiřazuje pravděpodobnost, že náhodná veličina nabude hodnoty menší nebo rovné než toto číslo. [7]
Distribuční funkce náhodné veličiny X:
Herm10 rce1.PNG
Vlastnosti distribuční funkce: [8]
•   Hodnoty distribuční funkce leží mezi 0 a 1
  Herm10 rce2.PNG
•   Distribuční funkce je funkcí neklesající, pro všechna x2>x1 tedy platí:
  Herm10 rce3.PNG
•   Pro každou distribuční funkci je:
Herm10 rce4.PNG
•   Je zprava spojitá
•   Má nejvýše spočetně mnoho bodů nespojitosti
•   Distribuční funkce náhodné veličiny spojitého typu je spojitá a distribuční funkce náhodné veličiny diskrétního typu je nespojitá.


Pravděpodobnostní funkce

Graf pravděpodobnostní funkce [x, p(x)].[5].

Pro popis diskrétní (nespojité) náhodné veličiny se používá pravděpodobnostní funkce.
Definice: Pravděpodobnostní funkce p(x) náhodné veličiny X přiřazuje každému reálnému číslu c pravděpodobnost, že náhodná veličina nabude této hodnoty tedy: [9]
Herm10 rce5.PNG
Pravděpodobnostní funkci p(x) můžeme vyjádřit grafem (obrázek napravo), tabulkou,
Herm10 obr3.PNG
nebo matematickým vzorcem.
Herm10 rce6.PNG


Hustota pravděpodobnosti

Pravděpodobnost, že náhodná proměnná X leží v intervalu [a, b]je daná plochou pod funkcí hustoty pravděpodobnosti fna intervalu [a, b].[10]

U spojité náhodné veličiny se místo pravděpodobnostní funkce používá funkce hustoty pravděpodobnosti.
Definice: Funkce hustoty pravděpodobnosti spojité náhodné veličiny X je nezáporná funkce f(x) taková, že [11]
Herm10 rce7.PNG
Na následujícím obrázku můžeme vidět hustotu pravděpodobnosti několika normálních rozdělení.
Hustota pravděpodobnosti několika normálních rozdělení.[5].


Střední hodnota

Fyzikální význam střední hodnoty – těžiště pravděpodobnostního rozdělení .[10]

Střední hodnota (aritmetický průměr) je definován jako součet všech hodnot náhodné proměnné dělený počtem hodnot. Vypočtený průměr pak udává, jaká stejná část z úhrnu hodnot sledované číselné proměnné připadá na jednu jednotku souboru (jednoho jedince). [12]
Střední hodnota náhodné veličiny X, kde je (měřitelná) funkce, je:
•   pro X diskrétně rozdělenou s pravděpodobnostní funkcí P definována jako
Herm10 rce22.PNG

•   pro X spojitě rozdělenou s hustotou f jako
Herm10 rce21.PNG

mají-li výrazy na pravé straně rovnice smysl.


Rozptyl

Rozptyl nám udává, jak moc jsou hodnoty v našem statistickém soubory rozptýleny. Rozptylu se někdy říká také variance - je to ukazatel variability (měnivosti). Řečeno definicí:
Rozptyl je průměrem druhých mocnin odchylek jednotlivých hodnot od aritmetického průměru z hodnot statistického souboru.
[13] [14]

Herm10 rce9.PNG
... rozptyl
n ..... počet prvků statistického souboru
... prvek statistického souboru o indexu i
..... prostý aritmetický průměr

Kvantily

Příklad kvantilu 0,9 (90%) pro normální rozdělení.[10]

Kvantily rozdělují množinu náhodných proměnných na určité části. Dělí prostor náhodných proměnných na část jevů, které nastanou s pravděpodobností menší nebo rovnou kvantilu a druhá část jevů s pravděpodobností rovnou 1 - kvantil. Medián je například kvantil o hodnotě 0.5. Dělí tedy prostor náhodných proměnných na dvě stejně pravděpodobné části.
Specifické názvy kvantilů:
•    kvartily: 0.25, 0.5, 0.75
•    decily: 0.1, 0.2, 0.9
•    centily: 0.01, 0.02, 0.99



Typy rozdělení

Jak již vyplývá z výše uvedených pojmů, typy rozdělení se nám v první řadě dělí na rozdělení pravděpodobnosti diskrétní a spojité náhodné veličiny. Dále pak existují například vícerozměrná rozdělení pravděpodobnosti, kterými se ale tento učební text nezabývá.

Nyní se pojďme podívat na důležitá pravděpodobnostní rozdělení, z nichž si většinu zde představíme podrobněji.

Důležitá diskrétní rozdělení [5]
•   Alternativní rozdělení (X nabývá pouze dvou hodnot 0 nebo 1)
•   Binomické rozdělení (n pokusů se stejnou pravděpodobností)
•   Poissonovo rozdělení
•   Negativně binomické rozdělení
•   Pascalovo rozdělení (speciální případ negativně binomického rozdělení)
•   Geometrické rozdělení (speciální případ Pascalova rozdělení)
•   Hypergeometrické rozdělení
•   Logaritmické rozdělení

Důležitá spojitá rozdělení [5]
•   Rovnoměrné rozdělení
•   Normální rozdělení (označované také jako Gaussovo rozdělení)
•   Logaritmicko-normální rozdělení (také log-normální rozdělení)
•   Exponenciální rozdělení
•   Cauchyho rozdělení
•   Gama rozdělení
•   Laplaceovo rozdělení (nebo také dvojitě exponenciální rozdělení)
•   Logistické rozdělení
•   Maxwellovo-Boltzmannovo rozdělení
•   Studentovo rozdělení
•   Fisherovo-Snedecorovo rozdělení
•   χ² rozdělení (Chí kvadrát)


Základní typy rozdělení pravděpodobnosti diskrétní náhodné veličiny

Alternativní rozdělení

Používá se, když má náhodný pokus pouze dva možné výsledky => úspěch; neúspěch. [15][16]
Herm10 roz1.PNG


Příklad: [17]
Házíme jedenkrát kostkou. Najděte pravděpodobnostní funkci náhodné veličiny X, která udává, jestli v daném hodu padlo číslo menší než 3.


Řešení:
Obor hodnot obsahuje dva prvky: M= {0,1}. Úspěch v našem případě znamená, že padlo číslo menší než 3, a to číslo 1 nebo 2. Neúspěch značí, že padla čísla 3, 4, 5 nebo 6.
Tedy:
Herm10 rce10.PNG
Pravděpodobnostní funkce náhodné veličiny X je tvaru:
Herm10 rce11.PNG

Binomické rozdělení

Pravděpodobnostní funkce náhodné veličiny s binomickým rozdělením pro n=10 a n=100[18].

Náhodná veličina udává počet úspěchů v posloupnosti n nezávislých alternativních pokusů. Binomické rozdělení vychází z Bernoulliova pokusu, který spočívá v tom, že v daném náhodném pokusu mohou nastat pouze dva stavy: úspěch, neúspěch.[15][16]
Herm10 rozBi2.PNG


Příklad:[17]

Zásilka obsahuje 85 % kvalitních a 15 % nekvalitních výrobků. Náhodně s vracením vybereme 4 výrobky. Určete pravděpodobnost, že právě 3 z nich budou kvalitní.


Řešení:
Náhodná veličina X udává počet vybraných kvalitních výrobků,X∼Bi(4;0,85).
Herm10 rce12.PNG
Pravděpodobnost, že právě 3 výrobky z námi vybraných 4 budou kvalitní, je 36,85 %.

Negativně binomické rozdělení

Rozdělení počtu neúspěchů předcházejících n-tému úspěchu v posloupnosti nezávislých pokusů. Ekvivalentem k NB(1, p) je Geo(p).[15][16]
Herm10 rozNegBin4.PNG

Geometrické rozdělení

Pravděpodobnostní funkce a distribuční funkce [10].

Udává počet neúspěchů před prvním úspěchem v posloupnosti nezávislých pokusů.[15][16]
Herm10 rozGeom3-1.PNG


Příklad:[17]

Ve firmě je známé, že na výběrové řízení na určitou pozici se dostaví uchazeč s vysokoškolským vzděláním s pravděpodobností 0,65, a uchazeč bez vysokoškolského vzdělání s pravděpodobností 0,35. Určete pravděpodobnost, že až čtvrtý uchazeč o danou pozici bude mít vysokoškolské vzdělání.


Řešení:
Náhodná veličina X∼Ge(0,65).


Herm10 rce13.PNG
Pravděpodobnost, že o pozici ve firmě se až jako čtvrtý bude ucházet člověk s vysokoškolským vzděláním, je 2,79 %.

Poissonovo rozdělení

Všimněte si, že pro velká λje Poissonovorozdělení podobné normálnímu rozdělení. Ale podstata náhodných jevů, které obě rozdělení popisují je zcela odlišná[10].

Náhodná veličina X charakterizuje počet výskytů události, která nastane za časovou jednotku. Například jaká je pravděpodobnost, že v následujících dvaceti minutách přijde do obchodu pět lidí. K událostem dochází náhodně, jednotlivě a vzájemně nezávisle. Průměrný počet událostí za časovou jednotku je roven parametru λ.[15][16]
Herm10 rozPois3.PNG


Příklad:[17]

Předpokládejme, že realitní makléř jedná v průměru s 5 zákazníky za den. Jaká je pravděpodobnost, že počet zákazníků makléře za jeden den bude právě 5.


Řešení:
Náhodná veličina X udává počet zákazníků makléře za den,X∼Po(5).
Herm10 rce14.PNG
S pravděpodobností 17,55 % bude mít v průběhu dne makléř právě 5 zákazníků.


Hypergeometrické rozdělení

Máme N prvků, mezi kterými je M prvků se sledovanou vlastností. Pokus opakujeme n-krát. Jednotlivé pokusy jsou vzájemně závislé => výsledek v jakémkoli pokusu závisí na předešlých pokusech. Je to tedy výběr bez vracení.[15][16]
Herm10 rozHyperGeom5.PNG


Příklad:[17]

V bance mají seznam 50 žadatelů o úvěr. Mezi nimi je 35 spolehlivých a 15 nespolehlivých žadatelů. Určete pravděpodobnost, že jestli banka poskytne úvěr právě 20 žadatelům, bude z nich 15 spolehlivých a 5 nespolehlivých.


Řešení:
•    N   = 150 .... všichni žadatelé
•    M   = 35 ..... spolehliví žadatelé
•  N-M = 15 ... nespolehliví žadatelé
•    n    = 20 ..... počet poskytnutých úvěrů
•    x    = 15 ..... vybraní spolehliví zájemci
•   n-x  = 5 .... vybraní nespolehliví zájemci

Pak námi hledaná pravděpodobnost je:
Herm10 rce15.PNG

Pravděpodobnost, že z 20-ti poskytnutých úvěrů bude 15 poskytnutých spolehlivým žadatelům a 5 nespolehlivým žadatelům, je 20,7 %.


Základní typy rozdělení pravděpodobnosti spojité náhodné veličiny

Rovnoměrné rozdělení

Hustota pravděpodobnosti a distribuční funkce [10].

Rozdělení s konstantní hustotou, tedy každá hodnota z intervalu (a, b) je stejně pravděpodobná.[15][16]
Herm10 rozRovn6.PNG


Příklad:[17]

Na prezentaci nově založené firmy je každých 20 minut promítána krátká prezentace o jejich vymezených cílech. Určete pravděpodobnost, že jestli náhodně přijdeme do promítací místnosti, nebudeme čekat více jak 5 minut.


Řešení:
Náhodná veličina X udává dobu čekání na prezentaci, X∼R(0,20).
Herm10 rce16.PNG

Normální rozdělení (Gausovo)

Hustota pravděpodobnosti a distribuční funkce [10].

Nejdůležitější rozdělení spojitého typu, jelikož[15][16]:
•  vyskytuje se nejčastěji
•  blíží se mu mnoho jiných rozdělení
•  řada jiných rozdělení se jím dá nahradit
Herm10 rozNormal7.PNG


Příklad:[17]

Jistá firma se rozhodla podrobit své zaměstnance IQ testu. Průměrná hodnota IQ testu byla 115, směrodatná odchylka 16. Předpokládejme, že hodnoty IQ testu se řídí normálním rozdělením. Určete pravděpodobnost, že hodnota IQ testu při náhodně vybraném zaměstnanci nabude hodnoty menší nebo rovné než 120.


Řešení:
Náhodná veličina X udává hodnotu IQ testu, X∼N(115,162).
Herm10 rce17.PNG

Hodnota IQ testu nabude hodnoty menší nebo rovné jak 120 s pravděpodobností 61,17 %.


Normované normální rozdělení

Jedná se o speciální případ obecného normálního rozložení, kdy µ = 0, σ^2 = 1.[15][16]
Herm10 rozNormovNorm11.PNG


Exponenciální rozdělení

Hustota pravděpodobnosti a distribuční funkce [10].

Představuje dobu čekání do nastoupení (poissonovského) náhodného jevu, nebo délku intervalu (časového nebo délkového) mezi takovými dvěma jevy (např. doba čekání na obsluhu, vzdálenost mezi dvěma poškozenými místy na silnici). Závisí na parametru λ, což je převrácená hodnota střední hodnoty doby čekání do nastoupení sledovaného jevu.[15][16]
Herm10 rozExponen9.PNG


Příklad:[17]

Životnost určitého výrobku se řídí exponenciálním rozdělením se střední hodnotou životnosti 200 hodin. Určete pravděpodobnost, že daný výrobek bude funkční nejvýše 150 hodin.


Řešení:
Víme, že: E(X)=200 hodin, tedy X∼Ex(1200),λ=0,005.
Herm10 rce18.PNG
S pravděpodobností 52,76 % bude výrobek funkční nejvýše 150 hodin.

Logaritmicko-normální rozdělení

Náhodná veličina X má logaritmicko-normální rozdělení s parametry μ, , jestliže ln(X) má normální rozdělení N(μ,σ^2)[15][16]
Herm10 rozLogaritNorm12.PNG



Příklad:[17]

Nechť X je náhodná veličina s logaritmicko normálním rozdělením s parametry μ=2 a =9. Určete pravděpodobnost, že náhodná veličina X je z intervalu (0,30).


Řešení:
Náhodná veličina X∼LN(2;9), hledaná pravděpodobnost je:
Herm10 rce19.PNG

Cauchyho rozdělení

Hustota je symetrická kolem a, momenty neexistují, E |X| = +∞.[15][16]
Herm10 rozCauchy8.PNG

Gama rozdělení

Gama rozdělení se obvykle používá při analýze front.[15][16]
Herm10 rozGama10.PNG

Citace

  1. KŘÍŽ, Oldřich, Jiří NEUBAUER a Marek SEDLAČÍK. Pravděpodobnost a náhodná veličina: učební text pro distanční studium. Brno: Univerzita obrany, vydáno 2008, 43s. ISBN 978-80-7231-488-1
  2. OTIPKA, Petr a Vladislav ŠMAJSTRLA. Pravděpodobnost a statistika., Ostrava: Vysoká škola báňská - Technická univerzita, 2006. 72s ISBN 80-248-1194-4.
  3. Náhodná veličina [online]. [cit. 2020-05-26]. Dostupné z: http://books.fs.vsb.cz/SystAnal/texty/07.htm
  4. 4.0 4.1 Fakulta elektrotechniky a komunikačních technologií VUT v Brně Náhodná veličina [online]. [cit. 2020-05-15] Dostupné z: http://www.umat.feec.vutbr.cz/~hlavicka/vyuka/BMA3_predn/prednaska02.pdf
  5. 5.0 5.1 5.2 5.3 5.4 Rozdělení pravděpodobnosti [online]. [cit. 2020-05-25]. Dostupné z: https://www.wikiwand.com/cs/Rozd%C4%9Blen%C3%AD_pravd%C4%9Bpodobnosti
  6. Distribuční funkce [online]. [cit. 2020-05-26]. Dostupné z: https://cit.vfu.cz/statpotr/POTR/Teorie/Predn1/distrib.htm
  7. MAREK, Patrice Náhodná veličina a její popis [online]. [cit. 2020-05-15] Dostupné z: http://physics.ujep.cz/~mmaly/vyuka/poc_fyz_1/NahodnaVelicina_zaklady.pdf
  8. Distribuční funkce [online]. [cit. 2020-05-15] Dostupné z: https://iastat.vse.cz/Dfunkce.htm
  9. KŘÍŽ, Oldřich, Jiří NEUBAUER a Marek SEDLAČÍK. Pravděpodobnost a náhodná veličina: učební text pro distanční studium. Brno: Univerzita obrany, vydáno 2008, 46s. ISBN 978-80-7231-488-1
  10. 10.0 10.1 10.2 10.3 10.4 10.5 10.6 10.7 Pravděpodobnostní rozdělení [online]. [cit. 2020-05-28]. Dostupné z: https://docplayer.cz/1838424-Rovnomerne-rozdeleni.html
  11. KŘÍŽ, Oldřich, Jiří NEUBAUER a Marek SEDLAČÍK. Pravděpodobnost a náhodná veličina: učební text pro distanční studium. Brno: Univerzita obrany, vydáno 2008, 50s. ISBN 978-80-7231-488-1
  12. FRIESL, Michal Střední hodnota [online]. 2014-02-08 [cit. 2020-05-10] Dostupné z: http://home.zcu.cz/~friesl/hpsb/e.html
  13. Rozptyl [online]. © 2006—2014 [cit. 2020-05-10] Dostupné z: https://matematika.cz/rozptyl
  14. VACHTOVÁ, Jitka Rozptyl [online]. 2020 [cit. 2020-05-10] Dostupné z: https://www.ekovyp.cz/rozptyl
  15. 15.00 15.01 15.02 15.03 15.04 15.05 15.06 15.07 15.08 15.09 15.10 15.11 15.12 KULICH, Michal Přehled pravděpodobnostních rozdělení Matematicko-fyzikální fakulta Univerzita Karlova 2009 [online]. [cit. 2020-05-10]. Dostupné z: http://www.karlin.mff.cuni.cz/~pesta/NSTP097/rozdeleni.pdf
  16. 16.00 16.01 16.02 16.03 16.04 16.05 16.06 16.07 16.08 16.09 16.10 16.11 16.12 OTIPKA, Petr a Vladislav ŠMAJSTRLA. Pravděpodobnost a statistika., Ostrava: Vysoká škola báňská - Technická univerzita, 2006. ISBN 80-248-1194-4.
  17. 17.0 17.1 17.2 17.3 17.4 17.5 17.6 17.7 17.8 BUDÍKOVÁ, Marie a ŠÁLYOVÁ, Jitka Vybraná pravděpodobnostní rozložení Přírodovědecká fakulta Masarykovy University [online]. [cit. 2020-05-10]. Dostupné z: https://is.muni.cz/do/rect/el/estud/prif/ps15/statistika/web/index2.html
  18. Binomické rozdělení [online]. [cit. 2020-05-28]. Dostupné z: https://portal.matematickabiologie.cz/index.php?pg=aplikovana-analyza-klinickych-a-biologickych-dat--biostatistika-pro-matematickou-biologii--nahodna-velicina-rozdeleni-pravdepodobnosti-a-realna-data--dalsi-rozdeleni-pravdepodobnosti--binomicke-rozdeleni