Difference between revisions of "Binomial distribution/cs"

From Simulace.info
Jump to: navigation, search
(Created page with "{{DISPLAYTITLE:Binomické rozdělení}} Přemýšleli jste někdy o tom, jak předpovědět počet úspěchů v sérii nezávislých pokusů? Nebo jste možná zvědaví na pr...")
 
Line 3: Line 3:
  
 
== Úvod ==
 
== Úvod ==
[[File:Binomial-probability-distribution-sample-plot-example.png|thumb|500px|Pravděpodobnostní rozdělení pro experiment s mincí. Počet pokusů n = 10 a pravděpodobností úspěchu (pád orla při jedním hodu) p = 0,5. <ref name="kumar"></ref>]]
+
[[File:Binomial-probability-distribution-sample-plot-example.png|thumb|500px|Pravděpodobnostní rozdělení pro experiment s mincí. Počet pokusů [[File:n.png|x8px]] = 10 a pravděpodobností úspěchu (pád orla při jedném hodu) [[File:P2.png|x10px]] = 0,5. <ref name="kumar"></ref>]]
 
Přemýšlejme o následujících experimentech a náhodných veličinách:
 
Přemýšlejme o následujících experimentech a náhodných veličinách:
# Házíme 10krát mincí. Označme [[File:X.png|18px]] počet kolikrát padne orel.
+
# Házíme 10krát mincí. Označme [[File:X.png|x15px]] počet kolikrát padne orel.
# Stroj vyrábí díly a některé z nich jsou vadné. Označme [[File:X.png|18px]] jako počet vadných dílů ze 100 z nich náhodně vybraných.
+
# Stroj vyrábí díly a některé z nich jsou vadné. Označme [[File:X.png|x15px]] jako počet vadných dílů ze 100 z nich náhodně vybraných.
 
# Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme [[File:X.png|18px]] jako počet pacientů, kteří zpozorují zlepšení.
 
# Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme [[File:X.png|18px]] jako počet pacientů, kteří zpozorují zlepšení.
# Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme [[File:X.png|18px]] jako počet správně zodpovězených otázek.
+
# Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme [[File:X.png|x15px]] jako počet správně zodpovězených otázek.
  
Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina [[File:X.png|18px]] je počet pokusů, které splňují určité kritérium. Výsledek každého pokusu buď splňuje kritérium, nebo ne; proto lze každý pokus shrnout jako „úspěch“ nebo „neúspěch“. Například v experimentu s testem je pro každou otázku pouze jedna kombinace možností, která je správná, a tedy považována za úspěch.
+
Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina [[File:X.png|x15px]] je počet pokusů, které splňují určité kritérium. Výsledek každého pokusu buď splňuje kritérium, nebo ne; proto lze každý pokus shrnout jako „úspěch“ nebo „neúspěch“. Například v experimentu s testem je pro každou otázku pouze jedna kombinace možností, která je správná, a tedy považována za úspěch.
  
Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože X počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. <ref name="kumar">KUMAR, Ajitesh <i>Binomial Distribution Explained with Examples</i> [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/</ref> <ref name="montgomery">MONTGOMERY, Douglas C. <i>Applied Statistics and Probability for Engineers</i> [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf</ref>
+
Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože [[File:X.png|x15px]] počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. <ref name="kumar">KUMAR, Ajitesh <i>Binomial Distribution Explained with Examples</i> [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/</ref> <ref name="montgomery">MONTGOMERY, Douglas C. <i>Applied Statistics and Probability for Engineers</i> [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf</ref>
 +
 
 +
== Terminologie ==
 +
=== Binomický experiment ===
 +
Nebo také Bernoulliho experiment/Bernoulliho schéma jsme si v úvodu představili, pojďme si ho nadefinovat a formalizovat.
 +
==== Požadavky ====
 +
Požadavky pro to, aby náhodný experiment byl binomickým experimentem, jsou následující:
 +
* Pevný počet ([[File:n.png|x15px]]) pokusů.
 +
* Každý pokus musí být nezávislý na ostatních. (výsledek jednoho pokusu nemá žádný vliv na výsledek ostatních pokusů.)
 +
* Každý pokus má právě dva možné výsledky, nazývané "úspěch" (výsledek, který nás zajímá) a "neúspěch".
 +
* Existuje konstantní pravděpodobnost (pravděpodobnost, že pokus skončí „úspěchem“, je stejná v každém z pokusů) ([[File:p2.png|x15px]]) úspěchu pro každý pokus, přičemž doplňkem této pravděpodobnosti je pravděpodobnost „neúspěchu“, která se někdy označuje jako [[File:q-formula.png|x18px]].
 +
<ref name="kumar"></ref> <ref name="bolt">UF Health <i>Binomial Random Variables</i> [online]. 2014 [cit. 2023-06-01] Dostupné z: https://bolt.mph.ufl.edu/6050-6052/unit-3b/binomial-random-variables/</ref>
 +
 
 +
=== Náhodná veličina ===
 +
Pro definici binomického rozdělení začneme s definicí náhodné veličiny [[File:X.png|x15px]]. Tu lze jednoduše definovat jako číselné vyjádření výsledku náhodného jevu.
 +
 
 +
=== Binomická náhodná veličina ===
 +
V binomických náhodných experimentech je počet „úspěchů“ v n pokusech náhodný. Může nabývat celočíselných hodnot od 0, pokud všechny pokusy skončí „neúspěchem“, nebo může být tak vysoký jako je [[File:n.png|x12px]], pokud všechny pokusy skončí „úspěchem“.
 +
Náhodná proměnná [[File:X.png|x15px]], která reprezentuje počet „úspěchů“ v těchto [[File:n.png|x12px]] pokusech, se nazývá '''binomická náhodná veličina''' a je určena hodnotami [[File:n.png|x12px]] a [[File:P2.png|x15px]].
 +
==== Definice ====
 +
Binomická náhodná veličina [[File:X.png|x15px]] je definována jako počet výskytu události (úspěchů) v [[File:n.png|x12px]] Bernoulliho pokusech.
 +
To, že má náhodná veličina binomické rozdělení zapisujeme: <ref name="vsb">VŠB <i>DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI</i> [online].[cit. 2023-06-01] Dostupné z: https://homel.vsb.cz/~dom033/predmety/statistika/ucebni_text/7DNV.pdf</ref>
 +
 
 +
[[File:vbr.png|x60px]]
 +
 
 +
==== Příklad: Binomické nebo ne? ====
 +
Zvažme ještě několik náhodných experimentů.
 +
U každého z nich rozhodneme, zda je náhodná proměnná binomická. Pokud je, určíme hodnoty pro [[File:n.png|x12px]] a [[File:P2.png|x15px]]. Pokud není, vysvětlíme proč.
 +
;Příklad A:
 +
: Házíme spravedlivou kostkou 50krát; [[File:X.png|x15px]] je počet krát, kdy padla šestka.
 +
: [[File:X.png|x15px]] '''je binomická''' s [[File:n.png|x12px]] = 50 a [[File:P2.png|x15px]] = 1/6.
 +
;Příklad B:
 +
: Opět házíme spravedlivou kostkou, [[File:X.png|x15px]] je počet hodů potřebných k dosažení šestky.
 +
: [[File:X.png|x15px]] '''není binomická''', protože počet pokusů není pevně stanovený.
 +
;Příklad C:
 +
: Vybíráme náhodně 3 karty jednu po druhé, nevracíme je zpátky do balíčku, z klasické sady obsahující 4 druhy karet. [[File:X.png|x15px]] je počet vybraných karet se znakem srdce.
 +
: [[File:X.png|x15px]] '''není binomická''', protože výběry nejsou nezávislé. (Pravděpodobnost úspěchu ([[File:P2.png|x15px]]) není konstantní, protože je ovlivněna předchozími výběry.)
 +
;Příklad D:
 +
: Odpovídáme na 10 testových otázek zcela náhodně, prvních pět otázek je ano/ne a druhých pět otázek má čtyři možnosti, ze kterých je jedna správná. [[File:X.png|x15px]] představuje počet správných odpovědí.
 +
: [[File:X.png|x15px]] '''není binomická''', protože pravděpodobnost [[File:P2.png|x15px]] se mění z 1/2 na 1/4.
 +
;Příklad E:
 +
: Pravděpodobnost mít krevní skupinu B je 0,1. Vybíráme 4 náhodné osoby. [[File:X.png|x15px]] je počet osob s krevní skupinou B.
 +
: [[File:X.png|x15px]] '''je binomická''' s [[File:n.png|x12px]] = 4 a [[File:P2.png|x15px]] = 0,1.
 +
: ''Komentář: Při výběru relativně malé náhodné vzorky (4 osoby) z velké populace, i když se odběr provádí bez „náhrady“, můžeme předpokládat nezávislost, protože matematický vliv odstranění jednoho jedince z velké populace na další výběr je zanedbatelný.''
 +
<ref name="bolt"></ref>
 +
 
 +
=== Binomické pravděpodobnostní rozdělení ===
 +
Nyní je čas diskutovat o pravděpodobnostním rozdělení binomické náhodné veličiny. Začneme jednoduchým příkladem a poté se přesuneme k obecnému vzorci.
 +
==== Příklad Přenosový kanál ====
  
 
= Citace =
 
= Citace =
 
<references/>
 
<references/>

Revision as of 21:25, 1 June 2023

Přemýšleli jste někdy o tom, jak předpovědět počet úspěchů v sérii nezávislých pokusů? Nebo jste možná zvědaví na pravděpodobnost dosažení konkrétního výsledku v sekvenci otázek s odpověďmi ano/ne? Pokud ano, hovoříme v podstatě o binomickém rozdělení, které se vztahuje k binomickým experimentům (tj. s binárními výsledky). Binomické rozdělení je důležitým konceptem v oblasti datové vědy a často se používá v rámci podnikových aplikací.

Úvod

Pravděpodobnostní rozdělení pro experiment s mincí. Počet pokusů N.png = 10 a pravděpodobností úspěchu (pád orla při jedném hodu) P2.png = 0,5. [1]

Přemýšlejme o následujících experimentech a náhodných veličinách:

  1. Házíme 10krát mincí. Označme X.png počet kolikrát padne orel.
  2. Stroj vyrábí díly a některé z nich jsou vadné. Označme X.png jako počet vadných dílů ze 100 z nich náhodně vybraných.
  3. Z celkového počtu pacientů trpících konkrétním onemocněním 35 % zažije zlepšení díky určitému léku. U následujících 1000 pacientů, kterým je podán ten samý lék, označme X.png jako počet pacientů, kteří zpozorují zlepšení.
  4. Test obsahuje 10 otázek s více možnými odpověďmi, každá s čtyřmi možnostmi, a vy hádáte u každé otázky. Označme X.png jako počet správně zodpovězených otázek.

Každý z těchto náhodných experimentů si lze představit jako soubor opakovaných náhodných pokusů: 10 hodů mincí nebo třeba 1000 pacientů užívajících lék. Náhodná veličina X.png je počet pokusů, které splňují určité kritérium. Výsledek každého pokusu buď splňuje kritérium, nebo ne; proto lze každý pokus shrnout jako „úspěch“ nebo „neúspěch“. Například v experimentu s testem je pro každou otázku pouze jedna kombinace možností, která je správná, a tedy považována za úspěch.

Termíny „úspěch“ a „neúspěch“ jsou pouze označení. V případě experimentu 2 je vyrobení vadného dílu označováno jako „úspěch“, protože X.png počítá vadné díly. Stejně dobře můžeme použít označení „A“ a „B“ nebo „0“ a „1“. [1] [2]

Terminologie

Binomický experiment

Nebo také Bernoulliho experiment/Bernoulliho schéma jsme si v úvodu představili, pojďme si ho nadefinovat a formalizovat.

Požadavky

Požadavky pro to, aby náhodný experiment byl binomickým experimentem, jsou následující:

  • Pevný počet (N.png) pokusů.
  • Každý pokus musí být nezávislý na ostatních. (výsledek jednoho pokusu nemá žádný vliv na výsledek ostatních pokusů.)
  • Každý pokus má právě dva možné výsledky, nazývané "úspěch" (výsledek, který nás zajímá) a "neúspěch".
  • Existuje konstantní pravděpodobnost (pravděpodobnost, že pokus skončí „úspěchem“, je stejná v každém z pokusů) (P2.png) úspěchu pro každý pokus, přičemž doplňkem této pravděpodobnosti je pravděpodobnost „neúspěchu“, která se někdy označuje jako Q-formula.png.

[1] [3]

Náhodná veličina

Pro definici binomického rozdělení začneme s definicí náhodné veličiny X.png. Tu lze jednoduše definovat jako číselné vyjádření výsledku náhodného jevu.

Binomická náhodná veličina

V binomických náhodných experimentech je počet „úspěchů“ v n pokusech náhodný. Může nabývat celočíselných hodnot od 0, pokud všechny pokusy skončí „neúspěchem“, nebo může být tak vysoký jako je N.png, pokud všechny pokusy skončí „úspěchem“. Náhodná proměnná X.png, která reprezentuje počet „úspěchů“ v těchto N.png pokusech, se nazývá binomická náhodná veličina a je určena hodnotami N.png a P2.png.

Definice

Binomická náhodná veličina X.png je definována jako počet výskytu události (úspěchů) v N.png Bernoulliho pokusech. To, že má náhodná veličina binomické rozdělení zapisujeme: [4]

Vbr.png

Příklad: Binomické nebo ne?

Zvažme ještě několik náhodných experimentů. U každého z nich rozhodneme, zda je náhodná proměnná binomická. Pokud je, určíme hodnoty pro N.png a P2.png. Pokud není, vysvětlíme proč.

Příklad A
Házíme spravedlivou kostkou 50krát; X.png je počet krát, kdy padla šestka.
X.png je binomická s N.png = 50 a P2.png = 1/6.
Příklad B
Opět házíme spravedlivou kostkou, X.png je počet hodů potřebných k dosažení šestky.
X.png není binomická, protože počet pokusů není pevně stanovený.
Příklad C
Vybíráme náhodně 3 karty jednu po druhé, nevracíme je zpátky do balíčku, z klasické sady obsahující 4 druhy karet. X.png je počet vybraných karet se znakem srdce.
X.png není binomická, protože výběry nejsou nezávislé. (Pravděpodobnost úspěchu (P2.png) není konstantní, protože je ovlivněna předchozími výběry.)
Příklad D
Odpovídáme na 10 testových otázek zcela náhodně, prvních pět otázek je ano/ne a druhých pět otázek má čtyři možnosti, ze kterých je jedna správná. X.png představuje počet správných odpovědí.
X.png není binomická, protože pravděpodobnost P2.png se mění z 1/2 na 1/4.
Příklad E
Pravděpodobnost mít krevní skupinu B je 0,1. Vybíráme 4 náhodné osoby. X.png je počet osob s krevní skupinou B.
X.png je binomická s N.png = 4 a P2.png = 0,1.
Komentář: Při výběru relativně malé náhodné vzorky (4 osoby) z velké populace, i když se odběr provádí bez „náhrady“, můžeme předpokládat nezávislost, protože matematický vliv odstranění jednoho jedince z velké populace na další výběr je zanedbatelný.

[3]

Binomické pravděpodobnostní rozdělení

Nyní je čas diskutovat o pravděpodobnostním rozdělení binomické náhodné veličiny. Začneme jednoduchým příkladem a poté se přesuneme k obecnému vzorci.

Příklad Přenosový kanál

Citace

  1. 1.0 1.1 1.2 KUMAR, Ajitesh Binomial Distribution Explained with Examples [online]. 2023 [cit. 2023-06-01] Dostupné z: https://vitalflux.com/binomial-distribution-defined-with-10-examples/
  2. MONTGOMERY, Douglas C. Applied Statistics and Probability for Engineers [online]. 2011 [cit. 2023-06-01] Dostupné z: https://industri.fatek.unpatti.ac.id/wp-content/uploads/2019/03/088-Applied-Statistics-and-Probability-for-Engineers-Douglas-C.-Montgomery-George-C.-Runger-Edisi-5-2011.pdf
  3. 3.0 3.1 UF Health Binomial Random Variables [online]. 2014 [cit. 2023-06-01] Dostupné z: https://bolt.mph.ufl.edu/6050-6052/unit-3b/binomial-random-variables/
  4. VŠB DISKRÉTNÍ ROZDĚLENÍ PRAVDĚPODOBNOSTI [online].[cit. 2023-06-01] Dostupné z: https://homel.vsb.cz/~dom033/predmety/statistika/ucebni_text/7DNV.pdf