Queueing theory/cs
Contents
Teorie hromadné obsluhy (Teorie front) [1]
Jednou z podskupin diskrétních simulací je teorie hromadné obsluhy, v češtině často nazývaná jako "Teorie front".
Úvod
Teorie front zkoumá systémy, na které opakovaně přicházejí sekvence požadavků a jejich výskyt je náhodný. Zjišťujeme tak například potřebnou kapacitu zdrojů, nebo optimální využití výrobních linek. Tato chování se dají nasimulovat do tzv. stochastických modelů. Cílem těchto modelů je analýza stávajících systémů a nalezení nejvhodnějšího způsobu optimalizace. Zároveň se musí optimalizovat množství lidí čekajících ve frontě a vytížení obslužných linek. Pro simulování frontových systémů potřebujeme informace o vstupním toku (např. jak často přijde nový požadavek na server), o frontovém systému, který se vytvoří, pokud požadavek nemůže být ihned vyřízen a organizace obsluhy - počet volných jednotek vykonávající proces obsluhy a jejich popis. Pokud mluvíme o vstupu jako o zákazníkovi, nejedná se o zákazníka v striktním slova smyslu, ale může to být proces, služba, člověk ale i jakýkoliv požadavek čekající na vyřízení.
systém | obslužné linky | požadavky |
---|---|---|
banka | úředníci u přepážky | klienti |
výrobní linka | místa na výrobní lince | výrobky |
ordinace u lékaře | lékař | pacienti |
lyžařské středisko | vleky | lyžaři |
benzínová pumpa | čerpací stojany | vozidla |
samoobsluha | pokladny, nákupní vozíky | zákazníci |
Schéma teorie front
- Objekty vyžadující obsluhu (zákazníci, jednotky, požadavky)
- Množina jednotek přicházející v úvahu pro hromadnou obsluhu
- Časová posloupnost vstupu jednotek
- Množina jednotek čekajících na obsluhu
- Systém realizující obsluhu
- Časová posloupnost výstupu
Základní informace nutné k řešení
Pro analýzu a návrh/optimalizaci systémů hromadné obsluhy je nutné znát základní parametry:
Vstupní tok
Zdroj požadavků, hraje velmi důležitou roli při analýze systémů hromadné obsluhy. I přesto, že v reálném světě jsou všechny vstupy konečné, při analýze systémů hromadné obsluhy se je lze považovat za nekonečné. "Zákazníci" mohou do systému vstupovat jednotlivě nebo hromadně - popis těchto příchodů probíhá pomocí intenzity příchodů (počet požadavků, které do systému přijdou za časovou jednotku), nebo pomocí intervalů mezi příchody. Např. za hodinu přijde průměrně 8 požadavků za hodinu, potom je interval mezi příchody 1/8 hodiny.
- Deterministický příchod požadavků
Intervaly mezi příchody požadavků jsou fixní hodnoty.
- Stochastický
Intervaly příchodů jsou proměnlivé, a proto bývají definovány pomocí pravděpodobnostních rozdělení. Toto rozdělení zjistíme analýzou empirických dat. Pro většinu případů lze využít rozdělení exponenciální [1] a využívá parametr pro označení intenzity příchodů. Střední hodnota tohoto rozdělení je určena jako:
.
Převrácená hodnota - tedy střední hodnota () vyjadřuje průměrnou dobu mezi příchody požadavků do systému.
Doba trvání obsluhy
Stejně jako při deklaraci intenzity vstupů se využívají popisy deterministické nebo pravděpobobnostní. Nejčastější je opět rozdělení exponenciální, nyní s parametrem , který označuje intenzitu obsluhy. Střední doba trvání obsluhy dostaneme jako:
Pokud je v systému zahrnuto více obslužných systémů, mohou se zapojovat sériově nebo paralelně do sítí. Tím se zvýší množství vyřízených požadavků při stejném časovém úseku. U paralelně zapojených systému se klade důraz na jejich zaměření (ne všechny mohou poskytovat stejné služby).
Převrácená hodnota - tedy střední hodnota označuje průměrnou délku doby trvání obsluhy.
Frontový režim
Ne vždy jsou všechny požadavky hned vyřízeny a z tohoto důvodu se u obslužných linek mohou tvořit fronty "zákazníků" čekajících na vyřízení. Řád fronty určuje, jak probíhá práce s požadavky ve frontě čekajícími. U paralelně zapojených systémů se rozlišují dva typy fronty - jedním typem je fronta, ze které odchází požadavky ke všem obslužným linkám postupně a druhý, kde se před každým obslužným systémem vytváří fronta vlastní.
- FIFO (First-in / First-out)
Požadavky přistupují k obsluze ve stejném pořadí, ve kterém přišly
- LIFO (Last-in / First-out) = LCFS (Last-come / first-served)
Fronta kdy jdou jako první na řadu ty požadavky, které přišly jako poslední
- SIRO (Service in Random Order)
Náhodný způsob výběru
- PRI (Priority queue)
Požadavky přicházejí s předem definovanými prioritami. Pokud se ve frontě sejde víc požadavků se stejnou prioritou, pokračuje podle klasicky definovaného způsobu (např. FIFO, LIFO, SIRO)
Kendallova klasifikace
D.G. Kendall byl anglický statistik a matematik, v 50. letech zavedl notaci pro jednotnou charakteristiku systémů hromadné obsluhy. Jelikož jsou systémy hromadné obsluhy velmi komplexní, je nutné standardizovat jejich značení pro zjednodušení následných výpočtů.
Profesor David George Kendall [3]
15 January 1918 – 23 October 2007 člen the Royal Society (1964) |
---|
Anglický statistik a matematik Zasadil se o rozvoj teorie pravděpodobnosti, statistické analýzy tvarů a vzhledu Vyučoval v Oxfordu a Cambridge Ocenění * Royal Statistical Society 1955 the Guy Medal in Silver, 1981 the Guy Medal in Gold * London Mathematical Society 1980 Senior Whitehead Prize, 1989 De Morgan Medal |
Jelikož tyto informace nejsou v praxi dostačující, rozšířil se model o další 3 klasifikační třídy.
Na jednotlivé pozice se do modelu dosazují kódy (výsledný model může mít až šestimístný kód - A/B/C/D/E/F)[4]
- A
Pravděpodobností rozdělení intervalů mezi příchody požadavků, nejčastěji:
M - exponenciální rozdělení
D - konstantní interval mezi příchody
G - obecné rozdělení se střední hodnotou a směrodatnou odchylkou
- B
Pravděpodobnostní rozdělení doby obsluhy, stejné jako A (M,D,G)
- C
Počet paralelně zapojených obslužných linek
- D
Kapacita obslužného systému (neuvedeno = )
- E
Zdroje požadavků (neuvedeno = )
- F
Systém fronty (FIFO, LIFO, ...)
Např. zápis systému M/M/1/ / /FIFO se zjednodušeně zapíše M/M/1
Analýza systému hromadné obsluhy
Teorie front se v praxi využívá k určení optimální kapacity obslužných systémů. Pokud jdeme například k lékaři na magnetickou rezonanci, musíme se objednávat dlouho dopředu. Rezonance má své časové limity pro obsloužení jednotlivých pacientů (časové náklady aj.), frontu můžeme urychlit, pokud například přidáme další převlékací místnost - jeden pacient je na MRI, druhý pacient se může připravit, po skončení první pacient rovnou odchází do převlékárny, druhý ho střídá. Pomocí teorie front můžeme určit, jak se zrychlí objednávání pacientů, pokud přidáme další přístroj, jaký by měl být minimální časový rozestup v objednávání pacientů aj.
Časové charakteristiky týkající se požadavků
Zjišťujeme především průměrnou dobu požadavků strávenou ve frontě před obsluhou, označujeme symbolem a průměrnou dobu strávenou v systému (celkově) . Průměrnou dobu, kterou střáví požadavek v systému je suma průměrné doby strávené ve frontě a průměrné doby trvání obsluhy , tedy:
.
Charakteristiky týkající se počtu požadavků
Zjišťujeme půrměrnou délku fronty nebo průměrný počet požadavků v systému . V jednodušších modelech se najde přímý vztah mezi průměrným počtem požadavků v systému (ve frontě) je roven průměrnému času, který požadavek stráví v systému (ve frontě), vynásobenému hodnotou , tedy:
,
.
Pravděpodobnostní charakteristiky
Z hlediska optimalizace a matematických analýz jsou velmi důležité matematické charakteristiky. Mezi ty nejdůležitější se řadí pravděpodobnost, že:
- Systém nepracuje (že není využit) nebo naopak, že pracuje
- Nově příchozí požadavek bude muset čekat ve frontě
- V systému je požadavků
- Požadavek nebude moci přistoupit k obsluze (systém s omezenou kapacitou míst ve frontě)
Nákladové charakteristiky
Pokud jsme schopni vyjádři náklady na čekání požadavků, prostoje nebo využití obslužných linek, je možné nákladově zefektivnit chod systému
- Minimální náklady na provoz za určitý čas
- Optimální počet obslužných linek v provozu
Analytické vs. simulační řešení
Analytické řešení se zabývá odvozením charakteristik systému a nalezení vzorců, které se pak používají stále dokola. Například počet obslužných linek , intenzita příchodů , nebo intenzita obsluhy . Analytické řešení bývá velmi uživatelsky příjemné. Výsledky jsou k dispozici velmi rychle, ale dají se použít pouze pro ty jednodužší případy. Tedy není vhodné pro sériově řazené obslužné linky, stejně jako modely s například omezenou trpělivostí požadavků, systém s PRI systémem fronty aj.
Pro případy modelů a se využívá systémových simulací. Napodobuje se chování reálného systému - výhoda je v tom, že výsledky, které bychom normálně sledovali i několik měsíců jsou k dispozici během pár minut. Tímto způsobem se testují téměř všechny navrhované systémy hromadné obsluhy.
Exponenciální model
Je sobota odpoledne, odpočíváte po náročném pracovním týdnu a rozhodnete se, že si zlepšíte svou fyzickou kondici a vyrazíte na večerní projížďku na kole. Cestou ale spadnete a musíte navštívit místní pohotovost. Na výběr máte dvě pohotovosti v sousedství, ale o víkendu na obou pohotovostech ordinuje pouze jeden lékař. Víte, že pacienti přicházejí na pohotovost A každých 8 minut (intervaly mezi příchody jsou exponenciálně rozdělené), na pohotovost B každých 10 minut (se stejným rozdělením). Průměrná doba ošetření je v nemocnici A 6 minut, v nemocnici B 5 minut. Průměrná doba rozdělení je náhodná veličina s exponenciálním rozdělením. Pacienti jsou na obou pohotovostech přijímáni v tom pořadím, ve kterém do nemocnice přišli. Kterou pohotovost si vyberete?
Pouze jedna obslužná linka |
Intervaly mezi příchody mají exponenciální rozdělení s parametrem |
Doba trvání obsluhy je náhodná veličina s exponenciálním rozdělením s parametrem |
Neomezená kapacita systému |
Neomezený zdroj požadavků |
Režim fronty FIFO |
Pro optimalizaci a stabilizaci systému je důležité, aby byla splněna základní podmínka, a to, že intenzita příchodů je nižší než intenzita obsluhy , tedy intenzita provozu .
Systém má dva parametry - intenzitu příchodů a intenzitu obsluhy . Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):
.
Tedy pravděpodobnost, že v systému je alespoň 1 požadavek (=obslužný systém je v provozu):
Prvek označuje intenzitu provozu systému hromadné obsluhy. Tato hodnota udává zároveň pravděpodbobnost, že nově příchozí požadavek do systému bude muset čekat ve frontě.
Pravděpodobnost, že v systému je požadavků a požadavků čeká ve frontě:
Průměrná doba, kterou požadavek stráví v systému a ve frontě je , tedy
.
Průměrný počet požadavků v systému , a ve frontě :
,
odtud
.
Nyní se vrátíme k našemu příkladu, jak si vybrat lepší pohotovost? Pokud dosadíme hodnoty do vzorečků, získáme rychlou odpověď.
proměnná | Pohotovost A | Pohotovost B |
---|---|---|
, intenzita příchodů (1 hod) | 60/8=7,5 | 60/10=6 |
, intenzita obsluhy (1 hod) | 60/6=10 | 60/5=12 |
, intenzita provozu | 7,5/10=0,75 | 6/12 = 0,5 |
S pravděpodobností 75% bude na pohotovosti A alespoň jeden pacient, na pohotovosti B 50%. Naopak na pohotovosti A s pravděpodobností 25% (1-0,75) nebude v čekárně nikdo čekat, v pohotovosti B s pravděpodobností 50%.
Ukládání na single server s frontou [6]
Queueing Theory and its Applications [7] |
---|
Sbírka výzkumných prací k výročí 65. narozenin Části knihy
|
Efektivní ukládání a maintanence front je základním prvkem počítačových věd. V následující studii od E. G. Coffmana Jr. a I. Mitraniho ze společností AT&T Bell Laboratiories zpracovávají stochastické modely lineárních úložných zařízení s frontou M/M/1, jako skrytým procesem příchodů a odchodů požadavků. Dále se zabývají nevyužitým prostorem při využití FIFO fronty, procesorově sdílenými službami a přísnými alokačními pravidly.
- Představení problému
V aplikacích teorie front existuje mnoho obsáhlých studií zaměřených ne pouze na výkonost a počet front a čekacích časů, ale i na analýzu zdrojů a řazení položek do front. V této výzkumné práci platí následující omezení:
a) fronta může být nekonečná a ukládání probíhá do lineárního pole,
b) požadavek je umístěn do buňky, kde zůstává až do jeho vyřízení
Model má určenou politiku ukládání. Což znamená pravidlo, které rozhoduje, do které z prázdných buněk ve frontě budou příchozí požadavky ukládány. Pro ukládání využíváme FIFO službu a nové přírůstky do fronty rozšiřují frontu doprava, pokud je fronta prázdná, uloží se příchozí požadavek co nejvíc doleva. Proměnné:
délka fronty v čase ,
index poslední obsazené buňky v čase
počet prázdných buněk směrem doleva (zbytečně volných buněk)
Zároveň definujeme , pokud .
Pokud je Markovův proces, tak R ani W nejsou Markovým řetězcem. Primárně předpokládáme stacionární chování, a pokud opomeneme index z našeho procesu, odkážeme se na náhodnou veličinu se stacionárním rozdělením. Definujme a jako distribuce a a složenou distribuci určenou pomocí . Zároveň definujeme generující funkci:
Failed to parse (syntax error): {\displaystyle F(u,v) = \sum\limits_{i &\ge& 0}} Failed to parse (syntax error): {\displaystyle \sum\limits_{j &\ge& 0}p_{ij}u^iv^j}
a generují a . Klasické modely dokazují, že pokud je . Proto v případě dostaneme:
Failed to parse (syntax error): {\displaystyle q_i = (1-p)p^1, i &\ge&0} Je vhodné rozšířit naši pravděpdobnostní notaci pro negativní hodnoty indexu (ale definujeme je jako nulové), proto: , pokud a , pokud je nebo .
- FIFO Fronta
Nové příchody jsou umístěny do prázdných buněk, za poslední obsazenou (nebo do první buňky, pokud je fronta prázdná). Primárním cílem je nalézt distribuci :
Jelikož není Markovův proces, můžeme ho analyzovat jako okraj bivariačního Markovova procesu se stacionární pravděpodobností . Z definice modelu dostáváme , to ovlivňuje , následně dosadíme:
(2.1) Failed to parse (syntax error): {\displaystyle P_{00} = q_0 = (1-p), P_{i0} = 0, i &\ne& 0 } .
Obecná generující funkce (2.2): Failed to parse (unknown function "\fra"): {\displaystyle P_{ij} = \fra{1}{1+p}q_{i-1, j+1} + \frac{p}{1+p} P_{i,j-1}, j &\ne& 0 } .
Pokud dosadíme do naší, získáme (2.3): , kde
Failed to parse (syntax error): {\displaystyle K(u)=\frac{1}{1-p}\sum\limits_{i&\ge&0}p_{i1} u^i } je neznámou funkcí.
Nyní je analytické pro a , kdykoliv jmenovatel dosáhne kořenu musí i čitatel. Pro každé v jednotce disku je přesně jedno , pro které jmenovatel zmizí a tato hodnota je dána (2.4):
Failed to parse (syntax error): {\displaystyle v(u) = \frac{1+p-&\sqrt{(1+p)^2-4pu}&}{2p}} ,
následnou substitucí (2.4) a dosazením do čitatele (2.3) dostaneme (2.5):
.
Další substitucí (2.5) do (2.3) a nastavením , dostaneme požadovanou generující funkci (2.6):
.
Nyní jsme se dostali k momentu, kde použijeme klasické řešení - například: .
Studie dále pokračuje výpočtem horních hranic modelu, dolní hranicí procesorově-sdíleným modelem a asymptotickými odhady.
Exponenciální model
Na úvod si opět uveďme jednoduchý příklad. Česká pošta modernizuje svou pobočku v nejmenovaném městě. Rozhodla se, že pro listovní operace vyhradí 3 přepážky. Obyvatelé, potenciální zákazníci, si po příchodu berou pořadové číslo a zařadí se do fronty. Podle těchto čísel jsou voláni k volné přepážce. Následně bylo odpozorováno, že po rekonstrukci přicházejí zákazníci s průměrnou intenzitou 68 za hodinu s tím, že intervaly mezi příchody mají exponenciální rozdělení. Každý klient stráví u přepážky různě dlouhou dobu (náhodná veličina) s exponenciálním rozdělením se střední hodnout 2,4 minuty (za hodinu je každá přepážka schopná odbavit 25 klientů (=60/2,4). Úkolem je zjistit, průměrnou dobu čekání na odbavení (ve frontě) a průměrnou dobu obsluhy včetně obsluhy.
Podmínkou pro optimalizaci je intenzita celého provozu systému
identických obslužných jednotek v systému |
Intervaly mezi příchody požadavků mají exponenciální rozdělení s parametrem |
Doba obsluhy na každé z linek je náhodná veličina s exponenciálním rozdělením s parametrem |
Neomezená kapacita systému |
Neomezený zdroj požadavků |
Režim fronty FIFO |
Systém má tři parametry - počet obslužných linek , intenzitu příchodů a intenzitu obsluhy u každé z obslužných linek.
Intenzita obsluhy je u každé z linek vlastní, a proto je výsledek celého systému roven součinu a .
Základní proměnné:
poměr intenzity příchodů a individuální intenzity obsluhy
intenzita provozu celého systému (=průměrné využití všech obslužných linek systému)
Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):
.
Tedy pravděpodobnost, že v systému je alespoň n požadavků, Failed to parse (syntax error): {\displaystyle n&\le&c} (=obslužný systém je v provozu):
Failed to parse (syntax error): {\displaystyle p_n = \frac{r^n}{n!}p_0, n&\le&c} .
Pravděpodobnost, že v systému je požadavků (), všechny systémy jsou tedy v provozu:
.
Průměrná doba, kterou požadavek stráví v systému a ve frontě je :
,
tedy
.
Průměrný počet požadavků v systému , a ve frontě :
,
odtud
.
Pravděpodobnost, že nově příchozí požadavek bude zařazen do fronty,
.
Zpět k našemu příkladu. Máme uvedno, že v systému jsou 3 přepážky vyřizující listovní služby - tedy . Intenzita příchodů požadavků je průměrně 68 za hodinu a intenzita obsluhy je 25 klientů za hodiny
proměnná | hodnota |
---|---|
, intenzita příchodů (1 hod) | 68 |
, intenzita obsluhy (1 hod) | 25 |
, intenzita provozu celého systému | 68/75 = 0,9067 |
Podmínka stabilizace je splněna (). Nejprve vypočteme pravděpodobnost, že v systému není žádný požadavek:
.
Pravděpodobnost je tedy 2,31%.
Časové charakteristiky a informace o počtu požadavků získame při použití rovnic na výpočet a .
zákazníka ,
zákazníka.
Průměrná doba čekání ve frontě je tedy 7,1 minuty, průměrná doba včetně obsluhy potom 9,5 minuty. Ve frontě je průměrně více jak 8 zákazníků a v celém systému 10, 77.
Optimalizace modelu
Optimalizace probíhá na úrovni nalezení konkrétní hodnoty , tak aby byly minimalizovány náklady na provoz celého systému. Proměnné:
náklady na pobyt jednoho požadavku v systému za jednotku času
náklady na provoz jedné obslužné linky v systému za jednotku času
průměrný počet jednotek v systému
počet paralelně řazených obslužných linek
Nákladovou funkci definujeme:
.
Rovnice se skládá ze dvou částí: a . První část () značí náklady na pobyt požadavku v systému za určitý čas a druhá část () charakterizuje náklady na provoz všech obslužných linek za časovou jednotku. Při navýšení obslužných systémů dojde ke zvýšení nákladů a sníží se průměrný počet požadavků v systému a naopak.
Pokud použijeme příklad pošty, doplníme náklady - například, pokud náklady na pobyt jednoho zákazníka v systému jsou 200 Kč (, náklady na provoz přepážky jsou 500 Kč . Při celkovém počtu přepážek, které jsme uvažovali, byl průměrný systém .
Po dosazení do nákladové funkce dostaneme výslednou částku:
Kč.
Pro nalezení optimálního poměru mezi počtem obslužných linek a náklady použijeme vypočtenou tabulku:
počet linek | N pobyt klientů | N provoz | N celkem |
---|---|---|---|
2 | 1000 | ||
3 | 2154 | 1500 | 3654 |
4 | 714 | 2000 | 2714 |
5 | 586 | 2500 | 3086 |
6 | 556 | 3000 | 3556 |
Z této tabulky můžeme vybrat pro nás nejlepší poměr mezi náklady na pobyt v systému a na provoz. (např. nyní pro nás nejlépe vycházejí 4 obslužné linky, 3 jsou nejdražší).
Reference
- ↑ JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
- ↑ JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
- ↑ Divergiendo: 23 de octubre: David Kendall. Divergiendo [online]. 2012 [cit. 2015-06-16]. Dostupné z: https://divergiendo.wordpress.com/2012/10/23/23-de-octubre-david-kendall/
- ↑ JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
- ↑ JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
- ↑ COHEN, Jacob Willem, O BOXMA a R SYSKI. Queueing theory and its applications: liber amicorum for J.W. Cohen. New York, N.Y., U.S.A.: Sole distributors for U.S.A. and Canada, Elsevier Science, 1988, xxii, 446 p. ISBN 04-447-0497-3.
- ↑ COHEN, Jacob Willem, O BOXMA a R SYSKI. Queueing theory and its applications: liber amicorum for J.W. Cohen. New York, N.Y., U.S.A.: Sole distributors for U.S.A. and Canada, Elsevier Science, 1988, xxii, 446 p. ISBN 04-447-0497-3.
- ↑ JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.