Queueing theory/cs

=Teorie hromadné obsluhy (Teorie front) = Jednou z podskupin diskrétních simulací je teorie hromadné obsluhy, v češtině často nazývaná jako "Teorie front".

Úvod
Teorie front zkoumá systémy, na které opakovaně přicházejí sekvence požadavků a jejich výskyt je náhodný. Zjišťujeme tak například potřebnou kapacitu zdrojů, nebo optimální využití výrobních linek. Tato chování se dají nasimulovat do tzv. stochastických modelů. Cílem těchto modelů je analýza stávajících systémů a nalezení nejvhodnějšího způsobu optimalizace. Zároveň se musí optimalizovat množství lidí čekajících ve frontě a vytížení obslužných linek. Pro simulování frontových systémů potřebujeme informace o vstupním toku (např. jak často přijde nový požadavek na server), o frontovém systému, který se vytvoří, pokud požadavek nemůže být ihned vyřízen a organizace obsluhy - počet volných jednotek vykonávající proces obsluhy a jejich popis. Pokud mluvíme o vstupu jako o zákazníkovi, nejedná se o zákazníka v striktním slova smyslu, ale může to být proces, služba, člověk ale i jakýkoliv požadavek čekající na vyřízení.

Schéma teorie front

 * Objekty vyžadující obsluhu (zákazníci, jednotky, požadavky)
 * Množina jednotek přicházející v úvahu pro hromadnou obsluhu
 * Časová posloupnost vstupu jednotek
 * Množina jednotek čekajících na obsluhu
 * Systém realizující obsluhu
 * Časová posloupnost výstupu

Základní informace nutné k řešení
Pro analýzu a návrh/optimalizaci systémů hromadné obsluhy je nutné znát základní parametry:

Vstupní tok
Zdroj požadavků, hraje velmi důležitou roli při analýze systémů hromadné obsluhy. I přesto, že v reálném světě jsou všechny vstupy konečné, při analýze systémů hromadné obsluhy se je lze považovat za nekonečné. "Zákazníci" mohou do systému vstupovat jednotlivě nebo hromadně - popis těchto příchodů probíhá pomocí intenzity příchodů (počet požadavků, které do systému přijdou za časovou jednotku), nebo pomocí intervalů mezi příchody. Např. za hodinu přijde průměrně 8 požadavků za hodinu, potom je interval mezi příchody 1/8 hodiny. Intervaly mezi příchody požadavků jsou fixní hodnoty. Intervaly příchodů jsou proměnlivé, a proto bývají definovány pomocí pravděpodobnostních rozdělení. Toto rozdělení zjistíme analýzou empirických dat. Pro většinu případů lze využít rozdělení exponenciální a využívá parametr $$\lambda$$ pro označení intenzity příchodů. Střední hodnota tohoto rozdělení je určena jako: $$E(X) = (\frac{1}{\lambda})$$.
 * Deterministický příchod požadavků
 * Stochastický

Převrácená hodnota $$\lambda$$ - tedy střední hodnota ($$\frac{1}{\lambda}$$) vyjadřuje průměrnou dobu mezi příchody požadavků do systému.

Doba trvání obsluhy
Stejně jako při deklaraci intenzity vstupů se využívají popisy deterministické nebo pravděpobobnostní. Nejčastější je opět rozdělení exponenciální, nyní s parametrem $$\mu$$, který označuje intenzitu obsluhy. Střední doba trvání obsluhy dostaneme jako: $$E(X) = (\frac{1}{\mu})$$

Pokud je v systému zahrnuto více obslužných systémů, mohou se zapojovat sériově nebo paralelně do sítí. Tím se zvýší množství vyřízených požadavků při stejném časovém úseku. U paralelně zapojených systému se klade důraz na jejich zaměření (ne všechny mohou poskytovat stejné služby).

Převrácená hodnota $$\mu$$ - tedy střední hodnota $$(\frac{1}{\mu})$$ označuje průměrnou délku doby trvání obsluhy.



Frontový režim
Ne vždy jsou všechny požadavky hned vyřízeny a z tohoto důvodu se u obslužných linek mohou tvořit fronty "zákazníků" čekajících na vyřízení. Řád fronty určuje, jak probíhá práce s požadavky ve frontě čekajícími. U paralelně zapojených systémů se rozlišují dva typy fronty - jedním typem je fronta, ze které odchází požadavky ke všem obslužným linkám postupně a druhý, kde se před každým obslužným systémem vytváří fronta vlastní.

Požadavky přistupují k obsluze ve stejném pořadí, ve kterém přišly Fronta kdy jdou jako první na řadu ty požadavky, které přišly jako poslední Náhodný způsob výběru Požadavky přicházejí s předem definovanými prioritami. Pokud se ve frontě sejde víc požadavků se stejnou prioritou, pokračuje podle klasicky definovaného způsobu (např. FIFO, LIFO, SIRO)
 * FIFO (First-in / First-out)
 * LIFO (Last-in / First-out) = LCFS (Last-come / first-served)
 * SIRO (Service in Random Order)
 * PRI (Priority queue)

Kendallova klasifikace
D.G. Kendall byl anglický statistik a matematik, v 50. letech zavedl notaci pro jednotnou charakteristiku systémů hromadné obsluhy. Jelikož jsou systémy hromadné obsluhy velmi komplexní, je nutné standardizovat jejich značení pro zjednodušení následných výpočtů.



Jelikož tyto informace nejsou v praxi dostačující, rozšířil se model o další 3 klasifikační třídy.



Na jednotlivé pozice se do modelu dosazují kódy (výsledný model může mít až šestimístný kód - A/B/C/D/E/F)

Pravděpodobností rozdělení intervalů mezi příchody požadavků, nejčastěji:
 * A

M - exponenciální rozdělení

D - konstantní interval mezi příchody

G - obecné rozdělení se střední hodnotou a směrodatnou odchylkou Pravděpodobnostní rozdělení doby obsluhy, stejné jako A (M,D,G) Počet paralelně zapojených obslužných linek Kapacita obslužného systému (neuvedeno = $$\infty$$) Zdroje požadavků (neuvedeno = $$\infty$$) Systém fronty (FIFO, LIFO, ...)
 * B
 * C
 * D
 * E
 * F

Např. zápis systému M/M/1/ $$\infty$$ / $$\infty$$ /FIFO se zjednodušeně zapíše M/M/1

Analýza systému hromadné obsluhy
Teorie front se v praxi využívá k určení optimální kapacity obslužných systémů. Pokud jdeme například k lékaři na magnetickou rezonanci, musíme se objednávat dlouho dopředu. Rezonance má své časové limity pro obsloužení jednotlivých pacientů (časové náklady aj.), frontu můžeme urychlit, pokud například přidáme další převlékací místnost - jeden pacient je na MRI, druhý pacient se může připravit, po skončení první pacient rovnou odchází do převlékárny, druhý ho střídá. Pomocí teorie front můžeme určit, jak se zrychlí objednávání pacientů, pokud přidáme další přístroj, jaký by měl být minimální časový rozestup v objednávání pacientů aj.

Časové charakteristiky týkající se požadavků
Zjišťujeme především průměrnou dobu požadavků strávenou ve frontě před obsluhou, označujeme symbolem $$T_f$$ a průměrnou dobu strávenou v systému (celkově) $$T$$. Průměrnou dobu, kterou střáví požadavek v systému $$(T)$$ je suma průměrné doby strávené ve frontě $$T_f$$ a průměrné doby trvání obsluhy $$(\frac{1}{\mu})$$, tedy:

$$T = T_f + (\frac{1}{\mu})$$.

Charakteristiky týkající se počtu požadavků
Zjišťujeme půrměrnou délku fronty $$N_t$$ nebo průměrný počet požadavků v systému $$N$$. V jednodušších modelech se najde přímý vztah mezi průměrným počtem požadavků v systému (ve frontě) je roven průměrnému času, který požadavek stráví v systému (ve frontě), vynásobenému hodnotou $$\lambda$$, tedy:

$$N = \lambda T$$,

$$N_t = \lambda T_f$$.

Pravděpodobnostní charakteristiky
Z hlediska optimalizace a matematických analýz jsou velmi důležité matematické charakteristiky. Mezi ty nejdůležitější se řadí pravděpodobnost, že:
 * Systém nepracuje (že není využit) nebo naopak, že pracuje
 * Nově příchozí požadavek bude muset čekat ve frontě
 * V systému je $$ \eta $$ požadavků
 * Požadavek nebude moci přistoupit k obsluze (systém s omezenou kapacitou míst ve frontě)

Nákladové charakteristiky
Pokud jsme schopni vyjádři náklady na čekání požadavků, prostoje nebo využití obslužných linek, je možné nákladově zefektivnit chod systému
 * Minimální náklady na provoz za určitý čas
 * Optimální počet obslužných linek v provozu

Analytické vs. simulační řešení
Analytické řešení se zabývá odvozením charakteristik systému a nalezení vzorců, které se pak používají stále dokola. Například počet obslužných linek $$c$$, intenzita příchodů $$\lambda$$, nebo intenzita obsluhy $$\mu$$. Analytické řešení bývá velmi uživatelsky příjemné. Výsledky jsou k dispozici velmi rychle, ale dají se použít pouze pro ty jednodužší případy. Tedy není vhodné pro sériově řazené obslužné linky, stejně jako modely s například omezenou trpělivostí požadavků, systém s PRI systémem fronty aj.

Pro případy modelů $$M/M/1$$ a $$M/M/c$$ se využívá systémových simulací. Napodobuje se chování reálného systému - výhoda je v tom, že výsledky, které bychom normálně sledovali i několik měsíců jsou k dispozici během pár minut. Tímto způsobem se testují téměř všechny navrhované systémy hromadné obsluhy.

Exponenciální model $$M/M/1$$
Je sobota odpoledne, odpočíváte po náročném pracovním týdnu a rozhodnete se, že si zlepšíte svou fyzickou kondici a vyrazíte na večerní projížďku na kole. Cestou ale spadnete a musíte navštívit místní pohotovost. Na výběr máte dvě pohotovosti v sousedství, ale o víkendu na obou pohotovostech ordinuje pouze jeden lékař. Víte, že pacienti přicházejí na pohotovost A každých 8 minut (intervaly mezi příchody jsou exponenciálně rozdělené), na pohotovost B každých 10 minut (se stejným rozdělením). Průměrná doba ošetření je v nemocnici A 6 minut, v nemocnici B 5 minut. Průměrná doba rozdělení je náhodná veličina s exponenciálním rozdělením. Pacienti jsou na obou pohotovostech přijímáni v tom pořadím, ve kterém do nemocnice přišli. Kterou pohotovost si vyberete?

Pro optimalizaci a stabilizaci systému je důležité, aby byla splněna základní podmínka, a to, že intenzita příchodů $$\lambda$$ je nižší než intenzita obsluhy $$\mu$$, tedy intenzita provozu $$\rho > 1$$.

Systém má dva parametry - intenzitu příchodů $$\lambda$$ a intenzitu obsluhy $$\mu$$. Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):

$$p_0 = 1 - \frac{\lambda}{\mu}$$.

Tedy pravděpodobnost, že v systému je alespoň 1 požadavek (=obslužný systém je v provozu):

$$\rho = \frac{\lambda}{\mu}$$

Prvek $$\rho$$ označuje intenzitu provozu systému hromadné obsluhy. Tato hodnota udává zároveň pravděpodbobnost, že nově příchozí požadavek do systému bude muset čekat ve frontě.

Pravděpodobnost, že v systému je $$n$$ požadavků a $$(n-1)$$ požadavků čeká ve frontě:

$$p_n = p_0 \rho^n = (1- \rho)\rho^n$$

Průměrná doba, kterou požadavek stráví v systému a ve frontě je $$ T = \frac{1}{\mu - \lambda}$$, tedy

$$ T_f = T - \frac{1}{\mu} = \frac{\lambda}{\mu(\mu - \lambda)}$$.

Průměrný počet požadavků v systému $$(N)$$, a ve frontě $$(N_f)$$:

$$ N = \lambda T = \frac{\lambda}{\mu-\lambda}$$,

odtud $$ N_f = \lambda T_f = \frac{\lambda^2}{\mu(\mu-\lambda)} $$.

Nyní se vrátíme k našemu příkladu, jak si vybrat lepší pohotovost? Pokud dosadíme hodnoty do vzorečků, získáme rychlou odpověď.

S pravděpodobností 75% bude na pohotovosti A alespoň jeden pacient, na pohotovosti B 50%. Naopak na pohotovosti A s pravděpodobností 25% (1-0,75) nebude v čekárně nikdo čekat, v pohotovosti B s pravděpodobností 50%.

===Ukládání na single server s frontou ===

Efektivní ukládání a maintanence front je základním prvkem počítačových věd. V následující studii od E. G. Coffmana Jr. a I. Mitraniho ze společností AT&T Bell Laboratiories zpracovávají stochastické modely lineárních úložných zařízení s frontou M/M/1, jako skrytým procesem příchodů a odchodů požadavků. Dále se zabývají nevyužitým prostorem při využití FIFO fronty, procesorově sdílenými službami a přísnými alokačními pravidly. V aplikacích teorie front existuje mnoho obsáhlých studií zaměřených ne pouze na výkonost a počet front a čekacích časů, ale i na analýzu zdrojů a řazení položek do front. V této výzkumné práci platí následující omezení:
 * Představení problému

a) fronta může být nekonečná a ukládání probíhá do lineárního pole,

b) požadavek je umístěn do buňky, kde zůstává až do jeho vyřízení

Model má určenou politiku ukládání. Což znamená pravidlo, které rozhoduje, do které z prázdných buněk ve frontě budou příchozí požadavky ukládány. Pro ukládání využíváme FIFO službu a nové přírůstky do fronty rozšiřují frontu doprava, pokud je fronta prázdná, uloží se příchozí požadavek co nejvíc doleva. Proměnné:

$$Q_t$$ délka fronty v čase $$t$$,

$$R_t$$ index poslední obsazené buňky v čase $$t$$

$$W_t=R_t - Q_t$$ počet prázdných buněk směrem doleva (zbytečně volných buněk)

Zároveň definujeme $$W_t = R_t = 0$$, pokud $$Q_t=0$$.

Pokud je $$Q_t$$ Markovův proces, tak R ani W nejsou Markovým řetězcem. Primárně předpokládáme stacionární chování, a pokud opomeneme index $$t$$ z našeho procesu, odkážeme se na náhodnou veličinu se stacionárním rozdělením. Definujme $$\{p_i\}$$ a $$\{q_i\}$$ jako distribuce $$W$$ a $$Q$$ a složenou distribuci $$(W,Q)$$ určenou pomocí $$\{p_{ij}\}$$. Zároveň definujeme generující funkci:

$$F(u,v) = \sum\limits_{i &\ge& 0}$$ $$\sum\limits_{j &\ge& 0}p_{ij}u^iv^j$$

$$F(u,1)$$ a $$F(1,v)$$ generují $$p_i$$ a $$q_i$$. Klasické modely dokazují, že pokud je $$\rho = (\frac{\lambda}{\mu})<1$$. Proto v případě $$Q$$ dostaneme:

$$q_i = (1-p)p^1, i &\ge&0$$ Je vhodné rozšířit naši pravděpdobnostní notaci pro negativní hodnoty indexu (ale definujeme je jako nulové), proto: $$p_i\equiv0, q_i \equiv 0$$, pokud $$i>1$$ a $$p_{ij}\equiv0$$, pokud je $$i<0$$ nebo $$j<0$$. Nové příchody jsou umístěny do prázdných buněk, za poslední obsazenou (nebo do první buňky, pokud je fronta prázdná). Primárním cílem je nalézt distribuci $$W$$: $$\{p_i\}$$
 * FIFO Fronta



Jelikož $$W_t$$ není Markovův proces, můžeme ho analyzovat jako okraj bivariačního Markovova procesu $$(W_t,Q_t)$$ se stacionární pravděpodobností $$P_{ij}$$. Z definice modelu dostáváme $$Q_t = 0$$, to ovlivňuje $$W_t = 0$$, následně dosadíme:

(2.1) $$P_{00} = q_0 = (1-p), P_{i0} = 0, i &\ne& 0 $$.

Obecná generující funkce (2.2): $$P_{ij} = \fra{1}{1+p}q_{i-1, j+1} + \frac{p}{1+p} P_{i,j-1}, j &\ne& 0 $$.

Pokud dosadíme do naší, získáme (2.3): $$F(u,v) = (1-p) \frac{u-(1+p)v+uvK(u)}{pv^2 -(1+p)v+u}$$, kde

$$K(u)=\frac{1}{1-p}\sum\limits_{i&\ge&0}p_{i1} u^i $$ je neznámou funkcí.

Nyní je $$F(u,v)$$ analytické pro $$u$$ a $$v$$, kdykoliv jmenovatel dosáhne kořenu musí i čitatel. Pro každé $$u$$ v jednotce disku je přesně jedno $$v$$, pro které jmenovatel zmizí a tato hodnota je dána (2.4):

$$v(u) = \frac{1+p-&\sqrt{(1+p)^2-4pu}&}{2p}$$,

následnou substitucí (2.4) a dosazením do čitatele (2.3) dostaneme (2.5):

$$K(u) = \frac{(1+p)v(u)-u}{uv(u)}$$.

Další substitucí (2.5) do (2.3) a nastavením $$v=1$$, dostaneme požadovanou generující funkci $$p_i$$ (2.6):

$$F(u,1)=(1-p) \frac{u(1-v(u))}{(1-u)v(u)}$$.

Nyní jsme se dostali k momentu, kde použijeme klasické řešení - například: $$E(W)=(\frac{p}{(1-p)})^2$$.

Studie dále pokračuje výpočtem horních hranic modelu, dolní hranicí procesorově-sdíleným modelem a asymptotickými odhady.

Exponenciální model $$M/M/c$$
Na úvod si opět uveďme jednoduchý příklad. Česká pošta modernizuje svou pobočku v nejmenovaném městě. Rozhodla se, že pro listovní operace vyhradí 3 přepážky. Obyvatelé, potenciální zákazníci, si po příchodu berou pořadové číslo a zařadí se do fronty. Podle těchto čísel jsou voláni k volné přepážce. Následně bylo odpozorováno, že po rekonstrukci přicházejí zákazníci s průměrnou intenzitou 68 za hodinu s tím, že intervaly mezi příchody mají exponenciální rozdělení. Každý klient stráví u přepážky různě dlouhou dobu (náhodná veličina) s exponenciálním rozdělením se střední hodnout 2,4 minuty (za hodinu je každá přepážka schopná odbavit 25 klientů (=60/2,4). Úkolem je zjistit, průměrnou dobu čekání na odbavení (ve frontě) a průměrnou dobu obsluhy včetně obsluhy.

Podmínkou pro optimalizaci je intenzita celého provozu systému $$\rho = \frac{\lambda}{c \mu} <1$$

Systém má tři parametry - počet obslužných linek $$c$$, intenzitu příchodů $$\lambda$$ a intenzitu obsluhy $$\mu$$ u každé z obslužných linek.

Intenzita obsluhy je u každé z linek vlastní, a proto je výsledek celého systému roven součinu $$c$$ a $$\mu$$.

Základní proměnné:

poměr intenzity příchodů a individuální intenzity obsluhy $$r = \frac{\lambda}{\mu}$$

intenzita provozu celého systému $$\rho = \frac{\lambda}{c\mu}$$ (=průměrné využití všech obslužných linek systému)

Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):

$$p_0 = [(\sum\limits_{k=0}^{c-1}\frac{r^k}{k!}) + \frac{cr^c}{(c-r)c!}]^{-1}$$.

Tedy pravděpodobnost, že v systému je alespoň n požadavků, $$n&\le&c$$ (=obslužný systém je v provozu):

$$p_n = \frac{r^n}{n!}p_0, n&\le&c$$.

Pravděpodobnost, že v systému je $$n$$ požadavků ($$n>c$$), všechny systémy jsou tedy v provozu:

$$p_n = \frac{r^n}{c!c^{n/c}}p_0, n>c$$.

Průměrná doba, kterou požadavek stráví v systému $$(T)$$ a ve frontě je $$(T_f)$$:

$$ T_f = \frac{r^c \mu}{(c-1)!(c\mu-\lambda)^2}p_0, n>c $$, tedy

$$ T = T_f + \frac{1}{\mu}$$.

Průměrný počet požadavků v systému $$(N)$$, a ve frontě $$(N_f)$$:

$$ N = \lambda T$$,

odtud $$ N_f = \lambda T_f $$.

Pravděpodobnost, že nově příchozí požadavek bude zařazen do fronty,

$$P_f = \frac{r^c c}{c!(c-r)}p_0$$.

Zpět k našemu příkladu. Máme uvedno, že v systému jsou 3 přepážky vyřizující listovní služby - tedy $$c=4$$. Intenzita příchodů požadavků je průměrně 68 za hodinu a intenzita obsluhy je 25 klientů za hodiny

Podmínka stabilizace je splněna ($$\rho<1$$). Nejprve vypočteme pravděpodobnost, že v systému není žádný požadavek:

$$p_0 = [\frac{2,72^0}{0!}+\frac{2,72^1}{1!}+\frac{2,72^2}{2!}+\frac{2,72^3}{3!} = \frac{1}{1+2,72+3,699+35,935} = 0,0231]$$.

Pravděpodobnost je tedy 2,31%.

Časové charakteristiky a informace o počtu požadavků získame při použití rovnic na výpočet $$T_f, T, N_f$$ a $$N$$.

$$T_f = \frac{2,72^3 25}{(3-1)!(75-68)^2}p_0 = \frac{503,1}{98}0,231 = 0,1184 hod = 7,1 min$$

$$T = 0,1184 + \frac{1}{25}= = 0,1584 hod = 9,5 min $$

$$N_t = 68(0,1184)=8,05 $$ zákazníka ,

$$N = 68(0,1584)=10,77 $$zákazníka.

Průměrná doba čekání ve frontě je tedy 7,1 minuty, průměrná doba včetně obsluhy potom 9,5 minuty. Ve frontě je průměrně více jak 8 zákazníků a v celém systému 10, 77.

Optimalizace modelu $$M/M/c$$
Optimalizace probíhá na úrovni nalezení konkrétní hodnoty $$c$$, tak aby byly minimalizovány náklady na provoz celého systému. Proměnné:

$$k_1$$ náklady na pobyt jednoho požadavku v systému za jednotku času

$$k_2$$ náklady na provoz jedné obslužné linky v systému za jednotku času

$$N$$ průměrný počet jednotek v systému

$$c$$ počet paralelně řazených obslužných linek

Nákladovou funkci definujeme:

$$NF(c) = K_1 N + K_2 c$$. Rovnice se skládá ze dvou částí: $$K_1N$$ a $$K_2 c$$. První část ($$K_1N$$) značí náklady na pobyt požadavku v systému za určitý čas a druhá část ($$K_2 c$$) charakterizuje náklady na provoz všech obslužných linek za časovou jednotku. Při navýšení obslužných systémů dojde ke zvýšení nákladů a sníží se průměrný počet požadavků v systému a naopak.

Pokud použijeme příklad pošty, doplníme náklady - například, pokud náklady na pobyt jednoho zákazníka v systému jsou 200 Kč ($$K_1$$, náklady na provoz přepážky jsou 500 Kč $$K_2$$. Při celkovém počtu $$c=3$$ přepážek, které jsme uvažovali, byl průměrný systém $$N = 10,77$$.

Po dosazení do nákladové funkce dostaneme výslednou částku:

$$NF(3)=200/(10,77)+500(3)= 3654$$ Kč.

Pro nalezení optimálního poměru mezi počtem obslužných linek a náklady použijeme vypočtenou tabulku:

Z této tabulky můžeme vybrat pro nás nejlepší poměr mezi náklady na pobyt v systému a na provoz. (např. nyní pro nás nejlépe vycházejí 4 obslužné linky, 3 jsou nejdražší).