Queueing theory/cs

From Simulace.info
Jump to: navigation, search

Teorie hromadné obsluhy (Teorie front) [1]

Jednou z podskupin diskrétních simulací je teorie hromadné obsluhy, v češtině často nazývaná jako "Teorie front".

Úvod

Teorie front zkoumá systémy, na které opakovaně přicházejí sekvence požadavků a jejich výskyt je náhodný. Zjišťujeme tak například potřebnou kapacitu zdrojů, nebo optimální využití výrobních linek. Tato chování se dají nasimulovat do tzv. stochastických modelů. Cílem těchto modelů je analýza stávajících systémů a nalezení nejvhodnějšího způsobu optimalizace. Zároveň se musí optimalizovat množství lidí čekajících ve frontě a vytížení obslužných linek. Pro simulování frontových systémů potřebujeme informace o vstupním toku (např. jak často přijde nový požadavek na server), o frontovém systému, který se vytvoří, pokud požadavek nemůže být ihned vyřízen a organizace obsluhy - počet volných jednotek vykonávající proces obsluhy a jejich popis. Pokud mluvíme o vstupu jako o zákazníkovi, nejedná se o zákazníka v striktním slova smyslu, ale může to být proces, služba, člověk ale i jakýkoliv požadavek čekající na vyřízení.

Příklady SHO [2]
systém obslužné linky požadavky
banka úředníci u přepážky klienti
výrobní linka místa na výrobní lince výrobky
ordinace u lékaře lékař pacienti
lyžařské středisko vleky lyžaři
benzínová pumpa čerpací stojany vozidla
samoobsluha pokladny, nákupní vozíky zákazníci


Schéma teorie front

  • Objekty vyžadující obsluhu (zákazníci, jednotky, požadavky)
  • Množina jednotek přicházející v úvahu pro hromadnou obsluhu
  • Časová posloupnost vstupu jednotek
  • Množina jednotek čekajících na obsluhu
  • Systém realizující obsluhu
  • Časová posloupnost výstupu

Základní informace nutné k řešení

Pro analýzu a návrh/optimalizaci systémů hromadné obsluhy je nutné znát základní parametry:

Vstupní tok

Zdroj požadavků, hraje velmi důležitou roli při analýze systémů hromadné obsluhy. I přesto, že v reálném světě jsou všechny vstupy konečné, při analýze systémů hromadné obsluhy se je lze považovat za nekonečné. "Zákazníci" mohou do systému vstupovat jednotlivě nebo hromadně - popis těchto příchodů probíhá pomocí intenzity příchodů (počet požadavků, které do systému přijdou za časovou jednotku), nebo pomocí intervalů mezi příchody. Např. za hodinu přijde průměrně 8 požadavků za hodinu, potom je interval mezi příchody 1/8 hodiny.

  • Deterministický příchod požadavků

Intervaly mezi příchody požadavků jsou fixní hodnoty.

  • Stochastický

Intervaly příchodů jsou proměnlivé, a proto bývají definovány pomocí pravděpodobnostních rozdělení. Toto rozdělení zjistíme analýzou empirických dat. Pro většinu případů lze využít rozdělení exponenciální [1] a využívá parametr pro označení intenzity příchodů. Střední hodnota tohoto rozdělení je určena jako:

.

Převrácená hodnota - tedy střední hodnota () vyjadřuje průměrnou dobu mezi příchody požadavků do systému.

Doba trvání obsluhy

Stejně jako při deklaraci intenzity vstupů se využívají popisy deterministické nebo pravděpobobnostní. Nejčastější je opět rozdělení exponenciální, nyní s parametrem , který označuje intenzitu obsluhy. Střední doba trvání obsluhy dostaneme jako:


Pokud je v systému zahrnuto více obslužných systémů, mohou se zapojovat sériově nebo paralelně do sítí. Tím se zvýší množství vyřízených požadavků při stejném časovém úseku. U paralelně zapojených systému se klade důraz na jejich zaměření (ne všechny mohou poskytovat stejné služby).

Převrácená hodnota - tedy střední hodnota označuje průměrnou délku doby trvání obsluhy.

Xblal26 SHO.jpg

Frontový režim

Ne vždy jsou všechny požadavky hned vyřízeny a z tohoto důvodu se u obslužných linek mohou tvořit fronty "zákazníků" čekajících na vyřízení. Řád fronty určuje, jak probíhá práce s požadavky ve frontě čekajícími. U paralelně zapojených systémů se rozlišují dva typy fronty - jedním typem je fronta, ze které odchází požadavky ke všem obslužným linkám postupně a druhý, kde se před každým obslužným systémem vytváří fronta vlastní.

  • FIFO (First-in / First-out)

Požadavky přistupují k obsluze ve stejném pořadí, ve kterém přišly

  • LIFO (Last-in / First-out) = LCFS (Last-come / first-served)

Fronta kdy jdou jako první na řadu ty požadavky, které přišly jako poslední

  • SIRO (Service in Random Order)

Náhodný způsob výběru

  • PRI (Priority queue)

Požadavky přicházejí s předem definovanými prioritami. Pokud se ve frontě sejde víc požadavků se stejnou prioritou, pokračuje podle klasicky definovaného způsobu (např. FIFO, LIFO, SIRO)

Kendallova klasifikace

D.G. Kendall byl anglický statistik a matematik, v 50. letech zavedl notaci pro jednotnou charakteristiku systémů hromadné obsluhy. Jelikož jsou systémy hromadné obsluhy velmi komplexní, je nutné standardizovat jejich značení pro zjednodušení následných výpočtů.

Profesor David George Kendall [3]

D.G.Kendall

15 January 1918 – 23 October 2007

člen the Royal Society (1964)

Anglický statistik a matematik

Zasadil se o rozvoj teorie pravděpodobnosti, statistické analýzy tvarů a vzhledu

Vyučoval v Oxfordu a Cambridge

Ocenění

* Royal Statistical Society
1955 the Guy Medal in Silver,
1981 the Guy Medal in Gold
* London Mathematical Society
1980 Senior Whitehead Prize,
1989 De Morgan Medal

KendelovaKlasifikace.png

Jelikož tyto informace nejsou v praxi dostačující, rozšířil se model o další 3 klasifikační třídy.

Xblal26 rozsirenimodelu.PNG

Na jednotlivé pozice se do modelu dosazují kódy (výsledný model může mít až šestimístný kód - A/B/C/D/E/F)[4]

  • A

Pravděpodobností rozdělení intervalů mezi příchody požadavků, nejčastěji:

M - exponenciální rozdělení

D - konstantní interval mezi příchody

G - obecné rozdělení se střední hodnotou a směrodatnou odchylkou

  • B

Pravděpodobnostní rozdělení doby obsluhy, stejné jako A (M,D,G)

  • C

Počet paralelně zapojených obslužných linek

  • D

Kapacita obslužného systému (neuvedeno = )

  • E

Zdroje požadavků (neuvedeno = )

  • F

Systém fronty (FIFO, LIFO, ...)

Např. zápis systému M/M/1/ / /FIFO se zjednodušeně zapíše M/M/1

Analýza systému hromadné obsluhy

Teorie front se v praxi využívá k určení optimální kapacity obslužných systémů. Pokud jdeme například k lékaři na magnetickou rezonanci, musíme se objednávat dlouho dopředu. Rezonance má své časové limity pro obsloužení jednotlivých pacientů (časové náklady aj.), frontu můžeme urychlit, pokud například přidáme další převlékací místnost - jeden pacient je na MRI, druhý pacient se může připravit, po skončení první pacient rovnou odchází do převlékárny, druhý ho střídá. Pomocí teorie front můžeme určit, jak se zrychlí objednávání pacientů, pokud přidáme další přístroj, jaký by měl být minimální časový rozestup v objednávání pacientů aj.

Časové charakteristiky týkající se požadavků

Zjišťujeme především průměrnou dobu požadavků strávenou ve frontě před obsluhou, označujeme symbolem a průměrnou dobu strávenou v systému (celkově) . Průměrnou dobu, kterou střáví požadavek v systému je suma průměrné doby strávené ve frontě a průměrné doby trvání obsluhy , tedy:

.

Charakteristiky týkající se počtu požadavků

Zjišťujeme půrměrnou délku fronty nebo průměrný počet požadavků v systému . V jednodušších modelech se najde přímý vztah mezi průměrným počtem požadavků v systému (ve frontě) je roven průměrnému času, který požadavek stráví v systému (ve frontě), vynásobenému hodnotou , tedy:

,
.

Pravděpodobnostní charakteristiky

Z hlediska optimalizace a matematických analýz jsou velmi důležité matematické charakteristiky. Mezi ty nejdůležitější se řadí pravděpodobnost, že:

  • Systém nepracuje (že není využit) nebo naopak, že pracuje
  • Nově příchozí požadavek bude muset čekat ve frontě
  • V systému je požadavků
  • Požadavek nebude moci přistoupit k obsluze (systém s omezenou kapacitou míst ve frontě)

Nákladové charakteristiky

Pokud jsme schopni vyjádři náklady na čekání požadavků, prostoje nebo využití obslužných linek, je možné nákladově zefektivnit chod systému

  • Minimální náklady na provoz za určitý čas
  • Optimální počet obslužných linek v provozu

Analytické vs. simulační řešení

Analytické řešení se zabývá odvozením charakteristik systému a nalezení vzorců, které se pak používají stále dokola. Například počet obslužných linek , intenzita příchodů , nebo intenzita obsluhy . Analytické řešení bývá velmi uživatelsky příjemné. Výsledky jsou k dispozici velmi rychle, ale dají se použít pouze pro ty jednodužší případy. Tedy není vhodné pro sériově řazené obslužné linky, stejně jako modely s například omezenou trpělivostí požadavků, systém s PRI systémem fronty aj.

Pro případy modelů a se využívá systémových simulací. Napodobuje se chování reálného systému - výhoda je v tom, že výsledky, které bychom normálně sledovali i několik měsíců jsou k dispozici během pár minut. Tímto způsobem se testují téměř všechny navrhované systémy hromadné obsluhy.

Exponenciální model

Je sobota odpoledne, odpočíváte po náročném pracovním týdnu a rozhodnete se, že si zlepšíte svou fyzickou kondici a vyrazíte na večerní projížďku na kole. Cestou ale spadnete a musíte navštívit místní pohotovost. Na výběr máte dvě pohotovosti v sousedství, ale o víkendu na obou pohotovostech ordinuje pouze jeden lékař. Víte, že pacienti přicházejí na pohotovost A každých 8 minut (intervaly mezi příchody jsou exponenciálně rozdělené), na pohotovost B každých 10 minut (se stejným rozdělením). Průměrná doba ošetření je v nemocnici A 6 minut, v nemocnici B 5 minut. Průměrná doba rozdělení je náhodná veličina s exponenciálním rozdělením. Pacienti jsou na obou pohotovostech přijímáni v tom pořadím, ve kterém do nemocnice přišli. Kterou pohotovost si vyberete?


Předpoklady[5]
Pouze jedna obslužná linka
Intervaly mezi příchody mají exponenciální rozdělení s parametrem
Doba trvání obsluhy je náhodná veličina s exponenciálním rozdělením s parametrem
Neomezená kapacita systému
Neomezený zdroj požadavků
Režim fronty FIFO

Pro optimalizaci a stabilizaci systému je důležité, aby byla splněna základní podmínka, a to, že intenzita příchodů je nižší než intenzita obsluhy , tedy intenzita provozu .

Systém má dva parametry - intenzitu příchodů a intenzitu obsluhy . Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):

.

Tedy pravděpodobnost, že v systému je alespoň 1 požadavek (=obslužný systém je v provozu):


Prvek označuje intenzitu provozu systému hromadné obsluhy. Tato hodnota udává zároveň pravděpodbobnost, že nově příchozí požadavek do systému bude muset čekat ve frontě.

Pravděpodobnost, že v systému je požadavků a požadavků čeká ve frontě:


Průměrná doba, kterou požadavek stráví v systému a ve frontě je , tedy

.

Průměrný počet požadavků v systému , a ve frontě :

, 

odtud

.

Nyní se vrátíme k našemu příkladu, jak si vybrat lepší pohotovost? Pokud dosadíme hodnoty do vzorečků, získáme rychlou odpověď.

proměnná Pohotovost A Pohotovost B
, intenzita příchodů (1 hod) 60/8=7,5 60/10=6
, intenzita obsluhy (1 hod) 60/6=10 60/5=12
, intenzita provozu 7,5/10=0,75 6/12 = 0,5

S pravděpodobností 75% bude na pohotovosti A alespoň jeden pacient, na pohotovosti B 50%. Naopak na pohotovosti A s pravděpodobností 25% (1-0,75) nebude v čekárně nikdo čekat, v pohotovosti B s pravděpodobností 50%.

Ukládání na single server s frontou [6]

Queueing Theory and its Applications [7]

Liber Amicorum for J. W. Cohen Wblal26 Cohen Wim.jpeg

Sbírka výzkumných prací k výročí 65. narozenin Části knihy

  • Single server fronty
  • Analytické metody v teorii front
  • Sítě a počítače
  • Modely front a příbuzné obory

Efektivní ukládání a maintanence front je základním prvkem počítačových věd. V následující studii od E. G. Coffmana Jr. a I. Mitraniho ze společností AT&T Bell Laboratiories zpracovávají stochastické modely lineárních úložných zařízení s frontou M/M/1, jako skrytým procesem příchodů a odchodů požadavků. Dále se zabývají nevyužitým prostorem při využití FIFO fronty, procesorově sdílenými službami a přísnými alokačními pravidly.

  • Představení problému

V aplikacích teorie front existuje mnoho obsáhlých studií zaměřených ne pouze na výkonost a počet front a čekacích časů, ale i na analýzu zdrojů a řazení položek do front. V této výzkumné práci platí následující omezení:

a) fronta může být nekonečná a ukládání probíhá do lineárního pole,

b) požadavek je umístěn do buňky, kde zůstává až do jeho vyřízení

Model má určenou politiku ukládání. Což znamená pravidlo, které rozhoduje, do které z prázdných buněk ve frontě budou příchozí požadavky ukládány. Pro ukládání využíváme FIFO službu a nové přírůstky do fronty rozšiřují frontu doprava, pokud je fronta prázdná, uloží se příchozí požadavek co nejvíc doleva. Proměnné:

délka fronty v čase ,

index poslední obsazené buňky v čase

počet prázdných buněk směrem doleva (zbytečně volných buněk)

Zároveň definujeme , pokud .

Pokud je Markovův proces, tak R ani W nejsou Markovým řetězcem. Primárně předpokládáme stacionární chování, a pokud opomeneme index z našeho procesu, odkážeme se na náhodnou veličinu se stacionárním rozdělením. Definujme a jako distribuce a a složenou distribuci určenou pomocí . Zároveň definujeme generující funkci:

Failed to parse (syntax error): {\displaystyle F(u,v) = \sum\limits_{i &\ge& 0}} Failed to parse (syntax error): {\displaystyle \sum\limits_{j &\ge& 0}p_{ij}u^iv^j}

a generují a . Klasické modely dokazují, že pokud je . Proto v případě dostaneme:

Failed to parse (syntax error): {\displaystyle q_i = (1-p)p^1, i &\ge&0} Je vhodné rozšířit naši pravděpdobnostní notaci pro negativní hodnoty indexu (ale definujeme je jako nulové), proto: , pokud a , pokud je nebo .

  • FIFO Fronta

Nové příchody jsou umístěny do prázdných buněk, za poslední obsazenou (nebo do první buňky, pokud je fronta prázdná). Primárním cílem je nalézt distribuci :

Xblal26 FIFO.png

Jelikož není Markovův proces, můžeme ho analyzovat jako okraj bivariačního Markovova procesu se stacionární pravděpodobností . Z definice modelu dostáváme , to ovlivňuje , následně dosadíme:

(2.1) Failed to parse (syntax error): {\displaystyle P_{00} = q_0 = (1-p), P_{i0} = 0, i &\ne& 0 } .

Obecná generující funkce (2.2): Failed to parse (unknown function "\fra"): {\displaystyle P_{ij} = \fra{1}{1+p}q_{i-1, j+1} + \frac{p}{1+p} P_{i,j-1}, j &\ne& 0 } .

Pokud dosadíme do naší, získáme (2.3): , kde

Failed to parse (syntax error): {\displaystyle K(u)=\frac{1}{1-p}\sum\limits_{i&\ge&0}p_{i1} u^i } je neznámou funkcí.

Nyní je analytické pro a , kdykoliv jmenovatel dosáhne kořenu musí i čitatel. Pro každé v jednotce disku je přesně jedno , pro které jmenovatel zmizí a tato hodnota je dána (2.4):

Failed to parse (syntax error): {\displaystyle v(u) = \frac{1+p-&\sqrt{(1+p)^2-4pu}&}{2p}} ,

následnou substitucí (2.4) a dosazením do čitatele (2.3) dostaneme (2.5):

.

Další substitucí (2.5) do (2.3) a nastavením , dostaneme požadovanou generující funkci (2.6):

.

Nyní jsme se dostali k momentu, kde použijeme klasické řešení - například: .

Studie dále pokračuje výpočtem horních hranic modelu, dolní hranicí procesorově-sdíleným modelem a asymptotickými odhady.

Exponenciální model

Na úvod si opět uveďme jednoduchý příklad. Česká pošta modernizuje svou pobočku v nejmenovaném městě. Rozhodla se, že pro listovní operace vyhradí 3 přepážky. Obyvatelé, potenciální zákazníci, si po příchodu berou pořadové číslo a zařadí se do fronty. Podle těchto čísel jsou voláni k volné přepážce. Následně bylo odpozorováno, že po rekonstrukci přicházejí zákazníci s průměrnou intenzitou 68 za hodinu s tím, že intervaly mezi příchody mají exponenciální rozdělení. Každý klient stráví u přepážky různě dlouhou dobu (náhodná veličina) s exponenciálním rozdělením se střední hodnout 2,4 minuty (za hodinu je každá přepážka schopná odbavit 25 klientů (=60/2,4). Úkolem je zjistit, průměrnou dobu čekání na odbavení (ve frontě) a průměrnou dobu obsluhy včetně obsluhy.

Podmínkou pro optimalizaci je intenzita celého provozu systému

Předpoklady [8]
identických obslužných jednotek v systému
Intervaly mezi příchody požadavků mají exponenciální rozdělení s parametrem
Doba obsluhy na každé z linek je náhodná veličina s exponenciálním rozdělením s parametrem
Neomezená kapacita systému
Neomezený zdroj požadavků
Režim fronty FIFO

Systém má tři parametry - počet obslužných linek , intenzitu příchodů a intenzitu obsluhy u každé z obslužných linek.

Intenzita obsluhy je u každé z linek vlastní, a proto je výsledek celého systému roven součinu a .

Základní proměnné:

poměr intenzity příchodů a individuální intenzity obsluhy

intenzita provozu celého systému (=průměrné využití všech obslužných linek systému)


Pravděpodobnost, že v systému není žádný požadavek (=obslužný systém není v provozu):

.

Tedy pravděpodobnost, že v systému je alespoň n požadavků, Failed to parse (syntax error): {\displaystyle n&\le&c} (=obslužný systém je v provozu):

Failed to parse (syntax error): {\displaystyle p_n = \frac{r^n}{n!}p_0, n&\le&c}
.

Pravděpodobnost, že v systému je požadavků (), všechny systémy jsou tedy v provozu:

.


Průměrná doba, kterou požadavek stráví v systému a ve frontě je :

,

tedy

.

Průměrný počet požadavků v systému , a ve frontě :

, 

odtud

.

Pravděpodobnost, že nově příchozí požadavek bude zařazen do fronty,

.

Zpět k našemu příkladu. Máme uvedno, že v systému jsou 3 přepážky vyřizující listovní služby - tedy . Intenzita příchodů požadavků je průměrně 68 za hodinu a intenzita obsluhy je 25 klientů za hodiny

proměnná hodnota
, intenzita příchodů (1 hod) 68
, intenzita obsluhy (1 hod) 25
, intenzita provozu celého systému 68/75 = 0,9067

Podmínka stabilizace je splněna (). Nejprve vypočteme pravděpodobnost, že v systému není žádný požadavek:

.


Pravděpodobnost je tedy 2,31%.


Časové charakteristiky a informace o počtu požadavků získame při použití rovnic na výpočet a .

zákazníka ,

zákazníka.

Průměrná doba čekání ve frontě je tedy 7,1 minuty, průměrná doba včetně obsluhy potom 9,5 minuty. Ve frontě je průměrně více jak 8 zákazníků a v celém systému 10, 77.


Optimalizace modelu

Optimalizace probíhá na úrovni nalezení konkrétní hodnoty , tak aby byly minimalizovány náklady na provoz celého systému. Proměnné:

náklady na pobyt jednoho požadavku v systému za jednotku času

náklady na provoz jedné obslužné linky v systému za jednotku času

průměrný počet jednotek v systému

počet paralelně řazených obslužných linek

Nákladovou funkci definujeme:

.

Rovnice se skládá ze dvou částí: a . První část () značí náklady na pobyt požadavku v systému za určitý čas a druhá část () charakterizuje náklady na provoz všech obslužných linek za časovou jednotku. Při navýšení obslužných systémů dojde ke zvýšení nákladů a sníží se průměrný počet požadavků v systému a naopak.

Pokud použijeme příklad pošty, doplníme náklady - například, pokud náklady na pobyt jednoho zákazníka v systému jsou 200 Kč (, náklady na provoz přepážky jsou 500 Kč . Při celkovém počtu přepážek, které jsme uvažovali, byl průměrný systém .

Po dosazení do nákladové funkce dostaneme výslednou částku:

Kč.

Pro nalezení optimálního poměru mezi počtem obslužných linek a náklady použijeme vypočtenou tabulku:

počet linek N pobyt klientů N provoz N celkem
2 1000
3 2154 1500 3654
4 714 2000 2714
5 586 2500 3086
6 556 3000 3556

Z této tabulky můžeme vybrat pro nás nejlepší poměr mezi náklady na pobyt v systému a na provoz. (např. nyní pro nás nejlépe vycházejí 4 obslužné linky, 3 jsou nejdražší).

Reference

  1. JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
  2. JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
  3. Divergiendo: 23 de octubre: David Kendall. Divergiendo [online]. 2012 [cit. 2015-06-16]. Dostupné z: https://divergiendo.wordpress.com/2012/10/23/23-de-octubre-david-kendall/
  4. JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
  5. JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.
  6. COHEN, Jacob Willem, O BOXMA a R SYSKI. Queueing theory and its applications: liber amicorum for J.W. Cohen. New York, N.Y., U.S.A.: Sole distributors for U.S.A. and Canada, Elsevier Science, 1988, xxii, 446 p. ISBN 04-447-0497-3.
  7. COHEN, Jacob Willem, O BOXMA a R SYSKI. Queueing theory and its applications: liber amicorum for J.W. Cohen. New York, N.Y., U.S.A.: Sole distributors for U.S.A. and Canada, Elsevier Science, 1988, xxii, 446 p. ISBN 04-447-0497-3.
  8. JABLONSKÝ, Josef. Operační výzkum: kvantitativní modely pro ekonomické rozhodování. 1. vyd. Praha: Professional Publishing, 2002, 323 s. ISBN 80-864-1923-1.