# Лекция 6. Метод укрупнения состояний в анализе моделей функциональной надежности

 - Метод агрегирования с использованием параметров связи
 - Агрегирование на основе принципа эквивалентности потоков
 - Управление ресурсами в однопроцессорной системе с неоднородными заявками

## Метод агрегирования с использованием параметров связи

В лекции 5 мы видели, что даже в простейших системах массового обслуживания при большом количестве параметров получить точное решение становится довольно сложно. Если же говорить о реальных моделях СМО, то это становится просто нереально. Нужны какие-то рациональные способы упрощения модели с минимальными потерями точности.

Рассмотрим в качестве примера расширение задачи лабораторной работы: 

$K$ программистов могут писать программы для выполнения на одном из $M$ серверов, при этом программа не попадает сразу на сервер, а обрабатывается на одном из $N$ специальных компьютеров, которые проверяют отсутствие вирусов. Интенсивность работы программистов $\lambda$, интенсивность работы компьютеров-антивирусов $\nu$, интенсивность работы основных серверов $\mu$, программа оказывается с вирусом с вероятностью $p$. Если программа с вирусом, она получает отказ обслуживания на основных серверах. Ни в каких частях системы очередь не образуется. 

Будем рассматривать трехмерный вектор состояний системы: $\zeta(t)=(\zeta_1(t),\zeta_2(t), \zeta_3(t))$, где $\zeta_1(t)$ - количество программистов, которые пишут программу в момент времени $t$, $\zeta_2(t)$ - количество программ, которые проверяются на наличие вирусов, $\zeta_3(t)$ - количество программ, которые выполняются на основных серверах.

Рассмотрим только частный случай: $K=2, M=2, N=2$. Введем состояния:

$S_{200}$ - все программисты пишут программу, сервера и компьютеры свободны;

$S_{110}$ - один программист пишет, одна программа проверяется на вирус;

$S_{101}$ - один программист пишет, одна программа выполняется на сервере;

$S_{011}$ - оба программиста ожидают ответа, одна программа проверяется на вирус, другая выполняется на сервере;

$S_{020}$ - оба программиста ожидают ответа, обе программы проверяются на вирус;

$S_{002}$ - оба программиста ожидают ответа, обе программы выполняются на сервере.

Граф состояний:

<img src="dia1.jpeg">


По данному графу состояний можно составить систему дифференциальных уравнений, а также найти финальные вероятности. Однако при увеличении $K, M, N$ размерность задачи очень быстно возрастает. Уже при $K=N=M=10$ нарисовать граф состояний и следовательно составить уравнения для финальных вероятностей становится практически нереально.

В этой ситуации можно использовать метод укрупнения состояний. Суть метода состоит в том, чтобы анализ сложной системы производить по частям, с помощью укрупненных (агрегированных) моделей. В каждой такой модели подробно представлена только некоторая часть системы, а влияние остальных частей отражается некоторым обобщенным параметром (параметром связи).

Предложим декомпозицию нашей задачи в виде двух моделей.

В первой модели совокупность серверов и компьютеров по проверке наличия вирусов заменим только одним обобщенным параметром - интенсивностью обслуживания $\mu_{\text{общ}}$. Тогда модель будет обычной моделью рождения гибели для замкнутой системы:

<img src="dia2.jpeg">

$$P_0=\left(1+\frac{K\lambda}{\mu_{\text{общ}}}+\frac{K(K-1)\lambda^2}{\mu_{\text{общ}}^2}+\ldots+\frac{K!\lambda^K}{\mu_{\text{общ}}^K}\right)^{-1}\tag{1}$$
$$P_1=P_0\frac{K\lambda}{\mu_{\text{общ}}}\tag{2}$$
$$P_2=P_0\frac{K(K-1)\lambda^2}{\mu_{\text{общ}}^2}\tag{3}$$
$$\ldots$$
$$L_{\text{сист}}=\sum_{k=1}^K k\cdot P_k\tag{4}$$
$$T_{\text{сист}}=\frac{L_{\text{сист}}}{\lambda(K-L_{\text{сист}})}\tag{5}$$

Однако пока остается неизвестным параметр связи $\mu_{\text{общ}}$. 

Во второй модели будем считать, что в системе постоянно циркулируют $L_{\text{сист}}$ заявок. В качестве состояний системы возьмем количество заявок, обрабатываемых на основных серверах: $$S_0, S_1, S_2, \ldots, S_{L_{\text{сист}}}$$

<img src="dia3.jpeg">

$$\nu_n=(1-p)\nu\cdot \min{(N,L_{\text{сист}}-n)}, n=0,\ldots,L_{\text{сист}}-1\tag{6}$$
$$\mu_n=\mu\cdot \min{(M, n)}, n=1,2, \ldots,L_{\text{сист}}\tag{7}$$

Для данной системы опять же, как для схемы рождения, гибели, можно посчитать финальные вероятности:

$$\pi_0=\left(1+\frac{\nu_0}{\mu_1}+\frac{\nu_0\nu_1}{\mu_1\mu_2}+\ldots\right)^{-1}\tag{8}$$
$$\pi_1=\pi_0\cdot \frac{\nu_0}{\mu_1}\tag{9}$$
$$\pi_2=\pi_0\cdot \frac{\nu_0\nu_1}{\mu_1\mu_2}\tag{10}$$
$$\ldots$$

Тогда $$\mu_{\text{общ}}=\sum_{n=1}^{L_{\text{сист}}}\pi_n\cdot \mu_n\tag{11}$$

Таким образом, чтобы разрешить $(1-5)$ нужно знать $\mu_{\text{общ}}$, чтобы разрешить (6-11), нужно знать $L_{\text{сист}}$. Значит совместное решение (1-11) позволяет найти оба параметра связи и выразить основные показатели эффективности системы.  

## Агрегирование на основе принципа эквивалентности потоков

Рассмотренный метод агрегирования на основе параметров связи обладает, как правило, существенной методической погрешностью за счет того, что на параметр $L_{\text{сист}}$ во второй модели накладывается ограничение целочисленности, тогда как в первой модели этого ограничения нет.

Для нивелирования этой погрешности можно использовать так называемый *принцип эквивалентности потоков*. В этом случае часть системы заменяется агрегированным узлом с очередью. 

Принцип эквивалентности потоков состоит в том, что агрегированный узел при любом числе заявок в нем должен обеспечивать такой же поток во внешнюю сеть (такую же пропускную способность), как заменяемая им подсистема.

Рассмотрим его использование на примере предыдуще задачи. Задача также разбивается на две взаимосвязанные модели: 1 модель - получение программ от программистов, 2 модель - обработка полученных программ на серверах и компьютерах антивирусах.

В отличие от предыдущей модели, здесь в первой модели параметр потока обслуживания $\mu_{\text{общ}}$ не остается постоянным, а зависит от количества программистов, уже пославших программу во вторую модель:

<img src="dia4.jpeg">

Формулы расчета опять же стандартны для процесса рождения, гибели:
$$P_0=\left(1+\frac{K\lambda}{\mu(1)}+\frac{K(K-1)\lambda^2}{\mu(1)\mu(2)}+\ldots+\frac{K!\lambda^K}{\prod_{k=1}^K\mu_k}\right)^{-1}\tag{12}$$
$$P_1=P_0\frac{K\lambda}{\mu(1)}\tag{13}$$
$$P_2=P_0\frac{K(K-1)\lambda^2}{\mu(1)\mu(2)}\tag{14}$$
$$\ldots$$
$$L_{\text{сист}}=\sum_{k=1}^K k\cdot P_k\tag{15}$$
$$T_{\text{сист}}=\frac{L_{\text{сист}}}{\lambda(K-L_{\text{сист}})}\tag{16}$$
$$\mu_{\text{ср}}=\sum_{k=1}^K\mu(k)\cdot P_k\tag{17}$$

Вторую модель используем для нахождения $\mu(i)$. В данном случае мы также не ограничиваемся постоянным параметром $L_{\text{сист}}$, а проводим расчеты при всех его возможных значениях $L_{\text{сист}}=1,2,3,\dots,K$. Имеем следующий граф состояний для фазы обслуживания:

<img src="dia5.jpeg">

$$\nu_n=(1-p)\nu\cdot \min{(N,u-n)}, n=0,\ldots,u-1\tag{18}$$
$$\mu_n=\mu\cdot \min{(M, n)}, n=1,2, \ldots,u\tag{19}$$

$$\pi_0=\left(1+\frac{\nu_0}{\mu_1}+\frac{\nu_0\nu_1}{\mu_1\mu_2}+\ldots\right)^{-1}\tag{20}$$
$$\pi_1=\pi_0\cdot \frac{\nu_0}{\mu_1}\tag{21}$$
$$\pi_2=\pi_0\cdot \frac{\nu_0\nu_1}{\mu_1\mu_2}\tag{22}$$
$$\ldots$$
$$\mu(u)=\sum_{n=1}^{u}\mu_n\pi_n\tag{23}$$

Расчеты по формулам (18-23) повторяют для каждого $u=\overline{1,K}$. Полученные значения $\mu(u)$ используют в формулах (12-17).

## Управление ресурсами в однопроцессорной системе с неоднородными заявками

В системах оперативной обработки заявок в качестве основного критерия эффективности чаще всего используют среднее время обслуживания заявок $T_{\text{сист}}$. 

Ранее мы рассматривали простейший входящий поток с однородными заявками - среднее время выполнения каждой заявки одинаково. Однако если предположить, что эти средние времена отличаются друг от друга и такие заявки попадают в очередь, то возникает резонный вопрос, будет ли влиять алгоритм вынимания заявок из очереди на суммарное среднее время обслуживания заявок. Например, мы может сначала выбирать из очереди все заявки с минимальным средним временем выполнения, или наоборот с максимальным временем выполнения, или может вообще их как-то хитро перемешивать. Ответ на этот вопрос дает алгорим Shortest-processing-task-first (SPT) - рекомендует выбирать на обслуживание сначала заявки с минимальным временем выполнения.

Рассмотрим на простом примере: пусть имеется три типа заявок со средним временем выполнения: $t_1=1, t_2=2, t_3=3$. Среднее время обслуживания складывается из ожидания в очереди и времени выполнения, усредненных по всем заявкам.

При порядке обслуживания $t_1=1, t_2=2, t_3=3$ получаем:

$$T_{\text{сист}}=\frac{1}{3}\cdot\left( t_1+(t_1+t_2)+(t_1+t_2+t_3) \right)=\frac{1}{3}\cdot\left( 1+(1+2)+(1+2+3) \right)=\frac{1+3+6}{3}=\frac{10}{3}\approx 3.33$$

А теперь, например, поменяем порядок: $t_2=2, t_1=1, t_3=3$:

$$T_{\text{сист}}=\frac{1}{3}\cdot\left( t_2+(t_1+t_2)+(t_1+t_2+t_3) \right)=\frac{1}{3}\cdot\left( 2+(1+2)+(1+2+3) \right)=\frac{2+3+6}{3}=\frac{11}{3}\approx 3.67$$

Из приведенных примеров видно, что перемещение вперед задач с меньшим временем выполнения приводит к уменьшению среднего времени обслуживания.

Таким образом, алгоритм SPT дает оптимальное значение среднего времени обслуживания при известных средних временах выполнения заявок.

Рассмотрим еще одну задачу - **минимизация штрафа за задержку обслуживания**.

Пусть имеется один пункт обслуживания и $n$ ожидающих обслуживания заявок. Каждая заявка имеет свое время обслуживания и штраф за его задержку. Обозначим время обслуживания i‑й заявки как $T_i$, а штраф за задержку обслуживания этой заявки на единицу времени (минута, час, сутки и т. п.) $C_i$.

Разные последовательности обслуживания заявок дают в общем случае разный суммарный штраф, т. е. разную эффективность СМО. Решение задачи сводится к определению такого порядка обслуживания (установлению такой последовательности обслуживания заявок), который обеспечивает минимальный суммарный штраф за задержку обслуживания всех этих заявок.

Для нахождения оптимального плана обслуживания заявок предположим, что у нас уже есть какое-то упорядочение заявок $\alpha = (1,2,3,\ldots,k-1, k, k+1,\ldots, n)$, обозначим через $S(\alpha)$ - суммарный штраф при обслуживании заявок в порядке $\alpha$. Поменяем теперь $k$ и $k-1$ заявки местами $\alpha'=(1,2,3,\ldots,k, k-1, k+1,\ldots, n)$. Предположим, что $S(\alpha)<S(\alpha')$ и оценим насколько увеличится штраф: теперь $k-1$ заявка будет дополнительно ждать время $T_k$ - время обслуживания $k$ заявки, и, наоборот, $k$ заявка ранее ждала время $T_{k-1}$, а теперь этого ожидания не будет. Суммарные потери составят: 
$$S(\alpha')-S(\alpha)=T_k\cdot C_{k-1}-T_{k-1}\cdot C_k$$ 

Последнее соотношение означает, что 
$$T_k\cdot C_{k-1}-T_{k-1}\cdot C_k\geq 0$$
Тогда 
$$\frac{C_{k-1}}{T_{k-1}}\geq \frac{C_{k}}{T_{k}}\tag{24}$$

Таким образом, если для каких-то соседних заявок выполняется соотношениие (26) и мы их поменяем местами, это приведет к увеличению штрафа. Отношение $\frac{C_i}{T_i}$ будем называть *относительным штрафом* $i$-й заявки.

Тогда получаем следующее правило: чтобы последовательность обслуживания заявок была оптимальной, требуется выполнение последовательности неравенств:
$$\frac{C_1}{T_1}\geq\frac{C_2}{T_2}\geq\ldots\geq\frac{C_n}{T_n}\tag{27}$$

Это означает, что **первыми должны обслуживаться заявки, имеющие больший относительный штраф**.

Фактически алгоритм SPT является частным случаем рассмотренной задачи при $\forall i:C_i=1$.

Однако часто в реальных задачах информация о среднем времени выполнения неоднородных заявок часто отсутствует и ее собирают в ходе вычислительного процесса, что также требует разработки алгоритмов.

Рассмотрим один из таких алгоритмов, который получил название RR (Round Robin) - алгоритм циклического обслуживания. Заявки поступают с интенсивностью $\lambda$ в очередь,откуда они выбираются и исполняются процессором. Для обслуживания каждой заявки отводится постоянный квант времени $q$. Если работа была выполнена за время $q$, она покидает систему. В противном случае она вновь поступает в конец очереди и ожидает предоставления ей очередного кванта времени. В результате такой манипуляции среднее время, которое отводится на выполнение более трудоемких задач автоматически увеличивается, поскольку они больше раз попадают в конец очереди.

Для обеспечения еще более быстрой реакции системы на короткие работы в системах оперативной обработки используются алгоритмы многоуровневого циклического планирования. Одним из таких алгоритмов является алгоритм FB (foreground-background). Суть алгоритма заключается в том, что заявки на выполнение работ поступают в очередь $O_1$. Работы, стоящие в очереди $O_1$, получают квант процессорного времени $q$. Если за это время работа была выполнена, то она покидает систему. В противном случае заявка на работу переносится в очередь $O_2$, откуда она может быть занесена в очереди $O_3,O_4,\ldots$. Очереди обслуживаются в следующем порядке. Если имеется хотя бы одна заявка в очереди $O_1$, то эта заявка непременно обслуживается. Заявки из очереди $O_2$, обслуживаются при условии, что нет заявок в очереди $O_1$. Аналогично заявки из очереди $O_k$ обслуживаются только в том случае, если все очереди $O_1, \ldots, O_{k-1}$ пусты.  

Применяются модификации алгоритма FB, различающиеся по величине квантов времени, предоставляемых заявкам из разных очередей. Возможно планирование на основе постоянной величины кванта или с использованием квантов переменной длительности, которая возрастает по мере увеличения номера очереди. Одна из таких модификаций - алгоритм планирования FB с учетом приоритетов работ. Работы, поступающие в систему, разделяются в зависимости от приоритетов $1,2,\ldots, n$ на $n$ потоков $\lambda_1, \lambda_2, \ldots, \lambda_n$.

Приоритеты задач относительны, т.е. поступление в систему заявки более высокого приоритета не прерывает процесс обработки менее приоритетных заявок, но при освобождении ресурса более приоритетные заявки будут назначены в первую очередь. Работы с высшим приоритетом поступают в очередь $O_1$, а работы с низким приоритетом в очередь $O_n$. Работам, выбираемым на обслуживание из разных очередей, выделяются кванты времени различной длительности, причем заявкам из очереди $O_m$ выделяется больший по продолжительности квант времени, чем заявкам из очереди $O_{m-1}$.

Приоритеты работам могут назначаться исходя из трудоемкости последних. Если трудоемкости работ известны хотя бы приближенно, то работам с большой трудоемкостью присваиваются низкие приоритеты и они сразу же поступают в очереди соответствующего приоритета, в которых получают большие кванты времени. В результате этого трудоемкие работы не будут задерживать процесс выполнения менее трудоемких работ. Если трудоемкость работы была занижена, т.е. ее приоритет оказался завышен, то после окончания выделенного для нее кванта времени работа переместится в очередь следующего, более низкого приоритета.

Алгоритм планирования с учетом приоритетов очень эффективен для систем с ограниченной емкостью оперативной памяти, не позволяющей разместить в ней программы всех работ, выполняемых системой. В таком случае в оперативной памяти размещается только небольшая часть программ, а остальные программы хранятся во внешней памяти на винчестере. Все программы циклически обслуживаются предоставлением им кванта процессорного времени, поэтому они вызываются в оперативную память поочередно, а, получив квант обслуживания, удаляются из нее во внешнюю память. Процесс циклического завершения программ в оперативной памяти называется **свопингом**. Если система работает со свопингом и все без исключения работы поступают в первую очередь, причем всем очередям выделяются одинаковые кванты времени, то затраты ресурсов системы на свопинг крайне большие. Для уменьшения непроизводительных затрат целесообразно трудоемкие работы сразу же размещать в очередях с низкими приоритетами и выделять им большие по длительности кванты времени.

Например, операционная система обеспечивает две процедуры разделения времени - циклическое планирование и вытеснение на диск. Процедура циклического планирования через заданный интервал времени циклически перемещает указатель задач в таблице задач системы STD (system task directory) и объявляет значимое событие, в результате обработки которого происходит перепланирование задач. Планировщик выбирает для выполнения первую задачу из STD. 

Процедура вытеснения на диск перемещает временно на диск часть задач из основной памяти, освобождая тем самым место для более приоритетных задач. Необходимые условия для вытеснения задачи:

- задача должна быть установлена как вытесняемая; 
- на диске есть более приоритетная задача, для которой нет места в основной памяти;
- задача не имеет незавершенных запросов ввода-вывода (кроме запроса ввода с терминала).

При выполнении процедур вытеснения на диск записываются область занимаемой задачей основной памяти и информация о текущем состоянии задачи, необходимая для продолжения ее работы. Разделение ресурсов задачами базируется на периодическом уменьшении приоритетов задач, находящихся в основной памяти, и как только приоритет задачи в основной памяти становится меньше приоритета задачи на диске, выполняется процедура вытеснения.

Приоритетность программ для систем со свопингом может назначаться в соответствии с алгоритмом *Корбато*. Здесь априорно принимается следующее предположение: программы с большей длиной - более трудоемкие.

Исходя из этого предположения, приоритеты программам присваиваются на основе формулы:

$$p=\lfloor\log_2{\frac{L_n}{L_q}+1}\rfloor$$
$L_n$ - длина программы в байтах,
$L_q$ - число байт, передаваемых между оперативной памятью и винчестером за время $q$.

Работа с приоритетом $p$ заносится в очередь $O_p$. Очереди $O_1, O_2, O_3, O_4, \ldots$ соответствуют квантам времени $q, 2q, 4q, 8q, \ldots$.