<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015 Karim Pichara - Christian Pieringer. Todos los derechos reservados, excepto en las imágenes provenientes de Wikipedia. Editado por Equipo Docente IIC2233 2018-1.</font>
</p>

## Simulación: Introducción

Durante el modelamiento de objetos hacemos supuestos del sistema respecto de las relaciones entre objetos y datos, y usamos algoritmos para representar su comportamiento. En general, estos modelos son una aproximación, con un cierto nivel de fidelidad, de los sistemas reales. Si bien existen sistemas simples, como el de aceleración de gravedad, que pueden ser fácilmente modelados mediante una solución analítica, los sistemas reales incluyen comportamientos más complejos difíciles de representar usando solo un modelo analítico. En estos casos el funcionamiento del sistema debe ser estimado por simulación.

La **simulación** consiste en el proceso mediante el cual se **modela** un sistema y se realizan **experimentos** sobre el modelo diseñado. El objetivo principal es comprender el comportamiento del sistema o evaluar el funcionamiento del modelo. Dentro de las principales ventajas de la simulación se encuentran: la reducción de costos y riesgos, como también una experimentación más rápida comparado con el uso de sistemas reales. En este curso, nos focalizaremos en el de **Simulación de Eventos Discretos** (**DES**) debido a las ventajas que ofrece.

El resultado final de la simulación consiste en un conjunto de estadísticas que resumen y cuantifican el funcionamiento y aspectos de interés en el sistema modelado. Por ejemplo, el tiempo de espera promedio en una cola de un cajero automático en alguna sucursal bancaria. La replicación de la simulación en distintas ejecuciones permite la elaboración de intervalos de confianza que sustentan la calidad de los resultados.

Uno de los componentes necesarios para la simulación es el **tiempo**, de los cuales existen dos tipos:

- tiempo de **simulación**: corresponde a un reloj virtual que cuantifica el tiempo de ejecución en el mundo de la simulación;
- tiempo de **ejecución**: tiene relación con el tiempo de cpu consumido por la simulación

Para obtener resultados en tiempos razonables, necesitamos que el tiempo de ejecución sea lo más breve posible. Sin embargo, en términos de resultados y organización de los experimentos, tiene mayor relevancia el tiempo de simulación.


### Distribuciones de probabilidad

Para efectos de la simulación, la ocurrencia de los eventos es modelada usando distribuciones de probabilidad, con el objetivo de imitar la realidad. Una distribución de probabilidad es una función que asigna a cada evento una probabilidad de ocurrencia. Nosotros trabajamos principalmente con números, por lo que una distribución asigna una probabilidad de que cierto número "aparezca".

Vale la pena señalar que **para este curso no es necesario saber cómo determinar qué distribución de probabilidad modela de mejor forma un proceso**. Si fuese necesario usar distribuciones, se señalará explícitamente cuál usar y con qué parámetros.

A continuación, mostraremos algunas distribuciones y cómo se pueden usar en Python para que lo tengas como referencia si fuese necesario usarlas.

#### Distribución uniforme

Es muy probable que ya estés familiarizado con la **distribución uniforme**, aunque no la conozcas por ese nombre. En esta distribución, todos los números – del intervalo a trabajar – se pueden obtener con la misma probabilidad. En pocas palabras, es el _random_ de toda la vida. En Python, podemos obtener números con esta distribución usando la librería `random`.

In [1]:
from random import random, uniform, randint

# Obtenemos un float con distribución uniforme entre 0 y 1 (sin incluir el 1)
uniforme_cero_uno = random()

# Obtenemos un float con distribución uniforme entre a y b, incluyendo ambos
a, b = 5, 10
uniforme_intervalo = uniform(a, b)

# Obtenemos un int con distribución uniforme entre a y b, incluyendo ambos
a, b = 10, 20
uniforme_entero = randint(a, b)

print(uniforme_cero_uno, uniforme_intervalo, uniforme_entero)

0.5034711297833797 6.684468165394678 12


#### Distribución normal

En la realidad no todo se puede modelar con distribución uniforme. Por ejemplo, es razonable pensar que la gran mayoría de los adultos tiene una estatura dentro de cierto rango, y unos pocos son muy altos o muy bajos. Eso es un ejemplo de una distribución **no uniforme**, pues los valores no se presentan con igual probabilidad.

En el caso concreto de la estatura, se suele modelar con una **distribución normal**. Esta distribución necesita dos parámetros $(\mu, \sigma)$, donde $\mu$ es el promedio que se espera, y $\sigma$ mide cuán dispersos están los datos. La mayoría de los números que generamos con esta distribución estarán cerca de la media, como se puede ver en el gráfico de abajo:

![](https://upload.wikimedia.org/wikipedia/commons/thumb/7/74/Normal_Distribution_PDF.svg/720px-Normal_Distribution_PDF.svg.png)

Otro aspecto importante sobre esta distribución es que puede entregar cualquier `float`, por lo que a veces se "corta" la distribución estableciendo un mínimo y/o máximo. Por ejemplo, para la estatura no es razonable colocar estaturas negativas, y tampoco estaturas mayores a 3 metros (el _record_ es de 2.72 metros).

En Python, podemos obtener números con distribución normal usando la función `normalvariate`.

In [8]:
from random import normalvariate

# Valores de mu, sigma
mu, sigma = 0, 1
valor = normalvariate(mu, sigma)
print(valor)

mu, sigma = 170, 8
# Acá queremos obtener estaturas
# En este caso, "truncamos" la distribución haciendo que no nos de nada
# mayor a 300 cm ni nada menor a 0 cm.
estatura = min(max(normalvariate(mu, sigma), 0), 300)
print(estatura)

-0.5997155719151182
159.68593357643616


#### Distribución exponencial

Otra cosa que no tiene distribución uniforme es el tiempo en que tarda en llegar el próximo cliente a un local, o el tiempo que demora en llegar el próximo auto a una bencinera. Se ha estudiado que este tipo de procesos se puede modelar con una **distribución exponencial**. 

Esta distribución necesita un parámetro $\lambda$, que es la tasa promedio de ocurrencia de un evento. Por ejemplo, si se espera que en promedio un cliente llegue cada 20 minutos a una cola, la tasa es $\frac{1}{20}$. Por otro lado, si se espera que dos autos lleguen cada minuto, la tasa es $2$. Mientras $\lambda$ es más grande, es más probable que salgan números cercanos a cero, como se puede ver en la imagen:

![By Skbkekas - Own work, CC BY 3.0, https://commons.wikimedia.org/w/index.php?curid=9508311](https://upload.wikimedia.org/wikipedia/commons/thumb/e/ec/Exponential_pdf.svg/360px-Exponential_pdf.svg.png)


Es importante destacar que esta distribución puede generar **cualquier número mayor o igual a cero**. Sólo se asegura que, si generamos suficientes números, obtendremos algo casi igual a la tasa que esperábamos.

En Python, podemos obtener números con distribución exponencial usando la función `expovariate`.

In [6]:
from random import expovariate

# Un cliente llega cada 20 minutos
tasa_llegada_clientes = 1 / 20
tiempo_llegada_próximo_cliente = expovariate(tasa_llegada_clientes)

# Dos autos llegan cada minuto
tasa_llegada_autos = 2
tiempo_llegada_próximo_auto = expovariate(tasa_llegada_autos)

print("Próximo cliente llega en {} minutos".format(tiempo_llegada_próximo_cliente))
print("Próximo auto llega en {} minutos".format(tiempo_llegada_próximo_auto))

Próximo cliente llega en 15.883616756917457 minutos
Próximo auto llega en 1.2433077592629864 minutos


## Simulación Síncrona

Es uno de los modos de simulación más sencillos. En este caso, el tiempo total de simulación es dividido en pequeños intervalos. En cada intervalo, el programa verifica todas las actividades involucradas en el sistema modelado.

El algoritmo general de este tipo de simulación es:

    MIENTRAS el tiempo simulación no termine
        aumentar tiempo en una unidad
        si ocurren eventos en este intervalo de tiempo:
            simular los eventos
            

Por ejemplo, consideremos el caso de modelar un taller de revisión técnica. En una revisión técnica, llegan vehículos (o clientes) cada cierto tiempo aleatorio, los que se colocan en una cola de espera. Además, atender cada vehículo toma otro tiempo aleatorio. Veamos como modelar esto con una simulación síncrona.

In [33]:
from collections import deque
from random import choice, randrange, random
from statistics import mean


class Vehículo:
    """ Esta clase modela los vehículos que llegan al taller."""
    def __init__(self, vehículos):
        # Cuando se crea un nuevo vehículo se escoge uniformemente el tipo de vehículo
        self.tipo = choice(list(vehículos))
        # Seleccionamos el tiempo que demorará atender a este vehículo.
        # Esperamos que como mínimo sea 1 minuto.
        self.tiempo_revisión = max(1, round(expovariate(vehículos[self.tipo])))
        
    def __repr__(self):
        return self.tipo

        
class Taller:
    """ Esta clase modela la línea de revisión en el taller."""
    def __init__(self):
        self.tarea_actual = None
        self.tiempo_revisión_restante = 0

    @property
    def ocupado(self):
        return self.tarea_actual is not None

    def atender(self, vehículo):
        self.tarea_actual = vehículo
        self.tiempo_revisión_restante = vehículo.tiempo_revisión
        print('[PLANTA] Atendiendo {0}, demorará {1} min'.format(
              self.tarea_actual, self.tiempo_revisión_restante))
        
    def tick(self):
        if self.tarea_actual is not None:
            self.tiempo_revisión_restante -= 1
            if self.tiempo_revisión_restante <= 0:
                print('[PLANTA] termina revisión de {}'.format(self.tarea_actual))
                self.tarea_actual = None
                
                
class SimulaciónSíncrona:
    
    STR_TEMPLATE = ('[COLA] llega {} en tiempo de simulación t={} min. '
                    'Hay {} vehículos en cola')
    
    def __init__(self, max_tiempo, vehículos):
        self.max_tiempo = max_tiempo
        self.vehículos = vehículos
        
        self.planta = Taller()
        self.cola_revisión = deque()
        self.tiempos_revisión = []

    @property
    def llega_nuevo_auto(self):
        """
        Esta funcion modela si llega o no un auto nuevo a la cola. 
        Se muestrea de una distribución de probabilidad uniforme. El método retorna
        True si el valor entregado por la función random es mayor a un valor dado.
        En este caso, es sencillo ver que retornará True un 20% de las veces.
        """
        return random() <= 0.2
    
    def imprimir_estadísticas(self):
        tiempo_promedio = mean(self.tiempos_revisión)
        tiempo_total = sum(self.tiempos_revisión)

        print()
        print('Estadísticas:')
        print('Tiempo promedio de atención {:6.2f} min.'.format(tiempo_promedio))
        print('Tiempo total de atención {:6.2f} min'.format(tiempo_total))
        print('Total de vehículos atendidos: {}'.format(len(self.tiempos_revisión)))
        

    def revisión_técnica(self):
        """Esta función maneja el proceso o servicio de revisión en el taller."""

        # Hacemos avanzar el reloj de la simulación minuto por minuto.
        # No importa si en ese minuto no pasa nada.
        for minuto in range(self.max_tiempo):

            if self.llega_nuevo_auto:
                vehículo = Vehículo(self.vehículos)
                self.cola_revisión.append(vehículo)
                print(self.STR_TEMPLATE.format(vehículo, minuto, len(self.cola_revisión)))

            if self.cola_revisión and not self.planta.ocupado:
                # Si hay vehículos esperando y la planta no está ocupada
                # Atendemos un vehículo, sacándolo de la cola
                vehículo = self.cola_revisión.popleft()
                self.tiempos_revisión.append(vehículo.tiempo_revisión)
                self.planta.atender(vehículo)

            # Avisamos a la planta que ha transcurrido 1 minuto
            self.planta.tick()

        # Ya terminamos la simulación, imprimamos las estadísticas
        self.imprimir_estadísticas()


    
if __name__ == '__main__':
    # Define los tipos de vehículos y su tiempo de atención promedio
    vehículos = {'moto': 1 / 8, 'auto': 1 / 15, 'camioneta': 1 / 20} 
    max_tiempo = 80
    
    simulación = SimulaciónSíncrona(max_tiempo, vehículos)
    simulación.revisión_técnica()

[COLA] llega auto en tiempo de simulación t=5 min. Hay 1 vehículos en cola
[PLANTA] Atendiendo auto, demorará 5 min
[PLANTA] termina revisión de auto
[COLA] llega moto en tiempo de simulación t=20 min. Hay 1 vehículos en cola
[PLANTA] Atendiendo moto, demorará 1 min
[PLANTA] termina revisión de moto
[COLA] llega moto en tiempo de simulación t=33 min. Hay 1 vehículos en cola
[PLANTA] Atendiendo moto, demorará 13 min
[COLA] llega camioneta en tiempo de simulación t=35 min. Hay 1 vehículos en cola
[PLANTA] termina revisión de moto
[PLANTA] Atendiendo camioneta, demorará 11 min
[COLA] llega camioneta en tiempo de simulación t=52 min. Hay 1 vehículos en cola
[COLA] llega moto en tiempo de simulación t=54 min. Hay 2 vehículos en cola
[PLANTA] termina revisión de camioneta
[PLANTA] Atendiendo camioneta, demorará 22 min
[COLA] llega auto en tiempo de simulación t=59 min. Hay 2 vehículos en cola
[COLA] llega moto en tiempo de simulación t=67 min. Hay 3 vehículos en cola
[COLA] llega moto en tie

Considerando que, en general, las simulaciones requieren de mucho tiempo para ejecutarse y producir resultados, la simulación síncrona presenta las siguientes desventajas:

- La ejecución es muy lenta, debido a que hay que verificar muchas condiciones para **cada** momento de la simulación, incluso, si sabemos que ahí no ocurrirá nada. Debido a lo anterior, presenta un alto consumo de tiempo de CPU.
- Además, los incrementos de tiempo son fijos. En nuestro ejemplo, no es posible que un auto llegue a los 15 minutos y 20 segundos del tiempo de simulación. Para eso, tendríamos que correr la simulación segundo a segundo, agravando el problema de eficiencia.

## Simulación basada en Eventos Discretos (DES)

En este paradigma de DES, existe una secuencia discreta de eventos distribuidas en el tiempo, en donde cada evento ocurre en un instante **t** determinado, y genera un cambio en el estado del sistema. A difrerencia de la simulación sincrónica, en DES se asume que entre eventos consecutivos no existen cambios del sistema. Esto permite saltar directamente entre eventos próximos y no depender del tiempo de simulación para transitar entre todos ellos. Para el funcionamiento de esta simulación, se incorpora un conjunto de eventos que representa a todos los eventos pendientes. En cada iteración se genera y agrega un nuevo evento al conjunto de eventos, que se representa generalmente usando una cola.

El algoritmo general de una simulación basada en eventos discretos es el siguiente:

    MIENTRAS la lista de eventos no esté vacía y el tiempo de simulación no termine:
        tomar un evento desde el principio de la lista de eventos
        avanzar el tiempo de simulación al tiempo del evento
        simular el evento

### Componentes de un Modelo DES

Un modelo de simulación se compone de los siguientes elementos:

1. Un conjunto de variables de estado que permiten describir el estado del sistema simulado
1. Una subrutina de inicialización de variables
1. Un reloj que lleva registro del tiempo de simulación
1. Un conjunto de eventos que generan secuencias de actividades que originan el estado del sistema
1. Un arreglo para regir la posición de cada evento y el tiempo en el cual ocurrirá el siguiente evento
1. Una subrutina para cada evento, que actualiza el estado del sistema cuando ocurre un evento de este tipo
1. Un programa principal que controla la ocurrencia de los eventos y que transfiere el control a la subrutina del evento correspondiente
1. Indicadores para calcular estadísticas del sistema


Ahora veamos el mismo ejemplo anterior para la planta de revisión técnica desde el punto de vista de simulación de eventos discretos. La figura siguiente explica el problema gráficamente.
![Ejemplo de diagrama de flujo.](./imgs/diagrama_flujo_ejemplo.png)

En el próximo _notebook_, veremos una forma de implementar una DES en Python con el mismo ejemplo de la revisión técnica.