<h1 align="center"> TEL341 Simulación de Redes - Ayudantía 2 </h1> 
<h3 align="center"> Juan Pablo Sánchez </h3>
<h3 align="center"> 30 de Mayo, 2022</h3>
<h2 align="center"> <img src="https://jupyter.org/assets/homepage/main-logo.svg" width="150"> </h2>


<h3 align="center"><a href="https://discord.gg/FqjXP3Ka"> Discord TEL341 </a></h3>


## Revisión Tarea 2

Se busca simular el comportamiento de las conexiones entre pares de nodos en distintas redes backbone MPLScompuestas de **N** nodos de red y **L** enlaces unidireccionales donde cadad enlace poseerá una misma capacidad **C** en unidades de ancho de banda.

<figure>
  <br><img title="criterio" alt="t" src="arpanet.png" style="width:45%" ><br>
  <center><figcaption>Fig.1 Ejemplo de una de las redes a simular - ArpaNet </figcaption></center>
</figure>

La idea de esta tarea es determinar las probabilidades de que ocurran bloqueos a medida que varía la capacidad de ancho de banda en los enlaces utilizados, analizando los bloqueos y llegadas de los usuarios. Particularmente se evaluará su variación desde un sistema sin bloqueos hasta obtener una probabilidad en el orden de $10^{-3}$ y posteriormente utilizar dicha información para determinar los promedios de probabilidades de bloqueo para pares de nodos con un mismo número de saltos en cada red. 

<figure>
  <br><img title="criterio" alt="t" src="criterio.png" ><br>
  <center><figcaption>Fig.2 Diagrama de flujo de la simulación </figcaption></center>
</figure>

Para esta simulación, tenemos que utilizar como **criterio de parada** el valor de **Probabilidad de bloqueo** $< 10^{-3}$. El cálculo de la probabilidad se obtiene utilizando la simulación de la tarea anterior con un valor de **LLEGADAS** $= 10^{6}$ o superior. El resultado de probabilidad de bloqueo final es el que se utiliza para comparar con el criterio de parada, en caso de no cumplirse se debe disminuir la capacidad de ancho de banda del enlace y repetir hasta que se cumpla el criterio.     

### Parámetros y consideraciones

Al tratarse de una red MPLS, los usuarios de la red corresponden a todos los posibles pared de nodos que puedan conectarse en la red, esto implica que la cantidad de usuarios se encontrará definida por el valor **N (N-1)**.

Respecto al tráfico de red, este se representa a través de un modelo **ON-OFF**. Mientras un usuario se encuentra en ON estará transmitiendo a tasa de bits de 1 unidad de ancho de banda ocupando parte de la capacidad **C** de todos los enlaces que conecten con su destino por la ruta especificada. En cambio cuando se encuentre en OFF no transmitirá. 

Dicho comportamiento se asemeja a la situación de la *Tarea 1* donde se simulaba el trafico de conexiones en 1 enlace, ahora tal situación hay que aplicarla de manera más global dentro de una red backbond y donde nuestras tasas de conexión y atención dependerán de los tiempos de ON y OFF.

<figure>
  <br><img title="trafico" alt="t" src="transmisión.png" style="width:90%" ><br>
  <center><figcaption>Fig.3 Transmisión de datos </figcaption></center>
</figure>


Ante esto, su código tendrá por lo menos las siguientes variables iniciales que definirán el comportamiento de su simulador:

* $$ \rho = \frac{t_{ON}}{t_{ON} + t_{OFF}} $$ - Carga de tráfico homogénea
* $$ \lambda  = \frac{1}{t_{ON} + t_{OFF}}  $$ - Tasa de llegada por bloqueo de un usuario y para inicializar la FEL. 
* $$\lambda' = \frac{1}{t_{OFF}}           $$ - Tasa de llegada por atención de un usuario  
* $$\mu = \frac{1}{t_{ON}}                 $$ - Tasa de salida de un usuario   

Los valores $$\rho$$ y $t_{ON}$ son constantes dadas en el problema y corresponden a 0.3 y 0.001 respectivamente. A diferencia de la tarea anterior, ahora se tienen 3 variables que modelan de forma **EXPONENCIAL** los tiempos aleatorios de conexión. Notar que ahora los valores dependen entre sí, de modo que si se modifica los valores de $$\rho$$ y $t_{ON}$ se han de ver reflejados los cambios en las variables.

Respecto a los datos de la red, estos deben extraerse a partir de cada archivo de la topología ya que en cada simulación los valores serán distintos según la red con la que se trabaje:

* N - Número de nodos de la red
* L - Número de enlaces de la red
* M - Número de usuarios de la red
* C - Capacidad del enlace en unidades de ancho de banda

## Leer archivos de topologías 

Para poder leer la información contenida en la topología debemos utilizar la biblioteca ``Pandas`` para poder acceder y almacenar los datos en forma de un dataFrame. 

``` Python
import pandas as pd
dfRutas = pd.read_csv("./Rutas/Arpanet.rut",header=None)
dfRutas= dfRutas[0].str.split('\t', expand=True)
dfRutas
```

In [30]:
import pandas as pd
dfRutas = pd.read_csv("./Rutas/Arpanet.rut",header=None)
dfRutas= dfRutas[0].str.split('\t', expand=True)
dfRutas

Unnamed: 0,0,1,2,3,4,5,6,7,8
0,Rutas,por,cnx.,1,,,,,
1,Number,of,nodes:,20,,,,,
2,Number,of,links:,62,,,,,
3,==============================================...,,,,,,,,
4,source,dest.,hops,path,(link,ids),,,
...,...,...,...,...,...,...,...,...,...
401,19,15,3,59,55,53,,,
402,19,16,2,59,55,,,,
403,19,17,1,59,,,,,
404,19,18,1,61,,,,,


In [31]:
N = int(dfRutas[3][1]) # Número de nodos de la red
L = int(dfRutas[3][2]) # Número de enlaces unidireccionales
M = N*(N-1) # Numero de usuarios
N,L,M

(20, 62, 380)

Limpiamos y actualizamos el dataframe con la finalidad de obtener solo la información asociada a los usuarios. Las columnas almacenan respectivamente la siguiente información: nodo inicio, nodo destino, cantidad de saltos, ruta.

``` Python
dfRutas = dfRutas[dfRutas[0]!=dfRutas[1]][6:].reset_index(drop=True)
```

In [32]:
dfRutas = dfRutas[dfRutas[0]!=dfRutas[1]][6:].reset_index(drop=True)
dfRutas

Unnamed: 0,0,1,2,3,4,5,6,7,8
0,0,1,1,0,,,,,
1,0,2,1,2,,,,,
2,0,3,2,0,8,,,,
3,0,4,2,2,10,,,,
4,0,5,3,0,8,14,,,
...,...,...,...,...,...,...,...,...,...
375,19,14,4,59,55,53,51,,
376,19,15,3,59,55,53,,,
377,19,16,2,59,55,,,,
378,19,17,1,59,,,,,


Con esto, podemos preocuparnos solo de la columna 3 en adelante que almacena los enlaces de cada ruta. Teniendo dicha información, gracias a la magia de pandas, contar los cada uno de los enlaces y ver la cantidad de veces que son utilizados. El valor máximo de estos será nuestra capacidad **C** para que inicialmente no tengamos ningún bloqueo en la red

``` Python
C = dfRutas.iloc[:,3:].apply(pd.value_counts).sum(axis=1).max()
```

In [33]:
dfRutas.iloc[:,3:].apply(pd.value_counts).sum(axis=1)

0     13.0
1     13.0
10    15.0
11    15.0
12     9.0
      ... 
60     5.0
61     5.0
7      7.0
8     15.0
9     15.0
Length: 62, dtype: float64

In [34]:
C = dfRutas.iloc[:,3:].apply(pd.value_counts).sum(axis=1).max()
C

33.0

A su vez, podemos procesar la información para obtener de forma clara cuales son las rutas definidas entre cada nodo, introduciendolas en el dataFrame para facilitar la visualización y su uso posteriormente para chequear la capacidad y si ocurren bloqueos o no.

```Python
dfRutas["RUTA"] = dfRutas.iloc[:,3:].apply(
      lambda x: [i for i in x.dropna().astype(int)],
      axis=1
  ) 
```

In [35]:
dfRutas["RUTA"] = dfRutas.iloc[:,3:].apply(
      lambda x: [i for i in x.dropna().astype(int)],
      axis=1
  ) 
dfRutas

Unnamed: 0,0,1,2,3,4,5,6,7,8,RUTA
0,0,1,1,0,,,,,,[0]
1,0,2,1,2,,,,,,[2]
2,0,3,2,0,8,,,,,"[0, 8]"
3,0,4,2,2,10,,,,,"[2, 10]"
4,0,5,3,0,8,14,,,,"[0, 8, 14]"
...,...,...,...,...,...,...,...,...,...,...
375,19,14,4,59,55,53,51,,,"[59, 55, 53, 51]"
376,19,15,3,59,55,53,,,,"[59, 55, 53]"
377,19,16,2,59,55,,,,,"[59, 55]"
378,19,17,1,59,,,,,,[59]


In [40]:
dfRutas['RUTA'][4]

[0, 8, 14]

## Aumentar y disminuir la capacidad de los enlaces según la conexión de usuario

Al conectarse un usuario (dos nodos entre sí) se estan utilizando los enlaces de ruta y se consume capacidad, por tanto es necesario manejar tal situación para disminuir la capacidad en todos los enlaces que se utilicen en caso de establecerse la conexión o aumentarla si termina la conexión liberando los recursos. 

### Opción 1 : Capacidad > 0

In [12]:
import numpy as np
## Capacidad actual en ancho de banda de cada uno de los C enlaces de la red
enlaces = np.full(L,C)
enlaces

array([33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33.])

In [18]:
## Aceptar conexión y usar recursos
enlaces[dfRutas['RUTA'][4]] -= 1
enlaces

array([-1., 33., 33., 33., 33., 33., 33., 33., -1., 33., 33., 33., 33.,
       33., 32., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33.])

In [19]:
## Liberar conexión y recursos 
enlaces[dfRutas['RUTA'][4]] += 1 
enlaces

array([ 0., 33., 33., 33., 33., 33., 33., 33.,  0., 33., 33., 33., 33.,
       33., 32., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33., 33.,
       33., 33., 33., 33., 33., 33., 33., 33., 33., 33.])

In [21]:
## Chequeamos si hay disponibilidad - de lo contrario ocurre un bloqueo.
np.all(enlaces[dfRutas['RUTA'][4]] > 0)

False

### Opción 2 : Capacidad > Uso

In [22]:
## Capacidad actual en ancho de banda de cada uno de los C enlaces de la red
enlaces = np.full(L,0)
enlaces

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [23]:
## Aceptar conexión y usar recursos
enlaces[dfRutas['RUTA'][4]] += 1
enlaces

array([1, 0, 0, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [24]:
## Liberar conexión y recursos 
enlaces[dfRutas['RUTA'][4]] -= 1 
enlaces

array([0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,
       0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0])

In [131]:
np.all(enlaces[dfRutas['RUTA'][4]] < C)

True

## Procesar arribos / bloqueos y calculo de probabilidades

A diferencia de la tarea anterior donde solo manteniamos una variable para bloqueos y llegadas, ahora necesitaremos una diferente para cada par de nodos. Utilizando nuevamente ``NumPy`` es posible procesar esta situación. Note que esto solo maneja las variables de **Arribos** y **Bloqueos**; en ningún instante remueve la necesidad de la FEL.

In [25]:
## Arreglo bi-dimensional. El primer valor almacena los bloqueos y el segundo los arribos
usuarios = np.full((M,2),0)
usuarios

array([[0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0,

In [29]:
### Evento de llegada de un usuario
eventoActual=[3,6]
usuarios[eventoActual[0],1] += 1
usuarios

array([[0, 0],
       [0, 0],
       [0, 0],
       [0, 3],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0,

In [30]:
### Evento bloqueado para un usuario
usuarios[eventoActual[0],0] += 1
usuarios

array([[0, 0],
       [0, 0],
       [0, 0],
       [1, 3],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0, 0],
       [0,

De tal forma logramos mantener asociados ambos valores y se hace posible manejar al mismo tiempo los arribos y bloqueos para todos los usuarios de la topología. Una vez se hayan cumplido la cantidad de llegadas es posible calcular las probabilidades de bloqueo facilmente para todos los usuarios y agregarlas al dataFrame para posterior uso. 

``` Python
dfRutas["Prob Bloqueo"] = usuarios[:,0]/usuarios[:,1]
```

De la misma forma, la probabilidad de bloqueo total para una la capacidad **C** actual se obtiene dividiendo la suma de todos los bloqueos con todas las llegadas

``` Python
P = usuarios[:,0].sum()/usuarios[:,1].sum()
```

También es necesario modificar el criterio de parada de modo que depende de un número de llegadas fijas para calcular la probabilidad. Un valor de llegadas razonable es cómo mínio $10^{6}$ para obtener probabilidades cercanas a la realidad.

``` Python
LLEGADAS = 10**6

# Condición de parada del simulador
while(usuarios[:,1].sum() <= LLEGADAS): 
    # Procesar eventosde la FEL, arribos salidas bloqueos. 
```

## Criterio de Parada Tarea 2

El procedimiento realizado en la tarea 1 se debe replicar en este trabajo para calcular las probabilidades de bloqueo dada una cierta capacidad. Dicho proceso debe repetirse mientras la probabilidad final obtenida sea menor a $10^{-3}$ disminuyendo en 1 la capacidad C hasta obtener el valor de probabilidad indicado.  

``` Python
P = 0
C = dfRutas.iloc[:,3:].apply(pd.value_counts).sum(axis=1).max()

while (P < 10**-3):
    # Ejecución del simulador de la Tarea 1 con la modificaciones mencionadas
    c -=1
```

Los valores de probabilidades **P** y las Capacidades **C** deben almacenarse en cada iteración para después graficar el avance solicitado. 

## Gráfico Probabilidades Bloqueo vs Largo usuarios

El largo de un usuario o par de nodos viene dado por el largo de la ruta que los conecta, osea la cantidad de enlaces que componen la ruta. Una vez obtenidas las probabilidades de bloqueo para cada usuario con una total en el orden de $10^{-3}$ se deberá agrupar los usuarios con el mismo largo y obtener el promedio de probabilidad para ellos. 


Para esta situación ``Pandas`` permite agrupar, hacer cálculos directamente del dataFrame para poder graficar esos datos en vez de ir uno por uno. Para esto solo necesitamos lo siguiente:

``` Python
dfRutas = df[[0,1,2,"Prob Bloqueo"]
dfRutas.groupby(2).mean().plot(kind="line")
```
Con lo anterior solo se plotean los datos, usted debe buscar como complementar el gráfico para presentar la información de la manera más completa y entendible. (Sea título,tamaño,ejes,leyenda,etc.)

### Salidas

Cómo salida de **una simulación**, se deben obtener 2 gráficos con la información obtenida:

1. Gráfico de las probabilidades de Bloqueo (Eje Y) vs Capacidad C asignada a cada enlace (Eje X) comenzando desde el caso con probabilidad de bloqueo igual a 0, hasta la probabilidad obtenida en el orden de $10^{-3}$.

<figure>
  <br><img title="graf1" alt="t" src="P_ArpaNet.png" style="width:40%" ><br>
  <center><figcaption>Fig.4 Ejemplo Gráfico ArpaNet </figcaption></center>
</figure>


2. Gráfico de líneas para el promedio probabilidades de Bloqueo (Eje Y) de los usuarios con el mismo largo de ruta en la topología de red para el caso cuando la probabilidad de bloqueo de la red este en el orden de $10^{-3}$.

<figure>
  <br><img title="graf2" alt="t" src="S_ArpaNet.png" style="width:40%" ><br>
  <center><figcaption>Fig.5 Ejemplo Gráfico Arpanet </figcaption></center>
</figure>

## Entrega

Su simulador debe ser ejecutado para las 6 topologías de red diferentes entregadas:

* ArpaNet
* EON
* EuroCore
* EuroLarge
* NFSNet 
* UKNet

En cada ejecución se debe obtener los dos gráficos mencionados, uno de Probabilidad de Bloqueo vs Capacidad y el otro de Probabilidad de Bloqueo Promedio vs Largo de la Ruta. Terminando la ejecución de la tarea, tendrá 12 gráficos a entregar que presenten la información respecto al progreso de las probabilidaddes de bloqueo para el problema del tráfico de datos en redes MPLS.

**Tiempo Aproximado Ejecución : 8 a 10 Horas** 

### Fecha Entrega : Viernes 25 de Junio de 2021 hasta las 23.59hrs. 

La asignación es individual, donde se debe entregar por aula y por correo electrónico a su queridísimo profesor ( nicolas.jara@usm.cl ) cómo un archivo comprimido en el formato **TEL341 Nombre Apellido T2**. El archivo debe contener todo lo necesario para la evaluación. Asegurese que pueda ser ejecutado tanto desde Jupyter Notebook como que pueda visualizarse claramente mediante Voilà desplegando los datos y su análisis. 

### Importante
Su código debe ser autocontenido y comentado con las explicaciones pertinentes. Para esto documente su código y mediante las facilidades de Jupyter con Markdown, incluya una breve introducción sobre el objetivo de su simulador, la definición y explicación de las variables/estados y un conclusión respecto a los datos y gráficos obtenidos.