# Problema de flujo máximo. 

## Introducción


Otro de los problemas más representativos en networking es el del flujo máximo que consiste en determinar el máximo flujo posible que puede ser transportado desde un nodo origen a un nodo destino teniendo en cuenta que hay restricciones de capacidad en cada uno de los enlaces. 

La primera persona en estudiar este problema fue el matemático ruso A. N. Tolstoi en 1930. El mapa mostrado abajo representa una red de trenes para la cual él quería encontrar el flujo máximo. 

![network_flow](https://developers.google.com/optimization/images/railway_network.png)

## Definición formal

Se tiene una red de $n$ nodos que representa una red de transporte, $|V| = n$. La idea es transportar material (datos) desde un nodo origen (designado como $s$ por source en inglés) hasta un nodo destino (designado como $d$ por destination en inglés). La capacidad de un enlace es la cantidad máxima de material que puede ser transportado en un período de tiempo fijo. Las capacidades de los enlaces representan las restricciones del problema. 

Un flujo es la asignación de una cantidad no negativa a cada enlace (la cantidad de flujo) que satisface la regla de la conservación del flujo: 

> En cada nodo, excepto en el nodo origen o destino, el flujo total de todos los enlaces que entran al nodo es igual al flujo total de todos los enlaces que salen del nodo. 

El problema de flujo máximo trata de encontrar la cantidad de flujo para la cual la suma de las cantidades de flujo de toda la red sea máxima siempre y cuando las capacidades de los enlaces no sean superadas. 


Dada una red representada por $G=(V, E)$ con un nodo origen $s$ y un nodo destino $d$ se quiere encontrar el flujo máximo sobre $G$. El grafo consiste de $|E|$ enlaces dirigidos ($e=1, 2, ..., E$) y $|V|$ nodos ($v=1, 2, ..., V$) donde cada enlace $e$ tiene asociada una capacidad $c_e$ y representa la cantidad máxima de flujo que puede ir por dicho enlace. 

Se quiere determinar entonces **la cantidad de flujo $f$ que debe ir por cada enlace con tal de enrutar la mayor cantidad posible de material de $s$ a $d$**

Por ejemplo, considere la red mostrada a continuación. La red tiene 5 nodos donde el nodo $v=0$ es considerado como el origen y el nodo $v=4$ es considerado como el destino. Los enlaces son dirigidos y tienen las capacidades mostradas en la figura y son resumidas en la tabla más abajo.

<img src="../source/imgs/max_flow_prob.png" width="400">

| $e$ 	|   $\langle u,v \rangle$ 	| $c_e$ 	|
|:---:	|  :---------------------:	|:-----:	|
|  1  	|         0, 1          	|   20  	|
|  2  	|          0, 2         	|   30  	|
|  3  	|          0, 3         	|   10  	|
|  4  	|          1, 4         	|   30  	|
|  5  	|          1, 2         	|   40  	|
|  6  	|         2, 3          	|   10   	|
|  7  	|         2, 4          	|   20  	|
|  8  	|          3, 2         	|   5   	|
|  9  	|          3, 4         	|   20  	|

El flujo debe tener las siguientes características: 
* El flujo $f$ no debe exceder la capacidad de ninguno de los enlaces que atraviese. 
* Se debe cumplir la ley de conservación del flujo (la suma de los flujos que entran a un nodo debe ser igual a la suma de los flujos que salen del mismo). 

En este caso tenemos, $x_e$ será la variable que represente la cantidad flujo que pasa por el enlace $e$. Básicamente, al resolver este problema, indirectamente también estamos encontrando una ruta para el flujo $f$. 


### Restricciones de capacidad
Se debe asegurar que el flujo $f$ no sobrepase la capacidad de ninguno de los enlaces. Por ejemplo, para la figura, el flujo que se asigne a cada enlace no puede superar la capacidad de dicho enlace. Así se tiene: 

$x_1 \leq 20$

$x_2 \leq 30$

$x_3 \leq 10$

...

$x_9 \leq 20$

En forma general:  $x_e \leq c_e,  \forall e \in E$


### Ley de conservación del flujo

Debemos asegurar que, excepto en los nodos origen y destino, la suma de los flujos que entran en un nodo debe ser igual a la suma de los flujos que salen del nodo. De esta manera se tiene: 

Para el nodo $v=1$:  $x_1 = x_5 + x_4$

Para el nodo $v=2$:  $x_2 + x_5 + x_8 = x_6 + x_7$

Para el nodo $v=3$:  $x_3 + x_6 = x_8 + x_9$


Cuando el nodo en cuestión es origen del flujo, la suma de los flujos que salen del nodo menos la suma de los flujos que entran a ese nodo deben ser iguales a la cantidad de flujo que se quiere maximizar ($f$). De esta manera se tiene:

Para el nodo $v=0$:  $f = x_1 + x_2 + x_3 $

Mientras que para el nodo destino, la suma de los flujos que entran en el nodo menos la suma de los flujos que salen del nodo deben ser iguales a la cantidad de flujo que se quiere maximizar ($f$). De esta manera se tiene: 

Para el nodo $v=4$:  $f = x_4 + x_7 + x_9$

Para expresar la ley de conservación del flujo de manera general necesitamos saber cómo se relacionan los enlaces con la dirección del flujo. Por ejemplo, es necesario saber si un enlace empieza o no en un determinado nodo o que enlaces terminan en un determinado nodo. Por ejemplo, para el nodo $v=0$ ningún enlace termina en él, todos los enlaces salen de él. En este caso se deben incluir dos parámetros binario $a_{ev}$ y $b_{ev}$ que:

$a_{ev} = \biggl \{  \begin{array}{l l}
    1 & \quad \text{si el enlace $e$ se origina en el nodo $v$}\\
    0 & \quad \text{en cualquier otro caso}\\
  \end{array}$
  
$b_{ev} = \biggl \{  \begin{array}{l l}
1 & \quad \text{si el enlace $e$ termina en el nodo $v$}\\
0 & \quad \text{en cualquier otro caso}\\
\end{array}$

|     |       |       | $a_{ev}$ |       |       |       |       | $b_{ev}$ |       |       |
|:---:|:-----:|:-----:|:--------:|:-----:|:-----:|:-----:|:-----:|:--------:|:-----:|:-----:|
| $e$ | $v=0$ | $v=1$ |   $v=2$  | $v=3$ | $v=4$ | $v=0$ | $v=1$ |   $v=2$  | $v=3$ | $v=4$ |
|  1  |   1   |   0   |     0    |   0   |   0   |   0   |   1   |     0    |   0   |   0   |
|  2  |   1   |   0   |     0    |   0   |   0   |   0   |   0   |     1    |   0   |   0   |
|  3  |   1   |   0   |     0    |   0   |   0   |   0   |   0   |     0    |   1   |   0   |
|  4  |   0   |   1   |     0    |   0   |   0   |   0   |   0   |     0    |   0   |   1   |
|  5  |   0   |   1   |     0    |   0   |   0   |   0   |   0   |     1    |   0   |   0   |
|  6  |   0   |   0   |     1    |   0   |   0   |   0   |   0   |     0    |   1   |   0   |
|  7  |   0   |   0   |     1    |   0   |   0   |   0   |   0   |     0    |   0   |   1   |
|  8  |   0   |   0   |     0    |   1   |   0   |   0   |   0   |     1    |   0   |   0   |
|  9  |   0   |   0   |     0    |   1   |   0   |   0   |   0   |     0    |   0   |   1   |

Con ayuda de este parámetro podemos escribir ahora las restricciones de conservación de flujo de manera general: 

Para los nodos que no son ni origen ni destino:  $\sum_e a_{ev}x_e - \sum_e b_{ev}x_e = 0,  \forall v \in V, v \neq \{s, d\}$  

Para los nodos que son origen:  $\sum_e a_{es}x_e - \sum_e b_{es}x_e = f,  v = s$ 

Para los nodos que son destino:  $\sum_e a_{ed}x_e - \sum_e b_{ed}x_e = f,  v = d$ 


### Restricciones de no negatividad

El flujo que lleva cada enlace de $G$ no puede ser negativo. 

$x_e \geq 0$

### Función objetivo

En este problema queremos maximizar el flujo $f$


### Formulación del modelo

Finalmente podemos escribir el problema de flujo máximo de la siguiente manera: 

**maximizar**

$f$

**sujeto a**

$\sum_e a_{es}x_e - \sum_e b_{es}x_e = f,  v = s$ (Ley de conservación del flujo)

$\sum_e a_{ev}x_e - \sum_e b_{ev}x_e = 0,  \forall v \in V, v \neq \{s, d\}$

$\sum_e a_{ed}x_e - \sum_e b_{ed}x_e = f,  v = d$ 

$x_e \leq c_e,  \forall e \in E$ (Restricciones de capacidad)

$x_e \geq 0$ (Restricciones de no negatividad)

---



## Solucion por medio de OR-Tools

A continuación resolveremos este problema haciendo uso del software desarrollado por Google para resolver problemas de optimización llamado [OR-Tools](https://developers.google.com/optimization). Puede instalarlo siguiendo las instrucciones sugeridas [aca](https://developers.google.com/optimization/install). Este notebook asume que usted ya tiene el paquete de OR-Tools instalado. La idea es que juegue con este notebook, si es necesario imprima las variables para saber qué contienen.

Para recopilar, el problema que queremos solucionar es el de maximizar la cantidad de flujo $f$ que debe ser direccionado desde el nodo origen hasta el nodo destino sabiendo que los enlaces tienen una capacidad dada.



### Implementación en Python

Lo primero es importar el módulo de python de OR-Tools y otras librerías de python. 

In [3]:
from __future__ import print_function
from ortools.graph import pywrapgraph

# Ejecutado en OR-Tools 7.7.7810 y python 3.7

### Datos de entrada

El grafo para este problema puede ser construido por tres vectores, uno para los nodos donde se originan los enlaces, otro donde finalizan los enlaces y el último para las capacidades de los enlaces. La longitud de cada vector es igual al número de enlaces del grafo. Para cada ```i```, el enlace del grafo irá desde el nodo ```start_nodes[i]``` hasta el nodo ```end_nodes[i]``` y su capacidad estará dada por ```capacities[i]```. La siguiente sección muestra cómo crear los enlaces usando estos datos. 

In [4]:
# Defina tres vectores paralelos:  start_nodes, end_nodes, y  capacities
# entre cada par. Por ejemplo, el enlace desde el nodo 0 hasta el nodo 1 
# tiene una capacidad de 20

start_nodes = [0, 0, 0, 1, 1, 2, 2, 3, 3]
end_nodes = [1, 2, 3, 2, 4, 3, 4, 2, 4]
capacities = [20, 30, 10, 40, 30, 10, 20, 5, 20]

### Declare el solver y añada los enlaces

Para resolver este problema se usará el solver [SimpleMaxFlow](https://developers.google.com/optimization/reference/graph/max_flow/SimpleMaxFlow). Para cada nodo de origen y destino del enlace, se crea el enlace y se le añade la capacidad con el método [AddArcWithCapacity](https://developers.google.com/optimization/reference/graph/max_flow/SimpleMaxFlow#AddArcWithCapacity). Las capacidades son las restricciones del problema. 

In [6]:
# Declare el software. 
max_flow = pywrapgraph.SimpleMaxFlow()
# Añada los enlaces.
for i in range(0, len(start_nodes)):
    max_flow.AddArcWithCapacity(start_nodes[i], end_nodes[i], capacities[i])

### Invoque el solver y muestre los resultados. 

Ahora que los enlaces fueron creados, lo que queda por hacer es invocar el método ```Solve()``` e imprimir los resultados teniendo en cuenta que el $v=0$ es nodo origen y $v=4$ el nodo destino. 

In [17]:
# Encuentre el flujo maximo entre el nodo 0 y el nodo 4.
if max_flow.Solve(0, 4) == max_flow.OPTIMAL:
    print('Flujo Maximo:', max_flow.OptimalFlow())
    print('')
    print('Enlace   Flujo / Capacidad')
    for i in range(max_flow.NumArcs()):
        print('%1s -> %1s   %3s   / %3s' % (
          max_flow.Tail(i),
          max_flow.Head(i),
          max_flow.Flow(i),
          max_flow.Capacity(i)))
    print('min-cut del lado del origen:', max_flow.GetSourceSideMinCut())
    print('min-cut del lado del destino:', max_flow.GetSinkSideMinCut())
else:
    print('Hubo un problema con la entrada del flujo maximo.')

Flujo Maximo: 60

Enlace   Flujo / Capacidad
0 -> 1    20   /  20
0 -> 2    30   /  30
0 -> 3    10   /  10
1 -> 2     0   /  40
1 -> 4    20   /  30
2 -> 3    10   /  10
2 -> 4    20   /  20
3 -> 2     0   /   5
3 -> 4    20   /  20
min-cut del lado del origen: [0]
min-cut del lado del destino: [4, 1]


### Análisis

El resultado del modelo de optimización muestra que el flujo máximo es de 60 unidades saliendo desde el nodo $v=0$ y se reparten de la siguiente manera: 

* Una parte del flujo sale por el enlace $e=1$ (del nodo $v=0$ al nodo $v=1$) y lleva 20 unidades de flujo sin exceder su capacidad. 
* Otra parte del flujo sale por el enlace del nodo $v=0$ al nodo $v=2$ llevando 30 unidades sin exceder su capacidad.
* 10 unidades de flujo salen del nodo $v=0$ y van al nodo $v=3$ sin exceder la capacidad del enlace. 
* Todo el flujo que entra al nodo $v=1$ sale por el enlace que va al nodo $v=4$. 
* De las 30 unidades que entran al nodo $v=2$ 10 van al nodo $v=3$ y 20 van al nodo $v=4$. 
* Finalmente el nodo $v=3$ recibe 10 unidades del nodo $v=1$ y 10 unidades del nodo $v=2$. Luego estas 20 unidades se dirigen al nodo $v=4$. 
* En resumidas cuentas, al nodo $v=4$ le llegan 60 unidades por los 3 enlaces de esta forma: 
    * 20 unidades del nodo $v=1$. 
    * 20 unidades del nodo $v=2$.
    * 20 unidades del nodo $v=3$. 

## Conclusión

En este ejemplo vimos cómo resolver el problema de flujo máximo de una red. Es decir, se determinó la cantidad máxima de flujo que puede ser enrutado por una red dado un origen y un destino y teniendo en cuenta de no exceder las capacidades de los enlaces. Aprendimos cómo formular el problema de manera general y resolvimos el caso específico usando el solver de OR-Tools. 

## Bibliografía

[1] H.A Taha, Operations research: an introduction. Pearson/Prentice Hall Upper Saddle Rive, 2011. Disponible en: [https://thalis.math.upatras.gr/~tsantas/DownLoadFiles/Taha%20-%20Operation%20Research%208Ed.pdf](https://thalis.math.upatras.gr/~tsantas/DownLoadFiles/Taha%20-%20Operation%20Research%208Ed.pdf)

[2] J.F. Botero, Presentación Modelamiento y ejemplos de problemas de flujo en redes. Universidad de Antioquia, 2020. 