# Clase 19

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2019%20-%20Grafos%20VIII.ipynb)

# Requisitos Previos

* Matemática Básica
* Matemática Discreta
* Grafos

# Relajación y Shortest-path trees

**Lema:** Sea $G = (V, E)$ un grafo dirigido y ponderado con función de peso $w : E \to \mathbb{R}$, sea $s \in V$ el nodo de origen y consideremos que el grafo no tiene ciclos negativos alcanzables por $s$. Entonces, luego de que el grafo sea inicializado con la función `initialize(s)`, el grafo de predecesor es un arbol con raiz en $s$ y luego de cualquier secuencia de relajaciones sobre las aristas de $G$ mantiene esta propiedad como una invariante.


**Prueba:**

Consideremos que luego de ejecutar la función `initialize(s)`, el único nodo en $G_{\pi}$ es el nodo $s$, que a su vez es raiz, por lo que el lema se cumple trivialmente.

Sea $G_{\pi}$ el grafo de predecesor generado luego de ejecutar una secuencia de relajaciones, primero probaremos que $G_{\pi}$ es acíclico:

Asumamos que $G_{\pi}$ posee un ciclo $c = \left\{v_{0}, v_{1}, \ldots, v_{k}\right\}$, con $v_{0} = v_{k}$; entonces se debe dar que $padre[v_{i}] = v_{i-1}$ y podemos asumir, sin pérdida de generalidad, que la relajación de la arista $(v_{k-1}, v_{k})$ fue la que creó el ciclo en $G_{\pi}$.

*Afirmación:* Todos los vértices del ciclo $c$ son alcanzables por $s$. La justificación de la afirmación es que cada nodo $u$ del ciclo tiene un $padre[u]$ diferente de *NULL*, por lo que van a tener también un $d[u] < \infty$: por la propiedad de cota superior, se debe cumplir que $\delta(s, u) \leq d[u] < \infty$, por lo que cada nodo del ciclo tendrá un peso de camino más corto finito. Finalmente, por la contrapositiva de la propiedad de inexistencia de camino, cada nodo $u \in c$ tendrá un camino de $s$ a $u$.

Ahora, probaremos que el ciclo $c$ es negativo: Consideremos los $d[u]$ para todos los $u \in c$ antes de la relajación de la arista $(v_{k-1}, v_{k})$; en ese momento se dará que $padre[v_{i}] = v_{i-1}, \forall i = 1, 1, 2, \ldots, (k - 1)$, así que la última vez que se actualizó $d[v_{i}]$ para cada $i = 1, \ldots, (k-1)$ fue para asignar $d[v_{i}] = d[v_{i-1}] + w(v_{i-1}, v_{i})$. Recordando que $d[u]$ solamente decrece, en el momento previo a la relajación de la arista $(v_{i-1}, v_{i})$ tendremos que:

$$ d[v_{i]] \geq d[v_{i-1}] + w(v_{i-1}, v_{i}), \forall i = 1, \ldots, (k-1) $$

Ya que el valor de $d[v_{i-1}]$ en ese momento solo puede ser menor o igual al del momento en que se realizó la actualización de $d[v_{i}]$.

Luego de la relajación se debió actualizar el resultado de $d[v_{k}]$, así que en ese momento se da que:

$$ d[v_{k}] > d[v_{k-1}] + w(v_{k-1}, v_{k}) $$

Sumando esta desigualdad con las $(k-1)$ anteriormente mencionadas, tendremos:

$$ \sum\limits_{i=1}^{k}d[v_{i}] > \sum\limits_{i=1}^{k}d[v_{i-1}] + w(v_{i-1}, v_{i}) $$

Sin embargo, notemos que $\{v_{0},v_{1},\ldots,v_{k-1}\} = \{v_{1},v_{2},\ldots,v_{k}\}$ ya que $v_{0} = v_{k}$, lo cual nos permite hacer las siguientes operaciones:

$$ \sum\limits_{i=1}^{k}d[v_{i}] > \sum\limits_{i=1}^{k}d[v_{i-1}] + \sum\limits_{i=1}^{k}w(v_{i-1}, v_{i}) $$

$$ 0 > \sum\limits_{i=1}^{k}w(v_{i-1}, v_{i}) $$

Lo cual nos señala que el ciclo $c$ tiene peso negativo, contradiciendo nuestra premisa de que $G$ no tiene ciclos negativos alcanzables por $s$.

Ahora hemos probado que $G_{\pi}$ es un grafo dirigido y acíclico; sin embargo, necesitamos probar que existe un único camino desde $s$ a cada nodo en $V_{\pi}$ para probar que $G_{\pi}$ es un árbol con raiz en $s$.

Probemos por inducción sobre la cantidad de relajaciones que existe al menos un camino de $s$ a $u, \forall u \in V_{\pi}$:

1) Luego de ejecutar `initialize(s)` tendremos que el único nodo de $V_{\pi}$ es $s$, el cual es trivialmente alcanzable por $s$, así que existe un camino de $s$ a todos los nodos de $V_{\pi}$ en $G_{\pi}$ en este punto.

2) Supongamos que luego de $n$ relajaciones se cumple que existe un camino de $s$ a todos los nodos de $V_{\pi}$ en $G_{\pi}$.

3) Consideremos que la $(n+1)$-ésima relajación sea sobre la arista $(u, v)$: Supongamos que el valor $d[v]$ fue actualizado, es decir $d[v] > d[u] + w(u, v)$ previo a la relajación, entonces actualizaremos también que $padre[v] = u$ (notemos que este caso solamente se puede dar si $d[u] < \infty$, por lo que $u \in V_{\pi}$). Por la hipótesis inductiva, existe un camino de $s$ a $u$ en $G_{\pi}$, por lo que ahora $v \in V_{\pi}$ y el camino de $s$ a $u$ en $G_{\pi}$, seguido por la arista $(padre[v], v) = (u,v)$ es un camino de $s$ a $v$ en $G_{\pi}$, con lo que termina la prueba.

Finalmente deberemos probar que existe a lo mucho un camino desde $s$ a $v, \forall v \in V_{\pi}$ en $G_{\pi}$. Supongamos que existen dos caminos diferentes de $s$ a $v$, para algún $v \in V_{\pi}$, los cuales pueden describirse como:

$$ p_{1} = s \leadsto u \leadsto x \rightarrow z \leadsto v $$

$$ p_{2} = s \leadsto u \leadsto y \rightarrow z \leadsto v $$

Con $x \not = y$.

Sin embargo, dado que cada nodo tiene exactamente un $padre[u]$ asignado, tendremos que $x = padre[z] = y$, lo cual es un contradicción. Usando las dos propiedades anteriores, concluimos que existe un único camino de $s$ a cada nodo de $V_{\pi}$ y en consecuencia $G_{\pi}$ es un árbol con raiz en $s$.

Ahora, ya que tenemos que el grafo de predecesor es un árbol con raiz en $s$, si llegamos a probar que las distancias asignadas a cada vértice son las más cortas con origen en $s$, entonces podremos demostrar que $G_{\pi}$ es un shortest-path tree.

**Lema (Propiedad del grafo de predecesor)**: Sea $G = (V, E)$ un grafo dirigido y ponderado con función de peso $w : E \to \mathbb{R}$, sea $s \in V$ el nodo de origen y consideremos que el grafo no tiene ciclos negativos alcanzables por $s$. Entonces, luego de que el grafo sea inicializado con la función `initialize(s)` y ejecute cualquier secuencia de relajaciones que genere el resultado $d[v] = \delta(s, v), \forall v \in V$, se dará que el grafo de predecesor $G_{\pi}$ es un shortest-path tree con raiz en $s$.

**Prueba:**

Deberemos probar las 3 características de un shortest-path $G' = (V', E')$, las cuales son:

1) $s$ es la raíz de $G'$.

2) $V' \subseteq V$ y $E' \subseteq E$. $V'$ es el conjunto de vértices de $V$ que son alcanzables por $s$.

3) Para todo $v \in V$, el único camino de $s$ a $v$ en $G'$ es un camino más corto de $s$ a $v$ en $G$.

*Propiedad 1:* Consecuencia directa del lema anterior.

*Propiedad 2:* Debemos probar que el conjunto $V_{\pi}$ es el conjunto de vértices $v \in V$ alcanzables por $s$. Por definición, el peso de un camino más corto $\delta(s, v)$ es finito si y solo si $v$ es alcanzable por $s$, por lo que los vértices alcanzables por $s$ son exactamente todos aquellos con $d[v]$ finito; sin embargo, todos los vértices $v \in V\backslash \{s\}$ con $d[v]$ finito son aquellos con $padre[v] \not = NULL$, asi que los vértices de que $V_{\pi}$ son exactamente aquellos que son alcanzables por $s$.

*Propiedad 3:* Sea $p = \{v_{0} = s,v_{1},v_{2},\ldots,v_{k} = v\}$ el único camino de $s$ a un nodo $v \in 
V_{\pi}$; entonces, por la propiedad de relajación de caminos, al obtener $G_{\pi}$ se da que $d[v_{i}] = \delta(s, v_{i})$ y que $d[v_{i}] \geq d[v_{i-1}] + w(v_{i-1}, v_{i})$. Uniendo ambas propiedades, llegamos a que:

$$ d[v_{i}] \geq d[v_{i-1}] + w(v_{i-1}, v_{i}) $$
$$ \delta(s, v_{i}) \geq \delta(s, v_{i-1}) + w(v_{i-1}, v_{i}) $$
$$ w(v_{i-1}, v_{i}) \leq \delta(s, v_{i}) - \delta(s, v_{i-1}) $$

Si realizamos la suma desde $i = 1$ hasta $i = k$:

$$ \sum\limits_{i=1}^{k}w(v_{i-1}, v_{i}) \leq \sum\limits_{i=1}^{k}\delta(s, v_{i}) - \delta(s, v_{i-1}) $$

$$ w(p) \leq \sum\limits_{i=1}^{k}\delta(s, v_{i}) - \sum\limits_{i=0}^{k-1}\delta(s, v_{i}) $$

$$ w(p) \leq \delta(s, v_{k}) + \sum\limits_{i=1}^{k-1}\delta(s, v_{i}) - \delta(s, v_{0}) - \sum\limits_{i=1}^{k-1}\delta(s, v_{i}) = \delta(s, v_{k}) - \delta(s, v_{0}) = \delta(s, v) - \delta(s,s) = \delta(s, v) $$

Por lo que $w(p) \leq \delta(s, v)$, pero por definición de camino más corto tenemos que $\delta(s,v) \leq w(p)$, así que tendremos la igualdad $w(p) = \delta(s, v)$ para todo camino $p$.

# Inecuaciones y Caminos más cortos

## Programación lineal

En un problema típico de programación lineal se nos da una matriz $A$ de $m \times n$, un vector $b$ de dimensión $m$ y otro vector $c$ de dimensión $n$. Se nos pide hallar un vector $x$ de dimensión $n$ que maximice la función objetivo $\sum\limits_{i=1}^{n}c_{i}x_{i}$ sujeto a las $m$ restricciones elemento a elemento de la inecuación $Ax \leq b$.

En nuestro caso particular, no nos enfocaremos en resolver un $x$ para maximizar una función objetivo, sino determinaremos si existe algún $x$ que cumpla con las $m$ restricciones.

## Sistema de restricción de diferencias

En un **sistema de restricción de diferencias**, cada fila de la matriz $A$ tiene exactamente un elemento igual a $1$ y un elemento igual a $-1$, el resto de elementos de la fila son 0. De esta forma, las restricciones del problema se pueden ver como:

$$ x_{j} - x_{i} \leq b_{k} $$

Con $1 \leq i, j \leq n, i \not = j$ y $1 \leq k \leq m$. 

Una observación importante que debemos hacer es que si existe una solución $x = (x_{1}, x_{2}, \ldots, x_{n})$; entonces, si tomamos un real $d$ arbitrario, $x + d = (x_{1} + d, x_{2} + d, \ldots, x_{n} + d)$ también es solución del sistema. La prueba se da simplemente reemplazando los valores asociados a cada elemento de $x$ y notar que la desigualdad sigue manteniéndose.

Este tipo de sistemas tienen algunas aplicaciones interesantes, entre ellas, podríamos considerar que los $x_{i}$ son puntos en el tiempo en el que se deben dar algunos eventos y con ellos podríamos relacionarlos de 2 a 2. Por ejemplo, si alguien debe realizar un proyecto y debe instalar una aplicación en un tiempo $x_{1}$ y la instalación dura unas 2 horas, entonces cualquier actividad relacionada al uso de dicha aplicación que se realice en el tiempo $x_{2}$ debe ser realizada desde el tiempo $x_{1} + 2$ en adelante, o en otras palabras, se debe cumplir que $x_{1} + 2 \leq x_{2} \rightarrow x_{1} - x_{2} \leq - 2$.

## Grafos de restricción

Podemos interpretar un sistema de restricción de diferencias como un grafo $G = (V, E)$ en el cual la matriz $A$ es la traspuesta de la matriz de incidencia de $G$, y podemos considerar que las variables $x_{i}$ se pueden asociar a cada nodo del grafo $v_{i}$.

De manera formal, podemos definir que el sistema de restricción de diferencias $Ax \leq b$ genera un **grafo de restricción $G = (V, E)$**, dirigido y ponderado, definido de la siguiente forma:

$$ V = \{v_{0}, v_{1}, \ldots, v_{n}\} $$

$$ E = \{(v_{i}, v_{j}) : x_{j} - x_{i} \leq b_{k} \text{ es una restriccion del sistema}\} \cup \{(v_{0}, v_{i}) : i = 1, 2, \ldots, n\} $$

El vértice $v_{0}$ es introducido para garantizar de que exista algún vértice que alcance a todos los demás y su función será explicada más adelante.

Los pesos de las aristas están definidos como:

$$ w(v_{i}, v_{j}) = \left\{ \begin{array}{cc} b_{k} &x_{j} - x_{i} \leq b_{k} \text{ es una restriccion del sistema} \\ 0 &\text{ en caso contrario} \end{array} \right. $$

Ahora probaremos un teorema que nos ayudará a relacionar y resolver los sistemas de restricción de diferencias con caminos más cortos.

**Teorema:** Dado un sistema de restricción de diferencias $Ax \leq b$ y sea $G = (V, E)$ el grafo de restricciones asociado a él. Si el grafo $G$ no contiene ciclos negativos, entonces:

$$ x = (\delta(v_{0},v_{1}), \delta(v_{0},v_{2}), \ldots, \delta(v_{0}, v_{n})) $$

Es una solución válida para el sistema; si $G$ contiene un ciclo negativo, entonces no hay solución válida para el sistema.

**Prueba:**

Primero probaremos que si el grafo $G$ no contiene ciclos negativos, entonces la solución planteada resuelve el sistema. 

Consideremos cualquier arista $(v_{i}, v_{j}) \in E$, por la desigualdad triangular se cumple que

$$ \delta(v_{0}, v_{j}) \leq \delta(v_{0}, v_{i}) + w(v_{i}, v_{j}) $$

O, equivalentemente:

$$ \delta(v_{0}, v_{j}) - \delta(v_{0}, v_{i}) \leq w(v_{i}, v_{j}) $$

Entonces, si usamos $x_{i} = \delta(v_{0}, v_{i})$ y $x_{j} = \delta(v_{0}, v_{j})$ el resultado cumplirá con la restricción asociada a la arista $(v_{i}, v_{j})$.

Ahora consideremos que el grafo $G$ tiene un ciclo negativo $c = \{u_{1}, u_{2}, \ldots, u_{k}\}$ con $u_{1} = u_{k}$, entonces este ciclo corresponde a las siguientes restricciones:

$$ u_{2} - u_{1} \leq w(u_{1}, u_{2}) $$
$$ u_{3} - u_{2} \leq w(u_{2}, u_{3}) $$
$$ \vdots $$
$$ u_{k} - u_{k-1} \leq w(u_{k-1}, u_{k}) $$

Supongamos que existe una solución válida $u$ que resuelva el sistema; entonces, en particular, la solución cumple con todas las $k$ restricciones anteriores. Si sumamos todas las restricciones, tendremos que:

$$ 0 \leq w(c) $$

Ya que en el lado izquierdo estaremos sumando y restando cada $u_{i}$ una vez (el caso de $u_{1}$ se resta una vez en la primera restricción y se suma una vez en la última, ya que $u_{1} = u_{k}$). Sin embargo, el ciclo $c$ tiene peso negativo, por lo que:

$$ 0 \leq w(c) < 0 \rightarrow 0 < 0 $$

Lo cual nos lleva a una contradicción sobre la existencia de $u$.

Gracias al teorema anterior, podemos hallar una posible solución en $O(VE)$ usando el algoritmo de Bellman-Ford, donde $V = n + 1$ y $E = n + m$ (ya que agregamos el nodo $v_{0}$ y además las $n$ aristas de $v_{0}$ a los demás nodos). Finalmente nuestra complejidad trivial es $O((n + 1)(n + m)) = O(n^2 + n + nm + m) = O(n^2 + nm)$. Se puede reducir a $O(nm)$ de manera simple, también.

## Problemas

* Upsolving del contest de Teoría de Números del de DP