# Clase 14

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2014%20-%20Grafos%20V.ipynb)

# Requisitos Previos

* Matemática Básica
* Matemática Discreta

# Single-Source Shortest Paths


En las clases previas analizamos grafos $G = (V,E)$ que podían ser dirigidos o no dirigidos, sin ninguna información extra a considerar. Esta vez, definiremos una función $w(e) : E \to \mathbb{R}$ que asociará cada arista a un valor real; dicho valor será llamado como el **peso de la arista $e$**. A los grafos con función $w : E \to \mathbb{R}$ se les llama **ponderados**.

Definimos el **peso** de un camino $p = \{u_{1},u_{2},\ldots,u_{k}\}$ como la suma de los pesos de cada arista $(u_{i},u_{i+1})$ para cada $i = 1, \ldots, (k-1)$:

$$ w(p) = \sum\limits_{i=1}^{k-1} w(u_{i},u_{i+1}) $$

Para aristas que no pertenecen a $E$, podemos asignar trivialmente $w(e) = \infty$.

El **peso de camino más corto** de un nodo $u$ a un nodo $v$ está denotado por $\delta(u,v)$ y está definido por:

$$ \delta(u,v) = \left\{ \begin{array}{cc} \min{\{w(p) : u \xrightarrow{p} v\}} &\text{Si existe camino de }u\text{ a }v \\ \infty &\text{En caso contrario} \end{array} \right. $$

Un **camino más corto** de un nodo $u$ a un nodo $v$ es algún camino $p$ de $u$ a $v$ tal que $w(p) = \delta(u,v)$.

## Subestructura Óptima en el Camino más Corto

**Lema:**

Dado un grafo ponderado y dirigido $G = (V,E)$ con función de peso $w : E \to \mathbb{R}$, sea $p = \{v_{0},v_{1},\ldots,v_{k}\}$ un camino más corto desde $v_{0}$ hasta $v_{k}$. Si definimos el subcamino $p_{ij}$ para todos los pares $0 \leq i \leq j \leq k$ como $p_{ij} = \{v_{i},v_{i+1},\ldots,v_{j}\}$, entonces $p_{ij}$ es un camino más corto desde $v_{i}$ hasta $v_{j}$.

**Prueba (por contradicción):**

Supongamos que particionamos el camino $p = p_{0i} + p_{ij} + p_{jk}$, entonces se da que $w(p) = w(p_{0i}) + w(p_{ij}) + w(p_{jk})$. Si existiera un camino $p'_{ij}$ de $v_{i}$ a $v_{j}$ con menor peso que $p_{ij}$, podríamos armar el camino:

$$ p' = p_{0i} + p'_{ij} + p_{jk} $$

Y el peso sería:

$$ w(p') = w(p_{0i}) + w(p'_{ij}) + w(p_{jk}) < w(p_{0i}) + w(p_{ij}) + w(p_{jk}) = w(p) $$

Por lo que el camino $p$ ya no sería un camino mínimo, lo cual es una contradicción.

## Aristas con peso negativo

La definición de camino más corto no presenta problemas si existen aristas de peso negativo **siempre y cuando** estas no formen un ciclo de peso negativo, debido a que si hay un ciclo negativo alcanzable desde $u$, entonces se puede reducir el peso del camino indefinidamente atravesando el ciclo cada vez.

Algunos algoritmos para caminos más cortos asumen que no hay ciclos negativos (como Dijkstra), mientras que otros los consideran y pueden determinar si hay ciclos negativos presentes (como Bellman-Ford); sin embargo, en términos generales, no es posible hallar un camino más corto si es que el origen puede llegar a atravesar un ciclo de peso negativo.

## Ciclos

Ya que hemos descartado la existencia de ciclos de peso negativo, podemos plantear la siguiente pregunta: **¿Un camino más corto puede tener un ciclo?**.

La respuesta es sí, pero solo si el ciclo tiene un peso nulo (es decir, peso $0$), dado que si el ciclo tiene peso positivo, lo óptimo es quitarlo del camino y así se obtendría un nuevo camino válido y con menor peso que el original. Ahora, lo importante es notar que si un ciclo tiene peso $0$, entonces su presencia no afecta al camino en relación al peso total, así que podemos simplemente asumir que no hay ciclos en el camino más corto sin pérdida de generalidad. Esto nos permite notar que un camino más corto a lo mucho tendrá $|V|-1$ aristas.

## Representación del camino más corto

Si uno desea hallar el camino más corto desde un nodo $s$ hasta todos los nodos $v \in V$, podemos definir (de manera similar al BFS) un atributo llamado $padre[v]$ para cada nodo $v$, que significará que existe un camino más corto desde $s$ hasta $v$ que pasa antes por $padre[v]$ y luego atraviesa la arista $(padre[v], v)$. Este grafo es llamado **grafo de predecesor** (en el caso del BFS, también toma el mismo nombre, aunque se le suele llamar BFS-Tree).

Notemos que este atributo es hallado en función a la suma de pesos de las aristas y no a la cantidad de aristas como el BFS. De esta forma, hallamos un *shortest paths tree*, el cual es un árbol que contiene un camino más corto desde $s$ hasta cada nodo alcanzable por ese nodo.

De esta forma, un *shortest paths tree* $G' = (V', E')$ cumple con las siguientes características:

1) $s$ es la raíz de $G'$.

2) $V' \subseteq V$ y $E' \subseteq E$. $V'$ es el conjunto de vértices de $V$ que son alcanzables por $s$.

3) Para todo $v \in V$, el único camino de $s$ a $v$ en $G'$ es un camino más corto de $s$ a $v$ in $G$.

**Nota:** Dado que los caminos más cortos no son siempre únicos, tampoco lo son los shortest paths tree para un mismo grafo $G$.

El conjunto de nodos del grafo de predecesor se denota como $G_{\pi}$ y su conjunto de aristas como $E_{\pi}$.

## Relajación

Los algoritmos para hallar caminos más cortos mantienen un atributo por cada nodo $v$ llamado $d[v]$, el cual es una cota superior para el peso del camino más corto de $s$ a $v$ en el grafo original y, a medida que el algoritmo va ejecutándose, dicho valor va reduciéndose hasta obtener el verdadero valor del camino más corto.

Para poder mantener adecuadamente los valores, estos deben ser inicializados previamente:

```Python
initialize(s):
    for v in V:
        d[v] = inf
        padre[v] = -1
    d[s] = 0
```

La modificación de los valores $d[v]$ se llama **relajación**, y dicho procedimiento puede actualizar el valor a uno más pequeño y cambiar el padre del nodo.

```Python
relax(u,v,w):
    if d[v] > d[u] + w(u,v):
        d[v] = d[u] + w(u,v)
        padre[v] = u
```

Algunos algoritmos relajan las aristas una cantidad de veces diferente: por ejemplo, Dijkstra solo las relaja una vez, mientras que Bellman-Ford las relaja $|V|-1$ veces.

## Propiedades de los caminos más cortos y la relajación

### Desigualdad triangular

Para cada arista $(u,v)\in E$, se cumple que:

$$ \delta(s,v) \leq \delta(s,u) + w(u,v) $$

### Propiedad de cota superior

Siempre tenemos que $d[v] \geq \delta(s,v)$ para todos los vértices $v \in V$, y una vez que $d[v] = \delta(s,v)$, este nunca cambia de nuevo.

### Propiedad de la inexistencia de camino

Si no hay ningún camino de $s$ a $v$, entonces se tendrá siempre que $d[v] = \delta(s,v) = \infty$.

### Propiedad de convergencia

Si $s \leadsto u \rightarrow v$ es un camino más corto de $s$ a $v$ para algún par $u, v\in V$ y si $d[u] = \delta(s,u)$ en algún paso antes de relajar la arista $(u,v)$, entonces $d[v] = \delta(s,v)$ para todo momento luego de relajarla.

### Propiedad de la relajación de camino

Si $p = \{v_{0},v_{1},\ldots,v_{k}\}$ es un camino más corto de $s = v_{0}$ hasta $v_{k}$ y relajamos las aristas de $p$ en el orden $(v_{0},v_{1}), (v_{1},v_{2}), \ldots, (v_{k-1},v_{k})$, entonces luego de dichas relajaciones se dará que $d[v_{k}] = \delta(s,v_{k})$. Esto sucede sin importar si hay relajaciones intermedias sobre otras aristas.

### Propiedad del grafo de predecesor

En el momento en que $d[u] = \delta(s,u), \forall u \in V$, se cumple que el grafo de predecesor $G_{\pi}$ es un shortest paths tree con raíz en $s$.

## Algoritmo de Bellman-Ford

El algoritimo de Bellman-Ford resuelve el caso general para grafos con pesos negativos, e inclusive puede determinar si existen ciclos negativos. Básicamente lo que propone es relajar todas las aristas en $|V|-1$ iteraciones. Notemos que el valor $|V|-1$ es muy particular, pues es la máxima cantidad de aristas que tendrá un camino más corto si no existen ciclos negativos, como vimos anteriormente. Esta misma característica implica que si uno puede realizar una relajación en alguna arista luego de esas $|V|-1$ iteraciones, existirá un ciclo de peso negativo.

El siguiente algoritmo devuelve verdadero o falso dependiendo si encuentra o no un ciclo negativo: Si no hay ningún ciclo negativo alcanzable por $s$, devuelve verdadero y las distancias procesadas son los caminos más cortos desde $s$ a cada nodo, mientras que si existe ciclo negativo devuelve falso, porque en dicho caso no está bien definido el camino más corto.

```Python
Bellman-Ford(s):
    initialize(s)
    for i=1 to (n-1):
        for (u,v) in E:
            relax(u,v,w)
    for (u,v) in E:
        if d[v] > d[u] + w(u,v):
            return False
    return True
```

Ahora, para determinar la correctitud del algoritmo, probaremos que si no hay un ciclo negativo alcanzable por $s$ en el grafo $G$, entonces el algoritmo procesa correctamente los valores de los caminos más cortos de $s$ a todo nodo $v \in V$.

**Lema:** Sea $G = (V,E)$ un grafo dirigido y ponderado con origen en $s$ y función de peso $w : E \to \mathbb{R}$ sin ciclos negativos alcanzables por $s$; entonces, luego de las $|V|-1$ iteraciones del algoritmo en las líneas 2-4, tenemos que $d[u] = \delta(s,u)$ para todos los vértices $u$ que sean alcanzables por $s$.

**Prueba:** 

Usaremos la propiedad de relajación de caminos. Consideremos cualquier vértice $v$ que es alcanzable por $s$ y sea $p = \{v_{0},v_{1},\ldots,v_{k}\}$ cualquier camino más corto de $v_{0} = s$ a $v_{k} = v$. Dado que no existen ciclos negativos alcanzables por $s$, tenemos que todos los caminos más cortos son simples, así que la cantidad de aristas que tiene es menor o igual a $|V|-1$, por lo que $k \leq |V| - 1$. Cada una de las $|V|-1$ iteraciones relaja todas las aristas, en particular, la $i$-ésima iteración relaja la arista $(v_{i-1},v_{i})$. Por la propiedad de relajación de caminos, luego de las $|V|-1$ iteraciones se dará que $d[v] = \delta(s,v)$.

**Corolario:** Sea $G = (V,E)$ un grafo dirigido y ponderado con origen en $s$ y función de peso $w : E \to \mathbb{R}$ sin ciclos negativos alcanzables por $s$; entonces para cada vértice $v \in V$ hay un camino de $s$ a $v$ **si y solo si** el algoritmo `Bellman-Ford(s)` termina con $d[v] < \infty$ cuando se ejecuta sobre $G$.

**Prueba (Ida):** 

Supongamos que hay un camino de $s$ a $v$, entonces debe existir un camino más corto de longitud $\delta(s,v)$. Como no hay ciclos negativos alcanzables por $s$, dicho camino debe ser finito con a lo mucho $|V|-1$ aristas de peso finito. Por el lema anterior, $d[v] = \delta(s,v) < \infty$ luego de ejecutar el algoritmo `Bellman-Ford(s)` sobre $G$.

**Prueba (Vuelta):** 

Supongamos que $d[v] < \infty$ luego de ejecutar el algoritmo `Bellman-Ford(s)` sobre $G$. Recordemos que $d[v]$ es monótonamente decreciente durante la ejecución del algoritmo. Además, al relajar $d[v]$, se cambiará su valor solamente si $d[v] > d[u] + w(u,v)$ y se asignará a $u$ como predecesor de $v$ en el grafo de predecesor. Dado que $v$ tiene un ancestro en el grafo de predecesor y tal grafo es un árbol con raiz $s$, entonces hay un camino de $s$ a $v$ en el grafo de predecesor. Dado que toda arista en el grafo de predecesor también existe en $G$, existe un camino de $s$ a $v$.

**Teorema:** Supongamos que se ejecuta `Bellman-Ford(s)` sobre un grafo dirigido y ponderado con origen en $s$ y función de peso $w : E \to \mathbb{R}$. Si $G$ no contiene ciclos negativos alcanzables por $s$, entonces el algoritmo devuelve verdadero y tendremos $d[v] = \delta(s,v), \forall v \in V$, así como que el grafo de predecesor es un shortest paths tree con raiz $s$. Si $G$ contiene un ciclo negativo alcanzable desde $s$, entonces el algoritmo devuelve falso.


**Prueba:**

Supongamos que el grafo $G$ no contiene ciclos negativos alcanzables desde $s$. Primero probaremos la afirmación de que al terminar la ejecución del algoritmo tenemos que $d[v] = \delta(s,v), \forall v \in V$. Si el vértice $v$ es alcanzable por $s$, el lema anterior prueba la afirmación. Si $v$ no es alcanzable por $s$, entonces la afirmación se justifica por la propiedad de la inexistencia de camino, así que la afirmación está probada. La propiedad del grafo de predecesor junto con la afirmación implica que $G_{\pi}$ es un shortest paths tree.

Ahora usaremos la afirmación para probar que el algoritmo devuelve verdadero. Luego de las $|V|-1$ iteraciones, tenemos que para todas las aristas $(u,v)\in E$:

$$ d[v] = \delta(s,v) \leq \delta(s,u) + w(u,v) = d[u] + w(u,v) $$

Por lo que nunca se dará el caso de encontrar alguna arista con $d[v] > d[u] + w(u,v)$, así que el algoritmo no devolverá falso.

Ahora supongamos que el grafo $G$ contiene un ciclo negativo alcanzable por $s$ y sea dicho ciclo $c = \{v_{0},\ldots,v_{k}\}$ con $v_{0} = v_{k}$. Entonces:

$$ \sum\limits_{i=1}^{k}w(v_{i-1},v_{i}) < 0 $$

Asumamos que el algoritmo devuelve verdadero, entonces $d[v_{i}] \leq d[v_{i-1}] + w(v_{i-1},v_{i})$ para $i = 1, 2, \ldots, k$. Sumando las desigualdades sobre el ciclo $c$ obtenemos:

$$ \sum\limits_{i=1}^{k}d[v_{i}] \leq \sum\limits_{i=1}^{k}\left(d[v_{i-1}] + w(v_{i-1},v_{i})\right) $$

$$ \sum\limits_{i=1}^{k}d[v_{i}] \leq \sum\limits_{i=1}^{k}d[v_{i-1}] + \sum\limits_{i=1}^{k}w(v_{i-1},v_{i}) $$

Dado que $v_{0} = v_{k}$, cada vértice del ciclo aparece una sola vez en cada sumatoria $\sum\limits_{i=1}^{k}d[v_{i}]$ y $\sum\limits_{i=1}^{k}d[v_{i-1}]$, así que tendremos que:

$$ S \leq S + \sum\limits_{i=1}^{k}w(v_{i-1},v_{i}) $$

Por lo que, despejando $S$:

$$ 0 \leq \sum\limits_{i=1}^{k}w(v_{i-1},v_{i}) < 0 $$

Lo cual es una contradicción, así que el algoritmo no devuelve verdadero para este caso, sino falso.

### Problemas

- [Implementación directa](https://www.e-olymp.com/en/problems/1453)
- [Implementación directa o TLE, m <= 78900](https://www.e-olymp.com/en/problems/4856)