# Clase 13

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2013%20-%20Grafos%20IV.ipynb)

# Requisitos Previos

* Matemática Básica
* Matemática Discreta
* DFS

# Componentes Fuertemente Conexas

Dado un grafo dirigido $G = (V,E)$, definimos como **componente fuertemente conexa** o **strongly connected component (SCC)** a todo conjunto $C \subseteq V$ maximal respecto a la propiedad siguiente:

* Para todo par de vértices $u, v \in C$ se cumple que existen caminos $u \leadsto v$ y $v \leadsto u$ simultáneamente.

**Nota:** Un conjunto es maximal respecto a una propiedad si no se pueden agregar más elementos de forma que se siga manteniendo la propiedad definida.

Para nuestra solución introduciremos un nuevo concepto: el grafo traspuesto de $G$, $G^{T}$, el cual está definido como:

$$ G^{T} = (V, E^{T}) $$
$$ E^{T} = \{(v,u) : (u, v) \in E\} $$

Notemos que las componentes fuertemente conexas de $G$ son las mismas que las de $G^{T}$, así que propondremos el siguiente algoritmo:

```Python
SCC():
    Llamar DFS() sobre G para procesar termina[u] para todo u in V
    Obtener el grafo traspuesto de G : Gt
    Llamar DFS() sobre Gt pero con los vértices ordenados por termina[u] descendentemente
    Cada árbol obtenido en el segundo DFS tiene los vértices de las SCCs.
```

Definamos primero al **grafo condensado** o **grafo de componentes** $G^{SCC} = (V^{SCC},E^{SCC})$, donde los conjuntos están dados de la siguiente forma:

- Sean $C_{1}, C_{2}, \ldots, C_{k}$ las componentes fuertemente conexas, entonces los vértices de $V^{SCC}$ son $v_{i}$, uno por cada SCC.

- La arista $(v_{i},v_{j}) \in E^{SCC}$ si existe algún $x \in C_{i}$  y algún $y \in C_{j}$ tal que $(x,y) \in E$.

Esto quiere decir que podemos obtener el grafo condensado usando el algoritmo anterior.

**Lema:** Sean $A$ y $B$ dos componentes fuertemente conexas **diferentes** en $G = (V,E)$. Sean $u, v\in A$ y $p,q\in B$. Supongamos que existe un camino $u \leadsto p$, entonces no puede existir el camino $q \leadsto v$.

**Prueba (por contradicción):**

Supongamos que existe el camino $q \leadsto v$ y también el camino $u \leadsto p$, entonces existe el camino $q \leadsto v \leadsto u$, así como el camino $u \leadsto p \leadsto q$, lo que implicaría que $u$ y $q$ deben pertenecer a la misma SCC. Dado que, por definición, las SCC son maximales, esto necesariamente nos lleva a que $A = B$, lo cual es una contradicción.

Extenderemos nuestra notación usando $descubre[U]$ para un conjunto $U$ como $descubre[U] = \min{\{descubre[u] : u \in U\}}$, así como $termina[U]$ para un conjunto $U$ como $termina[U] = \max{\{termina[u] : u \in U\}}$. El uso de esta notación es fácilmente distinguible cuando se refiere a un nodo o a un conjunto de nodos según la variable que se use como argumento.

**Lema:** Sean $A$ y $B$ dos componentes fuertemente conexas **diferentes** en $G = (V,E)$. Supongamos que existe una arista $(u,v)\in E$ con $u \in A$ y $v \in B$, entonces $termina(A) > termina(B)$.

**Prueba:**

Tenemos dos casos:

1) $descubre[A] < descubre[B]$: En este caso, si $x$ es el primer vértice de $A$ descubierto, en el momento $descubre[x]$ existe un camino blanco desde $x$ hasta cualquiera de los nodos de $A$. Dado que $(u,v) \in E$, también se da que existe un camino blanco desde $x$ hasta cualquiera de los nodos $w$ de $B$, los cuales serán $x \leadsto u \rightarrow v \leadsto w$, por lo que todos los vértices de $B$ se volverán descendientes de $x$ en el DFS-Tree. Por el teorema del paréntesis, $termina[x]$ es mayor que el de cualquiera de sus descendientes, por lo que $termina[A] > termina[B]$.

2) $descubre[A] > descubre[B]$: Sea $y$ el primer vértice descubierto de $B$. En el minuto $descubre[y]$, todos los vértices de $B$ son blancos y existen caminos blancos desde $y$ hasta todos esos vértices, lo que significa que todos los vértices de $B$ se volverán descendientes de $y$ y por el teorema del paréntesis, $termina[B] = termina[y]$. En el minuto $descubre[y]$, todos los vértices de $A$ son blancos, pero dado que existe un camino desde cada vértice de $A$ a $y$, no puede haber un camino de $y$ a alguno de los vértices de $A$ (por el lema anterior). Entonces, ninguno de los vértices de $A$ se vuelven descendientes de $y$, lo que significa que en el minuto $termina[y]$, los vértices de $A$ seguirán blancos. Finalmente, $termina[A] > termina[y] = termina[B]$ porque serán descubiertos en un minuto mayor a $termina[y]$.


**Corolario:** Sean $A$ y $B$ dos componentes fuertemente conexas **diferentes** en $G = (V,E)$. Supongamos que existe una arista $(u,v)\in E^{T}$ con $u \in A$ y $v \in B$, entonces $termina[A] < termina[B]$.

**Prueba:** Si $(u,v) \in E^{T}$, entonces $(v,u) \in E$. Aplicando el lema anterior, $termina[A] < termina[B]$.

Ahora sí podemos pasar a probar el teorema más importante en estos momentos:

**Teorema:** El algoritmo $SCC()$ obtiene correctamente las componentes fuertemente conexas del grafo de entrada $G$.

**Prueba (Por inducción):**

Probaremos por inducción que los primeros $k$ árboles procesados por el DFS en la 3ra línea del algoritmo son componentes fuertemente conexas.

1) $k = 0$ es trivial.

2) Asumimos que para $k$ arbitrario funciona. Esto implica que los primeros $k$ árboles procesados son SCCs.

3) Consideremos que la raiz del $(k+1)$-ésimo árbol es el nodo $u$ y que $u$ pertenece a la SCC $C$. Por la naturaleza de los nodos analizados en el segundo DFS, tenemos que $termina[u] = termina[C] > termina[A]$ para toda SCC $A$ que aún no haya sido visitada y que sea diferente de $C$. 