# Algoritmo de Kruskal

El algoritmo de Kruskal fue desarrollado con el objetivo de dar solución al problema del árbol recubridor mínimo

## Descripción del problema:  

El árbol recubridor mínimo consiste en un subgrafo que cumple con la estructura de un árbol, una de las características de este árbol es que conecta todos los nodos del grafo base.

De manera formal: Dado un grafo  $G(V,E)$  conexo y ponderado, siendo  V  la cantidad de nodos y  E  la cantidad de arcos, se busca un subgrafo  $\text{G′}(V,E')$  de forma que el costo de recorrer la totalidad de los nodos sea mínimo. Todo grafo  $G$  tiene un arbol recubridor mínimo $G$′, esto es fácilmente demostrable por medio de inducción matemática. Un bosque corresponde a un árbol recubridor mínimo para cada componente conexo.

## Descripción del algoritmo:

El algoritmo de Kruskal es un algoritmo greedy. Para resolver el problema, se ordenan los arcos en orden ascendente en una cola, para cada arco sacado de la cola se realiza el siguiente criterio: Si el arco conecta dos árboles diferentes, se guarda en la solución, uniendo ambos árboles. Si por el contrario el arco no conecta dos árboles distintos (es decir, forma un ciclo) este es descartado de la solución.

Una vez finalizado el algoritmo se retorna el único bosque presente, el cual corresponde al árbol recubridor mínimo del grafo.

## Ejemplo del problema: 

Suponga el siguiente grafo 

![](pics/path111.png)

Para formar el árbol se elige el primer arco en orden ascendente. En este caso el arco  $CE$. Como es el primero, es imposible que se genere un ciclo así que se añade a la solución.

![](pics/path112.png)

Se elige el siguiente arco menor, cuyo valor es de 2. De nuevo no se forman ciclos.

![](pics/path113.png)

para la siguiente iteración es posible elegir cualquiera entre aquellos arcos de valor tres, por conveniencia se eligirá el arco  $BE$ , el cual genera una conexión entre dos árboles y no crea ciclos.

![](pics/path114.png)


Ahora corresponde trabajar con el resto de arcos de valor $3$. Se selecciona aquel arco transversal  $AC$ . Note como esta conexión genera un ciclo entre los árboles presentes, por lo que no se considerará en la solución final.


![](pics/path115.png)

Se selecciona el último arco de valor 3, el cual no genera ciclos por lo que se incluye en la solución.


![](pics/path116.png)

Se continua con aquel arco  BC  de valor 4. Este arco genera un ciclo entre los nodos  BCE . Por lo que no se incluirá en la solución.


![](pics/path117.png)

Lo mismo ocurre para el arco  DC . Se genera un ciclo con la totalidad de los nodos, por lo que nuevamente no se incluye. 


Se han recorrido todos los arcos, por lo que la solución final corresponde a:


![](pics/path118.png)


El algoritmo podría haber haber terminado su ejecución satisfactoriamente en el momento que 
$V-1$ arcos forman parte de la solución, el resto de las iteraciones son con el
objetivo de clarificar el funcionamiento del algoritmo y no son necesarias.

## Complejidad espacial

Se requiere de un espacio de $O(v)$, necesario para realizar un seguimiento de todos los vértices al principio y los subconjuntos respectivos.

Por otro lado se requiere $O(e)$, necesario para realizar un seguimiento de todos los arcos ordenados que se incluyen en ARB (árbol recubridor mínimo).

Por lo que la complejidad espacial del algoritmo es $O(v + e)$.

## Complejidad temporal

**Teorema**: El algoritmo de kruskal posee un tiempo de ejecución de $\Theta(E \cdot log(V))$


Para poder explicar el tiempo de ejecución del algoritmo de kruskal hay que explicar el tiempo de ejecución de la operación `union-find`

$O(log(E))$ al máximo para la primera iteración 

$O(log(E))$ al máximo para la segunda iteración 

Esto se repite un total de $V-1$ veces, lo cual es dependiente de $E$.
De lo anterior se obtiene $T(n) = O(e \cdot log(e)) + V + O(e \cdot log(e)) + O(e \cdot log(e))$
Lo que es equivalente a la cota $\Theta(e \cdot log(e))$

Se continua con el algoritmo de kruskal

