## Buscando gráficas: BFS y DFS

Cuando estamos analizando una gráfica, una de las primeras cosas que puede hacerse es buscarla, es decir, seguir sus aristas sistemáticamente hasta tocar todos sus vértices. En esta sección exploramos dos algoritmos que realizan esta búsqueda: El **Breadth First Search** o **BFS**, y el **Depth First Search** o **DFS**.

Cabe mencionar que para la implementación de estos algoritmos estamos considerando la interpretación de las gráficas como un arreglo de listas, donde cada vértice representa un elemento del arreglo y su lista son los vecinos a los que llega.

### Breadth First Search

Este algoritmo es elemental para el entendimiento de las gráficas, y de hecho es un buen precursor para entender el algoritmo de Prim del árbol generador de peso mínimo y el algoritmo de Dijkstra del camino más corto de un solo origen. Dada una gráfica $G=(V,E)$ y un vértice inicial $s$, el algoritmo explora sistemáticamente las aristas de $G$ para encontrar todos los vértices alcanzables por $s$.

Para este algoritmo, a cada vértice se le añaden tres características:
- $v.color$: puede ser blanco, gris o negro, e indica el estado del vértice que puede ser desconocido, por explorar o explorado, respectivamente.
- $v.d$: la distancia del vértice de origen $s$ al vértice $v$.
- $v.\pi$: el predecesor de $v$, es decir, el vértice que estaba siendo explorado cuando fue alcanzado $v$.

Primero se presenta el algoritmo y luego damos una breve explicación de su funcionamiento.

#### ***BFS(G,s)***
1. **for each** vértice $u \in G.V-\{s\}$
2. $\hspace{0.5cm}u.color = BLANCO$
3. $\hspace{0.5cm}u.d = \infty$
4. $\hspace{0.5cm}u.\pi = NIL$
5. $s.color = GRIS$
6. $s.d = 0$
7. $s.\pi= NIL$
8. $Q = \emptyset$
9. $ENQUEUE(Q,s)$
10. **while** $Q \not= \emptyset$
11. $\hspace{0.5cm}u = DEQUEUE(Q)$
12. $\hspace{0.5cm}$ **for each** vértice $v \in G.Adj[u]$
13. $\hspace{1cm}$ **if** $v.color = BLANCO$
14. $\hspace{1.5cm}v.color = GRIS$
15. $\hspace{1.5cm}v.d = u.d + 1$
16. $\hspace{1.5cm}v.\pi = u$
17. $\hspace{1.5cm}ENQUEUE(Q,v)$
18. $\hspace{0.5cm}u.color = NEGRO$

Primero inicializamos las propiedades mencionadas en cada uno de los vértices. Luego, para la exploración, usamos una fila $Q$ (First-In, First-Out) en la que guardamos los vértices que han sido alcanzados pero no explorados, empezando por el vértice inicial $s$. Sobre el número de vértices en esta situación, o sea, los grises, es sobre el que avanza el ciclo **while**. Dentro de éste, primero tomamos un vértice y lo sacamos de la fila, nos fijamos en su lista de vecinos y si es que hay alguno de color blanco, le cambiamos el color a gris y le asignamos una distancia de $s$ y un predecesor $\pi$. Por esto es que se llama *breadth-first*, pues recorre a lo *ancho* de un vértice fijándose en todos sus vecinos antes de avanzar al siguiente.


Por la forma del algoritmo, es fácil ver que las distancias computadas son las menores posibles. Además, como cada vértice es enlistado solamente una vez, tiene a su vez un sólo predecesor. La forma del árbol puede variar según el orden en que los vértices son visitados, pero las distancias se conservan. Para calcular su tiempo, primero vemos que la asignación toma $O(V)$, mientras que los procesos de colas son $O(1)$. El ciclo while va a recorrer a lo mucho a todos los vértices, es decir, es de tiempo $O(V)$ por sí mismo. Luego, el recorrido por las aristas (que es el ciclo **for each**) nos toma, en conjunto con el ciclo while, a lo mucho dos veces $E$, que es el tamaño de la gráfica, lo que significa que es de tiempo $O(E)$. El tiempo total, entonces, es de $O(V+E)$.

Como ya habíamos comentado, el algoritmo se considera una base para Dijkstra y Prim, y es que ésta es una implementación para gráficas sin pesos. No es muy difícil notar que los vértices con las propiedades añadidas te ayudan a construir dichas soluciones, y sólo incluiremos en particular la impresión del camino más corto.

<img src="BFS-Cormen.png" alt="Ejemplo de BFS en el Cormen">

*Ejemplo del proceso hecho en **BFS***

#### PRINT-PATH($G,s,v$)
1. **if** $v==s$
2. $\hspace{0.5cm}$*print* $s$
3. **elseif** $v.\pi == NIL$
4. $\hspace{0.5cm}$*print* "No se encontró camino de " $s$ " a " $v$
5. **else**
6. $\hspace{0.5cm}$PRINT-PATH($G,s,v.\pi$)
7. $\hspace{0.5cm}$*print* $v$

Este algoritmo recursivo imprime desde el vértice $s$ y los sucesores hasta llegar al vértice $v$, y no es difícil ver que es de tiempo $O(d)$ con $d$ siendo la distancia entre $s$ y $v$.

### Depth First Search

Este algoritmo busca "a profundidad", es decir, dado un vértice inicial, se fija en los vecinos y si alguno de ellos tiene aristas sin explorar, lo toma como el punto de partida para repetir la búsqueda. Una vez que en el vértice que se encuentra ya no hay aristas por explorar, retrocede al vértice anterior y explora el siguiente vértice vecino aún por explorar. Este proceso se repite de forma recursiva hasta haber explorado todos los vértices.

Este proceso también usa colores para indicar el estado de un vértice, así como el predecesor. La diferencia es que, en lugar de generar un árbol con la subgráfica de predecesores, este método forma un bosque, pues puede partir de diferentes fuentes. Este último detalle garantiza, entonces, que la búsqueda realizada recorra realmente todos los vértices siempre, en comparación con Breadth First que requiere que sea una gráfica conexa para lograr el mismo resultado. Al bosque generado se le conoce como *depth first forest*.

Otra característica de este algoritmo es que también puede generar *timestamps* o marcas de tiempo que refieren al momento en que primero se descubre al vértice (se le colorea de gris) y el momento en que ya ha sido explorado en su totalidad (se le pinta de color negro). Estos tiempos brindan información importante respecto a la estructura de la gráfica y también pueden ayudar a explicar el comportamiento del algoritmo. Estas marcas temporales van de $1$ a $2|V|$, pues se realizan 2 marcas por cada vértice en la gráfica. Además, para cualquier vértice $u$ se cumple que $u.d < u.f$, siendo $u.d$ el tiempo en que es descubierto el vértice y $u.f$ el tiempo en que se ha explorado completamente. A su vez se puede notar que antes del tiempo $u.d$ el vértice $u$ es de color blanco, de color gris entre los tiempos $u.d$ y $u.f$, y negro el resto del tiempo. 

#### DFS($G$)
1. **for each** vértice $u \in G.V$
2. $\hspace{0.5cm} u.color = WHITE$
3. $\hspace{0.5cm} u.\pi = NIL$
4. time = 0
5. **for each** vértice $u \in G.V$
6. $\hspace{0.5cm}$ **if** $v.color == WHITE$
7. $\hspace{1cm}DFS-VISIT(G,u$)

#### DFS-VISIT ($G,u)$
1. $time = time + 1$
2. $u.d = time$
3. $u.color = GRAY$
4. **for each** vértice $v \in G.Adj[u]$
5. $\hspace{0.5cm}$ **if** $v.color == WHITE$
6. $\hspace{1cm} v.\pi = u$
7. $\hspace{1cm} DFS-VISIT(G,v)$
8. $time = time + 1$
9. $u.f = time$
10. $u.color = BLACK$

El método funciona de la siguiente forma. En $DFS$ las primeras líneas inicializan los valores de los vértices, mientras que de la 5 a la 7 se hace un recorrido por cada vértice y, si es blanco, se llama al proceso $DFS-VISIT$. Este segundo proceso primero aumenta el tiempo y se lo asigna al vértice como tiempo inicial, así como el color gris. Se hace un recorrido por cada arista del vértice y si alguno de los vecinos es de color blanco, se vuelve a llamar al proceso con el segundo parámetro siendo ese nuevo vértice. Finalmente se le asigna un tiempo final al vértice de la función y se le colorea negro.

El árbol o bosque resultante varía según el orden en que los vértices son recorridos en $DFS$, así como el orden en que son recorridos los vecinos en $DFS-VISIT$. Este detalle no suele afectar mucho en la práctica, pues la mayoría de las veces que se usa la búsqueda a profundidad cualquiera de los bosques generados es útil. En cuanto al tiempo de ejecución, de forma similar a Breadth First Search, los ciclos anidados hacen $\Theta(E)$ operaciones pues recorren cada arista, y con la inicialización tenemos un tiempo de ejecución de $\Theta(V+E)$.

<img src="DFS-Cormen.png" alt="Ejemplo de DFS en Cormen">

*Ejemplo del proceso hecho en **DFS***