In [1]:
#include <iostream> 
#include <stdlib.h> 
#include <string>   
#include <cmath>    
#include <stdexcept>
#include <type_traits>
//using namespace std;


# Problemas y algoritmos miscelaneos para complementar la formacion.



# Ciclo eureliano!

Supongamos que tenemos un grafo: `G = (V,E)`, decimos que `P` es un ciclo eureliano si y solo si:

- `P` es un ciclo
- `P` recorre TODOS los lados del grafo sin repetirlos.

Asi de tonto como ven el problema, se puede frasear en varios sabores, en sus versiones mas antiguas tenemos:

[Los Puentes de konisberg](https://en.wikipedia.org/wiki/Seven_Bridges_of_K%C3%B6nigsberg), un puzzle que trata de averiguar si es posible pasar por todos los puentes de la ciudad, sin repetir ninguno, y volviendo al punto de partida.

Pero incluso tenemos sabores mas modernos, en Dragon Age Inquisition, hay varias secciones dedicadas a resolver este tipo de puzzle:


<center>

![](https://static.wikia.nocookie.net/dragonage/images/f/f2/The_Storm_Coast_-_Bellitanus.jpg/revision/latest/scale-to-width-down/250?cb=20151029234509)

</center>


El cual trata de unir todos los puntos sin repetir lineas.

Todos estos problemas parten de la misma abstraccion.


## Y como lo resolvemos? 

Primero, debemos identificar si realmente existe una solucion... Y resulta que hay una manera lineal bien simple de verificar!

- Un grafo posee posee un ciclo eureliano si y solo si el grado de cada nodo es par y el grafo es conexo.

Que un grafo sea conexo significa que desde un nodo `v` puedo llegar al resto de los nodos.

El grado de un nodo `v`, es simplemente la cantidad de lados que inciden en el, es decir, la cantidad de lados de la forma `(v,u)` o `(u,v)`.

Pero por que esto funciona?

La razon es bastante simple, primero argumentaremos que: si un grafo es conexo, y cada nodo tiene grado par $\rightarrow$ el grafo admite un ciclo eureliano.

Como cada vertice tiene grado par y el grafo es conexo, esto significa que cada vertice debe poseer un ciclo: $p=<s,\dots,s>$, la razon de esto es casi directa: dado que $p$ es un ciclo, $s$ tiene un arco que incide en el: $(s,v)$, pero como $s$ tiene grado par, el debe tener otro arco adicional que lo empareje: $(s,u)$. Luego, como el grafo es conexo, existe un camino de $v$ a $u$, $p_1 = <v,\dots,u>$, por lo tanto chuas, existe el ciclo: $p= <s,v,\dots,u,s>$.


Y ahora lo unico que hacemos es que para cada elemento del ciclo $p= <s,v,\dots,u,s>$, encontramos otro ciclo! es decir, para $v$ encontramos todos los ciclos que pasen por el y no formen parte de $p$, para $u$ lo mismo, notemos que cada vez que encontramos un nuevo ciclo, disminuimos la cantidad de aristas (grado) visitadas en un numero par, hasta eventualmente llegar a 0.


El algoritmo es el siguiente:

1. Verificar si no hay ningun nodo de grado impar (ciclo) o a lo sumo 2 (camino)
2. Seleccionar un vertice aleatorio (ciclo) o uno de los vertices de grado impar (camino)
3. Iterar sobre todos los sucesores `u` de `v`
4. Remover el arco `(v,u)` del grafo
5. Repetir `2-3` recursivamente hasta que no hayan mas suceroes.
6. Anadir `v` al camino de la respuesta.

Notemos que este procedimiento ASUME una funcion nativa que no tenemos: eliminar arcos. Una buena opcion a esto es tener un conjunto de arcos `visitados` y solo llamamos recursivamente si el arco no esta ahi.


# Tarea 1: Dominada

Imaginemos que modelamos las piezas de domino como tuplas `<a,b>` en donde $0 \leq a,b \leq 6$. 

Se nos da un conjunto de piezas `ps`, y queremos saber si podemos usarlas todas para jugar domino solitario. Retornar `true` si es posible y `false` de otro modo, y adicionalmente construir el camino.

## Ejemplo:

```c++
input: [<2,2>,<4,6>,<1,2><2,4>,<6,2>]
output: <1,2,2,4,6,2>
```

# Componentes FUERTEmente Conexas de un grafo dirigido.

Definimos una componente fuertemente conexa: $SCC$ como un conjunto en donde cada par de nodos es mutuamente alcanzables... Es decir: Si $v,u \in SCC$ entonces existe un camino de $v$ hasta $u$ $p=<v,\dots,u>$, y otro camino de $u$ hasta $v$: $p'=<u,\dots,v>$.

El problema es claro: encontrar TODAS las componentes fuertemente conexas de un grafo.

Sorprendentemente, un algoritmo que resuelve este problema en tiempo lineal tambien es claro! (lo que no es claro es por que funciona):


1. Correr el `dfs` que asigna los tiempos hasta que no queden mas vertices.
2. Calculamos el grafo inverso: $G'$ (el resultante de voltear todos los arcos `<v,u>` a `<u,v>`).
3. Corremos `dfs` en $G'$ hasta que se acaben los nodos (seleccionando los nodos en orden decreciente de tiempo de finalizacion). 
4. En cada iteracion, el arbol generado es una componente fuertemente conexa.

La razon por la que esto funciona se basa en los siguientes argumentos:

- Si `t` es el **ultimo** arbol que genera `dfs`, entonces los unicos arcos interarboles que existen en el son de la forma $(v,u), v \in t$ (por que?). Por lo tanto, para cada `v` en `t`, todos los arcos/nodos necesarios para su componente conexa estan en `t` (por que?).
- Si `t` es el **ultimo** arbol con raiz `r`, entonces si corremos `dfs` en el grafo inverso $G'$, entonces, como `r` no posee arcos interarboles en $G'$, debe visitar solo los arcos de regreso (puesto que los arcos del arbol quedan descartados), encontrando solo ciclos!
- Al terminar dfs en `t`, el penultimo arbol ahora va a tener la misma propiedad...
- profit.
  



# Mas tarea!

# SCC graph!

Encontrar el grafo componente $CG=(V',E')$ de un grafo $G=(V,E)$.

El grafo componente $CG$, se define como el grafo inducidos por los arcos de $E'$, en donde $(v',u' \in E') \iff \exists (v,u) \in E \wedge \text{v,u no pertenecen a la misma SCC}$. 


# SCC + 1, SCC + n

Dado un equivalente al grafo componente (es decir, cualquier estructura que de la misma informacion). Como podemos calcular el nuevo grafo componente si añadimos:

- Un nuevo vertice.
- Un nuevo arco.
- Un nuevo vertice $v$ y un nuevo arco que incide en el: `(v,_)` o `(_,v)`
- Varios arcos.
- Un nuevo vertice $v$ y varios arcos que incidan en el.
- Varios vertices $v_i$ y varios arcos que incidan en ellos.
- Un vertice y varios arcos (sin la restriccion de incidencia).
- Varios vertices y varios arcos (sin la restriccion de incidencia).


# Grafo Componente del grafo inverso!

Encontrar el grafo componente del grafo inverso $G'$ dado $G$. Adicionalmente, Como podriamos encontrar el frafo componente $G'$ a partir del grafo componente de $G$?


# PERA AHI... DSU: Disjoint Set Union.

DSU es un algoritmo que nos sirve para combinar conjuntos disjuntos... Este realiza operaciones de busqueda, insersion y union en... $O(1)$! esto gracias al invariante de que siempre unimos conjuntos disjuntos.

DSU posee la siguiente interfaz:

```c++
// Constructor:
function MakeSet(x) is
    // Primero hay que chequear si $x$ ya pertenece, (vease funcion _)
    if x is not already in the forest then
        // si no lo esta, promovemos x a la estructura, haciendo que:
        x.value  := x
        x.parent := NULL // No tenga padre
        x.size := 1      // usado como heuristica
        x.rank := 0      // usado como heuristica
    end if
end function
```


```c++ 
// Find encuentra al **representante** del conjunto, es decir,
// al **nodo** raiz, teniendo como efecto de borde.... Comprimir el camino!
function Find(x) is
    // Si aun existe un padre...
    if x.parent ≠ NULL then
        //  comprimimos en uno el camino!
        x.parent := Find(x.parent)
        // y retornamos el valor.
        return x.parent
    else
        // ya estamos
        return x
    end if
end function
```


```c++
// une dos conjuntos disjuntos!
function Union(x, y) is
    // Replace nodes by roots
    x := Find(x)
    y := Find(y)

    if x = y 
        return  // x and y are already in the same set

    // If necessary, rename variables to ensure that
    // x has at least as many descendants as y
    if x.size < y.size then
        (x, y) := (y, x)
    end if

    // Make x the new root
    y.parent := x
    // Update the size of x
    x.size := x.size + y.size
end function
```

```c++
// version alternativa usando la otra heuristica.
function Union(x, y) is
    // Replace nodes by roots
    x := Find(x)
    y := Find(y)

    if x = y then
        return  // x and y are already in the same set
    end if

    // If necessary, rename variables to ensure that
    // x has rank at least as large as that of y
    if x.rank < y.rank then
        (x, y) := (y, x)
    end if

    // Make x the new root
    y.parent := x
    // If necessary, increment the rank of x
    if x.rank = y.rank then
        x.rank := x.rank + 1
    end if
end function
```





# Minimizando la fuerte conectividad

Dado un grafo $G$, y su grafo componente $SCC$, dar un grafo $H$ tal que $H$ tenga las mismas componentes fuertemente conexas que $G$, pero que su conjunto de arcos sea **minimo** (es decir, quite todos los arcos adicionales).


## Estrategia!:

- Para los arcos inter-componente, basta con llevar una lista de arcos por componente, es decir. Supongamos que $(u,v) \in E, u \in SCC_1, v \in SCC_2$, entonces metemos $(u,v)$ en la cabeza de la lista $SCC_1-SCC_2$. Al finalizar de encontrar todos los inter-arcos de $SCC_1$, nos quedamos solo con las cabezas de cada lista, puesto que los demas son superfluos.
- Para los arcos redundantes DENTRO de una misma SCC... DSU!

Notemos que podemos utilizar DSU para encontrar conectividad, de hecho es directo! (por que?).

# Semiconectividad.

Decimos que $G$ es semiconexo, si para cada par de vertices $v,u$, existe un camino de $v$ a $u$ O existe un camino de $u$ a $v$.

Determinar la semiconectividad de un grafo dirigido aciclico.
Determinar la semiconectividad de un grafo dirigido posiblemete con ciclos.


# Estrategia!

Para un grafo dirigido aciclico...

Basta con chequear que solo hay un nodo fuente, es decir, que tenemos un arbol!

Para un grafo dirigido posiblemente con ciclos.... DFS + DSU!

Soltamos DFS de la siguiente forma:

- Sea `v` el nodo a explorar, realizamos `MakeSet(v)`.
- Sea `e=(v,u)` un arco.
- Si `e` **no** es arco de retorno, entonces: `u.padre = v`.
- Repetimos hasta viitar todos los vertices
- Verificamos que TODOS los vertices tengan el mismo representante.


Notemos que esto hace un uso BIEN tramposo del DSU: al postergar FIND hasta el ultimo paso, podemos modificar los punteros sin repercusion alguna.

Mas aun, como hacemos `Find` al final, si escogemos un camino largo: `<u,x1,x2,.....,xn,v>`, por compresion de caminos, el find de `x1,x2,...,xn` sera $O(1)$.

# Algoritmo de busqueda Informado... A*!

`A*` se conoce como un algoritmo de costo minimo informado, puesto que el asume cierta informacion del problema en forma de una heuristica.


Una heuristica es una funcion que **estima** que tan cerca/bueno esta (es) un nodo del objetivo. Por ejemplo, Si estamos programando un enemigo en un videojuego, y queremos que este siga al jugador, como resolvemos el camino que este toma? 

Una opcion es encontrar el camino de longitud minima, pero debido a que es un espacio amplio, vamos a terminar explorando muchos tiles innecesarios.

Sin embargo, nosotros tenemos informacion del problema, sabemos que el player vive un un mundo 2d, y tenemos informacion de su posicion, por lo cual, cada tile tiene un potencial: `distancia(tile,jugador)`, si seguimos aquellos tile cuya distancia sea menor, convergeremos a la solucion mas rapido.

Esta `distancia` es nuestra heuristica: una funcion que anade valor/informacion a los nodos y que solo se puede obtener si conocemos el problema concreto que resolvemos.

En general, para los problemas de distancia, se puede utilizar:

- La distancia euclidiana al cuadrado: $(x_2 - x_1)^2 +(y_2 - y_1)^2$
- La distancia Manhattan $|x_2 - x_1| + |y_2 - y_1|$, esta representa la cantidad de tiles que necesitas cubrir si solo te puedes mover en 4 direcciones.

Ahora, la forma en que funciona A* es bien parecida a la que funciona dijkstra, pero tomando encuenta la heuristica y reapertura de caminos:


1. Inicializamos nuestro mapa de predecesores: `pred`.
2. Inicializamos un mapa `gScore` con valor por defecto `+infinity` excepto para el nodo inicial, cuyo valor sera `0`, este mapa representa los costos reales.
3. Inicializamos un mapa llamado `fScore`, con valor por defecto `+infinity` excepto para el nodo inicial, cuyo valor sera `h(s) + gScore[s]`, este mapa contendra los costos pesados con la heuristica.
4. Inicializamos una cola de prioridad: `open` con el nodo inicial pesado bajo su `fScore`.
5. Obtenemos la cabeza de la cola, y chequeamos todos sus sucesores... Igual que dijkstra
6. Si algun sucesor mejora el costo... Actualizamos el `gScore` el `fScore` el `pred` y lo insertamos a la cola si no esta.
7. Profit.

El algoritmo (sacado del viejo confiable wikipedia) es el siguiente:

```c++
// A* finds a path from start to goal.
// h is the heuristic function. h(n) estimates the cost to reach goal from node n.
function A_Star(start, goal, h)
    // The set of discovered nodes that may need to be (re-)expanded.
    // Initially, only the start node is known.
    // This is usually implemented as a min-heap or priority queue rather than a hash-set.
    openSet := {start}

    // For node n, cameFrom[n] is the node immediately preceding it on the cheapest path from start
    // to n currently known.
    cameFrom := an empty map

    // For node n, gScore[n] is the cost of the cheapest path from start to n currently known.
    gScore := map with default value of Infinity
    gScore[start] := 0

    // For node n, fScore[n] := gScore[n] + h(n). fScore[n] represents our current best guess as to
    // how short a path from start to finish can be if it goes through n.
    fScore := map with default value of Infinity
    fScore[start] := h(start)

    while openSet is not empty
        // This operation can occur in O(Log(N)) time if openSet is a min-heap or a priority queue
        current := the node in openSet having the lowest fScore[] value
        if current = goal
            return reconstruct_path(cameFrom, current)

        openSet.Remove(current)
        for each neighbor of current
            // d(current,neighbor) is the weight of the edge from current to neighbor
            // tentative_gScore is the distance from start to the neighbor through current
            tentative_gScore := gScore[current] + d(current, neighbor)
            if tentative_gScore < gScore[neighbor]
                // This path to neighbor is better than any previous one. Record it!
                cameFrom[neighbor] := current
                gScore[neighbor] := tentative_gScore
                fScore[neighbor] := tentative_gScore + h(neighbor)
                if neighbor not in openSet
                    openSet.add(neighbor)

    // Open set is empty but goal was never reached
    return failure
```



El potencial de `A*` viene dado por que tan buena sea la heuristica, heuristicas que estimen bien los nodos hacen que `A*` converga super rapido, heuristicas que __a penas__ lo describan no lo diferencian mucho de dijkstra.

En general tenemos dos tipos de heuristicas validas: `consistentes` y `admisibles`. Si la heuristica no es al menos `admisible` (`consistente` implica `admisible`), entonces **NO** podemos usarla.

Una heuristica `admisible` es aquella que jamas SOBREESTIMA el costo real del nodo, es decir: `h(n) <= costo_min(n,obj)` para todo `n`.

Una heuristica `consistente` pide un poco mas, pide que la funcion sea monotona sobre los vecinos, es decir si `w` es vecino de `n` entonces: `h(n) <= c(n,w) + h(w)`.

Una heuristica `consistente` converge mas rapido que una `admisible`.


# Problema clasico: el 9-game


<center>

![](https://upload.wikimedia.org/wikipedia/commons/a/a4/15-puzzle-02.jpg)

</center>

You know it, you love it, and now it's here, the 9-game.

El objetivo es claro, te dan un tablero como el de arriba desordenado, y tienes que desplazar las fichas hasta volverlo a ordenar. 

Como encontramos una solucion a este problema? `A*`!

- Modelamos los nodos como tableros.
- Modelamos las transiciones entre nodos como movidas del espacio en blanco: $(u,v) \in E$ si moviendo el espacio en blanco en una de sus 4 direcciones desde el tablero $u$, resulta en el tablero $v$.
- Modelamos los costos como... 0! todos los costos son iguales (un movimiento), asi que podemos fijarlos en 0.
- Modelamos la heuristica como... 

Hay muchisimos sabores de heuristicas, todas admisibles, pero cada una tiene un mejor rendimiento:

- La suma de los tiles que estan missplaced.
- La suma de la distancia de el missplacing.
- Numero de inversiones! 

El problema tiene muchisimas heuristicas bien interesantes [Este blog](https://michael.kim/blog/puzzle) ofrece una explicacion detallada de cada una y por que funciona junto a sus problemas.

Asi que su ejercicio es... 

# Grid!

Dado un Grid de tamano `nxn` con obstaculos pesados (representados como valores mayores a 0 en el grid), encontrar el camino mas corto de $s$ a $t$. Dar una alternativa si en cambio, los obstaculos no se pueden superar (es decir, son barreras impasables), estas vienen representadas como $1s$ en el grid.



# Dificultades...

Noten que cuando se tienen barreras, ya las formulas de distancia dejan de ser admisibles! toca encontrar nuevas heuristicas!
