<div style="padding:30px; color: white; background-color: #0071CD">
<center>
<img src="img/logoub.jpeg"></img>
<center>
<p>
<h1>Algorítmica Avanzada</h1>
<h2>Práctica 1 - Grafos </h2>
</center>
</p>
</div>

<div class="alert alert-danger" style="width:95%; margin:0 auto; padding">
<center><p><h2> ¡¡IMPORTANTE!! </h2></p> </center> 

<p>
Para la realización de esta práctica tendréis que utilizar la clase de grafos NetworkX y <b>NO</b> la clase `Graph` que implementasteis en la Práctica 0. Hay casos muy concretos que no contemplaban los tests y podría hacer que vuestros algoritmos no funcionen correctamente. NetworkX tiene una interfaz muy similar a la librería <i>Graph</i> que implementasteis la semana pasada. Para más información podéis consultar la documentación de la librería <a href="https://networkx.github.io/documentation/latest/reference/introduction.html">aquí.</a>
</p>
</div>

<div class="alert alert-info">
<center>
  <h1>Introducción</h1>
</center>

A lo largo de esta práctica trabajaremos con el grafo generado a partir de la red de metro de Londres. En este grafo, los nodos representan las estaciones y las aristas las vias que van de una estación a otra. Todas las aristas tienen cuatro atributos:

* Linea
* Color
* Nombre (de la linea)
* Distancia

Los nodos contienen: 
* El nombre de la estación
* La latitud y longitud de la estación
* Número de lineas
* Zona


In [1]:
from util import get_subway_graph, draw_subway_graph
from networkx import nx

# Carga del grafo del metro con el que trabajaremos
G, lines = get_subway_graph('csv')

# Algunos nodos
print(list(G.nodes())[:20],'...')
# Algunas aristas
print(list(G.edges())[:20],'...')
print('\n')
print("Ejemplo de arista: ",G.edges[156,167])
print("Ejemplo de nodo: ",G.node[33])

AttributeError: 'Graph' object has no attribute 'node'

Para más consultas, la información ha sido extraida de Wikimedia Commons:

https://commons.wikimedia.org/wiki/London_Underground_geographic_maps/CSV

# util.py

En este archivo se os facilitan varias funciones que os permitiran cargar y visualizar la red de metro.
```python
"""
Retorna un objeto nx.Graph que corresponde al grafo de la red de metro y un 
diccionario con las lineas del metro
 - location: ruta donde esta almacenado el archivo .csv
"""
G, lines = get_subway_graph(location)

"""
Dibuja el grafo que le pasemos por parametro.
- G: Grafo de la red de metro
- lines: diccionario con la información sobre las lineas del metro
- figsize: parametro opcional que nos permite definir el tamaño de la figura
- show_labels: parametro opcional que nos permite indicar si queremos mostrar los 
    nombres de las estaciones
"""
draw_subway_graph(G, lines, figsize=(10,6), show_labels=False)

```

In [2]:
draw_subway_graph(G, lines, figsize=(20,12))

NameError: name 'G' is not defined

<div class="alert alert-info">
<center>
  <h1>Contenido</h1>
  </center><p>



<div class="alert alert-success" style="width:90%; margin:0 auto;">

  <h2><p>1- Dijkstra</p></h2>
  <p>
 En esta segunda parte de la práctica se propone que implementéis el algoritmo <a href="https://en.wikipedia.org/wiki/Dijkstra%27s_algorithm">Dijkstra</a> (explicado en teoría) para encontrar el camino más corto entre dos paradas de la red de metro de Londres.
</p>



<div class="alert alert-danger" style="width:80%; margin:0 auto; padding">
<center><p><h3> Código </h3></p> </center>
<p>
<h3>INPUT</h3>
<ul>
<li>__G__: Este es el grafo (en el caso de esta practica la red de metro) que utilizaremos para buscar el camino. Debe de ser un objeto de tipo `nx.Graph`.</li>
<li>__origen__: Este parámetro corresponde al índice de un nodo. En este caso, como indexamos los nodos con el identificador de las paradas de Metro, deberá ser un entero _(e.g. 231)_.</li>
<li>__destino__: El indice del nodo al que queremos llegar. Igual que el origen, deberá ser un entero.</li>
<li>__infinity=*(int)*__: Parametro opcional en el que definimos que numero nos va bien para utilizar como infinito en el momento de inicializar los pesos de los nodos.</li>
</ul>
<br>
<h3>OUTPUT</h3>
El output de una funcion es un <b>diccionario</b> que contiene los siguientes valores
<ul>
<li>__ _'path'_ __: Una lista de índices correspondientes al camino encontrado del nodo inicial al nodo final (ambos nodos, inicio y final, han de estar incluidos en esta lista).</li>
<li>__ _'expanded'_ __: El numero de nodos que se han visitado para encontrar la solución.</li>
<li>__ _'distance'_ __: La distancia del camino mínimo desde el origen hasta el destino (es decir, el valor del nodo destino).
<ul>

</p>
</div>


In [3]:
import heapq
def dijkstra(G, origen, destino, infinity=2**32-1):
    
    path = []
    expanded = 0
    
    visited = dict() #creamos diccionarios para los nodos visitados, los nodos previos y la distancia entre ellos
    previous = dict()
    distance = dict()
    
    for x in G.nodes(): #inicializamos estos valores para todos los nodos del grafo
        visited[x] = False
        previous[x] = None
        distance[x] = infinity
        
    if destino not in G.nodes(): return 0 #tratamos el caso en el que el destino indicado no exista en el grafo
   
    distance[origen] = 0 #ajustamos los valores para el nodo origen
                         #el previo ya esta como None
    path.append((0,origen)) #añadimos al path el nodo origen y la distancia a este(0)
    
    while (len(path) != 0): #mientras el camino no sea 0
        aux = heapq.heappop(path)
        dist_origen = aux[0] #cogemos la distancia al nodo origen
        node = aux[1] #cogeremos el primer nodo del path
        visited[node] = True #marcamos el nodo como visitado
        
        if (node == destino): #si hemos llegado al nodo destino, paramos
            break
            
        for n in G.neighbors(node): #seguimos explorando los vecinos del nodo            
            if (visited[n] == True): #si ya esta visitado, seguimos con los otros vecinos
                continue
            expanded += 1
            #si la distancia encontrada es menor a la guardada previamente, se actualiza
            if (distance[n] > dist_origen + G.edges[node, n]['distance']):
                distance[n] = dist_origen + G.edges[node, n]['distance']
                previous[n] = node #se guarda el previous
                heapq.heappush(path, (distance[n], n)) #se actualiza el path
   
    path_min = []
    prev = destino
    while (prev != None):
        path_min.append(prev)
        prev = previous[prev] 
    
    path_min.reverse()
    
    
    return {
        'path': path_min,
        'expanded': expanded,
        'distance': distance[destino]
    }

In [3]:
# Prueba tu algoritmo! 
# El camino esperado es: [10, 128, 39, 145, 89, 277, 192, 107, 133, 146, 236, 99, 74, 17, 110, 265, 1, 73, 182, 194, 5, 252, 251, 235]
dijkstra(G, 10, 235)

{'path': [10,
  128,
  39,
  145,
  89,
  277,
  192,
  107,
  133,
  146,
  236,
  99,
  74,
  17,
  110,
  265,
  1,
  73,
  182,
  194,
  5,
  252,
  251,
  235],
 'expanded': 334,
 'distance': 0.31895111263175857}

<div class="alert alert-success" style="width:90%; margin:0 auto;">

  <h2><p>2- Paradas intermedias</p></h2>
   <p>
 Se propone aquí implementar una variante del algoritmo Dijkstra que encuentre el camino más corto entre dos paradas de metro forzando el mismo a pasar por una serie de paradas intermedias. Por ejemplo, queremos encontrar el camino más corto entre el nodo 10 y 235 pero pasando por el 33 y el 122. El algoritmo debe encontrar el orden idóneo de visita de los nodos intermedios (33 --> 122 o 122 --> 33) sabiendo que empezamos en 10 y acabamos en 235.
</p>

<p></p>

<p>
<b> Nota: </b> Recordad que en Algorítmica Avanzada buscamos la implementación de algoritmos que no solo resuelvan el problema, sino que lo hagan de manera eficiente.
</p>


<div class="alert alert-danger" style="width:80%; margin:0 auto; padding">
<center><p><h3> Código </h3></p> </center>
<p>
<h3>INPUT</h3>
<ul>
<li>__G__: Este es el grafo (en el caso de esta practica la red de metro) que utilizaremos para buscar el camino. Debe de ser un objeto de tipo `nx.Graph`.</li>
<li>__origen__: Este parámetro corresponde al índice de un nodo. En este caso, como indexamos los nodos con el identificador de las paradas de Metro, deberá ser un entero _(e.g. 231)_.</li>
<li>__destino__: El indice del nodo al que queremos llegar. Igual que el origen, deberá ser un entero.</li>
<li>__paradas__: Una lista de índices de nodos por los que queremos pasar de camino entre el origen y el destino. </li>
<li>__infinity=*(int)*__: Parametro opcional en el que definimos que numero nos va bien para utilizar como infinito en el momento de inicializar los pesos de los nodos.</li>
</ul>
<br>
<h3>OUTPUT</h3>
El output de una funcion es un <b>diccionario</b> que contiene los siguientes valores
<ul>
<li>__'ordering'__: Una lista de índices en el orden óptimo de visita. El primer y último elemento de la lista deben corresponderse, respectivamente, con el nodo origen y destino. El resto de elementos de la lista serán todas las paradas solicitadas.</li>
<li>__'expanded'__: El numero de nodos que se han visitado para encontrar la solución.</li>
    <li>__'distance'__: La distancia que se recorrerá desde el origen hasta el destino.</li>
</ul>

</p>


<p>
<b>Nota: </b> No se pide el camino completo entre origen y destino, solo el orden óptimo de visita de los nodos. No obstante, se valorará positivamente la reconstrucción del camino completo. Si lo incluís, añadidlo al diccionario que se devuelve con la clave 'complete_path'.
    </p>
</div>


In [4]:
import heapq
def _dijkstra(G, origen, destino, infinity=2**32-1):
    path = []
    expanded = 0
    visited = dict()
    previous = dict()
    distance = dict()
    for x in G.nodes():
        visited[x] = False
        previous[x] = None
        distance[x] = infinity
    distance[origen] = 0
    previous[origen] = None
    path.append((0,origen))
    while (len(path) != 0):
        aux = heapq.heappop(path)
        dist_origen = aux[0]
        node = aux[1]
        visited[node] = True
        if (node == destino):
            break 
        for n in G.neighbors(node):          
            if (visited[n] == True):
                continue
            expanded += 1
            if (distance[n] > dist_origen + G.edges[node, n]['distance']):
                distance[n] = dist_origen + G.edges[node, n]['distance']
                previous[n] = node
                heapq.heappush(path, (distance[n], n))
    path_min = []
    prev = destino
    while (prev != None):
        path_min.append(prev)
        prev = previous[prev]
    path_min.reverse()
    return {
        'path': path_min,
        'expanded': expanded,
        'distance': distance[destino]
    }

In [5]:
import itertools
def stops_ordering(G, origen, destino, paradas, infinity=2**32-1):
    ordering = [origen]
    expanded = 0
    distance = 0
    _ord = []
    _exp = [] #llista on anirem guardant el expanded de cada cami
    _dist = [] #llista on anirem guardant les distancies de cada cami
    caminos = list(itertools.permutations(paradas)) #guardem en una llista tots els camins possibles
    #node_actual = origen
    for camino in caminos:
        node_actual = origen
        for parada in camino:
            _return = _dijkstra(G, node_actual, parada, infinity=2**32-1)
            expanded += _return['expanded']
            distance += _return['distance']
            node_actual = parada
            ordering.append(parada)
        
        _return = _dijkstra(G, node_actual, destino, infinity=2**32-1)
        expanded += _return['expanded']
        distance += _return['distance']
        ordering.append(destino)
        
        _exp.append(expanded)
        _dist.append(distance)
        _ord.append(ordering)
        expanded = 0
        distance = 0
        ordering = [origen]
    
    distance = min(_dist)
    expanded = min(_exp)
    ordering = _ord[_dist.index(min(_dist))]
    
    return {
        'ordering': ordering,
        'expanded': expanded,
        'distance': distance
    }    

In [6]:
# Prueba tu algoritmo! El orden de recorrido esperado es: [10, 33, 122, 235]
stops_ordering(G, 10, 235, [33,122])
#stops_ordering(G,10,33,[35,122,92,87]) #[10, 87, 122, 35, 92, 33]

{'ordering': [10, 33, 122, 235],
 'expanded': 684,
 'distance': 0.5169849201008004}

In [75]:
#algoritmo de prueba
def _prueba (G, origen, destino, paradas, infinity=2**32-1):
    ordering = [origen]
    expanded = 0
    distance = 0
    _dist = []
    _exp = []
    node_actual = origen
    while (len(paradas) > 0):
        #print("principio while: ", node_actual, paradas)
        for parada in paradas:
            #print("mirar paradas: ", parada)
            _return = _dijkstra(G, node_actual, parada, infinity=2**32-1)
            _dist.append(_return['distance'])
            #print(_return['distance'])
            _exp.append(_return['expanded'])
        nodo = paradas[_dist.index(min(_dist))]
        distance += min(_dist)
        expanded += _exp[_dist.index(min(_dist))]
        _dist = []
        _exp = []
        ordering.append(nodo)
        #print("ordering", ordering)
        node_actual = nodo
        paradas.remove(nodo)
        #print(paradas)
    
    #print("salida bucle")
    _return = _dijkstra(G, node_actual, destino, infinity=2**32-1)
    expanded += _return['expanded']
    distance += _return['distance']   
    ordering.append(destino)
    
    return {
        'ordering': ordering,
        'expanded': expanded,
        'distance': distance
    }

<div class="alert alert-warning" style="width:80%; margin:0 auto; padding">
<center><p><h3> Comentarios Dijkstra</h3></p> </center> </div>

### _(En esta sección se os propone explicar como habeis realizado la implementación y cual es la complejidad detallada del algoritmo. Podéis contestar en este mismo bloque)_

Primero he creado 3 diccionarios. Uno para los nodos visitados, otro para el nodo previo a cada nodo y otro para la distancia del nodo hasta el origen. Todos los diccionarios son inicalizados, añadiendo todos los nodos del grafo y, en visitados, ponerlos todos a False; en los previos todos None y en la distancia el parámetro infinity.
Luego ajustamos la distancia del nodo origen que es 0, añadimos al path, que es una heapq, la distancia del nodo junto al nodo (0, origen) y podemos empezar a explorar el grafo.
Se entra en un while hasta que el path sea 0, que significara que todos los nodos ya han sido analizados, ya que usamos la función heappop(). Del contenido retornado por esta funcion guardaremos el nodo, el cual marcaremos como visitado, y su distancia al origen (dist_origen). Se hace un break si el nodo coincide con el destino. Ahora exploraremos los vecinos del actual nodo y comprobaremos la distancia guardada previamente y la encontrada a partir del nodo actual. Si la distancia guardada es mayor (en el caso de que sea la primera vez que se explora el nodo la distancia guadada es el parámetro infinity, por lo tanto siempre será mayor) se sustituirá por la encontrada a partir del nodo actual (el cual será guardado como previo en el diccionario previous). Y hacemos un heappush del path añadiendo tal nodo vecino y la distancia actual.

Por último, al salir del bucle, busaremos el path minimo recorriendo el grafo "hacia atrás" partiendo del destino. Ya tendremos guardado todo el recorrido minimo entre los nodos así que solo tendremos que hacer path.reverse() y ya tendremos el camino más corto entre el nodo origen y el nodo destino.

Complejidad alog(n), siendo n el número de nodos y a el numero de aristas.

<div class="alert alert-warning" style="width:80%; margin:0 auto; padding">
<center><p><h3> Comentarios Orden óptimo de Paradas Intermedias</h3></p> </center> </div>

### _(En esta sección se os propone explicar como habeis realizado la implementación y cual es la complejidad detallada del algoritmo. Podéis contestar en este mismo bloque)_

Para este algoritmo vamos a necesitar analizar todos los posibles caminos entre las paradas intermedias (sin tener en cuenta el origen y el destino). 
Para cada posible camino hacemos dijkstra desde el nodo origen hacia la parada 1, de la parada1 a la 2, y así hasta el destino. Iremos guardando la distancia de cada caminio en la lista _dist, los expanded en la lista _exp y el ordering en la lista _ord.
Al final cogeremos la distancia más corta de entre la lista _dist, y accederemos al expanded y el ordering del mismo índice.

Complejidad n^2 por el doble bucle

<div class="alert alert-info">
<center>
  <h1>Entrega</h1>
</center>
<p>
La entrega de esta práctica se podrá realizar en el campus virtual hasta el día <b>27 de Octubre a las 23:55</b>. En la tarea que se habilitará en el campus deberéis colgar únicamente este notebook con el nombre:
</p>
<p>
```
* [grupo]_[apellido]_[nombre]_1-Grafos.ipynb
```

</p>
<p>
    Por ejemplo, para un alumno llamado <i>Nombre Genérico</i> perteneciente al <i>grupo Z</i> el nombre del archivo debería ser:
</p>
<p>
```
Z_Generico_Nombre_1-Grafos.ipynb
```

</p>
<p>

Es muy importante que en el notebook exista <b> una sola función </b> con el nombre <i>dijkstra</i> y <i>stops_ordering</i> ya que emplearemos un corrector automático para agilizar el proceso. No os preocupéis si no os funciona del todo, el no pasar los tests no significa necesariamente que tengáis un 0 en la práctica; también revisaremos manualmente el código así como los comentarios del final del notebook y vuestro análisis de complejidad.


Es fundamental que el código esté bién comentado y con un análisis de complejidad exhaustivo del algoritmo. La importancia de poner nombre correcto al archivo debería ser directamente proporcional a lo contentos que queráis que los profesores de prácticas corrijan.
</p>
</div>