<h1>Recorrido de Grafos</h1>

Dado un grafo ponderado $(G , w )$ donde $G = (V , E )$ y $w : E  \mapsto \mathbb R$, un
arbol de expansión mı́nima es un arbol de expansión en el que la suma
de los pesos w de las aristas es mı́nima.

<h2>Algoritmo Prim</h2>

El algoritmo de Prim construye un arbol visitando vértices de
manera iterativa hasta que se obtiene un árbol de expansión mı́nima.Se comienza desde un vértice cualquiera y en cada iteración se agrega la arista que tenga el mı́nimo peso y no complete un ciclo.
La complejidad computacional del algoritmo de Prim es $O(V \operatorname{log} V)$.
El siguiente pseudo-código implementa el algoritmo mediante una cola de prioridad:


<img src="images/algoritmo_prim.png" />

<h2>Algoritmo Kruskal</h2>

El algoritmo de Kruskal construye un arbol visitando aristas de
manera iterativa hasta que se obtiene un árbol de expansión mı́nima.
Se comienza desde un vértice cualquiera y en cada iteración se
agrega la arista que tenga el mı́nimo peso y no complete un ciclo.
La complejidad computacional del algoritmo de Kruskal es $O(E \operatorname{log} E)$.


<img src="images/algoritmo_kruskal.png" />

In [7]:
import numpy as np
from heapq import heappush,heappop

class abstract_graph:
    
    def __init__(self,_edges):
        self.edges=_edges
        self.nodes={u for u,v in self.edges} | {v for u,v in self.edges}
        
    def adjacency_matrix(self):
        pass
    
    def adjacency_list(self):
        pass

    
class simple_graph(abstract_graph):
    
    def adjacency_list(self):
        adjacent=lambda n : {v for u,v in self.edges if u==n } | {u for u,v in self.edges if v==n}
        return {v:adjacent(v) for v in self.nodes}
    

    
class weighted_graph(abstract_graph):
    
    def __init__(self,_edges):
        self.edges=_edges
        self.nodes={u for u,v in self.edges.keys()} | {v for u,v in self.edges.keys()}
        
    def adjacency_matrix(self):
        n=len(self.nodes)
        mat=np.zeros((n,n))
        adjacent=lambda x : [1 if x==v else 0 for (u,v) in enumerate(sorted(list(G.nodes))) ]
        L=self.adjacency_list()
        i=0
        for v in sorted(list(G.nodes)):
            for l in L[v]:
                mat[i,]+=adjacent(l)
            i=i+1
        return mat
    
    def adjacency_list(self):
        adjacent=lambda n : {v for u,v in self.edges.keys() if u==n } | {u for u,v in self.edges if v==n}
        return {v:adjacent(v) for v in self.nodes}
    
    
    


In [14]:
def depth_first_search(graph,start):
    stack, path = [start], []
    adjacency=graph.adjacency_list()
    while stack:
        vertex = stack.pop()
        if vertex in path:
            continue
        path.append(vertex)
        for neighbor in adjacency[vertex]:
            stack.append(neighbor)
    return path

In [15]:
E={('a','b'):4,('a','h'):8,('b','h'):11,('b','c'):8,('c','d'):7,
   ('h','i'):7,('i','c'):2,('h','g'):1,('g','f'):2,('c','f'):4,
   ('d','e'):9,('d','f'):14,('f','e'):10}
G=weighted_graph(E)
print 'nodos : ',G.nodes
print 'matriz adyacencia : ',G.adjacency_matrix()
print 'lista adyacencia : ',G.adjacency_list()


nodos :  set(['a', 'c', 'b', 'e', 'd', 'g', 'f', 'i', 'h'])
matriz adyacencia :  [[0. 1. 0. 0. 0. 0. 0. 1. 0.]
 [1. 0. 1. 0. 0. 0. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 0. 1.]
 [0. 0. 1. 0. 1. 1. 0. 0. 0.]
 [0. 0. 0. 1. 0. 1. 0. 0. 0.]
 [0. 0. 1. 1. 1. 0. 1. 0. 0.]
 [0. 0. 0. 0. 0. 1. 0. 1. 0.]
 [1. 1. 0. 0. 0. 0. 1. 0. 1.]
 [0. 0. 1. 0. 0. 0. 0. 1. 0.]]
lista adyacencia :  {'a': set(['h', 'b']), 'c': set(['i', 'b', 'd', 'f']), 'b': set(['a', 'h', 'c']), 'e': set(['d', 'f']), 'd': set(['c', 'e', 'f']), 'g': set(['h', 'f']), 'f': set(['c', 'e', 'd', 'g']), 'i': set(['h', 'c']), 'h': set(['i', 'a', 'b', 'g'])}


In [16]:
E={(1,2),(1,3),(2,4),(3,5),(2,5),(4,6),(5,6),(6,7)}
G=simple_graph(E)
print 'nodos : ',G.nodes
print G.adjacency_list()

dfs_path=depth_first_search(G,1)
print dfs_path

nodos :  set([1, 2, 3, 4, 5, 6, 7])
{1: set([2, 3]), 2: set([1, 4, 5]), 3: set([1, 5]), 4: set([2, 6]), 5: set([2, 3, 6]), 6: set([4, 5, 7]), 7: set([6])}
[1, 3, 5, 6, 7, 4, 2]


<h2>Ejercicio</h2>

Se desea construir un acueducto que una las ciudades de la region del Maule. El costo en distancia se encuentra en mm en un archivo csv.

In [43]:
import pandas as pd

df=pd.read_csv('data/distancias_maule.csv', encoding = 'utf-8') 

df.loc[df['InputID']=='TALCA'].head()

Unnamed: 0,WKT,InputID,TargetID,Distance
0,"MULTIPOINT ((-71.661999 -35.432349),(-71.59687...",TALCA,PANGUILEMO,9402.992976
1,"MULTIPOINT ((-71.661999 -35.432349),(-71.56431...",TALCA,HUILQUILEMU,9026.79221
2,"MULTIPOINT ((-72.412391 -35.335426),(-71.66199...",TALCA,CONSTITUCION,69023.06364
3,"MULTIPOINT ((-72.333641 -35.427048),(-71.66199...",TALCA,SANTA OLGA,60993.437978
4,"MULTIPOINT ((-72.494926 -35.469452),(-71.66199...",TALCA,LOS PELLINES,75728.660537


In [44]:
df['InputID'] = df['InputID'].apply(lambda x: x.encode('ascii', 'ignore').decode('ascii'))
df['TargetID'] = df['TargetID'].apply(lambda x: x.encode('ascii', 'ignore').decode('ascii'))
df['InputID'].unique()

array([u'TALCA', u'PANGUILEMO', u'HUILQUILEMU', u'CONSTITUCION',
       u'SANTA OLGA', u'LOS PELLINES', u'CUREPTO', u'EMPEDRADO', u'MAULE',
       u'CULENAR', u'VILLA FRANCIA', u'CHACARILLAS', u'PELARCO',
       u'PENCAHUE', u'CUMPEO', u'SAN CLEMENTE', u'SAN RAFAEL',
       u'CAUQUENES', u'CHANCO', u'PELLUHUE', u'QUILICURA', u'CURICO',
       u'SARMIENTO', u'VILLA LOS NICHES', u'SAN ALBERTO', u'HUALAE',
       u'LICANTEN', u'ILOCA', u'MOLINA', u'ITAHUE UNO', u'RAUCO',
       u'ROMERAL', u'SAGRADA  FAMILIA', u'VILLA PRAT', u'TENO', u'LLICO',
       u'LAGO VICHUQUEN', u'LINARES', u'VARA GRUESA', u'LAS OBRAS',
       u'COLBUN', u'PANIMAVIDA', u'LONGAVI', u'PARRAL', u'RETIRO',
       u'COPIHUE', u'SAN JAVIER', u'BOBADILLA', u'VILLA ALEGRE',
       u'YERBAS BUENAS'], dtype=object)

In [45]:
E={}
for index, row in df.iterrows():
    E.update({(str(row['InputID']), str(row['TargetID'])):row['Distance']/1000})

In [46]:
print(E)

{('MOLINA', 'LLICO'): 82.8151728412793, ('MOLINA', 'CAUQUENES'): 133.24107434365902, ('LAS OBRAS', 'CHACARILLAS'): 38.8160744245475, ('LOS PELLINES', 'PARRAL'): 96.40185527135722, ('MAULE', 'PELLUHUE'): 86.2333699459002, ('COLBUN', 'PARRAL'): 62.7919809115779, ('SARMIENTO', 'SAN JAVIER'): 87.2200782712426, ('SAN RAFAEL', 'EMPEDRADO'): 75.6104131547154, ('PANIMAVIDA', 'RAUCO'): 93.1840138392034, ('ROMERAL', 'LOS PELLINES'): 136.171595752335, ('CURICO', 'SAN RAFAEL'): 44.8741459573556, ('CULENAR', 'SAN ALBERTO'): 76.9769765403075, ('PELLUHUE', 'LICANTEN'): 106.70843566356301, ('MAULE', 'SAN CLEMENTE'): 18.8781757482592, ('LINARES', 'QUILICURA'): 101.37469168011499, ('PANIMAVIDA', 'PELARCO'): 41.8401615994839, ('CONSTITUCION', 'SARMIENTO'): 119.121742346801, ('CONSTITUCION', 'CUMPEO'): 105.254349540721, ('MOLINA', 'HUALAE'): 49.9942413393492, ('LONGAVI', 'VARA GRUESA'): 22.5348024133909, ('SAN ALBERTO', 'CHANCO'): 156.137872831719, ('COLBUN', 'EMPEDRADO'): 80.1751200660946, ('LINARES', 'L