<h1>Recorrido de Grafos</h1>

Dado un grafo ponderado $(G , w )$ donde $G = (V , E )$ y $w : E  \mapsto \mathbb R$, un
arbol de expansión mı́nima es un arbol de expansión en el que la suma
de los pesos w de las aristas es mı́nima.

<h2>Algoritmo Prim</h2>

El algoritmo de Prim construye un arbol visitando vértices de
manera iterativa hasta que se obtiene un árbol de expansión mı́nima.Se comienza desde un vértice cualquiera y en cada iteración se agrega la arista que tenga el mı́nimo peso y no complete un ciclo.
La complejidad computacional del algoritmo de Prim es $O(V \operatorname{log} V)$.
El siguiente pseudo-código implementa el algoritmo mediante una cola de prioridad:


<img src="images/algoritmo_prim.png" />

<h2>Algoritmo Kruskal</h2>

El algoritmo de Kruskal construye un arbol visitando aristas de
manera iterativa hasta que se obtiene un árbol de expansión mı́nima.
Se comienza desde un vértice cualquiera y en cada iteración se
agrega la arista que tenga el mı́nimo peso y no complete un ciclo.
La complejidad computacional del algoritmo de Kruskal es $O(E \operatorname{log} E)$.


<img src="images/algoritmo_kruskal.png" />

In [1]:
import numpy as np
from heapq import heappush,heappop

class abstract_graph:
    
    def __init__(self,_edges):
        self.edges=_edges
        self.nodes={u for u,v in self.edges} | {v for u,v in self.edges}
        
    def adjacency_matrix(self):
        pass
    
    def adjacency_list(self):
        pass

    
class simple_graph(abstract_graph):
    
    def adjacency_list(self):
        adjacent=lambda n : {v for u,v in self.edges if u==n } | {u for u,v in self.edges if v==n}
        return {v:adjacent(v) for v in self.nodes}
    

    
class weighted_graph(abstract_graph):
    
    def __init__(self,_edges):
        self.edges=_edges
        self.nodes={u for u,v in self.edges.keys()} | {v for u,v in self.edges.keys()}
        
    def adjacency_matrix(self):
        n=len(self.nodes)
        mat=np.zeros((n,n))
        adjacent=lambda x : [1 if x==v else 0 for (u,v) in enumerate(sorted(list(G.nodes))) ]
        L=self.adjacency_list()
        i=0
        for v in sorted(list(G.nodes)):
            for l in L[v]:
                mat[i,]+=adjacent(l)
            i=i+1
        return mat
    
    def adjacency_list(self):
        adjacent=lambda n : {v for u,v in self.edges.keys() if u==n } | {u for u,v in self.edges.keys) if v==n}
        return {v:adjacent(v) for v in self.nodes}
    
    
    


In [2]:
def depth_first_search(graph,start):
    stack, path = [start], []
    adjacency=graph.adjacency_list()
    while stack:
        vertex = stack.pop()
        if vertex in path:
            continue
        path.append(vertex)
        for neighbor in adjacency[vertex]:
            stack.append(neighbor)
    return path

In [3]:
import heapq

h = []
heappush(h, (5, 'write code'))
heappush(h, (7, 'release product'))
heappush(h, (1, 'write spec'))
heappush(h, (3, 'create tests'))
while h:
    i,v=heappop(h)
    print('Tarea : {0}, Prioridad {1}'.format(v,i))

Tarea : write spec, Prioridad 1
Tarea : create tests, Prioridad 3
Tarea : write code, Prioridad 5
Tarea : release product, Prioridad 7


In [4]:
def prim_mst(graph,start):
    pq, path = [], []
    tree=[]
    heappush(pq, (0, start))
    adjacency=graph.adjacency_list()
    while pq:
        i,vertex=heappop(pq)
        if vertex in path:
            continue
        print('Vertice : {0}, Prioridad {1}'.format(vertex,i))
        path.append(vertex)
        for neighbor in adjacency[vertex]:
            if neighbor not in path:
                if (vertex,neighbor) in graph.edges:
                    heappush(pq, (graph.edges[(vertex,neighbor)], neighbor))
                    tree.append((vertex,neighbor))
                else:
                    heappush(pq, (graph.edges[(neighbor,vertex)], neighbor))
                    tree.append((neighbor,vertex))
    return tree

In [20]:
import numpy as np

E4={(1,2):1,(3,4):2,(2,4):1}
E4.keys()
G4=weighted_graph(E4)
print('aristas : ',G4.edges)
T=prim_mst(G4,1)
v=np.sum([G4.edges[t] for t in T])
print('Prim MST {0}, valor : {1}'.format(T,v))


aristas :  {(1, 2): 1, (3, 4): 2, (2, 4): 1}
Vertice : 1, Prioridad 0
Vertice : 2, Prioridad 1
Vertice : 4, Prioridad 1
Vertice : 3, Prioridad 2
Prim MST [(1, 2), (2, 4), (3, 4)], valor : 4


<h2>Ejercicio</h2>

Se desea construir un acueducto que una las ciudades de la region del Maule. El costo en distancia se encuentra en mm en un archivo csv.

In [6]:
import pandas as pd

df=pd.read_csv('https://raw.githubusercontent.com/sherna90/matematicas_discretas/master/data/distancias_maule.csv', encoding = 'utf-8',dtype={'WKT':str,'InputID':str,'TargetID':str,'Distance':float}) 

df.loc[df['InputID']=='TALCA'].head()

Unnamed: 0,WKT,InputID,TargetID,Distance
0,"MULTIPOINT ((-71.661999 -35.432349),(-71.59687...",TALCA,PANGUILEMO,9402.992976
1,"MULTIPOINT ((-71.661999 -35.432349),(-71.56431...",TALCA,HUILQUILEMU,9026.79221
2,"MULTIPOINT ((-72.412391 -35.335426),(-71.66199...",TALCA,CONSTITUCION,69023.06364
3,"MULTIPOINT ((-72.333641 -35.427048),(-71.66199...",TALCA,SANTA OLGA,60993.437978
4,"MULTIPOINT ((-72.494926 -35.469452),(-71.66199...",TALCA,LOS PELLINES,75728.660537


In [7]:
df['WKT'] = df['WKT'].apply(lambda x: x.encode('ascii', 'ignore').decode('ascii'))
df['InputID'] = df['InputID'].apply(lambda x: x.encode('ascii', 'ignore').decode('ascii'))
df['TargetID'] = df['TargetID'].apply(lambda x: x.encode('ascii', 'ignore').decode('ascii'))
df['InputID'].unique()

array(['TALCA', 'PANGUILEMO', 'HUILQUILEMU', 'CONSTITUCION', 'SANTA OLGA',
       'LOS PELLINES', 'CUREPTO', 'EMPEDRADO', 'MAULE', 'CULENAR',
       'VILLA FRANCIA', 'CHACARILLAS', 'PELARCO', 'PENCAHUE', 'CUMPEO',
       'SAN CLEMENTE', 'SAN RAFAEL', 'CAUQUENES', 'CHANCO', 'PELLUHUE',
       'QUILICURA', 'CURICO', 'SARMIENTO', 'VILLA LOS NICHES',
       'SAN ALBERTO', 'HUALAE', 'LICANTEN', 'ILOCA', 'MOLINA',
       'ITAHUE UNO', 'RAUCO', 'ROMERAL', 'SAGRADA  FAMILIA', 'VILLA PRAT',
       'TENO', 'LLICO', 'LAGO VICHUQUEN', 'LINARES', 'VARA GRUESA',
       'LAS OBRAS', 'COLBUN', 'PANIMAVIDA', 'LONGAVI', 'PARRAL', 'RETIRO',
       'COPIHUE', 'SAN JAVIER', 'BOBADILLA', 'VILLA ALEGRE',
       'YERBAS BUENAS'], dtype=object)

In [8]:
E={}
for index, row in df.iterrows():
    E.update({(str(row['InputID']), str(row['TargetID'])):row['Distance']/1000})

In [9]:
[(i,v,E[(i,v)]) for i,v in E.keys() if v == "SAN CLEMENTE"]

[('TALCA', 'SAN CLEMENTE', 19.4528449628067),
 ('PANGUILEMO', 'SAN CLEMENTE', 21.1146797476007),
 ('HUILQUILEMU', 'SAN CLEMENTE', 11.8953735732226),
 ('CONSTITUCION', 'SAN CLEMENTE', 86.8098658034372),
 ('SANTA OLGA', 'SAN CLEMENTE', 77.6784430231756),
 ('LOS PELLINES', 'SAN CLEMENTE', 91.65473697859939),
 ('CUREPTO', 'SAN CLEMENTE', 68.62354274281729),
 ('EMPEDRADO', 'SAN CLEMENTE', 72.2245847492922),
 ('MAULE', 'SAN CLEMENTE', 18.8781757482592),
 ('CULENAR', 'SAN CLEMENTE', 20.398649700976502),
 ('VILLA FRANCIA', 'SAN CLEMENTE', 21.6631724780706),
 ('CHACARILLAS', 'SAN CLEMENTE', 18.643405966825),
 ('PELARCO', 'SAN CLEMENTE', 17.125440117773),
 ('PENCAHUE', 'SAN CLEMENTE', 33.026326470266),
 ('CUMPEO', 'SAN CLEMENTE', 35.0342994980098),
 ('SAN RAFAEL', 'SAN CLEMENTE', 25.1597316840797),
 ('CAUQUENES', 'SAN CLEMENTE', 89.2547298938037),
 ('CHANCO', 'SAN CLEMENTE', 97.4213286434537),
 ('PELLUHUE', 'SAN CLEMENTE', 103.386857402107),
 ('QUILICURA', 'SAN CLEMENTE', 119.122912945131),
 ('C

In [10]:
# from matplotlib import pyplot
# from shapely.geometry import MultiPoint
# from shapely import wkt

# points=[]
# for index, row in df.iterrows():
#    points.append(wkt.loads(str(row['WKT'])))

In [11]:
G=weighted_graph(E)

In [12]:
print(G.nodes)

{'PARRAL', 'PANIMAVIDA', 'CULENAR', 'LOS PELLINES', 'COLBUN', 'LAS OBRAS', 'RETIRO', 'SAN RAFAEL', 'CAUQUENES', 'LONGAVI', 'LLICO', 'VILLA LOS NICHES', 'SAGRADA  FAMILIA', 'LINARES', 'CURICO', 'PELARCO', 'SARMIENTO', 'SAN ALBERTO', 'CUMPEO', 'ILOCA', 'CUREPTO', 'RAUCO', 'SAN JAVIER', 'PELLUHUE', 'CHANCO', 'SANTA OLGA', 'MAULE', 'ROMERAL', 'PANGUILEMO', 'EMPEDRADO', 'CHACARILLAS', 'CONSTITUCION', 'VILLA PRAT', 'BOBADILLA', 'SAN CLEMENTE', 'COPIHUE', 'LICANTEN', 'VILLA ALEGRE', 'VILLA FRANCIA', 'LAGO VICHUQUEN', 'MOLINA', 'TENO', 'QUILICURA', 'TALCA', 'HUILQUILEMU', 'VARA GRUESA', 'ITAHUE UNO', 'HUALAE', 'YERBAS BUENAS', 'PENCAHUE'}


In [13]:
T=prim_mst(G,'TALCA')

Vertice : TALCA, Prioridad 0
Vertice : CULENAR, Prioridad 3.9649338381316803
Vertice : VILLA FRANCIA, Prioridad 1.33428335842812
Vertice : CHACARILLAS, Prioridad 4.46585695446726
Vertice : MAULE, Prioridad 2.5950385329768
Vertice : BOBADILLA, Prioridad 4.465889689069121
Vertice : SAN JAVIER, Prioridad 4.59017254506704
Vertice : HUILQUILEMU, Prioridad 9.026792209591079
Vertice : VILLA ALEGRE, Prioridad 9.18977588004314
Vertice : PANGUILEMO, Prioridad 9.40299297647628
Vertice : SAN RAFAEL, Prioridad 9.18076991683921
Vertice : PELARCO, Prioridad 10.7754701402999
Vertice : PENCAHUE, Prioridad 11.4378358826853
Vertice : SAN CLEMENTE, Prioridad 11.8953735732226
Vertice : YERBAS BUENAS, Prioridad 16.4468074244873
Vertice : LINARES, Prioridad 10.7962798998361
Vertice : VARA GRUESA, Prioridad 8.408269680843619
Vertice : LAS OBRAS, Prioridad 8.48362388917583
Vertice : PANIMAVIDA, Prioridad 10.7193269370867
Vertice : COLBUN, Prioridad 7.22485864136085
Vertice : LONGAVI, Prioridad 13.1910016478016

In [14]:
v=np.sum([G.edges[t]/1000 for t in T])
print('Prim MST {0}, valor : {1}'.format(T,v))

QUENES'), ('PELARCO', 'LONGAVI'), ('PELARCO', 'LLICO'), ('PELARCO', 'VILLA LOS NICHES'), ('PELARCO', 'SAGRADA  FAMILIA'), ('PELARCO', 'LINARES'), ('PELARCO', 'CURICO'), ('PELARCO', 'SARMIENTO'), ('PELARCO', 'SAN ALBERTO'), ('PELARCO', 'CUMPEO'), ('PELARCO', 'ILOCA'), ('PELARCO', 'CUREPTO'), ('PELARCO', 'RAUCO'), ('PELARCO', 'PELLUHUE'), ('PELARCO', 'CHANCO'), ('PELARCO', 'SANTA OLGA'), ('PELARCO', 'ROMERAL'), ('PELARCO', 'EMPEDRADO'), ('PELARCO', 'CONSTITUCION'), ('PELARCO', 'VILLA PRAT'), ('PELARCO', 'SAN CLEMENTE'), ('PELARCO', 'COPIHUE'), ('PELARCO', 'LICANTEN'), ('PELARCO', 'LAGO VICHUQUEN'), ('PELARCO', 'MOLINA'), ('PELARCO', 'TENO'), ('PELARCO', 'QUILICURA'), ('PELARCO', 'VARA GRUESA'), ('PELARCO', 'ITAHUE UNO'), ('PELARCO', 'HUALAE'), ('PELARCO', 'YERBAS BUENAS'), ('PELARCO', 'PENCAHUE'), ('PENCAHUE', 'PARRAL'), ('PENCAHUE', 'PANIMAVIDA'), ('PENCAHUE', 'LOS PELLINES'), ('PENCAHUE', 'COLBUN'), ('PENCAHUE', 'LAS OBRAS'), ('PENCAHUE', 'RETIRO'), ('PENCAHUE', 'CAUQUENES'), ('PENCAHU