<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2016-2017 Ivania Donoso - Antonio Ossa. Editado en 2018-2 por Equipo Docente IIC2233.</font>
</p>

# Grafos

Un grafo es un conjunto no vacío de nodos y las relaciones entre estos nodos.
En teoría de grafos, a los nodos se les llama **vértices**; a las relaciones entre ellos, **aristas**. 

Los grafos pueden ser dirigidos o no dirigidos. Que un grafo sea dirigido significa que las relaciones entre los nodos **sí** tienen una orientación: si el nodo _A_ está relacionado con el nodo _B_, esto **no** signfica que el nodo _B_ está relacionado con el nodo _A_. En cambio, en los grafos no digiridos, las relaciones son simétricas: el nodo _A_ está relacionado con el nodo _B_, si y sólo si el nodo _B_ está relacionado con el nodo _A_.
![ejemplo](img/grafos.png)

En este curso, no estudiaremos [_teoría de grafos_](https://es.wikipedia.org/wiki/Teoría_de_grafos). Sólo nos limitaremos a estudiar las estructuras de datos que se usan para representarlos y operar con ellos. 

## Estructura

Existen múltiples formas para representar grafos. En este curso examinaremos cuatro de ellas: representación con nodos, listas de adyacencia, matrices de adyacencia y matrices de incidencia. 

### Representación con nodos

Esta es la forma más natural de representar un grafo: se define la clase nodo (`Node`), que tiene una lista de nodos a los cuales está relacionado. Sólo se tiene acceso directo a un nodo, tal y como sucede con los árboles.

In [1]:
class Node:
    
    def __init__(self, value):
        self.value = value
        self.connections = []
        
    def add_vertex(self, value):
        self.connections.append(value)
        
    def __repr__(self):
        r = f"[{self.value}]"
        if self.connections:
            r += " -> (" + ", ".join([repr(c) for c in self.connections]) + ")"
        return r  

Vamos a crear el grafo _no dirigido_ de la imagen de arriba:

In [2]:
grafo, nodo_5 = Node(1), Node(5)
last = grafo

for i in range(2, 5):
    nodo = Node(i)
    last.add_vertex(nodo)
    last = nodo
    
    if i in [3, 4]:
        last.add_vertex(nodo_5)    

Este es el resultado, tal y como esperábamos.

In [3]:
grafo

[1] -> ([2] -> ([3] -> ([5], [4] -> ([5]))))

### Lista de adyacencia

En esta estructura todos los vértices se guardan en una lista, y a su vez cada uno de ellos guarda una lista con los vértices con los que está relacionados. Los grafos de la imagen de arriba se representarían como:

### Matriz de adyacencia

Son matrices de dos dimensiones, donde las filas representan los vértices de origen y las columnas los vértices de llegada. En Python las podemos representar con listas de listas, o utilizar [`numpy`](http://www.numpy.org/) para generarlas.

In [5]:
grafo_no_dirigido = [[0, 1, 0, 0, 0], [1, 0, 1, 0, 0], [0, 1, 0, 1, 1], [0, 0, 1, 0, 1], [0, 0, 1, 1, 0]]
grafo_dirigido    = [[0, 1, 0, 0, 0], [0, 0, 1, 0, 0], [0, 0, 0, 1, 1], [0, 0, 0, 0, 1], [0, 0, 0, 0, 0]]

In [6]:
for v in grafo_no_dirigido:
    print(v)

[0, 1, 0, 0, 0]
[1, 0, 1, 0, 0]
[0, 1, 0, 1, 1]
[0, 0, 1, 0, 1]
[0, 0, 1, 1, 0]


In [7]:
for v in grafo_dirigido:
    print(v)

[0, 1, 0, 0, 0]
[0, 0, 1, 0, 0]
[0, 0, 0, 1, 1]
[0, 0, 0, 0, 1]
[0, 0, 0, 0, 0]


### Matriz de incidencia

También son matrices de dos dimensiones. La diferencia con la *matriz de adyacencia* es que aquí las filas son los vértices y las columnas son las aristas. Se pone un `1` cuando un vértice está conectado a una arista y un `0` cuando no existe una conexión.  

Si el grafo es dirigido, se debe poner un `-1` en las filas de los vértices que “reciben”.

In [8]:
grafo_no_dirigido = [[1, 0, 0, 0, 0], [1, 1, 0, 0, 0], [0, 1, 1, 1, 0], [0, 0, 1, 0, 1], [0, 0, 0, 1, 1]]
grafo_dirigido    = [[1, 0, 0, 0, 0], [-1, 1, 0, 0, 0], [0, -1, 1, 1, 0], [0, 0, -1, 0, 1], [0, 0, 0, -1, -1]]

In [9]:
for v in grafo_no_dirigido:
    print(v)

[1, 0, 0, 0, 0]
[1, 1, 0, 0, 0]
[0, 1, 1, 1, 0]
[0, 0, 1, 0, 1]
[0, 0, 0, 1, 1]


In [10]:
for v in grafo_dirigido:
    print(v)

[1, 0, 0, 0, 0]
[-1, 1, 0, 0, 0]
[0, -1, 1, 1, 0]
[0, 0, -1, 0, 1]
[0, 0, 0, -1, -1]


## Operaciones básicas

Las operaciones básicas que implementan estas estructuras de datos son:

**`adjacent(G, x, y)`** verifica que exista una arista entre `x` e `y`.

**`neighbors(G, x)`** entrega una lista con todos los vértices `y` tales que existe una arista entre `x` e `y`.

**`add_vertex(G, x)`** agrega el vértice `x`.

**`remove_vertex(G, x)`** remueve el vértice `x`.

**`add_edge(G, x, y)`** agrega una arista entre los vértices `x` e `y`.

**`remove_edge(G, x, y)`** remueve la arista entre `x` e `y`.

**`get_vertex_value(G, x)`** obtiene el valor asociado al vértice `x`.

**`set_vertex_value(G, x, v)`** asigna un valor al vértice `x`.

**`get_edge_value(G, x, y)`** retorna el valor asociado con la arista que existe entre `x` e `y`.

**`set_edge_value(G, x, y)`** asigna un valor a la arista que existe entre `x` e `y`.

## Ejemplo

Supongamos que quieres representar a tus amigos como un grafo. **Cada nodo sería una persona**, y cada vez que un nodo $A$ se conecte con un nodo $B$ significa que **$A$ considera que $B$ es su amigo 😄**. No siempre esta relación es simétrica; es decir, no siempre nuestros amigos creen que somos sus amigos. De hecho, cerca de la mitad de las personas que consideramos nuestros amigos no nos consideran amigos suyos 😢([comprobado cientificamente](http://www.nytimes.com/2016/08/07/opinion/sunday/do-your-friends-actually-like-you.html)). Por lo tanto el grafo que tendremos que representar es un **grafo dirigido**.

Partamos con la clase `Persona`.

In [6]:
class Persona:

    def __init__(self, nombre, edad):
        self.nombre = nombre
        self.edad = edad

    def __repr__(self):
        return self.nombre

Como dijimos, cada nodo es una persona. Para esto tenemos dos posibilidades: cada nodo tiene como valor a un objeto del tipo `Persona`, o cada Persona es un nodo en el grafo. Para este ejemplo, crearemos una clase `Nodo` cuyo valor sea del tipo `Persona`.

In [7]:
class Nodo:

    def __init__(self, valor):
        self.valor = valor
        
    def __repr__(self):
        return repr(self.valor)

Ahora definimos la clase `Grafo`, sobre la cual realizaremos nuestras operaciones.

In [8]:
class Grafo:

    def __init__(self, lista_adyacencia=None):
        self.lista_adyacencia = dict() if lista_adyacencia is None else lista_adyacencia

    def adjacent(self, x, y):
        return y in self.lista_adyacencia[x]

    def neighbors(self, x):
        return self.lista_adyacencia[x]

    def add_vertex(self, x):
        self.lista_adyacencia[x] = set()

    def remove_vertex(self, x):
        self.lista_adyacencia.pop(x, None)
        for k, v in self.lista_adyacencia.items():
            if x in v:
                v.remove(x)

    def add_edge(self, x, y):
        if x in self.lista_adyacencia:
            self.lista_adyacencia[x].add(y)

    def remove_edge(self, x, y):
        vertice = self.lista_adyacencia.get(x, list())
        if y in vertice:
            vertice.remove(y)

    def get_vertex_value(self, x):
        return self.lista_adyacencia.get(x, None)

    def set_vertex_value(self, x, v):
        self.lista_adyacencia[v] = self.lista_adyacencia.pop(x)

    def get_edge_value(self, x, y):
        pass

    def set_edge_value(self, x, y):
        pass

    def __repr__(self):
        output = [f"Amigos de {k}: {v}." for k, v in self.lista_adyacencia.items()]
        return "\n".join(output)

Veamos cómo se llevan algunos ayudantes del curso.  
(*Las opiniones vertidas en éste código son de exclusiva responsabilidad de quienes coordinan el curso en el 2017-1 (a.k.a. Bastián) y no representan necesariamente el pensamiento de quien programó este código.*)

In [9]:
# Creamos a nuestros ayudantes y los guardamos en nodos.
bamavrakis = Nodo(Persona("Bastián", 15))
fvr1 = Nodo(Persona("Florencia V", 20))
aaossa = Nodo(Persona("Antonio", 21))
flobarrios = Nodo(Persona("Florencia B", 20))
mjjunemann = Nodo(Persona("Matías", 20))
fgvenegas = Nodo(Persona("Freddie", 10))
indonoso = Nodo(Persona("Ivania", 22))

# Definimos las amistades.
amistades = {
    bamavrakis: set([fvr1, aaossa, flobarrios, mjjunemann, fgvenegas, indonoso]),
    fvr1: set([flobarrios, fgvenegas, indonoso]),
    aaossa: set([fvr1, mjjunemann, indonoso]),
    mjjunemann: set([aaossa, fgvenegas]),
    flobarrios: set([fvr1, aaossa, mjjunemann, indonoso]),
    indonoso: set([fvr1, aaossa, flobarrios, fgvenegas])
}

grafo = Grafo(amistades)
grafo

Amigos de Bastián: {Florencia V, Antonio, Florencia B, Matías, Freddie, Ivania}.
Amigos de Florencia V: {Florencia B, Freddie, Ivania}.
Amigos de Antonio: {Ivania, Florencia V, Matías}.
Amigos de Matías: {Freddie, Antonio}.
Amigos de Florencia B: {Matías, Florencia V, Ivania, Antonio}.
Amigos de Ivania: {Freddie, Florencia V, Florencia B, Antonio}.

In [10]:
# ¡Rayos! Nos olvidamos de un ayudante...
# Siempre nos olvidamos de Freddie :(
grafo.add_vertex(fgvenegas)
print(f"Amigos de Freddie: {grafo.get_vertex_value(fgvenegas)}")

# Freddie dice que tiene algunos amigos.
grafo.add_edge(fgvenegas, aaossa)
grafo.add_edge(fgvenegas, bamavrakis)
print(f"Amigos de Freddie: {grafo.get_vertex_value(fgvenegas)}")

# Y Jüne dice que Freddie es su amigo.
grafo.add_edge(mjjunemann, fgvenegas)

Amigos de Freddie: set()
Amigos de Freddie: {Bastián, Antonio}


In [11]:
# A Flory le cae mal Freddie, así que renuncia.
grafo.remove_vertex(fvr1)
grafo

Amigos de Bastián: {Antonio, Florencia B, Matías, Freddie, Ivania}.
Amigos de Antonio: {Ivania, Matías}.
Amigos de Matías: {Freddie, Antonio}.
Amigos de Florencia B: {Matías, Ivania, Antonio}.
Amigos de Ivania: {Freddie, Florencia B, Antonio}.
Amigos de Freddie: {Bastián, Antonio}.

## Cómo recorrer un grafo

Podemos usar los mismos métodos que usamos para árboles (BFS y DFS). Sin embargo, debemos recordar qué nodos hemos visitado hasta el momento, pues un grafo puede contener ciclos. Esto es importante para no quedarse atrapado en uno; en caso contrario, nuestro programa _nunca_ terminaría.

### DFS

DFS recorre exhaustivamente el grafo, dado un punto de partida. Si un nodo no fue visitado en el recorrido, significa que **no es alcanzable** desde ese punto de partida.

In [12]:
def dfs(graph, start):
    # Vamos a mantener un set con los nodos visitados.
    visited = set()
    
    # El stack de siempre.
    stack = [start]
    
    while stack:
        vertex = stack.pop()
        # Detalle clave: si ya visitamos el nodo, ¡no hacemos nada!
        if vertex not in visited:
            # Lo visitamos
            visited.add(vertex)
            # Agregamos los vecinos al stack si es que no han sido visitados.
            for v in graph[vertex]:
                if v not in visited:
                    stack.append(v)   
    return visited

In [13]:
dfs(amistades, bamavrakis)

{Antonio, Bastián, Florencia B, Freddie, Ivania, Matías}

In [14]:
grafo = {
    "A": ["B", "C", "E", "G"],
    "B": ["D", "F", "G"],
    "C": ["B", "E", "G"],
    "E": ["C", "F"],
    "D": ["B", "C", "E", "G"],
    "G": ["B", "C", "D", "F"],
    "F": ["C", "A"]
}

In [15]:
dfs(grafo, "F")

{'A', 'B', 'C', 'D', 'E', 'F', 'G'}

### BFS

Al igual que DFS, BFS recorre exhaustivamente el grafo, dado un punto de partida. Por lo tanto, si un nodo no fue visitado en el recorrido, significa que **no es alcanzable** desde ese punto de partida.

La diferencia con DFS es, principalmente, el orden en que se recorren los nodos. Como BFS es una búsqueda por nivel, encontrará los nodos según cuán lejos estén del punto de partida. Así, este algoritmo garantiza que si se visitó al nodo $n_1$ antes que el nodo $n_2$, entonces $n_1$ está más cerca o a la misma distancia del punto de partida que $n_2$.

In [16]:
from collections import deque

def bfs(graph, start):
    # Vamos a mantener un set con los nodos visitados.
    visited = set()
    # La cola de siempre.
    queue = deque([start])
    
    while queue:
        vertex = queue.popleft()
        # Detalle clave: si ya visitamos el nodo, no hacemos nada!
        if vertex not in visited:
            # Lo visitamos
            visited.add(vertex)
            # Agregamos los vecinos a la cola si es que no han sido visitados.
            for v in graph[vertex]:
                if v not in visited:
                    queue.append(v)
    return visited

In [17]:
bfs(amistades, indonoso)

{Antonio, Bastián, Florencia B, Freddie, Ivania, Matías}

In [18]:
grafo = {
    "A": ["B", "C", "E", "G"],
    "B": ["D", "F", "G"],
    "C": ["B", "E", "G"],
    "E": ["C", "F"],
    "D": ["B", "C", "E", "G"],
    "G": ["B", "C", "D", "F"],
    "F": ["C", "A"]
}

In [19]:
bfs(grafo, "F")

{'A', 'B', 'C', 'D', 'E', 'F', 'G'}