## Teoría de gráfos


## Objetivos de aprendizaje

- Conceptos básicos.
- Creación de funciones para realizar grafos
- Implementación de una clase para grafos en Python


## Un poco de historia sobre Teoría de grafos

Un área de creciente interés para los científicos que exploran la importancia, el poder o la influencia entre entidades se llama Teoría de grafos. Las raíces de la teoría de grafos comenzaron en 1736 cuando el matemático Carl Ehler presentó a Leonhard Euler el problema de los puentes de Konigsberg.

El problema de los puentes de Konigsberg se basa en la antigua ciudad alemana de Konigsberg, que se encuentra a ambos lados del río Pregel. En el centro había dos grandes islas que estaban conectadas entre sí y con las orillas del río por siete puentes. Carl Ehler se obsesionó con encontrar una ruta para caminar a través de cada uno de los siete puentes sin pasar por ninguno de ellos más de una vez. Ehler contactó a Leonhard Euler, un matemático suizo. Euler confirmó la hipótesis de Ehler de que el problema no tenía solución, y la explicación de Euler informó un nuevo paradigma matemático llamado Geometría de Posición.

El nuevo paradigma geométrico de Euler establecía que la ubicación de los puentes no importaba. El problema, en cambio, se puede simplificar convirtiendo cada puente en un punto (nodo) con líneas (aristas) para representar enlaces entre ellos. Esta práctica de usar nodos y aristas ahora se conoce como teoría de grafos.

[Mas información sobre el problema de los puentes en Konigsberg](https://en.wikipedia.org/wiki/Seven_Bridges_of_K%C3%B6nigsberg)


## Introducción a Teoría de gráfos con Python

Un `grafo` en matemáticas y en ciencias computacionales, consta de `nodos`, también conocidos como `vértices`. Los nodos pueden o no estar conectados entre sí. 

<center><img src="./imagenes/Nodes.png" width="200px"/></center>


- El nodo `a` está conectado con el nodo `c`, pero `a` no está conectado con `b`. La línea de conexión entre dos nodos se llama borde. Si los bordes entre los nodos no están dirigidos, el grafo se llama grafo no dirigido. Si una arista se dirige de un vértice (nodo) a otro, un grafo se llama grafo dirigido. Un borde dirigido se llama arco.
- Aunque los grafos pueden parecer muy teóricos, muchos problemas prácticos se pueden representar mediante grafos. Suelen utilizarse para modelar problemas o situaciones en física, biología, psicología y sobre todo en ciencias de la computación. Por ejemplo, los gráficos se utilizan para representar redes de comunicación, organización de datos, dispositivos computacionales, el flujo de computación.
- En este último caso, se utilizan para representar la organización de los datos, como el sistema de archivos de un sistema operativo o las redes de comunicación.
- La estructura de enlaces de los sitios web también se puede ver como un grafo, es decir, un grafo dirigido, porque un enlace es un borde dirigido o un arco. 
- Python no tiene un tipo o clase de datos integrados para grafos, pero es fácil implementarlos en Python. 
- Un tipo de datos  ideal para representar grafos en Python, son los diccionarios.
- Implmentación del grafo mostrado en la figura anterior:

In [12]:
graph = { "a" : {"c"},
          "b" : {"c", "e"},
          "c" : {"a", "b", "d", "e"},
          "d" : {"c"},
          "e" : {"c", "b"},
          "f" : {}
        }
print(graph)

{'a': {'c'}, 'b': {'e', 'c'}, 'c': {'a', 'd', 'b', 'e'}, 'd': {'c'}, 'e': {'b', 'c'}, 'f': {}}


- Las claves del diccionario anterior son los nodos de nuestro gráfico. Los valores correspondientes se establecen con los nodos, que están conectados por un borde. Un conjunto es mejor que una lista o una tupla, porque de esta manera, solo podemos tener una arista entre dos nodos. No existe una forma más sencilla y elegante de representar un gráfico.

- Un borde también se puede implementar idealmente como un conjunto con dos elementos, es decir, los nodos finales. Esto es ideal para grafos no dirigidos. Para grafos dirigidos, preferiríamos listas o tuplas para implementar bordes.

In [5]:
def generate_edges(graph):
    edges = []
    for node in graph:
        for neighbour in graph[node]:
            edges.append({node, neighbour})

    return edges

print(generate_edges(graph))

[{'a', 'c'}, {'b', 'e'}, {'b', 'c'}, {'a', 'c'}, {'d', 'c'}, {'b', 'c'}, {'e', 'c'}, {'d', 'c'}, {'b', 'e'}, {'c', 'e'}]


- Como podemos ver, no hay ninguna arista que contenga el nodo `f`. `f` es un nodo aislado de nuestro grafo. 
- La siguiente función de Python calcula los nodos aislados de un gráfico dado:

In [7]:
def find_isolated_nodes(graph):
    """ returns a set of isolated nodes. """
    isolated = set()
    for node in graph:
        if not graph[node]:
            isolated.add(node)
    return isolated
print(find_isolated_nodes(graph))

{'f'}


## Grafos como una clase de Python


<center><img src="./imagenes/Nodes_dos.png" width="200px"/></center>

Antes de continuar con la escritura de funciones para grafos, tenemos una primera implementación de una clase de gráfico de Python.

Si observa la siguiente lista de nuestra clase, puede ver en el método de inicio que usamos un diccionario "self._graph_dict" para almacenar los vértices y sus vértices adyacentes correspondientes.

In [21]:
""" A Python Class
A simple Python graph class, demonstrating the essential 
facts and functionalities of graphs.
"""


class Graph(object):

    def __init__(self, graph_dict=None):
        """ initializes a graph object 
            If no dictionary or None is given, 
            an empty dictionary will be used
        """
        if graph_dict == None:
            graph_dict = {}
        self._graph_dict = graph_dict

    def edges(self, vertice):
        """ returns a list of all the edges of a vertice"""
        return self._graph_dict[vertice]
        
    def all_vertices(self):
        """ returns the vertices of a graph as a set """
        return set(self._graph_dict.keys())

    def all_edges(self):
        """ returns the edges of a graph """
        return self.__generate_edges()

    def add_vertex(self, vertex):
        """ If the vertex "vertex" is not in 
            self._graph_dict, a key "vertex" with an empty
            list as a value is added to the dictionary. 
            Otherwise nothing has to be done. 
        """
        if vertex not in self._graph_dict:
            self._graph_dict[vertex] = []

    def add_edge(self, edge):
        """ assumes that edge is of type set, tuple or list; 
            between two vertices can be multiple edges! 
        """
        edge = set(edge)
        vertex1, vertex2 = tuple(edge)
        for x, y in [(vertex1, vertex2), (vertex2, vertex1)]:
            if x in self._graph_dict:
                self._graph_dict[x].add(y)
            else:
                self._graph_dict[x] = [y]

    def __generate_edges(self):
        """ A static method generating the edges of the 
            graph "graph". Edges are represented as sets 
            with one (a loop back to the vertex) or two 
            vertices 
        """
        edges = []
        for vertex in self._graph_dict:
            for neighbour in self._graph_dict[vertex]:
                if {neighbour, vertex} not in edges:
                    edges.append({vertex, neighbour})
        return edges
    
    def __iter__(self):
        self._iter_obj = iter(self._graph_dict)
        return self._iter_obj
    
    def __next__(self):
        """ allows us to iterate over the vertices """
        return next(self._iter_obj)

    def __str__(self):
        res = "vertices: "
        for k in self._graph_dict:
            res += str(k) + " "
        res += "\nedges: "
        for edge in self.__generate_edges():
            res += str(edge) + " "
        return res




g = { "a" : {"d"},
      "b" : {"c"},
      "c" : {"b", "c", "d", "e"},
      "d" : {"a", "c"},
      "e" : {"c"},
      "f" : {}
    }

graph = Graph(g)

for vertice in graph:
    print(f"Edges of vertice {vertice}: ", graph.edges(vertice))

Edges of vertice a:  {'d'}
Edges of vertice b:  {'c'}
Edges of vertice c:  {'d', 'c', 'b', 'e'}
Edges of vertice d:  {'a', 'c'}
Edges of vertice e:  {'c'}
Edges of vertice f:  {}


- Agregamos dos bordes:

In [22]:
graph.add_edge({"ab", "fg"})
graph.add_edge({"xyz", "bla"})

print("")
print("Vertices of graph:")
print(graph.all_vertices())

print("Edges of graph:")
print(graph.all_edges())


Vertices of graph:
{'f', 'd', 'ab', 'b', 'xyz', 'e', 'a', 'bla', 'fg', 'c'}
Edges of graph:
[{'a', 'd'}, {'b', 'c'}, {'d', 'c'}, {'c'}, {'e', 'c'}, {'ab', 'fg'}, {'bla', 'xyz'}]


Calculemos la lista de todos los vértices y la lista de todas las aristas (bordes) de nuestro grafo:

In [24]:
print("")
print("Vértices del grafo:")
print(graph.all_vertices())

print("aristas (bordes) del grafo:")
print(graph.all_edges())


Vertices del grafo:
{'f', 'd', 'ab', 'b', 'xyz', 'e', 'a', 'bla', 'fg', 'c'}
aristas (bordes) del grafo:
[{'a', 'd'}, {'b', 'c'}, {'d', 'c'}, {'c'}, {'e', 'c'}, {'ab', 'fg'}, {'bla', 'xyz'}]


- Añadimos un vértice y una arista al grafo:

In [26]:
print("Agregar vértice:")
graph.add_vertex("z")

print("Agregar un arista:")
graph.add_edge({"a", "d"})

print("Vértices del gráfo:")
print(graph.all_vertices())

print("Aristas del grafo:")
print(graph.all_edges())

Agregar vértice:
Agregar un arista:
Vértices del gráfo:
{'f', 'z', 'd', 'ab', 'b', 'xyz', 'e', 'a', 'bla', 'fg', 'c'}
Aristas del grafo:
[{'a', 'd'}, {'b', 'c'}, {'d', 'c'}, {'c'}, {'e', 'c'}, {'ab', 'fg'}, {'bla', 'xyz'}]


## Caminos en grafos

- Encontrar el camino más corto de un nodo a otro nodo. Antes de llegar al código de Python para este problema, tendremos que presentar algunas definiciones formales.
### Vértices adyacentes
- Dos vértices son adyacentes cuando ambos inciden en una arista común.
#### Camino en un gráfico no dirigido:
Un camino en un grafo no dirigido es una secuencia de vértices $P=(v_{1}, v_{2}, ..., v_{n})$ ∈ $V x V x ... x V$ tal que $v_{i}$es adyacente a $v_{i+1}$ para 1 ≤ i < n. Tal camino P se llama camino de longitud n desde $v_{1}$ hasta $v_{n}$.

#### Camino sencillo:
- Un camino sin vértices repetidos se llama camino simple.
