# Ayudantía 09 - Estructuras Nodales I y II

__Autores: Roberto Negrin (@roberto009) y Pablo Sanhueza (@pabloist)__

Una estructura de datos se define como una forma determinada  de **organizar** los datos para que puedan ser utilizarlos de la manera **más efectiva posible**.

###  Nodos
Veamos la estructura básica de un nodo:

In [1]:
# El nodo más básico
class Node:
    def __init__(self, value, next_node):
        self.value = value
        self.next = next_node

¿Qué podemos hacer con un nodo que sólo tiene una referencia?

## Listas Ligadas

Una lista ligada es una estructura que almacena nodos en un **orden secuencial**, en que cada nodo posee una referencia a un único nodo sucesor (next node).

El primer nodo de una lista ligada es denominado **cabeza (head)** de la lista, y el último, que no posee sucesor, es denominado **cola (tail)**.
 <div style="text-align: center;">
    <img src="./imagenes/linked-list.png" />
</div>


Veamos una simple forma de crear una lista ligada 

In [2]:
class Node:
    def __init__(self, value=None, next_node=None):
        self.value = value
        self.next_node = next_node
        
    def append(self, value):
        if not self.next_node:
            self.next_node = Node(value)
        else:
            self.next_node.append(value)
            
    def __str__(self):
        if not self.next_node:
            return str(self.value)
        else:
            return f'{self.value} -> {str(self.next_node)}'

In [3]:
lista_ligada = Node(0) # Este nodo corresponde al la cabeza de la lista ligada
print(lista_ligada)

lista_ligada.append(5)
lista_ligada.append(10)
lista_ligada.append(15) # El último nodo que agreguemos será la cola
print(lista_ligada )

0
0 -> 5 -> 10 -> 15


## Árboles

Los árboles son una estructura de dátos muy cómun.
A diferencia de las listas ligadas, tiene una **estructura jerárquica**.
Todos los nodos, excepto el **nodo raíz** tienen un **padre** y cero o más **hijos**.

¿Qué nodos no tienen hijos?
Los denominados **hojas** del árbol.

 <div style="text-align: center;">
    <img src="./imagenes/arboles.jpg" />
</div>


¿Y cómo creamos un árbol?

Si nos damos cuenta, un árbol es está formado por árboles más pequeños.

 <div style="text-align: center;">
    <img src="./imagenes/subtree.png" />
</div>

Por lo que podemos crear los árboles como estructuras recusivas, donde cada nodo es la raíz de un árbol más pequeño.

In [4]:
class Arbol:
    def __init__(self, valor):
        self.valor = valor
        self.hijos = set()

#### Agregar hijos

In [5]:
class Arbol:
    def __init__(self,ID , valor):
        self.ID
        self.valor = valor
        self.hijos = set()
    
    def agregar_hijo(self, hijo):
        self.hijos.add(hijo)

## Recorridos: DFS y BFS

Podemos recorrer un árbol:
- Vérticalmente, en profundidad (DFS).
- Horizontalmente, en amplitud (BFS).

## DFS 

 <div style="text-align: center;">
    <img src="./imagenes/dfs.png" />
</div>

## BFS

 <div style="text-align: center;">
    <img src="./imagenes/bfs.png" />
</div>

Dependiendo del tipo de problema, será mas conveniente usar DFS o BFS

¡ Agreguemosle un BFS a nuestro Árbol !

In [9]:
class Arbol:
    def __init__(self,ID , valor):
        self.ID = ID
        self.valor = valor
        self.hijos = []
    
    def agregar_hijo(self, ID, valor):
        self.hijos.append(Arbol(ID, valor))
        
    def buscar_nodo(self, id_buscada):
        if self.ID == id_buscada:
                return self
        por_visitar = [hijo for hijo in self.hijos]
        while len(por_visitar):
            nodo_actual = por_visitar.pop(0)
            if nodo_actual.ID == id_buscada:
                return nodo_actual
            por_visitar += [hijo for hijo in nodo_actual.hijos]
        return None
    
    def __repr__(self):
        return f"{(self.ID, self.valor)}"

In [11]:
# Creamos la raíz
raiz = Arbol(0, 50)

#Le agregamos nodos
raiz.agregar_hijo(1, 155)
raiz.agregar_hijo(2, 5)
raiz.agregar_hijo(3, 35)

#Buscamos un nodo y lo módificamos 
nodo_buscado = raiz.buscar_nodo(3)
print(nodo_buscado)
print(nodo_buscado.hijos)
nodo_buscado.agregar_hijo(4, 100)

#Lo volvemos a buscar para comprobar que se agregó el hijo
nodo_buscado = raiz.buscar_nodo(3)
print(nodo_buscado)
print(nodo_buscado.hijos)

(3, 35)
[]
(3, 35)
[(4, 100)]


## I Grafos ¿Qué son? 👀

Los grafos son conjuntos de objetos que contienen **aristas** y **nodos**, estas estructuras nos permiten establecer _**relaciones binarias**_ entre entidades. 

 <div style="text-align: center;">
    <img src="./imagenes/grafos.jpg" alt="image4" width="40%" weight="40%"/>
</div>

 <div style="text-align: center;">
    <img src="./imagenes/grafo_social.png" alt="image4" width="40%" weight="40%"/>
</div>

 <div style="text-align: center;">
    <img src="./imagenes/Konigsberg_bridges.png" alt="image4" width="40%" weight="40%"/>
</div>

## II Tipos de grafos

### a) Grafo no dirigido (¿mundo ideal? 🤞) 

 <div style="text-align: center;">
    <img src="./imagenes/undirected_graph.png" alt="image4" width="40%" weight="40%"/>
</div>


### b) Grafo dirigido (Mundo Real 🙃)

 <div style="text-align: center;">
    <img src="./imagenes/Directed_acyclic_graph.png" alt="image4" width="35%" weight="35%" />
</div>

Ya súper bonito, ¿pero de que sirven? 🤔

La **teoría de grafos** tiene aplicación en múltiples áreas tanto de programación como de otras áreas:
* Deep learning
* Algoritmos de recomendación
* Resolución de problemas matemáticos
* Sistemas mecánicos - eléctricos

## III Grafos en Python 👩‍💻👨‍💻


Existen diversas formas de crear grafos en Python:

### * Definiendo múltiples clases

In [4]:
class Nodo:
    
    def __init__(self, valor):
        self.valor = valor
        self.conexiones = list()
        
    def __repr__(self):
        seccion_1 = f'Nodo: {self.valor}\n'
        seccion_2 = "Conexiones: " + ', '.join(nodo.valor for nodo in self.conexiones)
        return seccion_1 + seccion_2
        

### * Una sola clase

In [5]:
class Grafo:
    
    def __init__(self):
        self.nodos = dict()
    
    def agregar_nodo(self, nodo):
        self.nodos[nodo.valor] = nodo
    
    def conectar_nodos(self, nodo_a, nodo_b):
        self.nodos[nodo_a.valor].conexiones.append(nodo_b)
        self.nodos[nodo_b.valor].conexiones.append(nodo_a)
        
    def eliminar_nodos(self, nodo_a, nodo_b):
        self.nodos[nodo_a.valor].conexiones.remove(nodo_b)
        self.nodos[nodo_b.valor].conexiones.remove(nodo_a)
    
    def __repr__(self):
        return "\n".join(str(nodo) for nodo in self.nodos.values())

In [6]:
nodo_1 = Nodo("A")
nodo_2 = Nodo("B")
nodo_3 = Nodo("C")
nodo_4 = Nodo("D")
grafo = Grafo()
grafo.agregar_nodo(nodo_1)
grafo.agregar_nodo(nodo_2)
grafo.agregar_nodo(nodo_3)
grafo.agregar_nodo(nodo_4)
grafo.conectar_nodos(nodo_1, nodo_2)
grafo.conectar_nodos(nodo_1, nodo_3)
grafo.conectar_nodos(nodo_1, nodo_4)
grafo.conectar_nodos(nodo_3, nodo_4)
grafo.eliminar_nodos(nodo_3, nodo_4)
print(grafo)

Nodo: A
Conexiones: B, C, D
Nodo: B
Conexiones: A
Nodo: C
Conexiones: A
Nodo: D
Conexiones: A


### * Otros (defaultdicts, listas de adyacencia, matriz de adyacencia, etc)

## IV Funcionalidades de grafos

**Funcionalidades**

Independiente de la forma en la que se creen los grafos, en general todos tienen un conjunto de funcionalidades en común:

* Modificación de nodos (agregar nodos, eliminar nodos, modificar nodos, etc).
* Modificación de aristas (agregar aristas, eliminar aristas, modificar aristas, etc).
* Recorrido o barrido del grafo desde un nodo inicial (DFS, BFS).

## V Recorrido

### b) DFS (Depths First Search)

 <div style="text-align: center;">
    <center><img src="./imagenes/Depth-First-Search.gif" alt="image4" width="40%" weight="40%"/></center>
</div>

In [2]:
def dfs(grafo, inicio):
    # Vamos a mantener un set con los nodos visitados.
    visitados = set()

    # El stack de siempre, comienza desde el nodo inicio.
    stack = [inicio]

    while len(stack) > 0:
        vertice = stack.pop()
        # Detalle clave: si ya visitamos el nodo, ¡no hacemos nada!
        if vertice in visitados:
            continue

        # Lo visitamos
        print(vertice)
        visitados.add(vertice)

        # Agregamos los vecinos al stack si es que no han sido visitados.
        for vecino in grafo[vertice]:
            if vecino not in visitados:
                stack.append(vecino)

    return list(visitados)

<center> También es posible establecer una forma recursiva de DFS (¿funciones recursivas? ❌😱) </center>

In [1]:
# Vamos a mantener (como parámetro) un set con los nodos visitados.
def dfs_recursivo(grafo, vertice, visitados=None):
    visitados = visitados or set()

    # Lo visitamos
    print(vertice)
    visitados.add(vertice)

    for vecino in grafo[vertice]:
        # Detalle clave: si ya visitamos el nodo, ¡no hacemos nada!
        if vecino not in visitados:
            dfs_recursivo(grafo, vecino, visitados)

    return list(visitados)

### a) BFS (Breadth First Search)

 <div style="text-align: center;">
    <center><img src="./imagenes/Breadth-First-Search-Algorithm.gif" alt="image4" width="40%" weight="40%"/></center>
</div>

<center>En la práctica se utiliza de forma mas común DFS sobre BFS para recorrer todos los nodos de un grafo. 🤩👌</center>

## VI Ejercicio DCComienzo 👾🔎

Han pasado 40 años desde la última galita (😓) y ya cansado del ~~terrible~~ magnífico manejo de la pandemia de Chile te decides a descrifrar finalmente cómo comenzó todo 🔎, ¿Fue el virus creado por el malvado científico Xue Hua Piao Piao 👾 o se desarrolló naturalmente?. 

Uno de tus viejos contactos de la OMS te ha facilitado dos documentos, en el primero se encuentra el registro de todas las personas del mundo (de un mundo muy pequeño 😅) y se indica si han sido pacientes confirmados de PrograVirus 2.0; mientras que en el segundo se encuentran los contactos que han tenido con otras personas. Debes encontrar el camino más largo que conecte a personas que hayan sido casos confirmados, así podrás encontrar con una alta probabilidad al paciente 0 🌍.

Buena suerte!.

Siguiendo la lógica del dividir para conquistar, es necesario primero definir una función que nos permita establecer si existe una línea de personas confirmadas que hayan estado en contacto

## a) Archivos

Se entregarán dos archivos: _personas.txt_ donde cada linea representa un **Nodo** y donde el segundo elemento representa si es o fue un caso confirmado de PrograVirus 2.0.

Ej:

    Elsa patito, 1
    Aquiles brinco, 0
    Xue Hua Piao Piao, 1
    .
    .
    .


Y _contactos.txt_, donde cada linea representa la conexión entre dos nodos. Puedes asumir que no se repetirán conexiones.

Ej:

    Pangui, Nachito Sánchez
    Elsa Patito, Aquiles Brinco
    Aquiles Brinco, Xue Hua Piao Piao
    .
    .
    .

## b) Definición de entidades y métodos

### Clase Nodo

In [None]:
class Nodo:
    
    def __init__(self, nombre, status):
        self.nombre = nombre
        self.status = status
        self.contactos = []
    
    def agregar_contacto(self, contacto):
        self.contactos.append(contacto)
        
    def eliminar_contacto(self, contacto):
        self.contactos.remove(contacto)
        
    def __str__(self):
        print(self.nombre, self.status)

### Grafo

In [None]:
class Grafo:
    
    def __init__(self):
        self.nodos = {}

#### Funcionalidades del grafo: Modificación de nodos

In [None]:
    def agregar_nodo(self, nodo):
        
    def eliminar_nodo(self, nodo):

#### Funcionalidades del grafo: Modificación de conexiones

In [None]:
    def agregar_contacto(self, nodoid_a, nodoid_b):
        
    def eliminar_contacto(self, nodoid_a, nodoid_b):

#### Funcionalidades del grafo: Recorrido: Existen casos confirmados entre dos personas?

Necesitamos saber si entre dos personas existen contactos que hayan sido identificados como casos confirmados, para lo anterior definimos la función:

_hay casos (persona_A, persona_B)_

La función hace un recorrido y retorna **True** en caso de que existan casos confirmados entre dos personas y **False** en caso contrario

In [None]:
    def hay_casos(self, nodo_a, nodo_b):

Ya sabemos si es que existen contactos confirmados entre dos personas, ahora ¿Quiénes son? Para hacer la trazabilidad necesitamos entonces generar una lista de las personas que son casos confirmados y contactos entre dos personas:

_trazabilidad(Persona_A, Persona_B)_

La función retorna una lista con los contactos que existen entre dos personas (**Importante: solo debe hacerlo entre personas que existan contactos confirmados**)

In [7]:
    def trazabilidad(self, nodo_a, nodo_b, visitados = set()):

In [None]:
class Grafo:
    
    def __init__(self):
        self.nodos = {}
        
    def agregar_nodo(self, nodo):
        pass
        
    def eliminar_nodo(self, nodo):
        pass
        
    def agregar_contacto(self, nodoid_a, nodoid_b):
        pass
        
    def eliminar_contacto(self, nodoid_a, nodoid_b):
        pass
        
    def hay_casos(self, nodo_a, nodo_b):
        pass
    
    def trazabilidad(self, nodo_a, nodo_b, visitados = set()):
        pass
        
    def mostrar_ruta(self, ruta):
        linea = ""
        for elemento in ruta:
            linea += "->"+elemento.nombre + elemento.status
        print(linea)
        
    def __str__(self):
        return f"Nodos {self.nodos}"

## Lectura de datos

In [None]:
def leer_archivos(archivo_nodos, archivo_conexiones):
    grafo = Grafo()
    
    with open(archivo_nodos, "r") as nodos:
        for linea in nodos:
            nodo = Nodo(*linea.strip().split(","))
            grafo.agregar_nodo(nodo)
        
    with open(archivo_conexiones, "r") as conexiones:
        for linea in conexiones:
            nodo_a, nodo_b = linea.strip().split(",")
            grafo.agregar_contacto(nodo_a, nodo_b)
        
    return grafo

## Probando lo desarrollado

In [None]:
grafo = leer_archivos("Personas.txt", "Contactos.txt")

In [None]:
print(grafo.hay_ruta("Peppa", "Hue Xia Piao Piao"))

In [None]:
rutas = grafo.trazabilidad("Peppa", "Hue Xia Piao Piao")
print(" -> ".join(str(n) for n in rutas))

## Propuesto 👩‍✈️👨‍✈️

Ya hemos definido la trazabilidad entre dos personas, ahora necesitamos poder definir cual es la línea de contactos más larga y llegar al posible paciente 0 👾. Para ello debes definir la siguiente función:

_Paciente\_0(grafo)_

Que debe retornar la línea de trazabilidad más larga entre las personas existentes en el grafo. ¡Buena suerte! 🤞