# Ayudantía 08: Estrucutras Nodales I

## ¿Qué es un Nodo?
  Un nodo es un objeto con un formato simple, pero que permite modelar estructuras muy complejas. Cada nodo tiene al menos dos atributos:

- **Valor:** un elemento contenido en el nodo. Este puede ser cualquier dato que queramos almacenar, desde un nombre a un objeto más complejo como una instancia de alguna clase.

- **Uno o más nodos vecinos:** el nodo debe estar conectado a otros nodos de la estructura. Este atributo puede ser una lista, un set, o en el caso de nodos con un sólo vecino, puede guardar el nodo mismo.

In [None]:
# Esto es todo lo que necesita un Nodo

class Nodo:
  def __init__(self, valor, siguiente):
    self.valor = valor
    # Si sólo está conectado a un nodo, lo llamamos el "nodo siguiente", o "next node"
    self.nodo_siguiente = siguiente

In [None]:
# Un Nodo algo más complejo:

class Nodo:
  def __init__(self, valor):
    self.valor = valor
    self.nodos_vecinos = []

  def agregar_vecino(self, nuevo_vecino):
    self.nodos_vecinos.append(nuevo_vecino)

  def __repr__(self)
    # En general es buena práctica agregar este método!.
    # Puede retornar lo que queramos, lo importante es que sea lo más informativo posible
    return f"Nodo con el valor {self.valor}"

## Listas Ligadas

Es una estructura que guarda nodos en orden, como una fila, o en programación, una lista, stack o cola. De esta manera, cada nodo guarda una referencia al nodo único que le sigue.

El primer nodo de la lista ligada se llama cabeza o head y el último se llama cola o tail.

Para modelar listas ligadas, crearemos una clase Nodo que guarde algún valor de interés y una referencia a su sucesor, esto último será None en el caso del Nodo cola.

Adicionalmente, podemos crear una clase ListaLigada que se encargue de almacenar y administrar el conjunto de nodos, que contenga en sus atributos a los nodos cabeza y cola de la lista. En ella podremos definir varios métodos útiles para gestionar la lista.

- **Agregar nodos a la lista:**
Podemos definir un método que agregue nodos a la lista, creando un nuevo nodo con su valor correspondiente, y referenciandolo tanto en el atributo sucesor del Nodo cola antiguo como en el atributo cola de la lista en si, sobreescribiendo al nodo antiguo.

- **Recuperar un valor:**
Podemos definir un método que sea capaz de obtener el valor de un nodo dada su posición en la lista. Como esta no es una lista normal, no se puede acceder directamente con el índice, y se tendrá que buscar uno por uno, a partir del nodo cabeza, el nodo que queremos encontrar.

- **Insertar un nodo:**
Podemos definir un método que inserte un nuevo nodo en alguna posición válida específica de la lista, entremedio de nodos ya existentes. Para eso, debemos asegurarnos de que el nodo que actualmente se encuentra en tal posición (si existe) quede referenciado como el sucesor del nuevo nodo, y que en el nodo que está justo antes de esa posición (si existe) guarde al nuevo nodo como su sucesor.

- **Retirar un nodo:**
Podemos definir un método que elimine un nodo que se encuentre en alguna posición específica de la lista. Para eso, debemos asegurarnos de que el nodo que se encuentra antes de tal posición (si existe) guarde al sucesor del nodo que se está eliminando (si existe) como su propio sucesor.

### Ejemplo

In [None]:
from os import path
import json


class Nodo:
    def __init__(self, valor, siguiente=None):
        self.valor = valor
        self.siguiente = siguiente

    def append(self, valor):
        if self.siguiente is None:
            self.siguiente = Nodo(valor)
        else:
            self.siguiente.append(valor)

    def conseguir_valor(self, posicion, posicion_actual=0):
        if posicion == posicion_actual:
            return self.valor
        return self.siguiente.conseguir_valor(posicion, posicion_actual + 1)

    def insertar_nodo(self, valor, posicion, posicion_actual=0):
        if posicion == posicion_actual:
            siguiente = self.siguiente
            self.siguiente = Nodo(valor, siguiente)
        else:
            self.siguiente.insertar_nodo(valor, posicion,
                                         posicion_actual + 1)

    def __str__(self):
        return f"Head: Nodo con valor {self.valor}\n" \
               f"Nodo siguiente: {self.siguiente}"


In [None]:
lista_ligada = Nodo("Hola soy un nodo")
lista_ligada.append("Hola soy un nuevo nodo")
respuesta = "placeholder"
while respuesta != "0":
    respuesta = input("Inventa nodos!\n"
                      "0 para terminar: ")
    lista_ligada.append(respuesta)

print(lista_ligada.conseguir_valor(1))
lista_ligada.insertar_nodo("Me colé jeje", 2)
print(lista_ligada)

###### Un ejemplo algo más difícil

Esta vez, los nodos guardarán una clase más compleja que un str, inventaremos una lista ligada cerrada que recorre los días de una semana y hace sonar un despertador.

In [None]:
class DiaSemana:
    def __init__(self, nombre, despertador):
        self.nombre = nombre
        self.despertador = despertador

    def sonar_alarma(self):
        print(f"Hoy es {self}! La alarma sonará a las "
              f"{self.despertador}")

    def __str__(self):
        return self.nombre

In [None]:
# Crearemos además una clase especial

class ListaLigada:
    def __init__(self):
        self.head = None

    def append(self, valor):
        if self.head is None:
            self.head = Nodo(valor)
        else:
            self.head.append(valor)

    def activar_despertadores(self):
        nodo = self.head
        while nodo is not None:
            nodo.valor.sonar_alarma()
            nodo = nodo.siguiente

In [None]:
path = path.join('Ejemplos', 'archivos', 'data.json')
with open(path, encoding='utf-8') as file:
    dias = json.load(file)

lista_ligada = ListaLigada()
for nombre_dia, hora_despertador in dias:
    dia = DiaSemana(nombre_dia, hora_despertador)
    lista_ligada.append(dia)

lista_ligada.activar_despertadores()

**Desafío**: hacer que se trate de una lista ligada cerrada!
Es decir, que el último nodo conecte con el primero.


## Árboles

Al contrario de las Listas Ligadas, los árboles son estructuras **no lineales**, y estos siguen una estructura **jerárquica**. De esta forma, los nodos se ordenan a través de relaciones **padre-hijo**.

El primer nodo se llama **nodo raíz** (*root*), y este es el único nodo que no posee un **padre** (*parent*). Cada nodo padre posee uno o más **hijos** (*children*). Los nodos que no tienen hijos, es decir, los que se encuentran en los extremos de los árboles, se denominan como nodos **hoja**, y el resto se llaman **nodos interiores**.

Una secuencia ordenada de nodos consecutivos unidos por aristas en un arbol *T* forman un **camino**. La **profundidad** (*depth*) de un nodo corresponde al número de aristas que debe recorrer para llegar a la raíz. La **altura** (*height*) del árbol corresponde al máximo de las profundidades alcanzadas por los nodos hoja.

### Árboles basados en nodos enlazados

Definiremos una clase `Arbol`, que servirá para modelar una estructura recursiva de manera que cada nodo (representado por una instancia de esta clase) es la raíz de un sub-árbol.


Modelaremos cada nodo como un objeto `Arbol` con los siguientes atributos:

- `id_nodo`: corresponde a un identificador para el nodo.
- `padre`: se usa para hacer referencia al nodo padre.
- `hijos`: es una estructura (como una lista o diccionario) que almacena referencias a los hijos del nodo.
- `valor`: es lo almacenado en ese nodo.

La estructura además incluirá los siguientes métodos:

- **Obtener un nodo**:
Busca y retorna el nodo con un identificador en específico.

- **Agregar nodo**:
Permite agregar un nuevo nodo (con nuevo identificador y valor) al árbol como hijo de un nodo con un identificador en específico. 

##### Ejemplo de árbol
Mostraremos un ejémplo básico de un arbol. Recordemos que hay muchas formas de implementarlos!

In [None]:
class Arbol:
    id_nodo = 0
    # En este caso, haremos que la clase misma vaya asignando una ID a cada nodo

    def __init__(self, valor, padre=None):
        self.id_ = Arbol.id_nodo
        Arbol.id_nodo += 1
        self.valor = valor
        self.padre = padre
        self.hijos = set()

    def obtener_nodo(self, id_nodo):
        if self.id_ == id_nodo:
            return self
        for hijo in self.hijos:
            nodo = hijo.obtener_nodo(id_nodo)
            if nodo is not None:
                return nodo

    def agregar_nodo(self, valor, id_padre):
        print(f"agregando valor {valor} en {id_padre}")
        nodo_padre = self.obtener_nodo(id_padre)
        if nodo_padre is None:
            return
        nuevo_nodo = Arbol(valor, nodo_padre)
        nodo_padre.hijos.add(nuevo_nodo)

    def __str__(self):
        return f"{self.id_: ^10d} -> {self.valor: ^10s}"

In [None]:
# Esta función es similar a la __repr__ vista en los contenidos,
# Pero imprime cada hijo recursivamente, en vez de retornar un string
def print_arbol(arbol, indent=0):
    texto = "|  " * indent
    texto += f"id: {arbol.id_}, valor: {arbol.valor}"
    texto += ', nodo hoja' if len(arbol.hijos) == 0 else ''
    print(texto)
    for hijo in arbol.hijos:
        print_arbol(hijo, indent + 1)

In [None]:
# Ahora poblaremos el arbol de secuencias de palabras aleatorias, y lo imprimimos!
from string import ascii_lowercase
from random import choices, choice

arbol = Arbol("Soy el Nodo Inicial")
for _ in range(15):
    texto = ''.join(choices(ascii_lowercase, k=6))
    id_padre = choice(range(Arbol.id_nodo))
    arbol.agregar_nodo(texto, id_padre)

print_arbol(arbol)


### Árboles binarios

Son un caso particular de árboles, donde:

- Cada nodo tiene como máximo dos nodos hijo.
- Cada nodo hijo está etiquetado como hijo-izquierdo, o bien como hijo-derecho (a lo más uno de cada uno).
- En términos de precedencia, el hijo-izquierdo va antes que el hijo-derecho.

Siendo así, podemos decir que el numero de nodos crece de manera exponencial, según la profundidad, por lo que la máxima cantidad de nodos por nivel $n$ será $2^n$.

Se denomina **árbol binario completo** al árbol binario donde todos los nodos interiores tienen exactamente dos hijos, y todos los nodos hoja están en el mismo nivel. Podemos calcular cuántos nodos tiene un árbol de este tipo, si consideramos que el nivel máximo de profundidad es $d$:

$$\sum_{i=0}^{d} 2^i = 2^{d + 1} - 1$$

# Recorrido de un Árbol

Uno de los procedimientos más complicados a implementar en un árbol (y más adelante, en los grafos) son los recorridos. Estos deben ser lo más eficientes posibles, recorriendo cada nodo del árbol sólo una vez. Los dos modelos más comunes y simples son **BFS** y **DFS**.


## BFS: Breadth-first search

Según este modelo, partimos recorriendo desde el primer Nodo (Nodo Padre). Recorremos a través de todos los nodos hijos de este nodo, y luego, todos los nodos hijos de estos nodos hijos, así sucesivamente. En este recorrido, los nodos hojas son los últimos en ser visitados.


## DFS: Depth-first search

En este algoritmo de búsqueda, tratamos de llegar **lo más profundo posible**, antes de continuar con los otros nodos hijos. Es decir, partimos por el Nodo Padre, luego seguimos con un nodo hijo, luego un hijo de ese hijo, y así sucesivamente, hasta llegar a un nodo hoja. Una vez llegado a este nodo hoja, se hace lo mismo desde otro Nodo hijo del primer Nodo. 

## Ejemplo

Simularemos una estructura de una empresa o algún equipo de trabajo, en donde existe un jefe y cada jefe tiene asociado a sus colaboradores.
Usaremos la estrucutra de árbol vista en clase y veremos las maneras que existen para recorrerlos y realizar algunas operaciones.

In [None]:
from collections import deque

class Empresa:
    
    def __init__(self, id_colaborador, nombre, tiempo_servicio, sueldo, jefe=None):
        self.id_colaborador = id_colaborador
        self.jefe = jefe
        self.nombre = nombre
        self.tiempo_servicio = tiempo_servicio
        self.sueldo = sueldo
        self.hijos = {}
        
    def obtener_nodo(self, id_colaborador):
        
        # Vemos si es el mimso
        if self.id_colaborador == id_colaborador:
            return self
        
        # Buscamos en los hijos recursivamente, hasta encontrar el mismo
        for hijo in self.hijos.values():
            nodo_obtenido = hijo.obtener_nodo(id_colaborador)
            if nodo_obtenido is not None:
                return nodo_obtenido
            
    def agregar_nodo(self, id_jefe, id_colaborador, nombre, tiempo_servicio, sueldo):
        jefe = self.obtener_nodo(id_jefe)
        
        if jefe is None:
            return
        
        colaborador = Empresa(id_colaborador, nombre, tiempo_servicio, sueldo, jefe)
        jefe.hijos[id_colaborador] = colaborador
        
    def soy_nuevo(self):
        
        if not self.hijos and self.tiempo_servicio < 2:
            self.sueldo = self.sueldo * 0.1
            return True
        return False
            
    def jerarquia(self, id_colaborador):
        colaborador = self.obtener_nodo(id_colaborador)
        return colaborador.jefes()
    
    def jefes(self):
        if not self.jefe:
            return [self.nombre]
        
        lista_jefes = self.jefe.jefes()
        lista_jefes.append(self.nombre)
        
        return lista_jefes
    
    def mas_nuevo_bfs(self):
        """Método que recorre el arbol utilizando BFS, con la condición de que al encontrar
        una persona nueva se termine el recorrido"""

        # Utilizamos el mismo método visto en clases
        cola = deque()
        cola.append(self)
        while len(cola) > 0:
            nodo_actual = cola.popleft()
            yield nodo_actual
            # En el caso de que el nodo actual cumpla las condiciones, terminamos el recorrido
            if nodo_actual.soy_nuevo():
                break
            for hijo in nodo_actual.hijos.values():
                cola.append(hijo)
    
    def mas_nuevo_dfs(self):
        """Método que recorre el arbol utilizando DFS, con la condición de que al encontrar
        a una persona nueva se termine el recorrido"""

        yield self
        # Despues de devolver el nodo en la iteración, revisamos si el nodo cumple la condición. Si
        # es que se cumple, retornamos True.
        if self.soy_nuevo():
            return True
        for subarbol in self.hijos.values():
            # El valor de la variable encontrado será None hasta que se encuentre un nodo indicado.
            # En ese caso, se devuelve True en todas las subrutinas, terminandolas.
            encontrado = yield from subarbol.mas_nuevo_dfs()
            if encontrado:
                return True


In [None]:
empresa = Empresa(0, "Carla", 15, 100)
empresa.agregar_nodo(0, 1, "James", 10, 90)
empresa.agregar_nodo(0, 2, "Juanita", 8, 94)
empresa.agregar_nodo(0, 3, "Carlos", 9, 92)
empresa.agregar_nodo(1, 4, "Maca", 5, 60)
empresa.agregar_nodo(1, 5, "Antonia", 6, 63)
empresa.agregar_nodo(2, 6, "José", 7, 67)
empresa.agregar_nodo(2, 7, "Esteban", 4, 45)
empresa.agregar_nodo(3, 8, "Tere", 3, 44)
empresa.agregar_nodo(3, 9, "Pablo", 1, 41)

In [None]:
print(empresa.jerarquia(9))
print(30 * "-")
print("Busqueda DFS")
for i in empresa.mas_nuevo_dfs():
    print(f"{i.nombre} -> {i.id_colaborador}")
print("")
print(30 * "-")
print("Busqueda BFS")
for i in empresa.mas_nuevo_bfs():
    print(f"{i.nombre} -> {i.id_colaborador}")