<p>
<font size='5' face='Georgia, Arial'>IIC2115 - Programación como herramienta para la ingeniería</font><br>
<font size='1'>Basado en material de Karim Pichara y Christian Pieringer. Todos los derechos reservados.</font>
</p>

En esta sección describiremos un conjunto de estructuras de datos basadas en una estructura base llama __nodo__. Un __nodo__ representa a un ítem y sus elementos, y mantiene una o más referencias con sus nodos vecinos con la finalidad de representar estructuras de datos más complejas.

# Árboles

Los árboles corresponden a una estructura de datos no lineal, en donde los objetos están estructurados __jerárquicamente__. A diferencia de las estructuras basadas en arreglos como colas y stacks, en los árboles los objetos quedan ordenados _sobre_ y _debajo_ de acuerdo a esta jerarquía. Cada elemento en el árbol se denomina __nodo__. El primer nodo en el árbol recibe el nombre de __raíz__ (root). A excepción del nodo raíz, cada nodo del árbol tiene un __padre__ y cero o más nodos __hijos__. Los nodos provenientes de un mismo padre se denominan __hermanos__ y los nodos en la línea de descendencia del nodo padre se conocen como __ancestros__.

Formalmente, un árbol __T__ que ordena los objetos bajo una relación _padre-hijo_ tiene las siguientes propiedades:

- Si __T__ no está vacío, tiene un nodo _raíz_ que no tiene padres
- Cada nodo _c_ en __T__ distinto de la raíz, tiene un único padre _p_, y todos los nodos _c_ que tienen por padre a _p_ son hijos de _p_.

En la figura a continuación, el árbol mostrado tiene como nodo raíz al reino animal. Este nodo tiene dos nodos hijos: Vertebrados e Invertebrados. Otro ejemplo dentro del mismo árbol es el nodo Gusanos que tiene como nodo padre al nodo Invertebrados, pero tiene cero nodos hijos.

![](figs/trees-example.png)

Un __vértice__ corresponde a la conexión entre un par de nodos (_u_, _v_) que tienen una relación directa. Cada nodo tiene solo un vértice entrante y cero o varios vértices salientes. La secuencia ordenada de nodos consecutivos unidos por un vértice a lo largo de árbol __T__ forman un __camino__. En la figura anterior, los nodos _Peces_ y _Oseos_ están unidos por un vértice, y están en el camino _Reino Animal-Vertebrados-Peces-Oseos_. Los nodos que no tienen hijos se conocen como nodos __hoja__ (_leaf nodes_). Así, todos los nodos que no son hoja ni raíz se denominan nodos __interiores__.


La __profundidad__ (depth) de un nodo _u_ se denomina como el número de áncestros que existen entre el nodo raíz y el nodo _u_, excluyendo el nodo. Así mismo, la __altura__ (height) del árbol corresponde al máximo de las profundidades alcanzada por los nodos hojas. Por ejemplo en la figura anterior, el nivel del nodo Peces es 2, y la profundidad del árbol es 3.

## Árboles de Estructura Enlazada 

Un forma de poder representar un árbol consiste en modelar cada nodo como un objeto con las propiedades de un nodo: id_nodo, id_padre, hijos y el valor almacenado en ese nodo. Cada nodo es en sí un árbol y podemos crear el árbol completo agregando nodos incrementalmente.

In [None]:
class Arbol:
    # Creamos la estructura básica del árbol. Los nodos hijos pueden ser guardados en alguna 
    # estructura como listas o diccionarios. Sin pérdidad de generalidad, en este ejemplo los
    # nodos hijos serán guardados en un diccionario.
    
    def __init__(self, id_nodo, valor=None, id_padre=None):
        self.id_nodo = id_nodo
        self.id_padre = id_padre
        self.valor = valor
        self.hijos = {}       
    
    def agregar_nodo(self, id_nodo, valor=None, id_padre=None):
        # Cada vez que agregamos un nodo verificamos primero si corresponde al nodo padre 
        # donde queremos agregar el nuevo nodo. Si no es el nodo, buscamos recursivamente 
        # a través de todos los nodos existentes hasta que encontremos el nodo correspondiente.
        
        if self.id_nodo == id_padre:
            # Si el nodo es el nodo padre, entonces actualizamos el diccionario 
            # con los hijos
            
            self.hijos.update({id_nodo: Arbol(id_nodo, valor, id_padre)})
            
        else:
            # Si no, recursivamente seguimos buscando en el árbol el nodo padre
            
            for hijo in self.hijos.values():
                hijo.agregar_nodo(id_nodo, valor, id_padre)
                
    def obtener_nodo(self, id_nodo):
        # recursivamente obtenemos el nodo siempre y cuando exista la posicion.
        
        if self.id_nodo == id_nodo:
            return self
        else:
            for hijo in self.hijos.values():
                nodo = hijo.obtener_nodo(id_nodo)
                
                if nodo:
                    # retorna el nodo si es que existe en el árbol
                    return nodo
                             
    def __repr__(self):
        # Para visualizar el arbol redefinimos el método __repr__ para recorrer recursivamente
        # todos los nodos del árbol.
        
        def recorrer_arbol(raiz):
            for hijo in raiz.hijos.values():
                self.ret += "id-nodo: {} -> id_padre: {} -> valor: {}\n".format(hijo.id_nodo, hijo.id_padre, hijo.valor)
                recorrer_arbol(hijo)
                
            return self

        self.ret = 'RAIZ:\nroot-id: {} -> valor: {}\n\nHIJOS:\n'.format(self.id_nodo, self.valor)
        recorrer_arbol(self)        
        return self.ret

Para crear y poblar el árbol, utilicemos el árbol de ejemplo mostrado en la siguiente figura. Cada nodo tiene el valor almacenado y su ID.
![](figs/ejemplo_arbol.png)

In [None]:
T = Arbol(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

# Desplegamos el árbol según se definió en el método __repr__
print(T)

Si queremos obtener un nodo específico utilizamos el método *obtener_nodo()* el que recursivamente busca por el id del nodo. En este ejemplo el método retorna todo el objeto el nodo.

In [None]:
nodo = T.obtener_nodo(6)
print('El ID del nodo es {}'.format(nodo.id_nodo))

nodo = T.obtener_nodo(1)
print('El nodo tiene {} hijos'.format(len(nodo.hijos)))


## Recorrido de un Árbol

El recorrido de un árbol o también conocido como _Tree traversal_, corresponde a la forma de accesar o visitar sistemáticamente todos los nodos de un árbol __T__. Existen múltiples formas de hacerlo, pero en este curso nos centraremos en dos esquemas: Breadth First Search (BFS) y Depth First Search (DFS).


#### Bread-First Search (BFS)

El enfoque **Breadth First Search** consiste en recorrer el árbol por nivel, siendo primero visitados todos los nodos de más arriba en la jerarquía del árbol. Para ejecutar el recorrido utiliza una **cola** para almacenar los nodos por visitar.

In [None]:
from collections import deque

class ArbolBFS(Arbol):
    # Heredamos de la clase original del Arbol y modificamos el metodo recorrer_arbol para usar 
    # el Breadth-first Search
    
    def __repr__(self):
        
        def recorrer_arbol(raiz):
            
            # Utiliamos una cola para almacenar los nodos por visitar
            Q = deque()
            Q.append(raiz)
            
            # Utilizamos una lista para registrar los nodos visitados
            visitados = []
            
            while len(Q) > 0:                
                p = Q.popleft()
                
                if p.id_nodo not in visitados:
                    
                    # Revisamos si el nodo ha sido visitado. Si no ha sido visitado
                    # lo agregamos a la lista de visitados
                    
                    visitados.append(p.id_nodo)

                    #visitamos el nodo
                    self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(
                        p.id_nodo, p.id_padre, p.valor)
                
                    # Agregamos todos los nodos hijos a la cola por visitar
                    for hijo in p.hijos.values():
                        Q.append(hijo)
                    
            return self

        self.ret = ''
        recorrer_arbol(self)
        return self.ret
    
# Poblamos el árbol con los datos utilizados en los casos anteriores
T = ArbolBFS(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 4, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

#### Depth First Search (DFS)

El enfoque **Depth First Search** consiste en recorrer el árbol por profundidad, llegando siempre hasta el final de cada camino. Para ejecutar el recorrido utiliza una _stack_ para almacenar los nodos por visitar.

In [None]:
from collections import deque

class ArbolDFS(Arbol):
    
    # Heredamos de la clase original del Arbol y modificamos el metodo recorrer_arbol para usar 
    # el Depth-first Search (DFS)
    
    def __repr__(self):
        
        def recorrer_arbol(raiz):
            
            # En DPS utilizamos un stack para almacenar los nodos por visitar          
            Q = deque()
            Q.append(raiz)
            
            # Utilizaremos una lista para marcar los nodos visitados
            visitados = []

            while len(Q) > 0:                
                p = Q.pop()
                
                if p.id_nodo not in visitados:
                    
                    # Revisamos si el nodo ha sido visitado. Si no ha sido visitado
                    # lo agregamos a la lista de visitados
                    
                    visitados.append(p.id_nodo)
                    
                    self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(
                        p.id_nodo, p.id_padre, p.valor)

                    for hijo in p.hijos.values():
                        Q.append(hijo)

            return self
        
        self.ret = ''
        recorrer_arbol(self)
        
        return self.ret
    
    
# Poblamos el árbol con los datos utilizados en los casos anteriores
T = ArbolDFS(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 4, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

<font size='1' face='Arial'><sup>1</sup>Agradecemos a los (ex) ayudantes del curso Programación Avanzada Belén Saldías, Ivania Donoso, Patricio López, Jaime Castro, Rodrigo Gómez y Marco Bucchi por su colaboración durante la revisión de este material.</font>