<p>
<font size='5' face='Georgia, Arial'>IIC-2233 Apunte Programación Avanzada</font><br>
<font size='1'>&copy; 2015-2016 Karim Pichara - Christian Pieringer <sup>1</sup>. Todos los derechos reservados.</font>
</p>

En esta sección describiremos un conjunto de estructuras de datos basadas en una estructura base llama **nodo**. Un **nodo** representa a un ítem y sus elementos, y mantiene una o más referencias con sus nodos vecinos con la finalidad de representar estructuras de datos más complejas.

# Árboles

Los árboles corresponden a una estructura de datos no lineal, en donde los objetos están estructurados <b>jerárquicamente</b>. A diferencia de las estructuras basadas en arreglos como colas y pilas, en los árboles los objetos quedan ordenados <i>sobre</i> y <i>debajo</i> de acuerdo a esta jerarquía. Cada elemento en el árbol se denomina <b>nodo</b>. El primer nodo en el árbol recibe el nombre de <b>raíz</b> (root). A excepción del nodo raíz, cada nodo del árbol tiene un <i><b>padre</b></i> y cero o más nodos <i><b>hijos</b></i>. Los nodos provenientes de un mismo padre se denominan nodos <b>hermanos</b> y los nodos en la línea de descendencia del nodo padre se conocen como ancestros.

Formalmente, un árbol <b>T</b> que ordena los objetos bajo una relación <i>padre-hijo</i> tiene las siguientes propiedades:

- Si <b>T</b> no está vacío, tienen un nodo <i>raíz</i> que no tiene padres
- Cada nodo <i>c</i> en <b>T</b> distinto de la raíz, tiene un único padre <i>p</i>, y todos los nodos <i>c</i> que tienen por padre a <i>p</i> son hijos de <i>p</i>.

En la figura a continuación, el árbol mostrado tiene como nodo raíz al reino animal. Este nodo tiene dos nodos hijos: Vertebrados e Invertebrados. Otro ejemplo dentro del mismo árbol es el nodo Gusanos que tiene como nodo padre al nodo Invertebrados, pero tiene cero nodos hijos.

![](img/trees-example.png)

<p>
Un <b>vértice</b> corresponde a la conexión entre un par de nodos (<i>u</i>, <i>v</i>) que tienen una relación directa. Cada nodo tiene solo un vértice entrante, y cero o varios vértices salientes. La secuencia ordenada de nodos consecutivos unidos por un vértice a lo largo de árbol <b>T</b> forman un <b>camino</b>. En la figura anterior, los nodos <i>Peces</i> y <i>Oseos</i> un vértice, y están en el camino <i>Reino Animal-Vertebrados-Peces-Oseos</i>. Los nodos que no tienen hijos se conocen como nodos <b>hoja</b> (leaf node). Así, todos los nodos que no son hoja ni raíz se denominan nodos <b>interiores</b>.
</p>

<p>
La <b>profundidad</b> (depth) de un nodo <i>u</i> se denomina como el número de áncestros que existen entre el nodo raíz y el nodo <i>u</i>, excluyendo el nodo. Así mismo, la <b>altura</b> (height) del árbol corresponde al máximo de las profundidades alcanzada por los nodos hojas. Por ejemplo en la figura anterior, el nivel del nodo Peces es 2, y la profundidad del árbol es 3.
</p>

## Árboles de Estructura Enlazada 

Un forma de poder representar un árbol consiste en modelar cada nodo como un objeto con las propiedades de: id_nodo, id_padre, hijos y el valor almacenado en ese nodo. Cada nodo es en sí un árbol y podemos crear el árbol completo agregando nodos incrementalmente.

In [2]:
class Arbol:
    # Creamos la estructura básica del árbol. Los nodos hijos pueden ser guardados en alguna 
    # estructura como listas o diccionarios. Sin pérdidad de generalidad, en este ejemplo los
    # nodos hijos serán guardados en un diccionario.
    
    def __init__(self, id_nodo, valor=None, id_padre=None):
        self.id_nodo = id_nodo
        self.id_padre = id_padre
        self.valor = valor
        self.hijos = {}       
    
    def agregar_nodo(self, id_nodo, valor=None, id_padre=None):
        # Cada vez que agregamos un nodo verificamos primero si corresponde al nodo padre 
        # donde queremos agregar el nuevo nodo. Si no es el nodo, buscamos recursivamente 
        # a través de todos los nodos existentes hasta que encontremos el nodo correspondiente.
        
        if self.id_nodo == id_padre:
            # Si el nodo es el nodo padre, entonces actualizamos el diccionario 
            # con los hijos
            
            self.hijos.update({id_nodo: Arbol(id_nodo, valor, id_padre)})
            
        else:
            # Si no, recursivamente seguimos buscando en el árbol el nodo padre
            
            for hijo in self.hijos.values():
                hijo.agregar_nodo(id_nodo, valor, id_padre)
                
    def obtener_nodo(self, id_nodo):
        # recursivamente obtenemos el nodo siempre y cuando exista la posicion.
        
        if self.id_nodo == id_nodo:
            return self
        else:
            for hijo in self.hijos.values():
                nodo = hijo.obtener_nodo(id_nodo)
                
                if nodo:
                    # retorna el nodo si es que existe en el árbol
                    return nodo
                             
    def __repr__(self):
        # Para visualizar el arbol redefinimos el método __repr__ para recorrer recursivamente
        # todos los nodos del árbol.
        
        def recorrer_arbol(raiz):
            for hijo in raiz.hijos.values():
                self.ret += "id-nodo: {} -> id_padre: {} -> valor: {}\n".format(hijo.id_nodo, hijo.id_padre, hijo.valor)
                recorrer_arbol(hijo)
                
            return self

        self.ret = 'RAIZ:\nroot-id: {} -> valor: {}\n\nHIJOS:\n'.format(self.id_nodo, self.valor)
        recorrer_arbol(self)        
        return self.ret

Para crear y poblar el árbol, utilicemos el árbol de ejemplo mostrado en la siguiente figura. Cada nodo tiene el valor almacenado y su ID.
![](img/ejemplo_arbol.png)

In [5]:
T = Arbol(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)


# Desplegamos el árbol según se definió en el método __repr__
print(T)
print(T.id_nodo)

RAIZ:
root-id: 0 -> valor: 10

HIJOS:
id-nodo: 1 -> id_padre: 0 -> valor: 8
id-nodo: 3 -> id_padre: 1 -> valor: 4
id-nodo: 5 -> id_padre: 3 -> valor: 1
id-nodo: 4 -> id_padre: 1 -> valor: 9
id-nodo: 2 -> id_padre: 0 -> valor: 12
id-nodo: 6 -> id_padre: 2 -> valor: 18

0


Si queremos obtener un nodo específico utilizamos el método *obtener_nodo()* el que recursivamente busca por el id del nodo. En este ejemplo el método retorna todo el objeto el nodo.

In [6]:
nodo = T.obtener_nodo(6)
print('El ID del nodo es {}'.format(nodo.id_nodo))

nodo = T.obtener_nodo(1)
print('El nodo tiene {} hijos'.format(len(nodo.hijos)))


El ID del nodo es 6
El nodo tiene 2 hijos


## Recorrido de un Árbol

El recorrido de un árbol o también conocido como <i>Tree traversal</i>, corresponde a la forma de accesar o visitar sistemáticamente todos los nodos de un árbol <b>T</b>. Existen dos formas principales: recursivas y no recursivas. Entre los métodos recursivos para visitar los nodos se encuentran: pre-order traversal y post-order traversal. Dentro de los métodos no recursivos más populares se encuentran: Breadth First Search y Depth First Search.

### Recorridos Recursivos


#### Pre-Order Traversal

En esta forma de recorrer el árbol nodo raíz se visita primero, y luego su hijos son recorridos recursivamente.

In [9]:
class ArbolPreOrder(Arbol):
    # Heredamos de la clase original del Arbol y hacemos override del metodo recorrer_arbol para recorrer el árbol 
    # usan do pre-order
    def __repr__(self):        
        def recorrer_arbol(raiz):
            self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(raiz.id_nodo, raiz.id_padre, raiz.valor)
            for hijo in raiz.hijos.values():
                recorrer_arbol(hijo)

        self.ret = ''
        recorrer_arbol(self)
        
        return self.ret
    
# Poblamos el árbol con los datos usados en el caso anterior de árbol
T = ArbolPreOrder(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

nodo_id: 0, id_padre: None -> valor: 10
nodo_id: 1, id_padre: 0 -> valor: 8
nodo_id: 3, id_padre: 1 -> valor: 4
nodo_id: 5, id_padre: 3 -> valor: 1
nodo_id: 4, id_padre: 1 -> valor: 9
nodo_id: 2, id_padre: 0 -> valor: 12
nodo_id: 6, id_padre: 2 -> valor: 18



#### Post-Order Traversal

En esta modalidad de recorrido primero se visita recursivamente los sub-arboles generados por los nodos hijos y finalmente el nodo raíz.

In [10]:
class ArbolPostOrder(Arbol):
    # Heredamos de la clase original del Arbol e implementamos el PostOrder para el recorrido del arbol
    def __repr__(self):
        def recorrer_arbol(raiz):
            # primero recorremos recursivamente los hijos
            for hijo in raiz.hijos.values():
                recorrer_arbol(hijo)
            
            # Finalmente visitamos el nodo raíz
            self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(raiz.id_nodo, raiz.id_padre, raiz.valor)

        self.ret = ''
        recorrer_arbol(self)
        return self.ret
    
# Poblamos el árbol usando los mismo datos que en el caso original
T = ArbolPostOrder(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

nodo_id: 5, id_padre: 3 -> valor: 1
nodo_id: 3, id_padre: 1 -> valor: 4
nodo_id: 4, id_padre: 1 -> valor: 9
nodo_id: 1, id_padre: 0 -> valor: 8
nodo_id: 6, id_padre: 2 -> valor: 18
nodo_id: 2, id_padre: 0 -> valor: 12
nodo_id: 0, id_padre: None -> valor: 10



### Recorridos No Recursivos

En métodos recorren los nodos del árbol sin recursión utilizando otras estructuras de datos auxiliares para manejar los nodos visitados.


#### Bread-First Search (BFS)

El enfoque **Breadth First Search** consiste en recorrer el árbol por nivel, siendo primero visitados todos los nodos de más arriba en la jerarquía del árbol. Para ejecutar el recorrido utiliza una **cola** para almacenar los nodos por visitar. En estructuras jerárquicas más complejas que los árboles, como por ejemplo un grafo no dirijido, es necesario también mantener un listado de los nodos que han sido visitados y de esta forma evitar que existan loops infinitos entre nodos.


In [11]:
from collections import deque


class ArbolBFS(Arbol):
    # Heredamos de la clase original del Arbol y modificamos el metodo recorrer_arbol para usar 
    # el Breadth-first Search
    
    def __repr__(self):
        
        def recorrer_arbol(raiz):
            
            # Utiliamos una cola para almacenar los nodos por visitar
            Q = deque()
            Q.append(raiz)
            
            # Utilizamos una lista para registrar los nodos visitados
            visitados = []
            
            while len(Q) > 0:                
                p = Q.popleft()
                
                if p.id_nodo not in visitados:
                    
                    # Revisamos si el nodo ha sido visitado. Si no ha sido visitado
                    # lo agregamos a la lista de visitados
                    
                    visitados.append(p.id_nodo)

                    #visitamos el nodo
                    self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(
                        p.id_nodo, p.id_padre, p.valor)
                
                    # Agregamos todos los nodos hijos a la cola por visitar
                    for hijo in p.hijos.values():
                        Q.append(hijo)
                    

        self.ret = ''
        recorrer_arbol(self)
        return self.ret
    
# Poblamos el árbol con los datos utilizados en los casos anteriores
T = ArbolBFS(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

nodo_id: 0, id_padre: None -> valor: 10
nodo_id: 1, id_padre: 0 -> valor: 8
nodo_id: 2, id_padre: 0 -> valor: 12
nodo_id: 3, id_padre: 1 -> valor: 4
nodo_id: 4, id_padre: 1 -> valor: 9
nodo_id: 6, id_padre: 2 -> valor: 18
nodo_id: 5, id_padre: 3 -> valor: 1



#### Depth First Search (DFS)

El enfoque **Depth First Search** consiste en recorrer el árbol por profundidad, siendo primero visitados todos los nodos de más arriba en la jerarquía del árbol. Para ejecutar el recorrido utiliza una **pila** para almacenar los nodos por visitar. Al igual que en el caso de BFS, es necesario mantener un listado de los nodos que han sido visitados para evitar que existan loops infinitos entre nodos cuando recorremos estructuras jérarquicas más complejas.

In [12]:
from collections import deque

class ArbolDFS(Arbol):
    
    # Heredamos de la clase original del Arbol y modificamos el metodo recorrer_arbol para usar 
    # el Depth-first Search (DFS)
    
    def __repr__(self):
        
        def recorrer_arbol(raiz):
            
            # En DPS utilizamos un stack para almacenar los nodos por visitar          
            Q = deque()
            Q.append(raiz)
            
            # Utilizaremos una lista para marcar los nodos visitados
            visitados = []

            while len(Q) > 0:                
                p = Q.pop()
                
                if p.id_nodo not in visitados:
                    
                    # Revisamos si el nodo ha sido visitado. Si no ha sido visitado
                    # lo agregamos a la lista de visitados
                    
                    visitados.append(p.id_nodo)
                    
                    self.ret += "nodo_id: {}, id_padre: {} -> valor: {}\n".format(
                        p.id_nodo, p.id_padre, p.valor)

                    for hijo in p.hijos.values():
                        Q.append(hijo)
        
        self.ret = ''
        recorrer_arbol(self)
        
        return self.ret
    
    
# Poblamos el árbol con los datos utilizados en los casos anteriores
T = ArbolDFS(0, 10)
T.agregar_nodo(1, 8, 0)
T.agregar_nodo(2, 12, 0)
T.agregar_nodo(3, 4, 1)
T.agregar_nodo(4, 9, 1)
T.agregar_nodo(5, 1, 3)
T.agregar_nodo(6, 18, 2)

print(T)

nodo_id: 0, id_padre: None -> valor: 10
nodo_id: 2, id_padre: 0 -> valor: 12
nodo_id: 6, id_padre: 2 -> valor: 18
nodo_id: 1, id_padre: 0 -> valor: 8
nodo_id: 4, id_padre: 1 -> valor: 9
nodo_id: 3, id_padre: 1 -> valor: 4
nodo_id: 5, id_padre: 3 -> valor: 1



# Árbol Binario

Los árboles binarios son un caso particular de las estructuras de datos tipo árbol, en donde:

- cada nodo tiene como máximo dos nodos hijo
- cada nodo hijo está etiquedado como <b>hijo-izquierdo</b> o bien <b>hijo-derecho</b>, y
- en términos de precedencia, el hijo-izquierdo precede al hijo-derecho.

En un árbol binario el máximo número de nodos crece en forma exponencial. Sea el <b>nivel</b> <i>d</i> de un arbol <b>T</b> el conjunto de todos los nodos ubicados a la misma profundidad <i>d</i>. En el nivel <i>d</i> = 0 existe a lo más el nodo raíz. El nivel <i>d</i> = 2 tiene a lo más dos nodos, y así sucesivamente. Al nivel <i>d</i>, el árbol debe tener como máximo 2<sup><i>d</i></sup> nodos. Se denomina árbol binario **completo** a aquel árbol en donde cada nodo padre del árbol presenta los dos nodos hijos, tal como se muestra en la siguiente figura.

![](img/binary-tree.png)

Un ejemplo real de árbol binario son los **árboles de decisión** en donde cada nodo interno y además la raíz están asociados a una pregunta, y cuyas respuestas (Si, No) quedan representadas en los dos nodos hijos. Otro ejemplo son las **operaciones artméticas**, en donde las variables son representadas por lo nodos hoja, y las operaciones por los nodos interiores.

## Árbol Binario de Estructura Enlazada

En esta implementación de árbol binario, modelaremos cada nodo como un objeto que tendrá por atributos las referencias al nodo padre, hijos, y el elemento en esa posición. Usaremos el valor <b>None</b> para señalar que un atributos particular no existe. Por ejemplo, si se modela el nodo padre, el atributo <i>padre = None</i>. A continuación el modelamiento queda de la siguiente forma:

In [2]:
class Nodo:
    def __init__(self, valor, padre=None):
        self.valor = valor
        self.padre = padre
        self.hijo_izquierdo = None
        self.hijo_derecho = None

    def __repr__(self):
        return 'padre: {0}, valor: {1}'.format(self.padre, self.valor)


class ArbolBinario:
    def __init__(self, nodo_raiz=None):
        self.nodo_raiz = nodo_raiz

    def agregar_nodo(self, valor):
        if self.nodo_raiz == None:
            self.nodo_raiz = Nodo(valor)
        else:
            temp = self.nodo_raiz
            agregado = False

            while not agregado:
                # Recursivamente recorremos el árbol revisando cada nodo usando
                # alguna regla. En este caso si el valor del nuevo nodo es mayor 
                # o no que el valor del nodo revisado.
                
                if valor <= temp.valor:
                    if temp.hijo_izquierdo == None:
                        # Si no hay nodo izquierdo, agregamos el nuevo nodo
                        temp.hijo_izquierdo = Nodo(valor, temp.valor)
                        agregado = True
                    else:
                        # Si ya existe un nodo izquierdo seguimos revisando
                        temp = temp.hijo_izquierdo
                else:
                    if temp.hijo_derecho == None:
                        # Si no hay un nodo derecho, agregamos el valor como 
                        # un nuevo nodo
                        temp.hijo_derecho = Nodo(valor, temp.valor)
                        agregado = True
                    else:
                        # Si ya hay un nodo seguimos buscando en profundidad
                        temp = temp.hijo_derecho

    def __repr__(self):
        def recorrer(nodo, lado="r"):
            ret = ''

            if nodo != None:
                ret += '{0} -> {1}\n'.format(nodo, lado)
                ret += recorrer(nodo.hijo_izquierdo, 'i')
                ret += recorrer(nodo.hijo_derecho, 'd')

            return ret

        ret = recorrer(self.nodo_raiz)
        return ret


T = ArbolBinario()
T.agregar_nodo(4)
T.agregar_nodo(1)
T.agregar_nodo(5)
T.agregar_nodo(3)
T.agregar_nodo(20)

print(T)

padre: None, valor: 4 -> r
padre: 4, valor: 1 -> i
padre: 1, valor: 3 -> d
padre: 4, valor: 5 -> d
padre: 5, valor: 20 -> d



In [7]:
class ArbolBinarioPreOrder(ArbolBinario):
    
    def __repr__(self):
        def recorrer(nodo, lado="r"):
            ret = ''

            if nodo != None:
                ret += '{0} -> {1}\n'.format(nodo, lado)
                ret += recorrer(nodo.hijo_izquierdo, 'i')
                ret += recorrer(nodo.hijo_derecho, 'd')

            return ret

        ret = recorrer(self.nodo_raiz)
        return ret


T = ArbolBinarioPreOrder()
T.agregar_nodo(4)
T.agregar_nodo(1)
T.agregar_nodo(5)
T.agregar_nodo(3)
T.agregar_nodo(20)

print(T)

padre: None, valor: 4 -> r
padre: 4, valor: 1 -> i
padre: 1, valor: 3 -> d
padre: 4, valor: 5 -> d
padre: 5, valor: 20 -> d



In [8]:
class ArbolBinarioInOrder(ArbolBinario):
    
    def __repr__(self):
        def recorrer(nodo, lado="r"):
            ret = ''

            if nodo != None:
                ret += recorrer(nodo.hijo_izquierdo, 'i')
                ret += '{0} -> {1}\n'.format(nodo, lado)
                ret += recorrer(nodo.hijo_derecho, 'd')

            return ret

        ret = recorrer(self.nodo_raiz)
        return ret


T = ArbolBinarioInOrder()
T.agregar_nodo(4)
T.agregar_nodo(1)
T.agregar_nodo(5)
T.agregar_nodo(3)
T.agregar_nodo(20)

print(T)

padre: 4, valor: 1 -> i
padre: 1, valor: 3 -> d
padre: None, valor: 4 -> r
padre: 4, valor: 5 -> d
padre: 5, valor: 20 -> d



In [9]:
class ArbolBinarioPostOrder(ArbolBinario):
    
    def __repr__(self):
        def recorrer(nodo, lado="r"):
            ret = ''

            if nodo != None:
                ret += recorrer(nodo.hijo_izquierdo, 'i')
                ret += recorrer(nodo.hijo_derecho, 'd')
                ret += '{0} -> {1}\n'.format(nodo, lado)

            return ret

        ret = recorrer(self.nodo_raiz)
        return ret


T = ArbolBinarioPostOrder()
T.agregar_nodo(4)
T.agregar_nodo(1)
T.agregar_nodo(5)
T.agregar_nodo(3)
T.agregar_nodo(20)

print(T)

padre: 1, valor: 3 -> d
padre: 4, valor: 1 -> i
padre: 5, valor: 20 -> d
padre: 4, valor: 5 -> d
padre: None, valor: 4 -> r



# Listas Ligadas

Las listas ligadas pueden ser consideradas como un caso particular de árbol. Corresponden a una secuencia de nodos, donde cada nodo posee un solo nodo del cual proviene o **nodo padre** y un solo nodo descendiente o **hijo**. El primer nodo de la lista es denominado <b>cabeza</b> (head), y el último <b>cola</b> (tail). Los nodos pueden ser modelados por un objeto cuyos atributos son: <b>valor</b> y <b>próximo</b> (next). El campo *next* contiene la referencia al siguiente nodo de la lista. En el nodo cola, el atributo next queda vacío o None.

![](img/linked-list.png)


In [13]:
class Nodo:
    # Creamos la estructura del nodo
    
    def __init__(self, valor=None):
        self.siguiente = None
        self.valor = valor

class ListaLigada:
    def __init__(self):
        self.cola = None
        self.cabeza = None

    def agregar_nodo(self, valor):
        if not self.cabeza:
            # Revisamos si el nodo cabeza tiene un nodo asignado.
            # Si no tiene nodo, creamos un nodo
            self.cabeza = Nodo(valor)
            self.cola = self.cabeza
        else:
            # Si ya tiene un nodo
            self.cola.siguiente = Nodo(valor)
            self.cola = self.cola.siguiente

    def obtener(self, posicion):
        nodo = self.cabeza
        
        for i in range(posicion):
            if nodo:
                nodo = nodo.siguiente
        if not nodo:
            return "posicion no encontrada"
        else:
            return nodo.valor

    def __repr__(self):
        rep = ''
        nodo_actual = self.cabeza
        
        while nodo_actual:
            rep += '{0}->'.format(nodo_actual.valor)
            nodo_actual = nodo_actual.siguiente
        
        return rep
    
l = ListaLigada()
l.agregar_nodo(2)
l.agregar_nodo(4)
l.agregar_nodo(7)

print(l.obtener(2))
print(l.obtener(1))

print(l)

7
4
2->4->7->


<font size='1' face='Arial'><sup>1</sup>Agradecemos a los ayudantes del curso Belén Saldías, Ivania Donoso, Patricio López, Jaime Castro, Rodrigo Gómez y Marco Bucchi por su colaboración durante la revisión de este material.</font>