# Árboles Binarios

## Un breve paréntesis: grafos

Para este punto del contenido, hay algo de lo que ya sabes, pero quizás no sabes que lo sabes: grafos. Es de esas cosas que ya has visto, pero no sabías cómo se les llamaba. Bueno, primero te daré una breve descripción de qué es un grafo, y seguro que recuerdas qué de lo que ya has hecho antes es un grafo:

> **Grafo:** Conjunto de nodos unidos por aristas, comunmente representados como flechas o líneas, gráficamente, en el que un nodo puede apuntar a uno o más nodos. Estas aristas pueden ser dirigidas, donde un nodo apunta directamente a otro nodo, o no dirigidas, donde todos los nodos que se conectan por una arista apuntan entre sí, bilateralmente.

![no_dirigido](https://upload.wikimedia.org/wikipedia/commons/6/67/Kaari_suuntaamaton_graafiteoria.png) ![dirigido](https://upload.wikimedia.org/wikipedia/commons/3/32/Kaari_suunnattu_graafiteoria.png)

¿Te recuerda a algo? Todas las estructuras de datos en las que un nodo apunta a otro, con las que hemos trabajado, son grafos. Más precisamente, son grafos dirigidos unidireccionales; esto significa que todos los nodos apuntan sólo a un otro nodo, y en una sola dirección. Las listas ligadas, las pilas y colas, todas siguen el mismo principio de unidireccionalidad.

Pero, como viene implícito en la definición, los grafos vienen en muchas formas y tamaños, y pueden representar muchas cosas distintas, dependiendo de cómo esté compuesto el grafo, y qué tipo de información contengan sus nodos, o qué representen.

![grafo](https://upload.wikimedia.org/wikipedia/commons/5/5b/6n-graf.svg)

Los grafos se pueden utilizar para muchas cosas distintas, las más notables cuando se trata de programación, casi siempre se relacionan con estructuras jerárquicas, o pueden tener aplicaciones relacionadas con mapas y sus derivados, como encontrar el camino más corto de un nodo a otro, si cada nodo representa una ciudad, y las aristas un camino.

En este caso, nos vamos a enfocar en uno que es de los más comunes: árboles.

## Un tipo de grafo peculiar: Árboles

Es un tanto largo explicar la importancia de los árboles y la clase de algoritmos en que se utilizan, pero casi todos están enfocados en ordenar jerárquicamente elementos, comúnmente para entender relaciones entre objetos, o hacer búsquedas rápidas de algún elemento en específico.

Un ejemplo sencillo para entender la estructura de un árbol, es un árbol genealógico. Seguro que alguna vez lo has visto; esos dibujos donde están dos pares de abuelos, que tuvieron hijos, que a su vez tuvieron más hijos y así.

![arbol_genealogico](https://cdn.pixabay.com/photo/2014/03/25/17/00/family-tree-297812_960_720.png)

Bueno, pues con los árboles en programación es algo casi exactamente idéntico, con los detalles que hablamos sobre los grafos: los elementos del árbol son nodos y cada nodo tiene aristas que apuntan a uno o más de sus descendientes, todos los nodos "hijos" tiene exclusivamente **un nodo padre**, por lo que ningún nodo "hermano" comparte descendientes, o sea, no puede haber dos nodos distintos conectados a un mismo nodo descendiente. Dicho de otra forma, un nodo hijo no puede ser hijo del "papá" y del "tío" al mismo tiempo.

Y dejando de lado esas relaciones familiares que podrían haber sido comunes en la edad media, nos concentraremos en un tipo de árbol específico: los árboles binarios.

## Ahora sí, árboles binarios

Los árboles binarios tienen una particularidad adicional a las que ya mencionamos de los árboles en general: pueden tener como **máximo** dos nodos descendientes, lo cual significa que cada nodo puede tener como mínimo 0 descendientes y como máximo dos.

### Implementación en Python

La implementación de un árbol en Python es casi idéntica a las de una lista ligada, sólo que al primer nodo, en lugar de llamarle "cabeza" o "tope" se le llama "raíz" (porque es donde empieza el árbol), y cada nodo, además del valor que contiene, en vez de tener un nodo "siguiente" tiene referencias a dos nodos; "izquierda" y "derecha", ambos inicializados como referencias vacías.

In [1]:
class Nodo:
    def __init__(self, valor):
        self.valor = valor
        self.izquierda = None
        self.derecha = None

class Arbol:
    def __init__(self, valor_raiz):
        self.raiz = Nodo(valor_raiz)

arbolito = Arbol(4)
arbolito.raiz.izquierda = Nodo(2)
arbolito.raiz.derecha = Nodo(6)
arbolito.raiz.izquierda.izquierda = Nodo(1)
arbolito.raiz.izquierda.derecha = Nodo(3)
arbolito.raiz.derecha.izquierda = Nodo(5)

Trata de imaginar en forma de grafo el árbol que se inicializó en el bloque de código anterior. Trata de dibujarlo antes de continuar leyendo.

Ahora sí, si visualizamos el grafo que representa nuestro árbol, se vería de la siguiente manera

```
     4
   /   \
  2     6
 / \   /
1   3 5

```

Este árbol cumple con la definición de un árbol binario:
- Nodo 1: tiene dos nodos hijo (2 y 3)
- Nodo 2: tiene dos nodos hijo (4 y 5)
- Nodo 3: tiene un nodo hijo (6)
- Nodos 4, 5 y 6: tienen 0 nodos hijo.

Más específicamente, representa un árbol de búsqueda binaria, en el que cada nodo tiene como nodo izquierdo un valor menor a sí mismo, y como nodo derecho un valor mayor a sí mismo, que, como podrás notar, es el caso de este árbol, porque, por ejemplo, el nodo 2 tiene a la izquierda un "1" y a la derecha un "3", ambos cumplen la condición para que forme parte de un árbol binario. Al mismo tiempo, el nodo "4" en la raíz tiene a la izquierda un "2" y un nodo "6" a la derecha, y finalmente, el nodo "6" tiene el nodo "5", que es menor a "6".

Todos los nodos del árbol tienen entre 0 y 2 hijos, ninguno tiene más. Como detalle adicional, a los nodos que están al final del árbol, en la parte más baja, se les llama "hojas". Como te darás cuenta, cuando hablamos de árboles en este contexto, los árboles se representan al revés que como normalmente los visualizamos; la raíz está en la parte más alta y las hojas en la parte más baja, pero si quieres verlo como normalmente lo harías, sólo tienes que voltear de cabeza el dibujo de tu árbol.

## Recorrer un árbol binario

Ahora quizás pienses algo parecido que nos pasó cuando empezamos a crear las primeras listas ligadas ¿cómo sé hasta dónde llega mi árbol? ¿Tengo que escribir `arbol.izquierda.izquierda.izquierda...` hasta que encuentre un error? Y la respuesta, igual que entonces es: no. La diferencia con las listas ligadas es que, teniendo dos posibles caminos en cada nodo, nos da más de una manera de recorrer el árbol, los más comunes siendo

- Pre-orden
- Post-orden
- En-orden

Los tres recorridos son muy parecidos en su implementación, con ligeras diferencias en el código, pero cambian por completo cómo se visualizan los contenidos de los nodos.

### Recorrido En-orden

El recorrido en-orden de un árbol binario imprime primero el contenido del sub-árbol izquierdo de cada nodo, después el contenido de sí mismo, y finalmente todo el contenido del sub-árbol derecho. Se le llama "en-orden" porque es común que los árboles tengan los valores más pequeños del lado izquierdo del árbol, y los valores mayores del lado derecho del árbol. En la siguiente lección profundizaremos en esa premisa, pero por el momento nos enfocaremos en recorrer el árbol.

El algoritmo de recorrido en-orden de un árbol es de la siguiente manera:

1. Visitar el nodo izquierdo (si no está vacío) y aplicar este algoritmo desde el principio
2. Imprimir el contenido del nodo actual
3. Visitar el nodo derecho (si no está vacío) y repetir desde el paso 1

Para nuestro ejemplo del árbol anterior, el recorido en-orden imprimiría los nodos en esta secuencia:

```
     4
   /   \
  2     6
 / \   /
1   3 5

Recorrido en-orden:
1, 2, 3, 4, 5, 6

# Visualización paso por paso del algoritmo:

-- Inicio --

Nodo actual: 4
Izquierda: 2
Derecha: 6
1. Visitar nodo izquierdo

  Nodo actual: 2
  Izquierda: 1
  Derecha: 3
  1. Visitar nodo izquierdo

    Nodo actual: 1
    Izquierda: Vacío
    Derecha: Vacío
    1. Visitar nodo izquierdo <- No se puede, no hay nodo izquierdo
    2. Imprimir contenido: "1"
    3. Visitar nodo derecho <- No se puede, no hay nodo derecho
    # Regresa un nivel arriba en la recursión
  
  Nodo actual: 2
  Izquierda: 1
  Derecha: 3
  2. Imprimir contenido actual: "2"
  3. Visitar nodo derecho
    
    Nodo actual: 3
    Izquierda: Vacío
    Derecha: Vacío
    1. Visitar nodo izquierdo <- No se puede, no hay nodo izquierdo
    2. Imprimir contenido: "3"
    3. Visitar nodo derecho <- No se puede, no hay nodo derecho
    # Regresa un nivel arriba en la recursión
  
  Nodo actual: 2
  Izquierda: 1
  Derecha: 3
  # Regresa un nivel arriba en la recursión

Nodo actual: 4
Izquierda: 2
Derecha: 6
2. Imprimir contenido: "4"
3. Visitar nodo derecho

  Nodo actual: 6
  Izquierda: 5
  Derecha: Vacío
  1. Visitar nodo izquierdo

    Nodo actual: 5
    Izquierda: Vacío
    Derecha: Vacío
    1. Visitar nodo izquierdo <- No se puede, no hay nodo izquierdo
    2. Imprimir contenido: "5"
    3. Visitar nodo derecho <- No se puede, no hay nodo derecho
    # Regresa un nivel arriba en la recursión

  Nodo actual: 6
  Izquierda: 5
  Derecha: Vacío
  2. Imprimir contenido: "6"
  3. Visitar nodo derecho <- No se puede, no hay nodo derecho
  # Regresa un nivel arriba en la recursión

Nodo actual: 4
Izquierda: 2
Derecha: 6
# Termina recursión

-- Fin recorrido --
```



### Recorrido Pre-orden

Este recorrido primero muestra el contenido del nodo actual antes de recorrer los sub-árboles izquierdo y derecho. El algoritmo es el siguiente:

1. Imprimir el contenido del nodo actual
2. Visitar el nodo izquierdo (si existe) y aplicar este algoritmo
3. Visitar el nodo derecho (si existe) y aplicar este algoritmo


```
     4
   /   \
  2     6
 / \   /
1   3 5

Recorrido pre-orden:
4, 2, 1, 3, 6, 5
```

### Recorrido Post-orden

Quizás lo sepas desde el nombre, este es el opuesto del recorrido Pre-orden, que primero visita ambos nodos hijo antes de imprimir su propio contenido. El algoritmo es el siguiente:

1. Visitar el nodo izquierdo (si existe) y aplicar este algoritmo
2. Visitar el nodo derecho (si existe) y aplicar este algoritmo
3. Imprimir el contenido del nodo actual

```
     4
   /   \
  2     6
 / \   /
1   3 5

Recorrido post-orden:
1, 3, 2, 5, 6, 4
```

### Implementación en Python de recorridos

Ahora vamos a implementar funciones que recorran los nodos de un árbol con cada algoritmo.

In [2]:
def en_orden(nodo):
    if nodo.izquierda is not None:
        en_orden(nodo.izquierda)
    print(nodo.valor)
    if nodo.derecha is not None:
        en_orden(nodo.derecha)

print("Recorrido en orden de arbol:")
# El recorrido debería imprimir en el siguiente orden: 1, 2, 3, 4, 5, 6
en_orden(arbolito.raiz)

Recorrido en orden de arbol:
1
2
3
4
5
6


In [3]:
def pre_orden(nodo):
    print(nodo.valor)
    if nodo.izquierda is not None:
        pre_orden(nodo.izquierda)
    if nodo.derecha is not None:
        pre_orden(nodo.derecha)

print("Recorrido pre-orden de arbol:")
# El recorrido debería imprimir en el siguiente orden: 4, 2, 1, 3, 6, 5
pre_orden(arbolito.raiz)

Recorrido pre-orden de arbol:
4
2
1
3
6
5


In [4]:
def post_orden(nodo):
    if nodo.izquierda is not None:
        post_orden(nodo.izquierda)
    if nodo.derecha is not None:
        post_orden(nodo.derecha)
    print(nodo.valor)

print("Recorrido post-orden de arbol:")
# El recorrido debería imprimir en el siguiente orden: 1, 3, 2, 5, 6, 4
post_orden(arbolito.raiz)

Recorrido post-orden de arbol:
1
3
2
5
6
4
