<a href="https://colab.research.google.com/github/valentitos/Colabs-CC1002/blob/main/Clase_12_Arboles_Binarios/Clase12_Arboles_Binarios.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

**Paso previo solo para colab**

En la unidad 2 usaremos el módulo `estructura.py` y `lista.py` (entre otros), los cuales son módulos personalizados para este curso. Para poder usarlos en colab, tenemos que hacer lo siguiente:

- Crear en nuestro Google Drive, una carpeta donde guardar estos módulos. Supongamos que creamos una carpeta llamada `"CC1002_modulos"` (sin comillas)
- En esa carpeta, guardar estos módulos (los pueden descargar desde material docente de Ucursos, o usar estos links directos)
  - `estructura.py`: https://drive.google.com/file/d/1CoJT4QqCOdWV12hhZACRt3YMlU5xjqQV/view?usp=drive_link
  - `lista.py`: https://drive.google.com/file/d/1jeb516Ky5XVCePkW2M5Nwf6c-JLcF2yA/view?usp=sharing
- Ejecutar la siguiente celda

In [None]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

import sys
sys.path.append('/content/drive/MyDrive/CC1002_modulos')

Reemplacen la parte que dice: `"CC1002_modulos"` por la carpeta que uds. crearon en su Gdrive

Puede que les pida permisos para que colab acceda a Gdrive, los cuales pueden aceptar nomas, ya que no estamos haciendo operaciones "peligrosas".

Con esto, no debiesen tener problemas para usar estructuras en colab.

---

# Clase 12: Árboles Binarios

## Repaso: Listas (parte 2)

A partir de varios ejemplos sobre nombres de frutas, dedujimos y generalizamos tales ideas para crear las siguientes funciones:

- Función `contiene(L,e)`, que dada una lista y un elemento, nos indica si el elemento se encuentra presente en la lista

- Función `eliminar(L,e)`, que elimina la primera aparición del elemento indicado de la lista

- Función `eliminarTodos(L,e)`, que elimina todas las apariciones del elemento indicado en la lista

También vimos que las listas pueden contener/almacenar estructuras, y lo vimos a través de un ejemplo con Estructuras Dulce

```python
# Dulce: nombre(str) sabor(str) cantidad(int)
estructura.crear("Dulce","nombre sabor cantidad")

sunny = Dulce('suny', 'manjar', 22)
frugeleN = Dulce('frugele', 'naranja', 36)
frugeleM = Dulce('frugele', 'manzana', 8)
masticableP = Dulce('masticable', 'naranja', 33)
```

Y con lo anterior, crear una lista de Estructuras Dulce

```python
Ldulces = lista(sunny, lista(frugeleN, lista(frugeleM, lista(masticableN, listaVacia))))
```

![](Ldulcesest.png)

Con esto, dada una lista de Estructuras Dulce, programamos funciones que:

- Contaban la cantidad de Dulces totales en la lista

- Entregaban el Dulce con mayor cantidad

- Entregaba una lista solo con los Dulces de cierto sabor


La clave para resolverlas, fue operar de igual manera como si fuese una lista de elementos simples, pero luego de extraer la cabeza de la lista, teníamos que "desempaquetar" la estructura Dulce, para obtener y operar los datos relevantes para cada función.

---


## Árboles Binarios (AB)

Las listas que vimos anteriormente almacenan elementos y son procesadas de manera secuencial.

Sin embargo, existen otras formas de organizar y representar conjuntos de información.

En particular, existen las organizaciones por jerarquía, o en distintos niveles (como las ramas de un árbol), que permiten organizar la información de una manera distinta, y también, permiten realizar ciertas operaciones con mayor eficiencia

Un árbol binario es una estructura recursiva compuesta de nodos, tal que:

- El nodo puede ser `vacio`

- El nodo puede contiene un `valor`, y puede contener `referencias` a otros **dos** nodos de árbol binario

    - Generalmente a estas referencias se les llama `izquierda` y `derecha` (debido a su posición al dibujarlo)

![nodo_cuadrado.png](nodo_cuadrado.svg)

Su definición en código es:

In [43]:
# AB: valor(any) izq(AB) der(AB)
estructura.crear('AB', 'valor izq der')

Al igual que para listas, existe un comodín que denota el nodo vacío:

![](arbolVacio.png)

In [44]:
arbolVacio = None

Al primer nodo del árbol se le suele llamar **raíz**

![](nodoRaiz.svg)

Y a los nodos que tanto su rama `izq` como `der` referencian al `arbolVacio`, se les suele llamar **hojas**

![](nodoHoja.svg)

Un ejemplo de árbol binario con los numeros 25, 16, 9, 39, 5, 31, 40 y 26 es:

![AB_cuadrado_full.png](AB_cuadrado_full.svg)

Por simplicidad, no se suelen dibujar los `arbolVacios` (se asume que si no sale ninguna flecha de un `izq` o un `der`, entonces referencia al `arbolVacio`)

![AB_cuadrado.png](AB_cuadrado.svg)

Mas aún, por mayor simplicidad, los nodos suelen dibujarse con esferas o cuadrados, y las flechas que salen en su respectiva dirección, representan la rama `izq` o `der`

![nodo_circular.png](nodo_circular.svg)

![AB_circular.png](AB_circular.svg)

Y su definición en codigo es de la siguiente forma:

In [45]:
raiz = AB(25, 
          AB(16, AB(26, arbolVacio, arbolVacio), 
                 AB(31, AB(40, arbolVacio, arbolVacio), 
                        AB(5, arbolVacio, arbolVacio))),
          AB(9, AB(39, arbolVacio, arbolVacio), 
                arbolVacio))

Las funciones clasicas que se realizan sobre un árbol binario son:

- Verificar si *algo* es un árbol binario

- Contar cuantos elementos (nodos) tiene el árbol

- Calcular cual es la altura del árbol (niveles de profundidad)

- Contar cuantos nodos del árbol no tienen rama derecha ni rama izquierda

- Buscar si existe un elemento o no el algún nodo del árbol



### Función `esAB`

Para este caso, partimos desde la raíz del árbol:

- Si nos encontramos con un `arbolVacio`, en particular es un árbol

- Si es algo no nulo, tenemos que verificar

  - Que sea de tipo AB
  
  - Sus ramas `izq` y `der` tienen que ser AB
  
  - No hay que verificar alguna condición sobre el valor almacenado



In [49]:
# esAB: any -> bool
# indica si lo entregado cumple con ser AB
# ej: esAB(raiz) entrega True
def esAB(A):
    
    # el nodo vacío se considera un árbol AB
    if A == arbolVacio:
        return True
    
    # El nodo actual debe ser de tipo AB, y 
    # sus ramas izq y der también deben serlo
    return type(A) == AB and \
           esAB(A.izq) and \
           esAB(A.der)

# Test
assert esAB(raiz)
assert esAB(arbolVacio)
assert not esAB("gatito")

In [50]:
esAB(raiz)

True

### Función `valores`

Para este caso, partimos desde la raiz del árbol:

- Si nos encontramos con un `arbolVacio`, no se cuenta y terminamos de contar.

- Si nos encontramos con un árbol no vacío, lo contamos, y luego:

  - Contamos cuantos valores hay por la rama `izq`.

  - Contamos cuantos valores hay por la rama `der`.

  - Sumamos los resultados de ambas cuentas.

In [51]:
# valores: AB -> int
# cuenta cuantos nodos tiene el arbol
# ej: valores(raiz) entrega 8
def valores(A):
    assert esAB(A)

    # el nodo vacío no tiene elementos
    if A == arbolVacio:
        return 0
    
    # Contamos el actual, y contamos cuantos 
    # valores hay en las ramas izq y der
    return 1 + valores(A.izq) + valores(A.der)

# test
assert valores(raiz) == 8

In [52]:
valores(raiz)

8

### Función `altura`

Para este caso, hacemos algo similar a la función anterior:

- Si nos encontramos con un `arbolVacio`, por def. tiene altura 0.

- Si nos encontramos con un árbol no vacío, cuenta como un nivel, y luego:

  - Contamos la altura del sub-árbol `izq`.

  - Contamos la altura del sub-árbol `der`.
  
  - Nos quedamos con la mayor entre ambas cuentas.


Para este caso, hacemos algo similar a la función anterior:

- Si nos encontramos con un arbolVacio, por def. tiene altura 0.
- Si nos encontramos con un árbol no vacío, cuenta como un nivel, y luego:
  - Contamos la altura del sub-árbol izq.
  - Contamos la altura del sub-árbol der.
  - Nos quedamos con la mayor entre ambas cuentas.

![](AB_altura_bot.svg)
![](AB_altura_bot2.svg)
![](AB_altura_bot3.svg)
![](AB_altura_bot4.svg)

In [53]:
# altura: AB -> int
# cuenta cual es la profundidad del arbol
# ej: altura(raiz) entrega 4
def altura(A):
    assert esAB(A)
    
    # el nodo vacío no tiene elementos
    if A == arbolVacio:
        return 0
    
    # Contamos el nivel actual y nos quedamos con el sub-árbol de mayor altura
    return 1 + max(altura(A.izq), altura(A.der))

# test
assert altura(raiz) == 4

In [54]:
altura(raiz)

4

### Función `hojas`

Para este caso, hacemos algo similar a la función anterior:

- Si nos encontramos con un `arbolVacio`, no es una hoja (ya que no tiene valor asociado)

- Si nos encontramos con un árbol no vacío:

  - Si no tiene rama `izq` ni `der`, entonces lo cuento como hoja

  - Si tiene al menos una rama definida, entonces cuento cuantas hojas hay allí

![](AB_hojas.svg)

In [55]:
# hojas: AB -> int
# cuenta cuantos nodos sin ramas hay en el arbol
# ej: hojas(raiz) entrega 4
def hojas(A):
    assert esAB(A)
    
    if A == arbolVacio:
        return 0
    
    if A.izq == arbolVacio and A.der == arbolVacio:
        return 1
    else: 
        return hojas(A.izq) + hojas(A.der)

# Test
assert hojas(raiz) == 4

In [56]:
hojas(raiz)

4

### Función `buscar`

Para este caso, hacemos algo similar a la función anterior:

- Si nos encontramos con un `arbolVacio`, no hay mas donde buscar, por lo que el elemento no está... Entregamos `False`.

- Si nos encontramos con un árbol no vacío, revisamos si coincide con el elemento buscado:

  - Si coincide, entregamos `True`.

  - Si no coincide, buscamos si existe en su rama `izq`, o bien, en su rama `der`.

In [57]:
# buscar: AB any -> bool
# busca si existe el elemento buscado en el arbol
# ej: buscar(raiz, 99) entrega False
def buscar(A,elem):
    assert esAB(A)
    
    # el nodo vacío no tiene valor, por lo que el elemento no existe
    if A == arbolVacio:
        return False
    
    # Si el valor del nodo actual coincide con el buscado, 
    # entonces si está en el árbol
    if A.valor == elem:
        return True
    
    # Si no, entonces buscamos si existe en las ramas izq o der
    return buscar(A.izq, elem) or buscar(A.der,elem)

# test
assert buscar(raiz,31)
assert not buscar(raiz,99)

In [58]:
buscar(raiz,31)

True

In [59]:
buscar(raiz,99)

False

### Propuesto

Crear una función, que reciba un AB, y entregue cuantos elementos son nodos interiores. En otras palabras, que cuente cuantos nodos no-vacíos del AB, que no sean hojas.

- Ej: `interiores(raiz)` entrega `4` 



### Follow-up

Usualmente en los árboles, se utiliza información contextual para almacenar la información, y así no tener que anotarlo explícitamente. 

Por ejemplo, se le puede dar una significado especial a:

- Las hojas de un árbol

- Sus nodos interiores

- La dirección (`izq` o `der`) por la cual avanza una rama del árbol

- El tipo de datos que almacenan cada uno de sus nodos

Veremos algunas aplicaciones particulares de AB's

---

### Patrón

Al igual que para el caso de funciones que operan con listas, para el caso de árboles, hay un patrón de operaciones similar:

El caso base consiste en:
- Decidir que hacer o que resultado entregar con el `arbolVacio`.
- Decidir qué hacer cuando estamos en un nodo tipo hoja (rama `izq` y rama `der` son el `arbolVacio`)

El caso recursivo consiste en:
- Tomar el elemento actual, decidir qué hacer con él o como operarlo.
- Luego decidir si hay que procesar los elementos de alguna de sus ramas `izq` o `der` (o ambas).
- Finalmente entregar un resultado, o continuar la función en alguna rama en específico.


In [None]:
def funcionArbol(A):

    if A es el arbolVacio:
        ''' ver que hacer en este caso '''
    
    if A es una hoja:
        ''' ver que hacer en este caso '''

    ... A.valor ... 

    ... funcionArbol(A.izq) ...

    ... funcionArbol(A.der) ...  

    return resultado

Más aún, podemos manejar exhaustivamente todos los casos posibles de nodo de árbol

In [None]:
def funcionArbol(A):

    if A == arbolVacio:
        ''' ver que hacer en este caso '''
    
    ... A.valor ...

    if A.izq == arbolVacio and A.der == arbolVacio:
        ''' ver que hacer en este caso '''

    if A.izq != arbolVacio and A.der == arbolVacio:
        ... funcionArbol(A.izq) ...

    if A.izq == arbolVacio and A.der != arbolVacio:
        ... funcionArbol(A.der) ...

    if A.izq != arbolVacio and A.der != arbolVacio:
        ... funcionArbol(A.izq) ...
        ... funcionArbol(A.der) ... 
    
    return resultado 

Tales casos son:

- Nodo Vacío
- Nodo Hoja
- Nodo solo rama izquierda
- Nodo solo rama derecha
- Nodo con ambas ramas

## Árbol de Expresiones Matemáticas (AB-exp)

Un caso particular de AB es el árbol de expresiones matemáticas (AB-exp), el cual permite representar una cadena de operaciones matemáticas

En los arboles AB-exp:

- Las **hojas** almacenan valores numéricos.

- Los **nodos interiores** almacenan un string que representa la operación aritmética a realizar entre el valor de su rama `izq` y `der`

- No hay nodos con una sola rama

- Todas las operaciones se realizan con dos operandos

- El objetivo es obtener el valor numérico final después de evaluar el árbol completo (con ayuda de una función)


Por ejemplo, el AB-exp que representa la operación aritmetica:

$$((26 - (40 + 5)) * 2)$$


![AB_exp.png](AB_exp.svg)

In [60]:
ABexp = AB('*', 
          AB('-', AB(26, arbolVacio, arbolVacio),
                  AB('+', AB(40, arbolVacio, arbolVacio),
                          AB(5, arbolVacio, arbolVacio))),
           AB(2, arbolVacio, arbolVacio)
          )

Dado un AB-exp, creemos las siguientes funciones:

- Validar que un AB cumple la propiedad de ser un AB-exp

- Evaluar el resultado final de un AB-exp dado


### Función `esABexp`

Para validar si un AB en particular es un AB-exp, tenemos que verificar:

- Si es un nodo interior, entonces su `valor` asociado tiene que ser una operación matemática y tanto sus ramas `izq` y `der` deben ser no-vacías

- Si es una hoja, entonces su `valor` asociado tiene que ser numérico y sus ramas `izq` y `der` deben ser vacías


In [63]:
# esABexp: AB -> bool
# indica si un AB en particular es AB-exp
# ej: esABexp(ABexp) entrega True
def esABexp(A):
    
    # Si no es AB, entonces en particular no puede ser AB-exp
    if not esAB(A):
        return False
    
    # Un AB vacío por si solo, no cumple con ser AB-exp
    if A == arbolVacio:
        return False
    
    # Si es hoja, entonces su valor debe ser numérico
    if A.izq == arbolVacio and A.der == arbolVacio:
        return type(A.valor) == int or type(A.valor) == float
    
    # Si es nodo interior, entonces su valor debe ser una
    #  operación y sus ramas deben ser AB-exp
    return type(A.valor) == str and \
           esABexp(A.izq) and esABexp(A.der)

# test
assert esABexp(ABexp)
assert not esABexp(raiz)

In [64]:
esABexp(ABexp)

True

In [65]:
esABexp(raiz)

False

### Función `evaluar`

Para evaluar el resultado final de un AB-exp tenemos que ver que hacer dependiendo del tipo de nodo:

- Si es un nodo interior, entonces hay que evaluar el valor resultante de sus ramas `izq` y `der`, y luego operarlas con la operación guardada en el nodo actual

- Si es una hoja, entonces entregamos su valor asociado, para que pueda ser operado mas arriba en el árbol

![AB_exp.png](AB_exp.svg)
![AB_exp_eval1.png](AB_exp_eval1.svg)
![AB_exp_eval2.png](AB_exp_eval2.svg)
![AB_exp_eval3.png](AB_exp_eval3.svg)


In [66]:
# evaluar: AB -> num
# obtiene el resultado final de evaluar un AB de exp. mat.
# Ej: evaluar(ABexp) entrega -38
def evaluar(AE):
    assert esABexp(AE)
    
    # Si es hoja, entregamos su valor
    if AE.izq == arbolVacio and AE.der == arbolVacio:
        return AE.valor
    
    # Obtenemos el resultado de evaluar sus ramas der e izq
    valorIzq = evaluar(AE.izq) 
    valorDer = evaluar(AE.der) 
    operador = AE.valor
    
    # Dependiendo del operador, aplicamos la operación adecuada
    #  entre los valores finales de la rama izq y der
    if operador == '+':
        return valorIzq + valorDer
    elif operador == '-':
        return valorIzq - valorDer    
    elif operador == '*':
        return valorIzq * valorDer
    elif operador == '/':
        return valorIzq / valorDer

# test
assert evaluar(ABexp) == -38

Disclaimer: okey, las operaciones anteriores solo consideraban los operadores básicos ``+ - * / ``, pero perfectamente se pueden agregar mas operadores en la cadena ``if-else`` para soportar mas operaciones

---

### Conclusiones

La estructura de Árboles Binarios  nos permite almacenar elementos, tal que sigan cierta organización o jerarquía, o respeten propiedades tan detalladas o complejas como se desee

Hoy en particular vimos que:

- Los AB son parecidos a las listas, pero en vez de un vínculo "siguiente", tienen 2 vínculos (izquierda y derecha)

- El caso particular de los Árboles de Expresiones Matemáticas, que son un caso particular de AB en que:
  - La información está organizada de cierta manera
  - Este orden permite realizar funciones u operaciones especializadas 