<a href="https://colab.research.google.com/github/valentitos/Colabs-CC1002/blob/main/Clase_13_Arboles_Busqueda_Binaria/Clase13_Arboles_Busqueda_Binaria.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---

**Paso previo solo para colab**

En la unidad 2 usaremos el módulo `estructura.py` y `lista.py` (entre otros), los cuales son módulos personalizados para este curso. Para poder usarlos en colab, tenemos que hacer lo siguiente:

- Crear en nuestro Google Drive, una carpeta donde guardar estos módulos. Supongamos que creamos una carpeta llamada `"CC1002_modulos"` (sin comillas)
- En esa carpeta, guardar estos módulos (los pueden descargar desde material docente de Ucursos, o usar estos links directos)
  - `estructura.py`: https://drive.google.com/file/d/1CoJT4QqCOdWV12hhZACRt3YMlU5xjqQV/view?usp=drive_link
  - `lista.py`: https://drive.google.com/file/d/1jeb516Ky5XVCePkW2M5Nwf6c-JLcF2yA/view?usp=sharing
- Ejecutar la siguiente celda

In [None]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

import sys
sys.path.append('/content/drive/MyDrive/CC1002_modulos')

Reemplacen la parte que dice: `"CC1002_modulos"` por la carpeta que uds. crearon en su Gdrive

Puede que les pida permisos para que colab acceda a Gdrive, los cuales pueden aceptar nomas, ya que no estamos haciendo operaciones "peligrosas".

Con esto, no debiesen tener problemas para usar estructuras en colab.

---

# Clase 13: Árboles de Búsqueda Binaria (ABB)

## Repaso: Árboles Binarios (AB)

Las listas permiten organizar datos de una manera lineal o encadenada

Sin embargo, en algunos contextos, es necesario contar con más de una referencia recursiva, o que estén agrupados bajo una jerarquía

Un Árbol Binario es una estructura recursiva compuesta de nodos tal que:
- Un AB puede ser vacío (`arbolVacio`)
- Un AB puede contener un valor, y dos enlaces a un AB, uno a por su rama `izquierda` y otro por su rama `derecha`

Su definición en código es:

```python
# AB: valor(any) izq(AB) der(AB)
estructura.crear('AB', 'valor izq der')
arbolVacio = None
```

![](nodo_circular.svg)

![](AB_hojas.svg)


- Al primer nodo del árbol se le suele llamar raíz.

- Por simplicidad no se dibujan los nodos arbolVacio.

- Los nodos que tanto su rama izq como der referencian al arbolVacio, se les suele llamar hojas


Las operaciones más comunes son:

- `valores(A)`:Cuenta la cantidad de valores / elementos / nodos en `A`.

- `altura(A)`:Entrega la altura del árbol (niveles de profundidad)

- `hojas(A)`:Cuenta los nodos con rama `izq` y `der` vacías.

- `buscar(A,elem)`:Indica si existe o no el `elemento` indicado en `A`.


![](ABB_letras_op1.svg)
![](ABB_letras_op2.svg)

Al igual que para el caso de funciones que operan con listas, para el caso de árboles, hay un patrón de operaciones similar:

El caso base consiste en:

- Decidir que hacer o que resultado entregar con el `arbolVacio`.

- Decidir qué hacer cuando estamos en un nodo tipo hoja (rama `izq` y rama `der` son el `arbolVacio`)


El caso recursivo consiste en:

- Tomar el elemento actual, decidir qué hacer con él o como operarlo.
- Luego decidir si hay que procesar los elementos de alguna de sus ramas `izq` o `der` (o ambas).
- Finalmente entregar un resultado, o continuar la función en alguna rama en específico.

```python
def funcionArbol(A):

    if A es el arbolVacio:
        ''' ver que hacer en este caso '''
    
    if A es una hoja:
        ''' ver que hacer en este caso '''

    ... A.valor ... 

    ... funcionArbol(A.izq) ...

    ... funcionArbol(A.der) ...  

    return resultado 

```

Más aún, podemos manejar exhaustivamente todos los casos posibles de nodo de árbol

```python
def funcionArbol(A):

    if A == arbolVacio:
        ''' ver que hacer en este caso '''
    
    ... A.valor ...

    if A.izq == arbolVacio and A.der == arbolVacio:
        ''' ver que hacer en este caso '''

    if A.izq != arbolVacio and A.der == arbolVacio:
        ... funcionArbol(A.izq) ...

    if A.izq == arbolVacio and A.der != arbolVacio:
        ... funcionArbol(A.der) ...

    if A.izq != arbolVacio and A.der != arbolVacio:
        ... funcionArbol(A.izq) ...
        ... funcionArbol(A.der) ... 
    
    return resultado
```


## Árboles de Busqueda Binaria (ABB)

Otro caso particular de AB, y uno de los más utilizados, son los Árboles de Búsqueda Binaria (ABB). Este tipo de árbol, esta diseñado para que las búsquedas sean mas rápidas, mantenido sus elementos bajo un cierto orden

En este tipo de árboles:

- Todos los valores en la rama `izq` son **menores** que el valor en la raíz.

- Todos los valores en la rama `der` son **mayores** que el valor en la raíz.

- Los sub-arboles de las ramas `izq` y `der` también cumplen las propiedades anteriores.

- Se asume que no hay valores repetidos, o bien, los valores iguales deben estar siempre por una rama especifica (usualmente la `der`), dependiendo si hay que garantizar la propiedad de unicidad o no.

Por ejemplo, el siguiente árbol cumple con la propiedad de ser ABB:

![AB_ABB.png](AB_ABB.png)


In [67]:
ABB1 = AB(31, AB(16, AB(5, arbolVacio, arbolVacio),
                     AB(25, AB(19, arbolVacio, arbolVacio),
                            AB(26, arbolVacio, arbolVacio))),
              AB(40, AB(39, arbolVacio, arbolVacio),
                     arbolVacio))

Y bueno, el AB que usamos anteriormente no la cumple:

![](AB_circular.png)

### Función `menor/mayor`

Como en un ABB los valores están ordenados, es mucho mas sencillo encontrar el menor o el mayor valor almacenado. En un AB tradicional teníamos que buscar exhaustivamente entre todos sus valores.

En un ABB:

- El **menor** valor en un ABB se encuentra en su nodo de más a la **izquierda**.

- El **mayor** valor en un ABB se encuentra en su nodo de más a la **derecha**.

In [69]:
# menor: AB -> any
# entrega el menor valor de un ABB
# ej: menor(ABB1) entrega 5
def menor(A):
    assert esAB(A)
    if A == arbolVacio:
        return None

    if A.izq == arbolVacio:
        return A.valor
    else:
        return menor(A.izq)

# test
assert menor(ABB1) == 5

In [70]:
# mayor: AB -> any
# entrega el mayor valor de un ABB
# ej: mayor(ABB1) entrega 40
def mayor(A):
    assert esAB(A)
    if A == arbolVacio:
        return None
    
    if A.der == arbolVacio:
        return A.valor
    else:
        return mayor(A.der)

# test
assert mayor(ABB1) == 40

### Función `esABB`

Ahora, nos gustaría verificar si un AB cualquiera, cumple con la propiedad de ser un ABB. Para esto, consideramos lo siguiente:

- Por definición, un `arbolVacio` es ABB.

- Si la rama `izq` es no-vacía, debemos verificar que:

  - Sea un ABB

  - Su *mayor valor sea menor* que el valor de la raíz actual

- Si la rama `der` es no-vacía, debemos verificar que:

  - Sea un ABB

  - Su *menor valor sea mayor* que el valor de la raíz actual


In [72]:
# esABB: AB -> bool
# indica si un AB cumple con ser ABB o no
# ej: esABB(ABB1) entrega True
def esABB(A):
    assert esAB(A)
    
    # consideraremos un árbol vacío como ABB
    if A == arbolVacio:
        return True
    
    v = A.valor
    # Verificamos si la rama izq es vacía, o bien, tiene que cumplir la propiedad ABB
    esIzq = (A.izq == arbolVacio) or \
            (esABB(A.izq) and mayor(A.izq) < v)
    
    # Verificamos si la rama der es vacía, o bien, tiene que cumplir la propiedad ABB
    esDer = (A.der == arbolVacio) or \
            (esABB(A.der) and menor(A.der) >= v)
    
    # es ABB si se cumplen las dos verificaciones anteriores
    return esIzq and esDer

# test
assert esABB(ABB1)
assert not esABB(raiz)

In [73]:
esABB(ABB1)

True

In [74]:
esABB(raiz)

False

### Operaciones típicas

Con un ABB, podemos realizar algunas operaciones que en un AB simple son mas engorrosas o ambiguas. Alguna de estas operaciones son:

- Buscar un elemento en un ABB

- Agregar un nuevo elemento a un ABB

### Función `enABB`

Como ahora existe una relación de orden en los elementos del árbol, ahora en vez de realizar una búsqueda exhaustiva, podemos realizar una búsqueda mas eficiente:

- Si nos encontramos con el `arbolVacio`, entonces el elemento no estaba en el árbol

- Comparamos el elemento a buscar con el valor actual:
  - Si el elemento es menor, entonces continuamos la búsqueda en la rama `izq` del árbol
  - Si el elemento es mayor, entonces continuamos la búsqueda en la rama `der` del árbol

Ejemplo de búsqueda con final feliz:

![ABB_buscar_yes1.png](ABB_buscar_yes1.svg)
![ABB_buscar_yes2.png](ABB_buscar_yes2.svg)
![ABB_buscar_yes3.png](ABB_buscar_yes3.svg)
![ABB_buscar_yes4.png](ABB_buscar_yes4.svg)

Ejemplo de búsqueda infructuosa:

![ABB_buscar1.png](ABB_buscar1.svg)
![ABB_buscar2.png](ABB_buscar2.svg)
![ABB_buscar3.png](ABB_buscar3.svg)

In [75]:
# enABB: ABB any -> bool
# determina si un elemento está en un ABB o no
# ej: enABB(ABB1,26) entrega True
def enABB(A,e):
    assert esABB(A)

    # El nodo vacío nos dice que el elemento no existía en el árbol
    if A == arbolVacio:
        return False

    v = A.valor
    # Dependiendo si el valor actual es estrictamente menor o mayor que el
    #  buscado, entonces continuamos la búsqueda en la rama respectiva
    if e < v: 
        return enABB(A.izq, e)
    elif e > v:
        return enABB(A.der, e)
    # Por descarte, si no era mayor ni menor, entonces el elemento 
    # es igual al actual, por lo que existe en el árbol
    else:
        return True

# test
assert enABB(ABB1, 26)
assert not enABB(ABB1, 42)

In [76]:
enABB(ABB1, 26)

True

In [77]:
enABB(ABB1, 42)

False

### Función `insertar`

Para agregar un nuevo elemento en un ABB, tenemos que tener cuidado con preservar sus propiedades. Como los arboles son estructuras no son mutables, y dado que estamos modificando el árbol, tenemos que "recrearlo" con los cambios que queremos realizar (similar a lo que hacíamos con las listas)

Debido a la propiedad de orden entre los elementos, solo existe un posible lugar donde podemos insertar el nuevo elemento. Este lugar es el espacio vacío al que se llega luego de una búsqueda infructuosa. 

Por lo que el procedimiento es:

- Se realiza una "búsqueda" del elemento a agregar.

- Cuando nos encontramos con un `arbolVacio`, entonces este es el lugar donde debiese haber estado el elemento, por lo que se agrega en ese espacio.

![ABB_buscar1.png](ABB_buscar1.svg)
![ABB_buscar2.png](ABB_buscar2.svg)
![ABB_insert3.png](ABB_insert3.svg)
![ABB_insert4.png](ABB_insert4.svg)

In [78]:
# insertar: ABB any -> ABB
# entrega un nuevo ABB con el elemento nuevo agregado
# ej: insertar(ABB1, 99) entrega el ABB:
#     ___31___   
#    /        \
#   16        40
#  /  \      /  \
# 5   25    39  99
#    /  \
#   19  26
def insertar(A,e):
    assert esABB(A)

    # CB: El nodo vacío nos indica que acá tenemos que dejar el nuevo elemento
    if A == arbolVacio:
        return AB(e, arbolVacio, arbolVacio)

    v = A.valor
    # Dependiendo si el valor actual es menor o mayor que el que se agregará,
    # creamos un nuevo nodo, conservando lo que quedará igual, pero modificando
    #  la rama donde hay que agregar el  nuevo elemento
    if e < v: 
        return AB(v, insertar(A.izq,e), A.der)
    elif e >= v:
        return AB(v, A.izq, insertar(A.der,e)) 

# test
Atest = insertar(ABB1,99)
assert esABB(Atest) and enABB(Atest,99)

In [79]:
insertar(ABB1,99)

AB(valor=31, izq=AB(valor=16, izq=AB(valor=5, izq=None, der=None), der=AB(valor=25, izq=AB(valor=19, izq=None, der=None), der=AB(valor=26, izq=None, der=None))), der=AB(valor=40, izq=AB(valor=39, izq=None, der=None), der=AB(valor=99, izq=None, der=None)))

### Propuestos

Pensar:

- ¿Cómo se podrían eliminar elementos de un ABB? ¿Qué complicaciones podrían ocurrir?

- ¿Cómo se podrían editar elementos en un ABB? Considerando que editar un elemento puede alterar la propiedad de orden


## Recorridos de un AB

Existen distintas maneras de navegar en los elementos en un árbol binario. Dependiendo que como se recorra, se pueden obtener resultados interesantes.

Los recorridos mas típicos son:

- Pre-orden

- In-orden

- Out-orden

- Post-orden

### Pre-orden

Se recorre primero la raíz, luego la rama `izq` y finalmente  la rama `der`.
![ABB_preorder.png](ABB_preorder.svg)

  Resultado: 31, 16, 5, 25, 19, 26, 40, 39
  
  Aplicaciones: Reconstrucción de un ABB con sus elementos en las mismas posiciones. Obtener una expresión en notación polaca.

### In-orden
Se recorre primero la rama `izq`, luego la raíz, y finalmente la rama `der`.
![ABB_inorder.png](ABB_inorder.svg)
  
  Resultado: 5, 16, 19, 25, 26, 31, 39, 40
  
  Aplicaciones: Obtener los elementos de un ABB en orden creciente.

### Out-orden
Se recorre primero la rama `der`, luego la raíz, y finalmente la rama `izq`.
![ABB_outorder.png](ABB_outorder.svg)
  
  Resultado: 40, 39, 31, 26, 25, 19, 16, 5
  
  Aplicaciones: Obtener los elementos de un ABB en orden decreciente.

### Post-orden
Se recorre primero la rama `izq`, luego la rama `der` y finalmente la raíz.
![ABB_postorder.png](ABB_postorder.svg)

  Resultado: 5, 19, 26, 25, 16, 39, 40, 31
  
  Aplicaciones: Entrega el orden en que los elementos deben ser eliminados del AB para no dejar elementos "sueltos". Entrega una expresión en notación polaca inversa.

## Ejemplos de Recorridos

Veamos algunos ejemplos de navegación:

- Imprimir en pantalla el contenido del AB en pre-orden

- Imprimir en pantalla el contenido del AB en in-orden

- Generar una lista con el contenido del AB en pre-orden

### Funciones `imprimir`

Para ambos recorridos, la idea es similar, solo que tenemos que tener cuidado en que orden vamos haciendo las acciones de imprimir. El caso particular del `arbolVacio`, nos indica que no hay nada más que imprimir en una rama en particular

In [82]:
# imprimirPreorden: AB -> None
# muestra en pantalla los valores de un AB en preorden
# ej: imprimirPreorden(ABexp)
def imprimirPreorden(A):
    assert esAB(A)

    if A == arbolVacio:
        return None

    print(A.valor)
    imprimirPreorden(A.izq)
    imprimirPreorden(A.der)

In [81]:
# imprimirInorden: AB -> None
# muestra en pantalla los valores de un AB en inorden
# ej: imprimirInorden(ABB1)
def imprimirInorden(A):
    assert esAB(A)

    if A == arbolVacio:
        return None

    imprimirInorden(A.izq)
    print(A.valor)
    imprimirInorden(A.der)


In [83]:
imprimirPreorden(ABexp)

*
-
26
+
40
5
2


In [84]:
imprimirInorden(ABB1)

5
16
19
25
26
31
39
40


### Funcion `convertirALista`

Para crear una lista con el contenido de un AB, seguimos un recorrido similar al anterior, y vamos pegando las distintas listas de elementos que se van generando en cada una de las ramas

- Generamos una lista con el valor actual (`L1`)

- Generamos una lista con los valores de la rama izq (`L2`)

- Generamos una lista con los valores de la rama der (`L3`)

- Juntamos `L1` y `L2`, y el resultado de eso lo juntamos con `L3`

In [85]:
# ABaListaPre: AB -> lista
# convierte un AB a lista con sus elementos en inorden
# ej: ABaListaPre(ABexp)...
def ABaListaPre(A):
    assert esAB(A)

    # CB: El nodo vacío nos indica que no hay elementos que rescatar
    if A == arbolVacio:
        return listaVacia

    # CR: Generamos las listas con el elemento actual,
    #  y las que se generen por la rama izquierda y derecha
    L1 = lista(A.valor, listaVacia)
    L2 = ABaListaPre(A.izq)
    L3 = ABaListaPre(A.der)
    
    # Juntamos las listas, siguiendo el pre-orden
    L1 = juntar(L1,L2)
    L1 = juntar(L1,L3)
    return L1

In [86]:
ABaListaPre(ABexp)

lista(valor='*', siguiente=lista(valor='-', siguiente=lista(valor=26, siguiente=lista(valor='+', siguiente=lista(valor=40, siguiente=lista(valor=5, siguiente=lista(valor=2, siguiente=None)))))))

In [87]:
ABaListaPre(ABB1)

lista(valor=31, siguiente=lista(valor=16, siguiente=lista(valor=5, siguiente=lista(valor=25, siguiente=lista(valor=19, siguiente=lista(valor=26, siguiente=lista(valor=40, siguiente=lista(valor=39, siguiente=None))))))))

### Propuestos

- Implementar las funciones que imprimen el contenido de un AB en out-orden y post-orden

- Implementar las funciones que guardan el contenido de un AB en una lista, con su contenido en in-orden, out-orden y post-orden


## Extras

### Eliminación en un AB

La tarea de eliminar un nodo de un árbol puede ser difícil de abordar y entender, ya que presenta varias particularidades, dependiendo si es:

- Un nodo hoja
- Un nodo con 1 rama
- Un nodo con 2 ramas

Una manera alternativa de resolver el problema es mediante composición funcional:

- Convertir el AB a una lista (en pre-orden)
- Realizar la eliminación del elemento en la lista
- Convertir la lista en AB

![](delete_way2.svg)

### Búsqueda en ABBs

¿Por qué son tan importantes los árboles de búsqueda binaria?

Porque nos permiten resolver el problema de búsqueda, **descartando rápidamente conjuntos de elementos** que no están cerca del elemento a buscar.

Por ejemplo, supongamos que estamos buscando un valor en una lista "grande" (1000 elementos)

![](Lgrande.svg)


En el peor caso, si el valor buscado se encuentra casi al final de la lista, para saberlo, tendremos que realizar aprox. 1000 verificaciones para saber si existe o no 

Por otro lado, al buscar en un ABB "grande", al navegar por una rama, sabemos que el elemento no se encontrará en la otra rama, lo que permite descartar, en promedio, la mitad de los elementos a verificar

![](ABBgrande.svg)



En el peor caso (el elemento a buscar se encuentra en una hoja al final del árbol), solo tenemos que hacer $log_2(nodos)$ ⁡verificaciones 
(aprox. 10 vs las ~1000 de una lista)



## Conclusiones

Hoy vimos una aplicación particular de AB, conocida como los Árboles de Búsqueda Binaria. 

En estos árboles, la información está jerarquizada de acuerdo a un orden, lo que permite realizar eficientemente la tarea de buscar un elemento en un conjunto

También vimos como navegar los nodos de un árbol, y dependiendo del orden en que se naveguen sus elementos, se pueden obtener recorridos con propiedades interesantes

Y que también es posible pasar de AB a lista, y viceversa.