<a href="https://colab.research.google.com/github/jugernaut/ManejoDatos/blob/main/AlgoritmosBusqueda/ArbolesBinariosBusqueda.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>Arboles Binarios de Búsqueda</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M.en.C. Miguel Angel Pérez León</i></h5>
  <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
  <h5 align="center"><i>Ayudante: Jonathan Ramírez Montes</i></h5>
  <h5 align="center"><i>Materia: Manejo de Datos</i></h5>
</font>

# Introducción 

Los Arboles Binarios de Búsqueda (ABB) son la evolución de los Arboles Binarios, ya que los ABB además de cumplir con la definición y operaciones de los AB, incluyen una caracteristica muy importante, el orden en sus elementos.

Podémos pensar que un ABB es un AB cuyos elementos se encuentran ordenados, esta forma de contruir estructuras sobre estructuras previamente definidas, es muy similar a la forma en como se constuyen conceptos en teoría de gráficas.

Además haciendo uso de POO, podemos aprovechar esta forma de crear conceptos y algoritmos para reutilizar y aprovechar definiciones previamente construidas.


# Arboles Binarios de Búsqueda (Ordenados)

Los Arboles Binarios de Búsqueda (u Ordenados) es una estructura de datos muy parecida a los árboles binarios, pero con la peculiaridad de que cada elemento que se agrega o elimina del árbol se lleva a cabo de tal manera que **se conserva un orden** dentro del mismo.

Al conservarse un orden ya es posible realizar búsquedas dentro del árbol de manera más eficiente, auque aún puede darse el peor caso (árbol degenerado).

Dado que las búsquedas se realizan de manera más eficiente esto **reduce considerablemente el orden de complejidad** al que pertenecen la mayoría de las posibles operaciones que se pueden realizar con este tipo de árboles.

De manera informal diremos que en un árbol binario de búsqueda, cualquier nodo cumple con la característica de que todos sus hijos (nietos, descendientes, etc.) **izquierdos contienen valores inferiores** al valor que contiene dicho nodo. Y por otro lado todos sus hijos **derechos contienen valores superiores** al valor de dicho nodo.

## Definición Formal 

***Arbol Binario de Búsqueda (ABB)***

Sea $A$ un árbol binario con raíz $R$, hijos izquierdo y derecho (posiblemente nulos) $H_I$ y $H_D$, respectivamente. Diremos que $A$ es un ABB si y solo si se satisfacen las dos condiciones siguientes de manera simultanea:

*    $H_I$ es vacío $\lor$ ($R$ contiene un valor mayor que todo elemento de $H_I \land H_I$ es un ABB).
*    $H_D$ es vacío $\lor$ ($R$ contiene un valor menor que todo elemento de $H_D \land H_D$ es un ABB).

Nota: Donde $\land$ es la conjunción lógica "y", y $\lor$ es la disyunción lógica "ó".

En la siguiente imagen se muestra un ABB.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/abb.png?raw=1" width="500"> 
</center>

## Operaciones sobre ABB

Al igual que con los AB, los ABB son caracterizados por el tipo de dato que almacena cada nodo, así como el conjunto de operaciones que se pueden llevar a cabo sobre estos.

Las principales operaciones de los ABB podemos decir que se
**heredan** de los AB, sin embargo dado que que los ABB se
caracterizan por estar ordenados, las operaciones de insertar y eliminar nodos cambia, para que después de llevar a cabo alguna de estas operaciones, el árbol en cuestión, cumpla con la definición de ABB.

Esta modificación, implica que en la mayoría de los casos las
operaciones sobre los ABB se mantenga en el orden de **complejidad logarítmica $O(\log_{2}n)$** donde $n$ es el número de nodos.

Sin embargo no se puede garantizar que nunca se dará el caso
degenerado del árbol, que es el peor caso, en el cual podemos pensar el ABB como una lista. En esta situación las operaciones son más costosas, llegando a **$O(n)$**.

## Clase Arbol Binario de Búsqueda `ABB`

A continuación se muestra el código para la clase `ABB` y podemos notar que esta clase hereda de la clase `AB`, lo que significa que estamos creado un árbol binario de búsqueda tomando un árbol binario como base.

Para esto necesitamos incluir en nuestra sesión actual el jupyter de Arboles Binarios, eso lo hacemos con la siguiente celda.

In [15]:
!wget https://raw.githubusercontent.com/jugernaut/ManejoDatos/desarrollo/AlgoritmosBusqueda/ArbolesBinarios.ipynb
!pip install import-ipynb

--2021-11-10 06:48:19--  https://raw.githubusercontent.com/jugernaut/ManejoDatos/desarrollo/AlgoritmosBusqueda/ArbolesBinarios.ipynb
Resolving raw.githubusercontent.com (raw.githubusercontent.com)... 185.199.108.133, 185.199.109.133, 185.199.110.133, ...
Connecting to raw.githubusercontent.com (raw.githubusercontent.com)|185.199.108.133|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 16833 (16K) [text/plain]
Saving to: ‘ArbolesBinarios.ipynb.2’


2021-11-10 06:48:20 (43.6 MB/s) - ‘ArbolesBinarios.ipynb.2’ saved [16833/16833]



In [13]:
import import_ipynb
from ArbolesBinarios import AB
from ArbolesBinarios import Nodo

''' Clase arbol binario de busqueda, genera la estructura de un arbol binario
    de busqueda asi como sus funciones.'''
class ABB(AB):
  ''' Consructor de arboles'''
  def __init__(self, dato):
    # llamamos al constructor de la clase padre con la palabra super
    super(ABB, self).__init__(dato)
    # y se agrega la variable ultimo agregado que sirve para clases posteriores
    self.ultimo_agregado = self.raiz

  ''' Busca un dato en el arbol y devuelve el nodo'''
  def busqueda(self, nodo, dato):
    # si la raiz es None o el dato esta contenido en el nodo,
    # se devuelve el nodo.
    if nodo is None or nodo.dato == dato:
      return nodo
    # si el dato es mayo entonces se busca del lado derecho
    if nodo.dato < dato:
      return self.busqueda(nodo.der, dato)
    # si no, se busca en el lado izquierdo
    else:
      return self.busqueda(nodo.izq, dato)

  ''' Inserta un elemento en el arbol a partir de un nodo'''
  def insertar_nodo(self, nodo, dato):
    # si el nodo es vacio ahi se crea el nuevo nodo
    if nodo is None:
      nuevo_nodo = Nodo(dato)
      self.ultimo_agregado = nuevo_nodo
      return nuevo_nodo
    # si el dato es menor que su padre, se inserta en el lado izquierdo
    if dato < nodo.dato:
      nuevo_nodo = self.insertar_nodo(nodo.izq, dato)
      nodo.izq = nuevo_nodo
      nuevo_nodo.padre = nodo
    # de no ser asi se inserta del lado derecho
    else:
      nuevo_nodo = self.insertar_nodo(nodo.der, dato)
      nodo.der = nuevo_nodo
      nuevo_nodo.padre = nodo
    # nodo guarda toda la ruta de donde sera insertado el dato
    # hasta caer en el caso base, es por eso que se devuelve    
    return nodo
  
  ''' Inserta un nodo en el arbol, a partir de la raiz'''
  def insertar(self, dato):
    # si el dato a insertar no se encuentra en el ABB se inserta
    if self.busqueda(self.raiz, dato) is None:
      # Se inserta el dato desde la raiz
      self.insertar_nodo(self.raiz, dato)

  ''' Busca el minimo en el subarbol a partir de nodo, este metodo sirve
      para poder eliminar nodos del arbol y mantener el orden'''
  def minimo_en_subarbol(self, nodo):
    # caso base en el que no hay minimo
    if nodo is None:
      return nodo
    # caso base en el que el nodo es el minimo ya que no tiene hijo izq
    if nodo.izq is None:
      return nodo
    # llamada recursiva para movernos al siguiente minimo
    return self.minimo_en_subarbol(nodo.izq)

  ''' Borra un nodo en el arbol, busca al nodo que contiene a dato
      y en caso de existir lo borra, se pueden dar multiples casos'''
  def borra_nodo(self, nodo, dato):
    # Caso 0) revisamos si el arbol es vacio.
    if self.raiz is None:
      return None
    # buscamos el nodo a borrar
    nodo_a_borrar = self.busqueda(nodo, dato)
    aux = nodo_a_borrar

    # Caso 0.1) si el dato no se encontro en el arbol no se puede borrar
    if nodo_a_borrar is None:
      return None

    # Caso 1) si el nodo a borrar es la RAIZ
    if nodo_a_borrar is self.raiz:
      # caso1.1) no tiene hijos, solo se borra la raiz
      if nodo_a_borrar.izq is None and nodo_a_borrar.der is None:
        self.raiz = None
        self.ultimo_agregado = None
        return None

      # Caso1.2) solo se tiene hijo derecho, entonces se sube al hijo derecho
      if nodo_a_borrar.izq is None and nodo_a_borrar.der is not None:
        self.raiz = nodo_a_borrar.der
        self.raiz.padre = None
        return self.raiz

      # Caso1.3) solo se tiene hijo izquierdo, entonces se sube al hijo izquierdo
      if nodo_a_borrar.izq is not None and nodo_a_borrar.der is None:
        self.raiz = nodo_a_borrar.izq
        self.raiz.padre = None
        return self.raiz

      # Caso1.4) tiene ambos hijos
      if nodo_a_borrar.izq is not None and nodo_a_borrar.der is not None:
        # buscamos el minimo en el subarbol derecho (minimo de los mayores)
        minimo = self.minimo_en_subarbol(nodo_a_borrar.der)
        aux = minimo.padre
        self.raiz.dato = minimo.dato
        self.borra_nodo(minimo, minimo.dato)
        return aux

    else: #Caso 2)
      # a partir de aqui se tienen 3 casos:
      # si no tiene hijos simplemente se borra el nodo
      # si tiene un solo hijo (ya sea izquierdo o derecho) se sube al unico hijo
      # tiene ambos hijos

      # es necesario identificar si el nodo a borrar es hijo izquierdo o derecho
      es_izquierdo = False
      if nodo_a_borrar.padre.izq == nodo_a_borrar:
        es_izquierdo = True

      # Caso2.1) no tiene hijos, solo se borra el nodo
      if nodo_a_borrar.izq is None and nodo_a_borrar.der is None:
        aux = nodo_a_borrar.padre
        # revisamos si el nodo a borrar es un hijo izquiero o derecho
        if es_izquierdo: # Caso2.1.1)
          aux.izq = None
        else: # Caso2.1.2)
          aux.der = None
        nodo_a_borrar = None
        return aux
      
      # Caso2.2) solo se tiene hijo izquierdo, entonces se sube al hijo izquierdo
      if nodo_a_borrar.izq is not None and nodo_a_borrar.der is None:
        nodo_a_borrar.izq.padre = nodo_a_borrar.padre
        aux = nodo_a_borrar.padre
        # revisamos si el nodo a borrar es un hijo izquiero o derecho
        if es_izquierdo: # Caso2.2.1)
          nodo_a_borrar.padre.izq = nodo_a_borrar.izq
        else: # Caso2.2.2)
          nodo_a_borrar.padre.der = nodo_a_borrar.izq
        return aux

      # Caso2.3) solo se tiene hijo derecho, entonces se sube al hijo derecho
      if nodo_a_borrar.izq is None and nodo_a_borrar.der is not None:
        nodo_a_borrar.der.padre = nodo_a_borrar.padre
        aux = nodo_a_borrar.padre
        # revisamos si el nodo a borrar es un hijo izquiero o derecho
        if es_izquierdo: # Caso2.3.1)
          nodo_a_borrar.padre.izq = nodo_a_borrar.der
        else: # Caso2.3.2)
          nodo_a_borrar.padre.der = nodo_a_borrar.der
        return aux

      # Caso2.4) tiene ambos hijos
      if nodo_a_borrar.izq is not None and nodo_a_borrar.der is not None:
        # buscamos el minimo en el subarbol derecho
        minimo = self.minimo_en_subarbol(nodo_a_borrar.der)
        aux = minimo.padre
        nodo_a_borrar.dato = minimo.dato
        self.borra_nodo(minimo, minimo.dato)
        return aux
  
  ''' Borra un nodo que contiene a dato a partir de la raiz'''
  def borrar(self, dato):
    self.borra_nodo(self.raiz, dato)

# Métodos Importantes

Lo primero que podemos notar, es que dado que la clase ABB hereda de la clase AB, entonces ya tenemos los siguientes métodos que no sufren cambios con respecto a la clase AB:

*   `elimina`: borra todo el árbol.
*   `nivel`: devuelve el nivel del nodo.
*   `altura`: devuelve la altura de un nodo.
*   `recorridos`: devuelve la altura de un nodo.

Todos estos métodos no sufren cambios ya que funcionan exactamente igual que en la versión AB.

Por otro lado los metodos que sufren cambios y que requiere un analizis más detallados son los siguientes: 

*   `busqueda`: busca un valor en el árbol.
*   `insertar`: inserta un valor en el árbol a partir de la raíz.
*   `borrar`: borra un valor del árbol a partir de la raíz.

Para una mejor comprensión del funcionamiento de estos métodos harémos uso del programa *trees.jar* para mostrar de manera más detallada el funcionamiento de los mismos.


## `busqueda`

La idea de este método es que se busque al nodo que contenga un determinado dato, en caso de el árbol no sea vació (`nodo is not None`), comenzamos a buscar al dato en el árbol.

Supongamos que tenemos el siguiente ABB.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/busqueda.png?raw=1" width="500"> 
</center>

Y tratemos de buscar el nodo con el valor "55", dado que el ABB es no vacío lo primero que hacemos es comenzar a buscar desde la raíz, así que estos serían los pasos:

*   Comparamos el valor 55 con el dato contenido en la raíz, como el valor 55 es mayor, ahora nos desplazamos al hijo derecho de la raíz.
*   Comparamos el valor 55 con el dato contenido en el hijo derecho de la raíz, como el valor 55 es mayor, ahora nos desplazamos al hijo derecho del hijo derecho de la raíz.
*   Comparamos el valor 55 con el dato contenido en el hijo derecho del hijo derecho de la raíz, como el valor 55 es igual al dato contenido con este nodo ya se localizo al dato y el método devuelve el nodo que contiene a dicho valor.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/busqueda1.gif?raw=1" width="700"> 
</center>

En caso de que el valor a buscar no exista en el árbol, aún así es necesario buscarlo en el mismo y en el mejor de los casos el máximo número de comparaciones realizadas sería logarítmica $O(\log_{2}n)$ donde $n$ es el número de nodos.

Supongamos que queremos bucar el valor 10 en el ABB.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/busqueda2.gif?raw=1" width="700"> 
</center>



## `insertar`

El proceso para poder insertar un valor en el ABB es muy similar al de la búsqueda, la diferencia principal radica en que en el momento de llegar a un nodo vacío (`None`) en ese momento se crea un nuevo nodo y establecen los vínculos de hijo y padre respectivamente.

Tomando como ejemplo el mismo ABB usado previamente, veamos que sucede si tratamos de insertar el valor 43.

*   Comparamos el valor 43 con el dato contenido en la raíz, como el valor 55 es mayor, ahora nos desplazamos al hijo derecho de la raíz.
*   Comparamos el valor 43 con el dato contenido en el hijo derecho de la raíz (45), como el valor 43 es menor, ahora nos desplazamos al hijo izquierdo del hijo derecho de la raíz.
*   Dado que ese nodo no existe (`None`), en ese momento ya encontramos la posición donde debe crearse el nuevo nodo, ademas de saber quien es el padre.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/insertar.gif?raw=1" width="700"> 
</center>

En caso de tratar de insertar un valor existente en el ABB, simplemente ya no se inserta, veamos que sucede si se trata de insertar el valor 55 nuevamente.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/insertar2.gif?raw=1" width="700"> 
</center>

## `borrar`

El método para eliminar un valor dentro de un ABB requiere un poco más de esfuerzo para cumplir con el orden dentro del ABB.

El primer paso para eliminar un valor en un ABB es buscar dicho valor, si el valor no se encuentra en el árbol, no lo podemos eliminar por lo que podemos pensar que este caso junto con el caso de que el ABB sea un ABB vacío, son los **casos triviales**.

Por otro lado, en caso de que el valor a eliminar si se encuentre dentro del ABB tenemos 2 opciones, localizar al mayor de los hijos izquierdos (máximo de los menores) ó localizar al menor de los hijos derechos (mínimo de los mayores). 

Cualquiera de estos 2 nodos (máximo de los mayores ó mínimo de los mayores), cumple con la cualidad de que al substituir el valor a eliminar con alguna de estas 2 opciones, **el orden se mantiene**.

Los casos triviales ya no muestran, y solo verémos que sucede cuando el ABB es no vacío y el dato a eliminar si se encuentra en el ABB. Supongamos que queremos eliminar el valor 45 dentro del siguiente ABB.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/eliminar.png?raw=1" width="700"> 
</center>

Los dos posibles candidatos son el valor 48 (mínimo de los mayores) o el 44 (máximo de los menores), veamos.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/minimo.gif?raw=1" width="700"> 
</center>

### ¿Más casos?

Para ser honesto existen más casos, por ejemplo ¿qué sucede si el nodo a eliminar no tiene hijos? ó ¿qué sucede si solo tiene hijo izquierdo? ó ¿qué sucede si el nodo a eliminar es la raíz? ó ¿qué sucede si el mínimo tiene ambos hijos y a su vez estos tienen más hijos? 😮

Todos estos casos, se explican de manera detallada tanto en código como en el programa *trees.jar*, así que **se deja como tarea al lector revisar y entender todos estos posibles casos**.

# Pruebas

Ahora podemos probar el código de los `ABB` y también ver el comportamiento de este ABB usando *trees.jar*.

In [16]:
def main():
  abb = ABB(10)
  abb.insertar(5)
  abb.insertar(6)
  abb.insertar(3)
  abb.insertar(15)
  abb.insertar(12)
  abb.insertar(17)
  
  print('Altura desde la raiz')
  print(abb.altura(abb.raiz))
  print('Nivel del nieto izquierdo de la raiz')
  print(abb.nivel(abb.raiz.izq.izq))
  print('recorido en orden')
  abb.recorrido_enorden(abb.raiz)
  print('recorido en preorden')
  abb.recorrido_preorden(abb.raiz)
  print('recorido en postorden')
  abb.recorrido_postorden(abb.raiz)
  
  abb.borrar(5)
  
  print ('recorido en orden')
  abb.recorrido_enorden(abb.raiz)

if __name__ == "__main__":
  # llamamos a la funcion main
  main()

Altura desde la raiz
3
Nivel del nieto izquierdo de la raiz
2
recorido en orden
3
5
6
10
12
15
17
recorido en preorden
10
5
3
6
15
12
17
recorido en postorden
3
6
5
12
17
15
10
recorido en orden
3
6
10
12
15
17


<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/abb.gif?raw=1" width="700"> 
</center>

Antes de eliminar el valor 5, el ABB se ve así.

<center>
<img src="https://github.com/jugernaut/ManejoDatos/blob/desarrollo/Imagenes/AlgoritmosBusqueda/abb1.png?raw=1" width="700"> 
</center>

Podemos notar que la altura del ABB es 3 y el ABB tiene como máximo nivel el nivel 2, tal como se muestra en código.

¡¡¡Comprueba que los recorridos que se muestran en la ejecución del código correspondan con las definiciones de dichos recorridos, posteriormente elimina el nodo con el valor 5 vuelve a comprobar los recorridos!!!.

# Referencias

1.  Thomas H. Cormen: Introduction to Algorithms.
2.  Referencias Libro Web: Introduccion a Python.
3.  Referencias Daniel T. Joyce: Object-Oriented Data Structures.
4.  Referencias John C. Mitchell: Concepts in programing Languages.