<a href="https://colab.research.google.com/github/Norwrongcl/ADA-Informes/blob/main/OptimalBST.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#1. Optimal Binary Search Tree
**Entrada**: Secuencia ordenada de n claves: $K=\left<k_1,k_2,...,k_n\right>$. Cada clave $k_i$ tiene una probabilidad $p_i$ de ser buscada. Existen claves ficticias $d_i$ que representan búsquedas fallidas con $k_{i-1} \leq d_i \leq k_i$. Cada clave $d_i$ tiene una probabilidad $q_i$ de ser buscada. La suma de probabilidades debe ser uno, es decir: $\sum\limits_{i=1}^n p_i + \sum\limits_{j=0}^n q_i = 1$

**Salida**: Un árbol de búsqueda óptimo, es decir, un árbol que minimice la cantidad esperada de nodos visitados (costo esperado).

Los árboles binarios de búsqueda, también llamados **BST** (Binary Search Tree) son un tipo particular de árbol, el cual presenta una estructura de datos en esta forma. Éstos siempre tienen una raíz e hijos izquierdos y derecho, en donde se cumple que el subárbol izquierdo de cualquier nodo no vacío contiene valores menores a dicho nodo, y el subárbol derecho contiene sus valores mayores. Existen algoritmos implementados por medio del paradigma **programación dinámica**, existe aquel caso en donde queremos buscar un elemento, sin embargo, ya conocemos la frecuencia con la que será visitado cada uno. Por lo tanto, lo mejor sería construir un árbol que tenga los elementos más repetidos en la parte superior, y aquellos que no mucho más abajo. A esto lo llamaremos **árbol binario de búsqueda óptimo**.

![image](https://cis.temple.edu/~wolfgang/cis551/Korsh_ch12_4-12_5/537_A.GIF)

#2. Árbol de búsqueda óptimo

# 2. Descripcion del algoritmo

Arbol binario de búsqueda óptimo funcionara de la siguiente manera:

1. Primeramente se crea un matriz auxiliar que guardara los valores.

2. Se realiza una comparacion segun los nodos, si tenemos un nodo donde el coste es igual a la frecuencia del nodo y el segundo caso para cuando tenemos mas de un nodo donde su frecuencia es igual al coste, calculandose su respectivo coste.

3. Se guardan los valores iterativamente.

>Arbol binario de búsqueda óptimo con programacion dinamica: A diferencia del recurisvo este es modificable en cualquier momento de su ejecucion permitiendo rotaciones de arboles. Tiene una ventaja en su complejidad a comparacion del Arbol binario de búsqueda óptimo recursivo debido a que por medio del guardado de las operaciones anteriormente hechas, no es necesario el resolverlas nuevamente logrando asi un clara ventaja en comparacion de crear este algoritmo de manera recursiva.

>Arbol binario de búsqueda óptimo con programacion recursiva: El arbol puede ser modificado unicamente una sola vez que este ha sido construido. Este tipo de programacion es bastante ineficiente a comparacion de la programacion dinamica debido a que trantando de cumplir la misma funcion en este caso el costo optimo debe de resolver todos los subproblemas anteriores al actual debido a que estos no fueron almacenados en ninguna variable auxiliar, es por ello que aumentan significativamente su complejidad pero "optimizan" su memoria.

##2.1 Código
A continuación, se presentan dos implementaciones del algoritmo estudiado: por recursión y por acercamiento bottom-up (programación dinámica).

In [4]:
import random
import numpy as np
from termcolor import cprint

subproblems = 0

def recursive_optimalBST():
  e = [[0 for x in range(n)] for y in range(n)]
  return e[0][n-1]

def dp_optimalBST(p, q, n):
  global subproblems
  e = [[0 for x in range(n)] for y in range(n)]
  w = [[0 for x in range(n)] for y in range(n)]

  for i in range(n):
    e[i][i] = q[i]
    w[i][i] = q[i]
  
  for l in range(1,n+1):
    for i in range(n-l+1):
      j = i + l - 1
      e[i][j] = 999999
      w[i][j] = w[i][j-1] + p[j] + q[j]
      for r in range(i,j+1):
        t = 0
        if (r > i):
          t += e[i][r-1]
        if (r < i):
          t += e[r+1][j]
        t += w[i][j]
        if t < e[i][j]:
          subproblems+=1
          e[i][j] = t
  
  return e[0][n-1]

def optimal_bst_instance_generator(n):
    keys = sorted(random.sample(range(1, 100), n))
    arr = np.random.random(n*2+1)
    arr /= arr.sum()
    
    p = list(arr[:n]) 
    q = arr[n:]
    return keys, p, q

# MAIN #
n = random.randint(1,10)
opt = random.randint(1,2)
keys, p, q = optimal_bst_instance_generator(n)
cprint(f"Elementos del árbol: {keys}", 'red', attrs=["bold"])
if (opt == 1):
  cprint("Implementación: Programación dinámica", 'green')
  test = dp_optimalBST(p,q,n)
  cprint(f"prueba: {test}",'blue')
  cprint(f"Subproblemas resueltos: {subproblems}",'yellow')
if (opt == 2):
  cprint("Implementación: Recursiva",'blue')
  test = recursive_optimalBST()
  cprint(f"prueba: {test}",'red')

[1m[31mElementos del árbol: [6, 7, 32, 33, 40, 66, 84][0m
[32mImplementación: Programación dinámica[0m
[34mprueba: 0.9107277965450611[0m
[33mSubproblemas resueltos: 28[0m
