<a href="https://colab.research.google.com/github/Sylver640/ADA-Informes/blob/main/Informe_OptimalBST.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#1. Descripción del problema
**Entrada**: Secuencia ordenada de n claves: $K=\left<k_1,k_2,...,k_n\right>$. Cada clave $k_i$ tiene una probabilidad $p_i$ de ser buscada. Existen claves ficticias $d_i$ que representan búsquedas fallidas con $k_{i-1} \leq d_i \leq k_i$. Cada clave $d_i$ tiene una probabilidad $q_i$ de ser buscada. La suma de probabilidades debe ser uno, es decir: $\sum\limits_{i=1}^n p_i + \sum\limits_{j=0}^n q_i = 1$

**Salida**: Construir un árbol de búsqueda óptimo, es decir, un árbol que minimice la cantidad esperada de nodos visitados (costo esperado).

Los árboles binarios de búsqueda, también llamados **BST** (Binary Search Tree) son un tipo particular de árbol, el cual presenta una estructura de datos en esta forma. Éstos siempre tienen una raíz e hijos izquierdos y derecho, en donde se cumple que el subárbol izquierdo de cualquier nodo no vacío contiene valores menores a dicho nodo, y el subárbol derecho contiene sus valores mayores. Ahora bien, siguiendo con nuestra línea que estudia algoritmos implementados por medio del paradigma de **programación dinámica**, existe aquel caso en donde queremos buscar un elemento, sin embargo, ya conocemos la frecuencia con la que será visitado cada uno. Por lo tanto, lo mejor sería construir un árbol que tenga los elementos más repetidos en la parte superior, y aquellos que no mucho más abajo.

¿Es esto posible? **Sí**, y eso es lo que será analizado a continuación, donde podremos organizar un árbol binario de búsqueda para minimizar la cantidad de nodos visitados en todas las búsquedas. A esto lo llamaremos **árbol binario de búsqueda óptimo**.

![image](https://upload.wikimedia.org/wikipedia/commons/9/9c/Optimal-binary-search-tree-from-sorted-array.gif)

#2. Árbol de búsqueda óptimo

##2.1 Código
A continuación, se presentan dos implementaciones del algoritmo estudiado: por recursión y por acercamiento bottom-up (programación dinámica).

In [89]:
import random
import numpy as np
from termcolor import cprint

subproblems = 0

def recursive_optimalBST():
  e = [[0 for x in range(n)] for y in range(n)]
  return e[0][n-1]

def dp_optimalBST(p, q, n):
  global subproblems
  e = [[0 for x in range(n)] for y in range(n)]
  w = [[0 for x in range(n)] for y in range(n)]

  for i in range(n):
    e[i][i] = q[i]
    w[i][i] = q[i]
  
  for l in range(1,n+1):
    for i in range(n-l+1):
      j = i + l - 1
      e[i][j] = 999999
      w[i][j] = w[i][j-1] + p[j] + q[j]
      for r in range(i,j+1):
        t = 0
        if (r > i):
          t += e[i][r-1]
        if (r < i):
          t += e[r+1][j]
        t += w[i][j]
        if t < e[i][j]:
          subproblems+=1
          e[i][j] = t
  
  return e[0][n-1]

def optimal_bst_instance_generator(n):
    keys = sorted(random.sample(range(1, 100), n))
    arr = np.random.random(n*2+1)
    arr /= arr.sum()
    
    p = list(arr[:n]) # Probabilidad de las claves
    q = arr[n:] # Probabilidad de las claves ficticias
    return keys, p, q

#Ejemplo
n = random.randint(1,10)
opt = random.randint(1,2)
keys, p, q = optimal_bst_instance_generator(n)
cprint(f"Elementos del árbol: {keys}", 'yellow', attrs=["bold"])
if (opt == 1):
  print("Implementación: Programación dinámica")
  test = dp_optimalBST(p,q,n)
  print(f"prueba: {test}")
  print(f"Subproblemas resueltos: {subproblems}")
if (opt == 2):
  print("Implementación: Recursiva")
  test = recursive_optimalBST()
  print(f"prueba: {test}")

[1m[33mElementos del árbol: [9, 23, 39][0m
Implementación: Programación dinámica
prueba: 0.984873442142604
Subproblemas resueltos: 6


##2.2 Descripción del algoritmo

##2.3 Ejemplo

##2.4

#3. Correctitud

#4. Tiempo de ejecución

#5. Experimentos