# Búsqueda Binaria

Esta lección te resultará bastante fácil si ya sabes cómo ordenar una lista de elementos. Hay más de una manera de buscar elementos en una lista, pero es muchísimo más fácil si ya está ordenada. Por ejemplo, si buscas el elemento más grande de la lista, sólo tienes que retornar el último elemento de la lista ordenada, si buscas el menor, retornas el primero, si buscas el segundo, tercero o cuarto menor elemento, pues sólo retornas el segundo, tercero o cuarto elemento. Super fácil ¿no? Bien, esas son operaciones de orden constante, porque estás buscando un elemento al que te puedes referir con un índice que conoces de antemano.

En otro caso un tanto diferente, si quieres buscar un elemento específico, digamos que tienes el arreglo `[1, 5, 9, 11, 16]`, y quieres buscar el número 9, realmente no hay manera de saber *a priori* que es el elemento que justo está en medio. Una forma de buscarlo sería más o menos evidente: buscas uno por uno desde el principio de la lista hasta que encuentres un número que sea igual a `9`. Y en este caso te tomaría 3 iteraciones encontrarlo. O, por ejemplo, puedes tener un arreglo `[1,2,3,4,5,6,7,8,9,10]`, en ese caso te tomaría 9 iteraciones buscarlo. Claro, podrías buscar desde el final y tomaría menos iteraciones, pero tampoco sabes *a priori* si no hay elementos repetidos. En el arreglo `[1,1,1,1,1,1,9,10,10,10,10,10,10]` te tomaría el mismo número de iteraciones si lo buscas desde el principio que si lo buscas desde el final hacia atrás. Y digamo, no es tan malo ni tan lento, después de todo, un algoritmo que itera una vez de principio a fin, es de orden "O(n)", entonces te tomaría, máximo, en el peor caso, "n" iteraciones encontrar un elemento. Pero de nuevo, eso significa que si tu elemento es el penúltimo o último, en una lista de 10,000 números, te tomaría prácticamente 10,000 iteraciones, o si es un número que está en el medio te tomaría cerca de 5,000 iteraciones.

## Algoritmo de búsqueda binaria

Pero, ¿y si te dijera que hay una forma mucho más rápida de buscar números si el arreglo ya está ordenado? ¿Que hay una manera de que un arreglo de más de 1 millón de elementos te tome máximo 20 iteraciones llegar a cualquier número? Pues sí, la hay, y lo mejor; el algoritmo es super simple, hermoso, elegante.

El principio que sigue es muy sencillo:
- Buscamos desde la mitad del arreglo, y al elemento que contiene le llamaremos "pivote"
  - Si el pivote ES el que estamos buscando, terminamos
  - Si el elemento que buscamos es menor que el pivote, descartamos todo el lado derecho del arreglo
  - Si el elemento que encontramos es mayor que el pivote, descartamos todo el lado izquierdo del arreglo
- Si no hemos encontrado el elemento, usamos la nueva mitad que seleccionamos en el paso anterior y repetimos desde el principio


Eso es todo. Sí, en serio, eso es todo lo que hay que hacer, por lo menos "en papel". Ahora te explicaré en más detalle por qué esto es mucho más rápido en casi todos los casos que buscar secuencialmente.

Considera el siguiente arreglo: `[2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30]`

Tiene todos los números pares desde el 2 hasta el 30, y contiene 15 elementos. Ahora, si buscamos el número 16, empezamos por calcular el índice del pivote, redondeando hacia abajo el resultado, en caso de que el número de elementos (la longitud del arreglo) sea impar. Y comparamos el número que buscamos contra el pivote.

### Ejemplos

```
indice_pivote = 15 // 2 -> 7

# Buscamos el elemento en el índice del pivote (recuerda que los índices empiezan en 0)
arreglo[7] -> 16

```

Y así, en una sola iteración, encontramos que nuestro elemento existe. Pero busquemos algo que normalmente sería el peor caso para un algoritmo de estos: uno que está en las orillas. 

Busquemos el número 30.

```
### Iteracion 1 ###

indice_pivote = 15 // 2 -> 7
# Buscamos el elemento en el índice del pivote (recuerda que los índices empiezan en 0)
arreglo[7] -> 16

# 30 es mayor que que el pivote (16), entonces buscaremos ahora en la mitad que va desde el pivote hasta el final.

### Iteracion 2 ###

# Nuestro nuevo arreglo es entonces: 

 (0) (1) (2) (3) (4) (5) (6) <- Nuevos índices
[18, 20, 22, 24, 26, 28, 30] 

# El nuevo arreglo tiene 7 elementos
# Calculamos un nuevo pivote:
indice_pivote = 7 // 2 -> 3
# Buscamos el elemento en el índice del pivote
arreglo[3] -> 24

# 30 sigue siendo mayor que el nuevo pivote (24), entonces volvemos a buscar en la mitad derecha

### Iteracion 3 ###

 (0) (1) (2)
[26, 28, 30]

# El nuevo arreglo tiene 7 elementos
# Calculamos un nuevo pivote:
indice_pivote = 3 // 2 -> 1
# Buscamos el elemento en el índice del pivote
arreglo[1] -> 28

# 30 sigue siendo mayor que el nuevo pivote (24), entonces volvemos a buscar en la mitad derecha

### Iteracion 4 ###
 (0)
[30]

# El nuevo arreglo tiene 7 elementos
# Calculamos un nuevo pivote:
indice_pivote = 1 // 2 -> 0
# Buscamos el elemento en el índice del pivote
arreglo[0] -> 30

# Encontramos nuestro elemento (30)
```

Y así, nuestro peor caso son 4 iteraciones.

### Complejidad

Por si te interesa saber la complejidad, la complejidad del algoritmo de búsqueda binaria es de "O(log<sub>2</sub>(n))", que significa que un número (normalmente 2), elevado a una determinada potencia, te daría como resultado "n". Esto es casi el opuesto en complejidad de los algoritmos con compejidad cuadrática o exponencial, porque este, en lugar de elevarse a una potencia, implica que el número de la potencia, en sí mismo, es el máximo número de iteraciones a realizar. En este caso, implica que `2` elevado a una determinada potencia equivale a nuestro `n`, o sea que **esa potencia** que encuentra la expresión de logaritmo base 2 (log<sub>2</sub>) siempre será mucho menor que `n`.

Por ejemplo:
- log<sub>2</sub>(8) = 3
- log<sub>2</sub>(256) = 8
- log<sub>2</sub>(1024) = 10
- log<sub>2</sub>(1048576) = 20

Eso nos dice que para un arreglo con 8 elementos, nos tomará **máximo** 3 iteraciones encontrar cualquier elemento, y para una lista con **1048576 elementos** nos tomará **máximo** 20 iteraciones llegar a cualquier número.

Entonces, en nuestro pequeño caso, log<sub>2</sub>(15) = 3.9069, que se redondea a 4, como en el último ejemplo, que nos tomó `4` iteraciones llegar al elemento que representaría el peor caso para este algoritmo (el último elemento, o primer elemento de un arreglo). 

## Implementación recursiva en Python

La implementación del código puede ser de dos maneras, iterativa o recursiva. Como encontrarás a menudo, las soluciones recursivas suelen ser más fáciles de implementar que las soluciones iterativas, pero al mismo tiempo, las soluciones recursivas pueden llegar a hacer demasiadas llamadas recursivas (como vimos en la secuencia de Fibonacci) y llega un momento en que no puede alojar más llamadas recursivas y arroja un error. Ahora, lo bueno es que eso sólo sucede cuando la entrada es prácticamente gigantesca, pero para nuestro caso, y para fines didácticos, podemos utilizarla sin mayor problema. De hecho la mayor parte del tiempo, en aplicaciones no-enormes, cualquiera de las dos funcionará bastante bien, mientras el resultado sea correcto; y para fines de este curso, te mostraré ambos métodos.

In [28]:
# Recibimos como parámetros la lista de números ("lista")
# y el número que estamos buscando ("n")
def busqueda_binaria_recursiva(lista, n):
    longitud = len(lista)
    # Caso base: si llegamos a una lista vacía, retornamos False
    if longitud == 0:
        return False
    # Caso base: si la longitud es 1 y no es el elemento que buscamos
    elif longitud == 1 and lista[0] != n:
        return False
    # Calculamos el índice del pivote redondeando hacia abajo
    # la división de la longitud / 2 (en caso de que el resultado contenga .5)
    i_pivote = longitud // 2
    elem_pivote = lista[i_pivote]
    # Si encontramos el elemento retornamos True
    if elem_pivote == n:
        return True
    # Si el que buscamos es menor que el pivote
    elif n < elem_pivote:
        # Repetimos la búsqueda en la mitad izquierda del arreglo
        return busqueda_binaria_recursiva(lista[0:i_pivote], n)
    else:
        # Si no, repetimos la búsqueda en la mitad derecha del arreglo
        return busqueda_binaria_recursiva(lista[i_pivote + 1:longitud], n)

In [29]:
arreglo_par = [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
arreglo_impar = [1, 3, 5, 7, 9, 11, 13, 15, 17]
print(f"El arreglo_par contiene sólo elementos pares, y tiene una longitud par {len(arreglo_par)}")
print(f"El arreglo_impar contiene sólo elementos impares, y tiene una longitud impar {len(arreglo_impar)}")

El arreglo_par contiene sólo elementos pares, y tiene una longitud par 10
El arreglo_impar contiene sólo elementos impares, y tiene una longitud impar 9


In [30]:
print("Buscar el numero 6 en arreglo par:", busqueda_binaria_recursiva(arreglo_par, 6))
print("Buscar el numero 14 en arreglo par:", busqueda_binaria_recursiva(arreglo_par, 14))
print("Buscar el numero 13 en arreglo par:", busqueda_binaria_recursiva(arreglo_par, 13))

Buscar el numero 6 en arreglo par: True
Buscar el numero 14 en arreglo par: True
Buscar el numero 13 en arreglo par: False


In [31]:
print("Buscar el numero 7 en arreglo par:", busqueda_binaria_recursiva(arreglo_impar, 7))
print("Buscar el numero 17 en arreglo par:", busqueda_binaria_recursiva(arreglo_impar, 17))
print("Buscar el numero 12 en arreglo par:", busqueda_binaria_recursiva(arreglo_impar, 12))

Buscar el numero 7 en arreglo par: True
Buscar el numero 17 en arreglo par: True
Buscar el numero 12 en arreglo par: False


### Implementación iterativa en Python

Repito, no es tan intuitivo como la recursiva, pero en casos donde el arreglo es gigantesco (y para otros algoritmos que no son tan simples como búsqueda binaria), es frecuentemente mucho más eficiente en tiempo de ejecución cuando no se hacen llamadas recursivas.

En este caso, para sustituir las llamadas recursivas en sub-arreglos, lo que haremos será llevar el control de los índices de donde termina e inicia cada parte de la sub-lista, y recorriendo uno de los índices por mitad cada iteración.

In [32]:
def busqueda_binaria_iterativa(lista, n):
    i=0
    j=len(lista)
    encontrado = False
    while not encontrado and i <= j:
        # Calculamos el pivote como la "longitud" que hay
        # entre nuestros extremos dividida entre 2
        # Y se lo sumamos a partir de donde empieza nuestra sub-lista (índice i)
        indice_pivote = i + ((j-i) // 2)
        elem_pivote = lista[indice_pivote]
        if elem_pivote == n:
            encontrado = True
        # Si el elemento que buscamos es menor que el pivote 
        # Recorremos el índice 'j' hacia la izquierda del pivote
        elif n < elem_pivote:
            j = indice_pivote - 1
        # Si el elemento que buscamos es mayor que el pivote 
        # Recorremos el índice 'i' hacia la derecha del pivote
        else:
            i = indice_pivote + 1
    return encontrado

Y ahora usaremos los mismos ejemplos anteriores con nuestra versión iterativa del arreglo.

In [33]:
arreglo_par = [2, 4, 6, 8, 10, 12, 14, 16, 18, 20]
arreglo_impar = [1, 3, 5, 7, 9, 11, 13, 15, 17]
print(f"El arreglo_par contiene sólo elementos pares, y tiene una longitud par {len(arreglo_par)}")
print(f"El arreglo_impar contiene sólo elementos impares, y tiene una longitud impar {len(arreglo_impar)}")

El arreglo_par contiene sólo elementos pares, y tiene una longitud par 10
El arreglo_impar contiene sólo elementos impares, y tiene una longitud impar 9


In [34]:
print("Buscar el numero 6 en arreglo par:", busqueda_binaria_iterativa(arreglo_par, 6))
print("Buscar el numero 14 en arreglo par:", busqueda_binaria_iterativa(arreglo_par, 14))
print("Buscar el numero 13 en arreglo par:", busqueda_binaria_iterativa(arreglo_par, 13))

Buscar el numero 6 en arreglo par: True
Buscar el numero 14 en arreglo par: True
Buscar el numero 13 en arreglo par: False


In [35]:
print("Buscar el numero 7 en arreglo par:", busqueda_binaria_iterativa(arreglo_impar, 7))
print("Buscar el numero 17 en arreglo par:", busqueda_binaria_iterativa(arreglo_impar, 17))
print("Buscar el numero 12 en arreglo par:", busqueda_binaria_iterativa(arreglo_impar, 12))

Buscar el numero 7 en arreglo par: True
Buscar el numero 17 en arreglo par: True
Buscar el numero 12 en arreglo par: False
