# Búsqueda binaria

* [Adivinar un número entero entre el 1 y el 100](#u2c4.1)
* [Uso de la búsqueda binaria para calcular la raíz cuadrada](#u2c4.2)
* [Ventajas de la búsqueda binaria](#u2c4.3)
* [Comparación de la búsqueda exhaustiva y la búsqueda binaria: hallar la raíz cúbica de un número $N$](#u2c4.4)
* [La búsqueda binaria: descripción](#u2c4.5)
* [Más detalles de la comparación de la búsqueda exhaustiva y la búsqueda binaria en la obtención de la raíz cuadrada](#u2c4.6)
* [Ejercicios](#u2c4.7)

<a id="u2c4.1"></a>
## Adivinar un número entre el 1 y el 100


Nos piden adivinar un número entero $N$ del 1 al 100. Ya conocemos un algoritmo de búsqueda exhaustiva. En el algoritmo de búsqueda binaria se empieza en $n_0=50,$ el punto medio de la secuencia considerada, no en el primer valor, y se verifica si $N$ es o bien 

    i) igual a $n_0$, o bien 
    ii) mayor que $n_0$ o bien 
    iii) menor a $n_0$. 

En el primer caso ya habríamos acabado. En el segundo caso, escogeríamos el punto medio entre 0 y 50, es decir 25, como nuestra siguente apuesta; en el tercer caso se escogería el 75. Reptiendo el procedimiento llegaremos a $N$.

In [None]:
import random
N = random.randint(1,100)

def busqueda_binaria(N):
    
    limInf = 1
    limSup = 100
    n = int((limSup + limInf)/2)
    
    while n != N:
        if n < N:
            limInf = n
        else:
            limSup = n
        n = int((limSup + limInf)/2)
    
    print('Has acertado, el número es: ',n,N)

busqueda_binaria(N)      

En la búsqueda binaria las condiciones que se verifican a cada paso requieren mucha información: si nuestra apuesta es mayor, igual o menor a $N$. Para poder hacer estas verificaciones es necesario que haya algún tipo de __orden__ subyacente en los elementos entre los que buscamos. En particular, los número enteros son un conjunto ordenado y poseen las propiedades necesarias para esta tarea. En este caso usamos también los operadores de comparación `>` y `<`.

<a id="u2c4.2"></a>
## Uso de la búsqueda binaria para calcular la raíz cuadrada

Vamos a mejorar el algoritmo de búsqueda de la raíz cuadrada de un número mayor que uno. Para ello usaremos que si $N>1$ entonces

$$
1<N<N^2\Leftrightarrow 1<\sqrt[2]{N}<N.
$$

Por tanto, dado un número $N$, su raíz cuadrada estará en el intervalo $[1,N]$. Llamaremos $r$ al valor buscado, es decir, a la raíz cuadrada de $N$: $r=\sqrt{N}$.

Como el intervalo $[1,N]$ es un conjunto ordenado podemos usar, como primera aproximación de $r$, el punto medio del intervalo, $\tilde{r}$, y preguntar si el cuadrado de ese número es

    i) igual a $N$ (con una precisión dada), 
    ii) mayor (con una precisión dada) o 
    iii) menor que $N$ (con una precisión dada). 

En el primer caso hemos terminado. En el segundo ocurrirá que la raíz cuadrada de $N$ estará en el intervalo $[1,\tilde{r}]$ y en el tercero en $[\tilde{r},N]$. Repetimos el procedimiento con una nueva aproximación a $r$, que sea el punto medio del intervalo obtenido en el paso anterior.

__Atención:__ no podemos usar preguntas del tipo ¿es $\tilde{r}$ igual/mayor/menor que la raíz de $N$? No conocemos ese valor, por tanto hemos de comparar usando $\tilde{r}^2$.

In [None]:
N = 389
precision = 0.001

menor = 1
mayor = N
prueba = (menor + mayor)/2
contador = 0

while abs(prueba**2 - N) >= precision:
    if prueba**2 > N:
        mayor = prueba
    else:
        menor = prueba
    prueba =(menor + mayor)/2
    contador += 1

print('La raíz cuadrada de ',N,' es ',prueba, 'con una precisión ',precision)
print('Hemos dado: ',contador,' iteraciones.')

<a id="u2c4.3"></a>
## Ventajas de la búsqueda binaria

Hemos visto que la búsqueda binaria es más restrictiva que la búsqueda exhaustiva: es necesaria una ordenación del conjunto donde estamos buscando. En el caso de los números enteros o reales esta ordenación existe, pero en otros casos puede no existir o no ser tan obvia. Pensemos en la tarea de contar la cantidad de letras _s_ de las obras completas de Calderón de la Barca. ¿Qué tipo de orden existe entre las letras de, por ejemplo, La vida es sueño?

Esta restricción, tan fastidiosa a veces, viene con una gran ventaja: la búsqueda binaria es mucho más eficiente que la búsqueda exhaustiva. Usando la búsqueda binaria daremos muchos menos pasos, en media, para llegar a nuestro objetivo.

__Observaciones:__ Existen algoritmos que mejoran la velocidad de la búsqueda binaria.

__Adivinar un número entre 1 y 100__

Vamos a contar el número de preguntas que tenemos que hacer en cada caso, es decir, el número de iteraciones que hay que realizar para obtener el resultado.

In [None]:
#import random
#N = random.randint(1,100)
N = 86

def busqueda_exhaustiva_pasos(N):
    pasos = 0
    for i in range(1,101):
        pasos += 1
        if i == N:
            print('Has acertado, el número es: ',i,N)
            print('Hemos necesitado: ',pasos,' pasos.')
            break

def busqueda_binaria_pasos(N):
    limInf = 1
    limSup = 100
    n = int((limSup+limInf)/2)
    pasos = 0
    
    while n != N:
        if N > n:
            limInf = n
        else:
            limSup = n
        n = int((limSup + limInf)/2)
        pasos+=1
    
    print('Has acertado, el número es: ',n,N)
    print('Hemos necesitado: ',pasos,' pasos.')

busqueda_exhaustiva_pasos(N)
busqueda_binaria_pasos(N) 

Para el caso particular $N=86$ necesitamos $86$ pasos en la búsqueda exhaustiva y solamente 6 de la búsqueda binaria. Veamos qué sucede en media.

Vamos a realizar varias simulaciones aleatorias con ambas búsquedas. Veremos que, en media, el número de iteracines  en la búsqueda binaria es próximo 5 en media, mientras que en la búsqueda exhaustiva es próxima, en media, a 53, con 10 simulaciones.

In [2]:
def busqueda_exhaustiva_numero_pasos(N):
    pasos = 0
    for i in range(1,101):
        pasos += 1
        if i == N:
            break
    return pasos
            
def busqueda_binaria_numero_pasos(N):
    limInf = 1
    limSup = 100
    n = int((limSup + limInf)/2)
    pasos = 0
    
    while n != N:
        if n < N:
            limInf = n
        else:
            limSup = n
        n = int((limSup + limInf)/2)
        pasos += 1
    return pasos

pasos_busqueda_exhaustiva = 0
pasos_busqueda_binaria = 0

media_exhaustiva = 0
media_binaria = 0
    
simulaciones = 1000
simulaciones_efectivas = 0
estamos_en_100 = False
enes = ''

import random
for s in range(simulaciones):
    N = random.randint(1,100)
    enes += str(N) +','
    if N == 100:
        #print('N es:',N)
        estamos_en_100 = True
        continue
    else:
        pasos_busqueda_exhaustiva += busqueda_exhaustiva_numero_pasos(N)
        pasos_busqueda_binaria += busqueda_binaria_numero_pasos(N)
    simulaciones_efectivas += 1

media_exhaustiva = pasos_busqueda_exhaustiva/simulaciones_efectivas
media_binaria = pasos_busqueda_binaria/simulaciones_efectivas

print('Media de pasos en búsqueda exhaustiva: ',media_exhaustiva)
print('Media de pasos en búsqueda binaria: ',media_binaria)
print('Tenemos', simulaciones_efectivas, 'simulaciones')
#print(enes[:-1])

Media de pasos en búsqueda exhaustiva:  49.638018200202225
Media de pasos en búsqueda binaria:  4.759352881698685
Tenemos 989 simulaciones


__Observación:__

Hay un problema con el número $100,$ $N = 100.$ En ese caso la búsqueda binaria no funciona, porque la operación:

$$\text{n} = \text{int}((\text{limSup} + \text{limInf})/2)$$

cuando $\textrm{limSup} = 100$ y $\textrm{limInf} = 99,$ implica que $n = 99,$ por tanto nunca se podrá elegir $100$ en el caso de este sea el valor seleccionado por la máquina. Por esta razón hemos eliminado el valor $100,$ en caso de que salga.

__Raíz cuadrada__

Las siguientes funciones cuentan el número de pasos para calcular la raíz cuadrada de un número con una precisón de   $0.001$ y un paso de $0.0001$

In [None]:
def raiz_cuadrada_exhaustiva(N):
    precision = 0.001
    paso = 0.0001
    prueba = 1
    contador = 0
    señal = False

    while abs(prueba**2-N) >= precision:
        if prueba**2 > N + precision:
            señal = True
            break       
        prueba +=paso
        contador+=1
    if señal:
        print('Nos hemos pasado')
    else:
        print('Pasos con la búsqueda exhaustiva:  ', contador)  

def raiz_cuadrada_binaria(N):
    precision = 0.001

    menor = 1
    mayor = N
    prueba = (menor + mayor)/2
    contador = 0

    while abs(prueba**2 - N) >= precision:
        if prueba**2 > N:
            mayor = prueba
        else:
            menor = prueba
        prueba =(menor + mayor)/2
        contador += 1
    print('Pasos con la búsqueda binaria:  ', contador)

raiz_cuadrada_exhaustiva(125)
raiz_cuadrada_binaria(125)

Hemos pasado de 101803 iteraciones en la búsqueda exhaustiva a 20 en la búsqueda binaria. Uno puede pensar que esto es un ejemplo concreto, pero si repetimos este procedimiento para todos los números entre el 100 y el 125 veremos que se repite este resultado.

In [None]:
def raiz_cuadrada_exhaustiva(N):
    precision = 0.001
    paso = 0.0001
    prueba = 1
    contador = 0
    señal = False

    while abs(prueba**2 - N) >= precision:
        if prueba**2 > N + precision:
            señal = True
            break       
        prueba += paso
        contador += 1
    return contador 

def raiz_cuadrada_binaria(N):
    precision = 0.001

    menor = 1
    mayor = N
    prueba = (menor + mayor)/2
    contador = 0

    while abs(prueba**2 - N) >= precision:
        if prueba**2 > N:
            mayor = prueba
        else:
            menor = prueba
        prueba = (menor + mayor)/2
        contador += 1
    return contador


pasos_busqueda_exhaustiva = 0
pasos_busqueda_binaria = 0
numero_pruebas = 25

for s in range(100,100 + numero_pruebas):
    pasos_busqueda_exhaustiva += raiz_cuadrada_exhaustiva(s)
    pasos_busqueda_binaria += raiz_cuadrada_binaria(s)

media_raiz_cuadrada_exhaustiva = pasos_busqueda_exhaustiva/numero_pruebas
media_raiz_cuadrada_binaria = pasos_busqueda_binaria/numero_pruebas
print('Media iteraciones en la búsqueda exhaustiva de la raíz: ',media_raiz_cuadrada_exhaustiva)
print('Media iteraciones en la búsqueda binaria de la raíz: ',media_raiz_cuadrada_binaria)

__Observación:__ Como ya se ha indicado la búsqueda binaria en este caso mejora mucho la eficiencia del algoritmo. En el caso del cálculo de raices el algoritmo de Newton-Raphson  mejora aún más esta eficiencia de la búsqueda binaria.

<a id="u2c4.5"></a>
## La búsqueda binaria: descripción

La búsqueda binaria es un tipo de búsqueda rápida que puede realizarse en conjuntos ordenados. 

Si buscamos un elemento en un conjunto ordenado,  dividimos el conjunto en dos partes (iguales) y conservamos aquella mitad donde podría encontrarse el elemento buscado. Volvemos a repetir este proceso con la mitad seleccionada y continuamos hasta encontrar el valor buscado.

**Ejemplo** Supongamos que tenemos un conjunto de cajas

$$\{ \square_1, \square_2,\square_3,\square_4,\square_5,\square_6,\square_7,\square_8 \}.$$

Las cajas contienen los números

$$\{ 1,2,3,5,6,8,11,15\},$$

en ese orden, pero no lo sabemos antes de abrirlas. El problema consiste en determinar si el número $3$ está en alguna de las cajas.

**Algoritmo** Si dividimos el conjunto de cajas en dos partes (de igual tamaño)

$$\{\square_1, \square_2,\square_3,\square_4\}, \quad \{ \square_5, \square_6,\square_7,\square_8\},$$

el $3$ estará en alguna de ellas.

Abrimos una de las cajas centrales:

$$ \square_5 = 6$$

Como $3 < 6$, el $3$ debe estar en la mitad izquierda (si está). Debemos buscar por ello en 

$$\{\square_1, \square_2,\square_3,\square_4\}.$$

Repetimos el proceso:

$$\square_2 = 2$$

por lo que continuamos buscando en 

$$\{\square_3, \square_4\}.$$

Una vez más

$$\square_4 = 2$$

por lo que continuamos buscando en

$$\{\square_3\}.$$

Y por último, abrimos la última caja:

$$\square_3=3$$

y comprobamos que $3$ sí está en el conjunto, precisamente en la tercera caja.

**Observaciones:** 

- Si en el último paso obtenemos un número diferente de $3$, entonces $3$ no formaría parte del conjunto. Hay dos problemas posibles: averiguar si $3$ está en el conjunto y averiguar en que caja está.

- Como en cada paso se reduce el número de elementos a la mitad, el algoritmo termina un número finito de pasos. Si el conjunto donde buscamos tiene $N$ cajas, serán necesarios $\log_2N$ pasos (en el peor escenario).

- La búsqueda exhaustiva (lineal) sería diferentes. Consistiría en ir abriendo las cajas $\square_1$, $\square_2$, $\dots$ en ese orden hasta encontrar (o no) el número buscado. En este caso serán necesarios $N$ pasos (en el peor escenario).

- La búsqueda binaria es más rápida pero exige que *los números contenidos en las cajas estén ordenados*. Esta condición es restrictiva.

<a id="u2c4.6"></a>
## Más detalles de la comparación de la búsqueda exhaustiva y la búsqueda binaria en la obtención de la raíz cuadrada

Vamos a ver más detalles de la comparación de la eficiencia de ambos algoritmos en la búsqueda de la raíz cuadrada de un número mayor que uno.

Vamos a hallar, computacionalmente, la raíz cuadrada de un número, $N$, suponiendo que no disponemos de la operación _elevar a 1/2_ y a comparar el comprtamiento de estos dos algoritmos en este caso particular.

Sea $N$ un número mayor que $1$ cualquiera (tipo ``float``). Estamos buscando un número $r$ tal que $r=\sqrt[2]{N}$, es decir, $r^2=N$. Pero ya hemos visto que esta condición a veces es imposible de probar usando variables de tipo ``float`` y el operador ``==``. Por ejemplo, si $N=3$:

In [None]:
N=3
raiz = N**(1/2)
raiz,raiz**2,N,raiz**2 == N

Es necesario usar el concepto de __precisión__. Diremos que un número $r$ es la raíz cuadrada de $N$ con precisión $\varepsilon$ si

$$
\left|r^2-N\right|<\varepsilon,\qquad \varepsilon>0.
$$

Dicho de otro modo, $r$ __no__ será la raíz cuadrada de $N$ si $|r^2-N|\geq \varepsilon$, para una precisón $\varepsilon>0$ dada.

Solamente queda decidir qué números $r$ _probaremos_. 

Sabemos que se verifica que si $x>1$ entonces $1<x<x^2$ (la raíz cuadrada de un número mayor que 1 es mayor que uno y menor que dicho número). entonces un buen candidato para comenzar a buscar la raíz de un número $N$ mayor que 1 es $r=1$. Si resulta que $|r^2-N|\geq\varepsilon$ entonces procederemos a __incrementar__ el valor de $r$ y probar de nuevo. El tamaño del incremento lo llamaremos ``paso``.

__Ejemplo__

Buscamos $\sqrt[2]{2}\cong 1.4140$ con una precisión de $\varepsilon=0.05$. Si nuestra _prueba_ inicial es $r=1$ y el ``paso`` es 0.05, entonces las iteraciones serán:

In [None]:
2**(1/2)

In [None]:
N=3
precision = 0.05
paso = 0.01
prueba = 1
contador = 0

print('prueba','\t\t\t','abs(prueba**2-N)')
print(prueba,'\t\t\t',abs(prueba**2-N))

while abs(prueba**2-N)>=precision:
    prueba +=paso
    contador+=1
    print(prueba,'\t\t\t',abs(prueba**2-N))
    
print('Hemos necesitado: ',contador,' iteraciones.')
print('El candidato a raíz cuadrada es: ',prueba)
    

Podemos aumentar la precisión, pero necesitaremos más pasos.

Este procedimiento tiene un peligro: si usamos el mismo ejemplo que antes, pero el paso es muy grande, o la precisión muy pequeña, podemos _pasarnos de largo_ y continuar iterando sin fin; puede suceder que entremos en un bucle infinito.

In [None]:
N=3
precision = 0.01
paso = 0.1
prueba = 1
contador = 0

print('prueba','\t\t\t','abs(prueba**2-N)')
print(prueba,'\t\t\t',abs(prueba**2-N))

while abs(prueba**2-N)>=precision:
    prueba +=paso
    contador+=1
    print(prueba,'\t\t\t',abs(prueba**2-N))
    if contador >20:
        break

Es necesario poner una condición de parada. En el programa anterior hemos puesto la condición que el número de iteraciones del bucle sea, como mucho, 20. Observamos que con ese número de iteraciones ya hemos llegado a probar números mayores que 3 como candidatos a raíz cuadrada de 3, lo cual es una tontería. Ya hemos visto antes que la raíz cuadrada de un número mayor que uno será menor que dicho número.

También puede suceder lo contrario: puede suceder que 20 iteraciones no sean suficientes para alcanzar la raíz cuadrada. Por ejemplo, usando el ejemplo anterior, si $N=25,$ se obtiene:

In [None]:
N=25
precision = 0.01
paso = 0.04
prueba = 1
contador = 0

print('prueba','\t\t\t','abs(prueba**2-N)')
print(prueba,'\t\t\t',abs(prueba**2-N))

while abs(prueba**2-N)>=precision:
    prueba +=paso
    contador+=1
    print(prueba,'\t\t\t',abs(prueba**2-N))
    if contador > 20:
        break

__Conclusión:__ La condición de fijar un número máximo a la cantidad de iteraciones no es buena. Necesitamos otra condición. Pensando en el ejemplo anterior ($N=3$) una primera idea sería que si llegamos a un valor de _prueba_ tal que $prueba>N$ entonces deberíamos parar. En ese caso no habríamos encontrado la raíz cúbica de $N$ para los valores de _paso_ y _precisión_ usados; deberíamos cambiarlos para obtener un resultado. 

Pero esta opción es poco informativa y se puede mejorar. Pararemos el bucle si $prueba^2>N$. En ese caso, al terminar el bucle __sin__ haber hallado un buen candidato para la raíz de $N,$ podremos comenzar de nuevo el proceso con un valor cercano al último valor de _prueba_ obtenido, modificando los valores de _paso_ y _precisión_.

In [None]:
N=3
precision = 0.01
paso = 0.01
prueba = 1
contador = 0
señal = False

while abs(prueba**2-N)>=precision:

    if prueba**2>N or contador >10**6:
        señal = True
        break
    
    prueba +=paso
    contador+=1

if señal:
    print('Nos hemos pasado. El último valor probado es: ',prueba)
else:
    print('La raíz cuadrada de ',N,' es ',prueba, 'con una precisión ',precision)
print('Hemos dado: ',contador,' iteraciones.')

In [None]:
N=3
precision = 0.01
paso = 0.001
prueba = 1
contador = 0
señal = False

while abs(prueba**2-N)>=precision:

    #print(prueba,'\t\t\t',abs(prueba**2-N))
    if prueba**2 > N or contador > 10**6:
        señal = True
        break
    
    prueba += paso
    contador += 1

if señal:
    print('Nos hemos pasado. El último valor probado es: ',prueba)
else:
    print('La raíz cuadrada de ',N,' es ',prueba, 'con una precisión ',precision)
print('Hemos dado: ',contador,' iteraciones.')

En el programa anterior hemos usado una variable semáfor0 (flag) que nos indica si nos hemos pasado o no. En función del valor del semáforo mostraremos un mensaje u otro.

Observamos que disminuyendo el paso son necesarias muchas más iteraciones para obtener el resultado. Esto es obvio, ya que vamos avanzando con pasos más pequeños y necesitaremos más para llegar al valor de parada. Si usamos un valor de $N$ más grande:

In [None]:
N=389
precision = 0.001
paso = 0.00001
prueba = 1
contador = 0
señal = False

while abs(prueba**2-N)>=precision:

    #print(prueba,'\t\t\t',abs(prueba**2-N))
    if prueba**2 > N or contador > 10**6:
        señal = True
        break
    
    prueba += paso
    contador += 1

if señal:
    print('Nos hemos pasado. El último valor probado es: ',prueba)
else:
    print('La raíz cuadrada de ',N,' es ',prueba, 'con una precisión ',precision)
print('Hemos dado: ',contador,' iteraciones.')

<a id="u2c4.7"></a>
## Ejercicios

1. Obtener la raíz cúbica de un número no negativo menor que $1.$


2. Obtener la raíz cúbica de un número arbitrario.