# Búsqueda

Dada una lista de elementos, nos gustaría poder encontrar la posición de un elemento que cumpla alguna determinada propiedad.

## Búsqueda lineal
Una alternativa es recorrer la lista desde inicio a fin revisando si cada elemento cumple o no con la propiedad. Cuando encontramos un elemento que lo hace, retornamos su posición. Si no hay ningún elemento que cumpla, retornamos -1.

#### Ejemplo
Vamos a buscar en una lista de números, la posición de un número en específico

In [6]:
def buscar(lista, elemento):
    for i in range(len(lista)):
        if lista[i] == elemento:
            return i
    return -1

l = [5, 3, 7, 6, 5, 8, 12, 54, 3]

print(buscar(l, 12))
print(buscar(l, 13))

6
-1


¿Cuántos elementos hay que revisar en promedio para encontrar al que buscamos?

Si la lista tiene **n** elementos distribuidos de manera uniforme, entonces hay n posibles posiciones para el elemento. A veces tendremos que revisar solo el primer elemento y encontraremos lo que buscamos, otras veces el primero y el segundo; el primero, segundo y tercero... y así hasta el caso en que hay que revisar todos los elementos.

Por lo tanto en promedio hay que revisar 

$$\frac{\sum_{i=1}^{n} i }{n} \approx \frac{n}{2}$$

posiciones.

¿Se podrá hacer algo mejor? 

### Experimento
¿Dónde está el 93 en la siguiente lista?

![numeros desordenados](binaria1.png "números')

¿Dónde están el 93, 8, 82 y 42 en la siguiente lista?
![numeros ordenados](binaria2.png "números')

Pareciera ser que si la lista está ordenada es más fácil buscar. ¿Cómo podemos aprovechar esta propiedad?

## Búsqueda binaria
- Ver elemento central. Si cumple la propiedad, retornamos su posición
- Si es mayor, busco a la izquierda
- Si es menor, busco a la derecha

#### Ejemplo
Busquemos el 82
![numeros ordenados](binaria2.png "números')

El valor del elemento central es 49
![numeros ordenados](binaria3.png "números')

Como 49 es menor que 82, buscamos a la derecha
![numeros ordenados](binaria4.png "números')

El valor del elemento central es 79
![numeros ordenados](binaria5.png "números')

Como 79 es menor que 82, buscamos a la derecha
![numeros ordenados](binaria6.png "números')

El valor del elemento central es 91
![numeros ordenados](binaria7.png "números')

Como 91 es mayor que 82, buscamos a la izquierda
![numeros ordenados](binaria8.png "números')

El valor central es 82, así que retornamos su posición (33)
![numeros ordenados](binaria9.png "números')

    

In [7]:
def busqueda_binaria(lista, elemento):
    left = 0
    right = len(lista) - 1
    while left <= right:
        middle = (left+right)//2
        if lista[middle] < elemento:
            left = middle + 1
        elif lista[middle] > elemento:
            right = middle - 1
        else:
            return middle
    
    return -1

l = [0, 1, 2, 4, 8, 15, 16, 19, 28, 30, 30, 31, 32, 39,
42, 42, 42, 44, 46, 49, 49, 49, 51, 57, 57, 58, 62, 68,
73, 75, 77, 79, 80, 82, 86, 89, 91, 91, 92, 95, 96, 96]
print(busqueda_binaria(l,82))
 

33


## Actividad

### Comparación entre lineal y binaria
Generar listas con $10^i$ enteros, con i=2..7. Para cada lista, correr 10 veces el algoritmo de búsqueda lineal e imprimir el número de comparaciones promedio. Repetir lo mismo para búsqueda binaria (para aplicar la búsqueda binaria la lista debe estar ordenada primero, se puede utilizar el método sort de las listas).

In [1]:
from random import randint

#modificamos las funciones de búsqueda para que además, retornen cuántas operaciones hicieron aproximadamente
def busqueda_lineal(lista, elemento):
    for i in range(len(lista)):
        if lista[i] == elemento:
            return i, i + 1
    return -1, i + 1

def busqueda_binaria(lista, elemento):
    left = 0
    right = len(lista) - 1
    
    operaciones = 0
    while left <= right:
        operaciones += 1
        middle = (left+right)//2
        if lista[middle] < elemento:
            left = middle + 1
        elif lista[middle] > elemento:
            right = middle - 1
        else:
            return middle, operaciones
    
    return -1, operaciones


for i in range(2,8):
    numeros = []
    rango = 10**i
    for j in range(rango):
        numeros.append(randint(0, rango))
        
    numeros.sort()
    
    operaciones_lineal = 0
    operaciones_binaria = 0
    
    for j in range(10):
        elemento = randint(0, rango)
        
        posicion, operaciones = busqueda_lineal(numeros, elemento)
        operaciones_lineal += operaciones
        
        posicion, operaciones = busqueda_binaria(numeros, elemento)
        operaciones_binaria += operaciones
        
    print('tamaño 10^{}'.format(i))
    print('promedio operaciones lineal:', operaciones_lineal)
    print('promedio operaciones binaria:', operaciones_binaria)
        

tamaño 10^2
promedio operaciones lineal: 917
promedio operaciones binaria: 68
tamaño 10^3
promedio operaciones lineal: 5264
promedio operaciones binaria: 90
tamaño 10^4
promedio operaciones lineal: 69044
promedio operaciones binaria: 129
tamaño 10^5
promedio operaciones lineal: 587016
promedio operaciones binaria: 147
tamaño 10^6
promedio operaciones lineal: 6919269
promedio operaciones binaria: 191
tamaño 10^7
promedio operaciones lineal: 68912732
promedio operaciones binaria: 231
