### Algoritmo de búsqueda binaria

El propósito de este cuaderno es explicar en detalle el algoritmo de búsqueda binaria, mostrando cómo demostrar su corrección, terminación y derivar su tiempo de ejecución. Esto sirve de complemento a la clase que explica la idea principal detrás del algoritmo.

Dada una lista _ordenada_ (asumir orden ascendente) de $n$ elementos, deseamos determinar si un elemento dado `elt` pertenece a la lista.

El algoritmo de búsqueda binaria reduce repetidamente la posible ubicación del elemento comparando el elemento central del rango de búsqueda con el que estamos buscando, aprovechando el hecho de que el arreglo está ordenado.


Se desea implementar una función `binarySearchHelper(lst, elt, left, right)` en la cual:
  - `lst` es una lista no vacía con al menos 2 elementos.
  - `elt` es el elemento cuyo índice estamos buscando.
  - `left` y `right` representan los "límites" (índices) del rango de búsqueda de la lista.
    - Recuerda que en Python los índices comienzan en 0 y llegan hasta `len(lst)-1`.
    - Sea `n` la longitud de la lista.
    - Si 0 <= `left` <= `right` <= n-1, el rango a buscar es no vacío; de lo contrario, se asume que es vacío.

La salida esperada es un número `index` o el valor de Python `None`.
  - Si se retorna un número `index`, éste debe ser un índice válido en la lista entre `left` y `right` y debe cumplirse que `lst[index] == elt`.
  - En caso contrario, se retorna `None` si y sólo si la lista `lst` no contiene a `elt`.

A continuación se muestra la implementación de `binarySearchHelper`.

In [None]:
def binarySearchHelper(lst, elt, left, right):
    n = len(lst)
    if (left > right):
        return None  # La región de búsqueda está vacía: salimos ya que no se puede encontrar elt en la lista.
    else:
        # Si elt existe en la lista, debe encontrarse entre los índices left y right.
        mid = (left + right) // 2  # Nota: // es división entera
        if lst[mid] == elt:
            return mid  # ¡Lo encontramos. Se retorna su índice.
        elif lst[mid] < elt:
            # Buscamos en la parte derecha de la lista
            return binarySearchHelper(lst, elt, mid + 1, right)
        else:  # lst[mid] > elt
            # Buscamos en la parte izquierda de la lista
            return binarySearchHelper(lst, elt, left, mid - 1)

In [None]:
def binarySearch(lst, elt):
    n = len(lst)
    if (elt < lst[0] or elt > lst[n-1]):
        return None
    else:  # Nota: Solo llegamos aquí si lst[0] <= elt <= lst[n-1]
        return binarySearchHelper(lst, elt, 0, n-1)

In [None]:
print("Buscando 9 en la lista [0,2,3,4,6,9,12]")
print(binarySearch([0,2,3,4,6,9,12], 9))

print("Buscando 8 en la lista [1, 3, 4, 6, 8, 9, 10, 11, 12, 15]")
print(binarySearch([1, 3, 4, 6, 8, 9, 10, 11, 12, 15], 8))

print("Buscando 5 en la lista [1, 3, 4, 6, 8, 9, 10, 11, 12, 15]")
print(binarySearch([1, 3, 4, 6, 8, 9, 10, 11, 12, 15], 5))

print("Buscando 0 en la lista [0,2]")
print(binarySearch([0,2], 0))

print("Buscando 1 en la lista [0,2]")
print(binarySearch([0,2], 1))

print("Buscando 2 en la lista [0,2]")
print(binarySearch([0,2], 2))

print("Buscando 1 en la lista [1]")
print(binarySearch([1], 1))

print("Buscando 2 en la lista [1]")
print(binarySearch([1], 2))


#### Implementación usando bucles

In [None]:
def binSearch(lst, elt):
    n = len(lst)
    if (elt < lst[0] or elt > lst[n-1]):
        return None
    else:
        left = 0
        right = n - 1
        while (left <= right):
            # La misma lógica que en la versión recursiva.
            mid = (left + right) // 2  # Nota: en Python 3, // realiza división entera
            if lst[mid] == elt:
                return mid  # ¡BINGO! Lo encontramos. Se retorna su índice.
            elif lst[mid] < elt:
                left = mid + 1
            else:  # lst[mid] > elt
                right = mid - 1
        return None

In [None]:
print("Buscando 9 en la lista [0,2,3,4,6,9,12]")
print(binSearch([0,2,3,4,6,9,12], 9))

print("Buscando 8 en la lista [1, 3, 4, 6, 8, 9, 10, 11, 12, 15]")
print(binSearch([1, 3, 4, 6, 8, 9, 10, 11, 12, 15], 8))

print("Buscando 5 en la lista [1, 3, 4, 6, 8, 9, 10, 11, 12, 15]")
print(binSearch([1, 3, 4, 6, 8, 9, 10, 11, 12, 15], 5))

print("Buscando 0 en la lista [0,2]")
print(binSearch([0,2], 0))

print("Buscando 1 en la lista [0,2]")
print(binSearch([0,2], 1))

print("Buscando 2 en la lista [0,2]")
print(binSearch([0,2], 2))

#### ¿Por qué funciona la búsqueda binaria?

Probaremos lo siguiente:
  - Si `elt` pertenece a `lst` en el índice `j`, entonces la búsqueda binaria retornará `j`, O
  - Si `elt` no pertenece a `lst`, entonces la búsqueda binaria retornará `None`.

También demostraremos que la búsqueda termina.

Para facilitar, razonaremos sobre la versión recursiva.

##### **Afirmación 1:** Para cualquier llamada a la función `binarySearchHelper(lst, elt, left, right)`, si `elt` pertenece a la lista en el índice `j`, entonces se cumple que `left <= j <= right`.

**Demostración:** La demostración es por inducción en las llamadas a la función `binarySearchHelper`.

**Caso base:** La primera llamada a `binarySearchHelper` realizada desde la función `binarySearch` satisface estas propiedades. Al inicio, tenemos `left = 0` y `right = n-1`. Por lo tanto, si `elt` pertenece a la lista, su índice debe estar entre `0` y `n-1`.

**Inducción:** Si una llamada dada a `binarySearchHelper` satisface estos hechos, entonces la llamada subsiguiente también lo hará.

Para demostrarlo, observemos detenidamente el cuerpo de la función:
```python
mid = (left + right) // 2  # Nota: // es división entera
if lst[mid] == elt:
    return mid
elif lst[mid] < elt:
    return binarySearchHelper(lst, elt, mid + 1, right)  ## LLAMADA 1
else:  # lst[mid] > elt
    return binarySearchHelper(lst, elt, left, mid - 1)  ## LLAMADA 2
```

Observa que se hacen dos llamadas a `binarySearchHelper` (LLAMADA 1 y LLAMADA 2).
  - Para la LLAMADA 1, esta se efectúa únicamente si `lst[mid] < elt`. Dado que la lista está ordenada, si `elt` se encontrara, estaría en el rango de índices `[mid+1, right]`. Por ello, la propiedad se mantiene en la LLAMADA 1.
  - Para la LLAMADA 2, esta se efectúa únicamente si `lst[mid] > elt`. Por lo tanto, si `elt` se encontrara, estaría en el rango de índices `[left, mid-1]`. Así, la propiedad se mantiene en la LLAMADA 2.

**Definición:** Definimos el "tamaño" de la región de búsqueda de la búsqueda binaria como `(right - left + 1)`.

##### **Afirmación 2:** Para cualquier llamada a la función `binarySearchHelper(lst, elt, left, right)`, o bien (a) terminamos encontrando `elt`, o (b) concluimos que `elt` no existe en `lst`, o (c) realizamos una llamada a `binarySearchHelper` con una región de búsqueda estrictamente menor.

**Demostración:** La demostración de esta afirmación es directa a partir del código.
```python
mid = (left + right) // 2  # Nota: // es división entera
if lst[mid] == elt:
    return mid
elif lst[mid] < elt:
    return binarySearchHelper(lst, elt, mid + 1, right)  ## LLAMADA 1
else:  # lst[mid] > elt
    return binarySearchHelper(lst, elt, left, mid - 1)  ## LLAMADA 2
```

Para la LLAMADA 1, el nuevo tamaño de la región de búsqueda es
`right - (mid + 1) + 1`, lo cual es lo mismo que `right - mid`. Dado que
`mid >= left` (es decir, `mid > left - 1`), se tiene que el nuevo tamaño es `right - mid < right - (left - 1) = right - left + 1`.

Para la LLAMADA 2, el nuevo tamaño de la región es `mid - left`. Dado que `mid <= right`, se tiene que `mid < right + 1`, y así `mid - left < right + 1 - left`. En consecuencia, la nueva región de búsqueda es estrictamente menor que la original.


#### Argumento de corrección global

- Cada vez que se llama a `binarySearchHelper(lst, elt, left, right)`, se establece que, si `elt` se encuentra en `lst`, éste estará en el rango `[left, right]` (según la afirmación 1).
- Por lo tanto, si `left > right`, el rango está vacío y podemos concluir que `elt` no se encuentra en la lista.
- Además, en cada llamada sucesiva, la región de búsqueda se reduce estrictamente en tamaño.
- Finalmente, se termina la ejecución ya sea al encontrar `elt` o al alcanzar la condición `left > right`.

#### Terminación

La afirmación 2 prueba directamente la terminación.

#### Tiempo de ejecución en el peor caso

##### **Afirmación 3:** Consideremos una llamada a `binarySearchHelper(lst, elt, l, r)` y una llamada subsecuente `binarySearchHelper(lst, elt, l1, r1)`. El tamaño de la nueva región de búsqueda, `r1 - l1 + 1`, es a lo sumo la mitad del tamaño de la región anterior, `r - l + 1`. Formalmente,
 $$ r1 - l1 + 1 \leq \frac{(r - l + 1)}{2} $$

**Demostración:**

Considera el código de `binarySearchHelper(lst, elt, l, r)` (usamos `l` y `r` en lugar de `left` y `right`, y `m` en lugar de `mid`):
```python
m = (l + r) // 2  # Nota: // es división entera
if lst[m] == elt:
    return m
elif lst[m] < elt:
    return binarySearchHelper(lst, elt, m + 1, r)  ## LLAMADA 1
else:  # lst[m] > elt
    return binarySearchHelper(lst, elt, l, m - 1)  ## LLAMADA 2
```

En la LLAMADA 1, el tamaño de la nueva región es:
$$ r - (m + 1) + 1 = r - m $$
Dado que
$$ m = \left\lfloor \frac{(l + r)}{2} \right\rfloor \geq \frac{l + r - 1}{2}, $$
se tiene que:
$$ r - m \leq \frac{(r - l + 1)}{2}. $$

En la LLAMADA 2, el tamaño de la nueva región es:
$$ (m - 1) - l + 1 = m - l, $$
y de forma similar se puede demostrar que
$$ m - l \leq \frac{(r - l + 1)}{2}. $$

Por lo tanto, en ambos casos la región de búsqueda se reduce a lo sumo a la mitad.

**Análisis de complejidad:**

El tamaño inicial de la región de búsqueda es $n$. En cada llamada, la región se reduce a la mitad, por lo que después de $k$ iteraciones el tamaño es a lo sumo $\frac{n}{2^k}$.

Se detendrá cuando la región sea menor que 1, es decir, cuando $\frac{n}{2^k} < 1$, lo que implica que $2^k \leq n$, es decir, $k \leq \log_2(n)$.

Cada llamada recursiva realiza un número constante de operaciones, por lo que el tiempo de ejecución es $O(\log(n))$.

Un análisis similar demuestra que en el peor caso el algoritmo toma $\Omega(\log(n))$, lo que combinado nos da un tiempo de ejecución de $\Theta(\log(n))$.