<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/Unidad_2/1_Correctitud_de_algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión, veremos ejemplos de algunos algoritmos o problemas clásicos, daremos posibles soluciones y formas de implementarlos, y veremos cuáles son correctos y cuáles no, en caso de no serlo es bueno que el estudiante medite si es posible arreglar el código o la idea de fondo para obtener un resultado positivo.

# Correctitud

Intuitivamente, un algoritmo es correcto si hace lo que queremos. Para establecer esto con más formalidad, definimos los siguientes conceptos:

* *Precondición:* Suposiciones que hacemos acerca de la entrada del algoritmo, y el entorno en el cual será ejecutado.
* *Postcondición:* Resultado esperado del algoritmo. 

Con esto, podemos decir que un algoritmo es **correcto** si se cumple la postcondición siempre que se cumple la precondición, i.e. 

$$\text{precondición}\Rightarrow \text{postcondición}$$

Adicionalmente, decimos que un algoritmo es **totalmente correcto** si siempre *termina*, es decir, si eventualmente regresa una respuesta para cualquier entrada.

# Probando correctitud

Las dos maneras más básicas de probar si un algoritmo es correcto son:

* Demostración por inducción
* Demostración por invariante de bucle

(en el fondo, estas dos son la misma cosa).

## Demostración por inducción

En la mayoría de los casos, el problema de esta clase de demostraciones se reduce a encontrar un entero adecuado para hacer inducción.

Veamos un ejemplo; el siguiente algoritmo ordena la lista `a`, de largo $n$:

```python
def insertion_sort(A1, A2, ..., An):
    if n == 0:
        return []
    else:
        insertion_sort(A1, A2, ..., An-1)
        insert(An; A1, A2, ..., An-1)
```

La función `insert` está definida como:

```python
def insert(x; A1, A2, ..., An):
    if n == 0:
        A1 = x
    elif x > An:
        An+1 = x
    else:
        An+1 = An
        insert(x; A1, A2, ..., An-1)
```

Probamos que es correcta por inducción sobre el largo de la lista $n$:

* **Caso base:** Si $n=0$ entonces la lista está vacía, por lo cual está trivialmente ordenada.
* **Hipótesis de inducción:** El algoritmo de arriba es correcto para una lista de tamaño $n$.
* **Paso inductivo:** Notemos que el algoritmo hace `insertion_sort` de manera recursiva sobre la lista `A1, ..., An`, el cual por hipótesis de inducción es correcto; después, llama `insert`. Entonces, si probamos que `insert` es correcto, entonces habremos probado que `insertion_sort` también lo es.

Lo hacemos por inducción:

* **Caso base:** Si $n=0$, entonces `insert` regresa una lista de un elemento, que está trivialmente ordenada.
* **Hipótesis de inducción:** `insert` es correcto para una lista de $n$ elementos.
* **Paso inductivo:** Notemos que hay dos casos:

* Caso 1: $x>A_{n+1}$. En este caso, $x$ es mayor que el último elemento de $A$, y por lo tanto es mayor que todos los elementos de $A$ (ya que $A$ está ordenado). Por lo tanto, $x$ es insertado de manera correcta al último.

* Caso 2: $x\leq A_{n+1}$. Como $x$ no es mayor que $A_{n+1}$, la función se llama de manera recursiva sobre la lista $A_1, \ldots, A_n$. Por H.I., el resultado de esto estará ordenado. Finalmente, la función vuelve a insertar a $A_{n+1}$ al final de la lista, y como $A$ estaba ordenada, esto también estará ordenado.

Por lo tanto, `insert` es correcto, por lo cual `insertion_sort` también lo es.

## Demostración por invariantes de bucle

Muchos algoritmos funcionan con base en bucles. Estos por lo general tienen la siguiente estructura:

1. **Inicialización:** El algoritmo inicializa algunas variables con base en las entradas.
2. **Bucle:** El algoritmo realiza iteraciones del bucle principal. Cada iteración cambia algunas variables de acuerdo a las instrucciones, lo cual se repite hasta que una cierta condición (conocida como *condición de guardia*) falla.
2. **Salida:** Cuando la guardia falla, el bucle acaba, y el algoritmo produce algún resultado con base en los valores de las variables.

Queremos saber muchas cosas de esta clase de algoritmos: ¿cómo depende la entrada de la salida?, o ¿el algoritmo siempre acaba?, o tal vez ¿cuántas iteraciones se lleva?

Todas estas preguntas tienen que ver con el comportamiento *global* de la función; sin embargo, la descripción del algoritmo solo nos da su comportamiento *local*, i.e., lo que pasa en cada paso. Las invariantes de bucle nos ayudarán a conectar ambos.

El proceso de demostración por invariantes de bucle es esencialmente inducción. Los pasos a seguir son:

1. **Caso base:** Probar que la invariante es cierta *antes* de entrar al bucle, i.e., con 0 iteraciones.
2. **Hipótesis de inducción:** Asumir que la invariante y la guardia son ciertas al finalizar una cierta iteración $n$.
3. **Paso inductivo:** Demostrar que la H.I. implica que la invariante sigue siendo cierta para la iteración $n+1$.
4. **Postcondición:** Finalmente, probar que la invariante y la **negación** de la guardia implican que la postcondición se cumple. 

Veamos un ejemplo: afirmamos el siguiente algoritmo calcula $\lceil \log_2 x\rceil$:

In [19]:
def log_ceil(x):
    i = 0
    y = 1
    if x <= 0:
        return
    
    while y < x:
        i = i+1
        y = 2*y
    return i

In [20]:
log_ceil(16)

4

Queremos probar que el resultado de esta función es $\lceil \log_2 x\rceil$. Para hacerlo, notemos que cada vez que iteramos sobre el bucle, $i$ se incrementa por 1, y $y$ se duplica. Por lo tanto, $y$ siempre será una potencia de 2. Demostraremos que $y=2^i$ en todo momento, i.e., que es una invariante de bucle.

* **Caso base:** Antes de entrar al bucle, $i=0$ y $y=1$. Claramente $1=2^0$, por lo cual se cumple.
* **H.I.:** $y=2^i$ y la guardia se cumple, i.e. $y<x$.
* **Paso inductivo:** Sean $i_n, y_n$ los valores de $i$ y $y$ al terminar la $n$-ésima iteración. Por H.I., $y_n=2^{i_n}$. Al terminar la iteración $n+1$, por la descripción del bucle sabemos que $i$ incrementa 1 y $y$ se duplica, es decir:

$$ i_{n+1} = i_n + 1,\qquad y_{n+1} = 2y_n$$

Por H.I.:

$$\begin{align}
y_{n+1} &= 2y_n\\
&= 2\cdot 2^{i_n}\\
&= 2^{i_n+1}\\
&= 2^{i_{n+1}}
\end{align}$$

Por lo tanto, $y=2^i$ es una invariante de bucle.

* **Postcondición:** Asumamos que después de la iteración $k$ la guardia es cierta, pero después de la $k+1$ es falsa. Es decir:

$$y_k < x \leq y_{k+1}$$

Como $y_{k+1} = 2y_k$:

$$y_k < x \leq 2y_{k}$$

Usando la invariante de bucle:

$$2^{i_k} < x \leq 2\cdot 2^{i_k} = 2^{i_k+1} = 2^{i_{k+1}}$$

Tomando el logaritmo:

$$i_k\log_2 2 < \log_2 x \leq i_{k+1} \log_2 2$$

Es decir:

$$i_k < \log_2 x \leq i_{k+1}$$

Por lo tanto, $i_{k+1}$ es el entero más cercano a $\log_2 x$ (redondeado hacia arriba).

# Ejercicios

## Ejercicio 1

Considera el siguiente algoritmo para calcular el producto punto entre los vectores $u$ y $v$:

In [4]:
def dot_product(u, v):
    assert len(u) == len(v), "Los vectores no tienen el mismo tamaño."
    
    if len(u) == 0:
        return 0
    else:
        return dot_product(u[:-1], v[:-1]) + u[-1]*v[-1]

Prueba que es correcto usando inducción.

Probamos que es correcta por inducción sobre la longitud $n$ de los dos vectores:

* **Caso base:** Si $n=0$ entonces el vector está vacio, por lo cual el producto punto de dos vectores sin ninguna componente es $0$, por lo tanto es verdad.
* **Hipótesis de inducción:** El prodcuto punto de dos vectores de longitud $n$ es correcto.
* **Paso inductivo:** Notemos que el algoritmo hace `dot_product` de manera recursiva sobre los vectores $u_1, ..., u_n$ y $v_1,..., v_n$ y por paso inducto los nuevos vectores seran hasta $u_{n+1}$, al hacer la llamada recursiva tendriamos los vectores 
$$u_1,u_2,...,u_n, u_{n+1}$$ 
despues usando `u[:-1]` y `v[:-1]` tendriamos el vector con $n-1$ que seria:
$$u_1,u_2,...,u_n, u_{n+1-1} = u_1,u_2,...,u_n$$ 
$$v_1,v_2,...,v_n, v_{n+1-1} = v_1,v_2,...,v_n$$ 
el cual por hipótesis de inducción es correcto para cada uno de los vectores.

In [18]:
u = [1,2,3]
v = [4,5,7]
dot_product(u, v)

35

## Ejercicio 2

Considera el siguiente algoritmo que revisa si un número es primo o no:

In [27]:
def is_prime(n):
    b = True
    for i in range(2, n):
        if n % i == 0:
            return False
    return True

Este algoritmo tiene complejidad $O(n)$. Mejórala y explica por qué tus cambios funcionan (*Hint:* solo tienes que cambiar los límites del bucle).

Posteriormente, prueba que tu algoritmo modificado es correcto usando invariantes de bucle (*Hint:* tal vez sea conveniente que reescribas el código usando un `while`.)

In [122]:
# Aquí va tu algoritmo modificado
import math

def is_prime(n):
    for i in range(2, int(math.sqrt(n)) + 1):        
        if n % i == 0:
            return False
    return True

In [123]:
is_prime(11)

True

Para explicar por qué esto funciona, primero tenemos que saber que todos los posible divisores de cualquier numero son menores e iguales que $n/2$, cualquier numero que sea mayor es un multiplo solamente de un divisor.

La segunda observacion es que si vemos los posible divisores que son menores de $n/2$ veremos que la hacer una combinacion de productos de esos valores obtendremos $n$ tal que alguno se repetiran dos veces por la propidad conmutativa de $a *b = b* a$, entonces los unico divisores de $n$ seran los que sean menores o iguales de $\sqrt{n}$.

Otra observacion es que solo sera necesario verificar sobre los numeros $2,3,5$ ya cualquier otro numero sera multiplos de ellos, entonces se prueba si es divisible con todos los números primos menores que la raíz obtenida, Si es divisible con algún número primo entonces es compuesto, en caso contrario es primo.

In [135]:
import math

def is_prime(n):    
    i = 2    
    y = n % i 
    while( y != 0 ):        
        i += 1
        if i > int(math.sqrt(n)):
            return True        
        y = n % i
    return False

In [137]:
is_prime(457)

True

Queremos probar que el resultado de esta función es verdad si es primo. Para hacerlo, notemos que cada vez que iteramos sobre el bucle, $i$ se incrementa por 1, y $y$ sigue True ya que el módulo de n es diferente de $0$. Por lo tanto, $y$ siempre será True cuando sea un numero que no es multiplo de 2,3,5 y no divisible con un numero primo menor que $\sqrt{n}$. Demostraremos que $y \neq 0$ en todo momento, i.e., que es una invariante de bucle.

* **Caso base:** Antes de entrar al bucle, $i=2$ y $y\neq1$. Claramente $y =n \% 2 \neq 0$, por lo cual se cumple.
* **H.I.:** $y = n \% i \neq 0$ y la guardia se cumple, i.e. $y \neq 0$.
* **Paso inductivo:** Sean $i_n, y_n$ los valores de $i$ y $y$ al terminar la $n$-ésima iteración. Por H.I., $y_n= n \% i \neq 0$. Al terminar la iteración $n+1$, por la descripción del bucle sabemos que $i$ incrementa 1 y $y$ es $\neq 0$, es decir:

$$ i_{n+1} = i_n + 1,\qquad y_{n+1} \neq 0$$

Por H.I.:

$$\begin{align}
y_{n+1} &= (n+1) \% (i+1)\\
&= 2\cdot 2^{i_n}\\
&= 2^{i_n+1}\\
&= 2^{i_{n+1}}
\end{align}$$

Por lo tanto, $y=2^i$ es una invariante de bucle.


Queremos probar que el resultado de esta función es verdad si es primo. Para hacerlo, notemos que cada vez que iteramos sobre el bucle, $i$ se incrementa por 1, y $y$ se duplica. Por lo tanto, $y$ siempre será una potencia de 2. Demostraremos que $y=2^i$ en todo momento, i.e., que es una invariante de bucle.

* **Caso base:** Antes de entrar al bucle, $i=0$ y $y=1$. Claramente $1=2^0$, por lo cual se cumple.
* **H.I.:** $y=2^i$ y la guardia se cumple, i.e. $y<x$.
* **Paso inductivo:** Sean $i_n, y_n$ los valores de $i$ y $y$ al terminar la $n$-ésima iteración. Por H.I., $y_n=2^{i_n}$. Al terminar la iteración $n+1$, por la descripción del bucle sabemos que $i$ incrementa 1 y $y$ se duplica, es decir:

$$ i_{n+1} = i_n + 1,\qquad y_{n+1} = 2y_n$$

Por H.I.:

$$\begin{align}
y_{n+1} &= 2y_n\\
&= 2\cdot 2^{i_n}\\
&= 2^{i_n+1}\\
&= 2^{i_{n+1}}
\end{align}$$

Por lo tanto, $y=2^i$ es una invariante de bucle.


## Referencias
- https://en.wikipedia.org/wiki/Primality_test
- https://www.conoce3000.com/html/espaniol/Libros/Matematica01/Cap07-03-AlgoritmoDeterminarNumeroPrimo.php