# Clase 08

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Clase%2001%20-%20Demostraciones%20y%20B%C3%BAsqueda%20Completa.ipynb)

# Requisitos Previos

* Matemática Básica

# Algoritmo de la división

Sean dos enteros $a$ y $b > 0$, existe un único par de enteros $q$ y $r$ tales que:

$$ a = bq + r, \quad \text{con }0 \leq r < b $$

**Prueba**:

Sea

$$ S = \{y : y = a - bx, x \in \mathbb{Z}, y \geq 0\}  $$

Entonces $S$ es un subconjunto de los números enteros no negativos y además es **no vacio** (Si $a \geq 0$, entonces $a = a - b\cdot 0 \in S$, si $a < 0$ entonces $a\cdot(1-b) \geq 0 \in S$). Por el Principio del buen orden, $S$ admite un elemento mínimo $r = a - bq$, el cual debe cumplir que $r < b$ (Probemos por contradicción):

Supongamos que $r \geq b$, entonces $r' = r - b  = a - b(q+1) \geq 0 \in S$, pero $r' < r$, lo cual es una contradicción debido a que $r$ es el elemento mínimo de $S$.

Ahora veamos la unicidad: Supongamos que existen dos valores $q'$ y $r'$ tales que:

$$ bq + r = bq' + r' $$
$$ b(q-q') = r'-r $$

De la última igualdad notamos que:

$$ b | |r' - r|, \text{ pero } |r' - r| < b \rightarrow |r'-r| = 0 \rightarrow r = r' $$

Por lo tanto, también concluimos que $q = q'$, verificando la unicidad del par $(q,r)$.

# Máximo Común Divisor y Mínimo Común Múltiplo

El hallar el máximo común divisor de dos números enteros es un problema recurrente en matemáticas, sobretodo en aritmética modular y criptografía. 

Definimos un **divisor común** de dos enteros $a$ y $b$ como un entero $d$ tal que:

$$ d | a \wedge d | b $$

Definiremos entonces el **máximo común divisor** de dos enteros $a$ y $b$ (denotado por $(a,b)$) como el entero $d$ tal que:

1) $d \geq 0$

2) $d | a$ y $d | b$

3) Si $e | a$ y $e | b$ entonces $e | d$

Además, se cumple que:

$$ d = ax + by $$

Para algún par de enteros $(x,y)$. Finalmente, $d$ es único para $a$ y $b$ fijos.

**Prueba**:

Si $a = b = 0$ basta tomar $d = 0$ como único valor que cumple con la condición $3$.

En otro caso, definimos:

$$ S(a,b) = \{ax + by: x, y \in \mathbb{Z}\} $$

Y elegimos $d = ax_{0} + by_{0}$ como el mínimo elemento positivo de $S(a,b)$. Por el algoritmo de la división, existen $(q,r)$ tales que:

$$ a = dq + r, \text{ }0\leq r < d $$

Entonces

$$ r = a - dq = a - (ax_{0} + by_{0})q = a(1-qx_{0}) + bqy_{0} \in S(a,b) $$

Pero $r$ es no negativo y menor que $d$, por lo que $r = 0$ (si no fuera así sería una contradicción por la minimalidad de $d$ sobre los positivos de $S(a,b)$). Lo anterior nos permite confirmar que $d | a$ y mediante un análisis análogo podemos probar que $d | b$.

Ahora, dado que $d$ es una combinación lineal de $a$ y $b$ es sencillo notar que cumple con la condición $3$.

Verificar la unicidad tampoco es muy complicado, supongamos que $e$ es otro MCD de $a$ y $b$, entonces:

$$ e|a \wedge e|b \rightarrow e | d $$

Además, como $e$ es MCD:

$$ d|a \wedge d|b \rightarrow d | e $$

Como obtenemos que $e | d$ y $d | e$ entonces $d = e$.


## Obteniendo el MCD I

La manera más natural de obtener el MCD de dos enteros es simplemente iterando sobre todos los números $x$ entre $1$ y $min(a,b)$ (debido a que los números entre $min(a,b)+1$ y $max(a,b)$ no serán divisores de $min(a,b)$) y verificando si $x$ cumple la condición; en cuyo caso, actualizaríamos la respuesta.

El siguiente algoritmo calcula el valor del MCD de $a$ y $b$ de manera trivial, con complejidad $O(min(a,b))$.

```C++
d = 1;
for(int i=2; i<=min(a,b); i++){
    if(a % i == 0 and b % i == 0) d = i;
}
```

## Obteniendo el MCD II

Una optimización de la solución anterior considera lo siguiente:

$$ \text{d es divisor de }min(a,b) $$

Por lo que podemos usar fuerza bruta sobre los divisores de $min(a,b)$ en $O(\sqrt{min(a,b)})$ para probar cada candidato, así obtendríamos una complejidad de $O(\sqrt{min(a,b)})$.

```C++
d = 1
for(int i=1; i*i<=min(a,b); i++){
    if(min(a,b) % i == 0){
        if(b % i == 0) d = max(d,i);
        if(b % (min(a,b) / i) == 0) d = max(d,min(a,b) / i);
    }
}
```

Sin embargo, existe un algoritmo que nos da el MCD en una complejidad muchísimo mejor.


## Algoritmo de Euclides

### Lema

Sean $a$ y $b$ enteros positivos tales que $a = bq + r$ (por el algoritmo de la división), entonces:

$$ (a,b) = (b,r) $$

**Prueba**:

Sean $d = (a,b)$ y $e = (b,r)$, dado que $r = a - bq$, entonces:

$$ d | a \wedge d | b \rightarrow d | b \wedge d | a - bq = r \rightarrow d | e $$

De manera análoga:

$$ e | b \wedge e | r \rightarrow e | r + bq = a \wedge e | b \rightarrow e | d $$

Por lo que concluimos que $e = d$.

El algoritmo de Euclides halla el MCD de dos enteros $a$ y $b$ usando el lema anterior, por lo que itera sobre todos los valores de la sucesión:

$$ \begin{array}{cc}
    a = bq_{1} + r_{1} &\text{con }0\leq r_{1} < b \\
    b = r_{1}q_{2} + r_{2} &\text{con }0\leq r_{2} < r_{1} \\
    \vdots &\vdots \\
    r_{n-3} = r_{n-2}q_{n-1} + r_{n-1} &\text{con }0\leq r_{n-1} < r_{n-2} \\ 
    r_{n-2} = r_{n-1}q_{n} &\text{y }r_{n} = 0
\end{array} $$

Aplicando de manera sucesiva el lema, concluimos que:

$$ (a,b) = (b,r_{1}) = \cdots = (r_{n-2},r_{n-1}) = (r_{n-1},0) = r_{n-1} $$

Ahora debemos preguntarnos ¿Cuánto es la complejidad de este algoritmo?, lo cual nos lleva a cuestionar el valor aproximado de $n$.

Notemos que:

$$ r_{i+2} < r_{i+1} < r_{i} $$

$$ r_{i} = r_{i+1}q_{i+2} + r_{i+2} \geq r_{i+1} + r_{i+2} > 2r_{i+2} $$

Por lo que $r_{i+2} < \frac{r_{i}}{2}$ para todo $i$, con lo que concluimos que:

$$ n = O(\log{max(a,b)}) $$

Lo que nos da una complejidad logarítmica.


# Criba de Eratóstenes

La criba de Eratóstenes ayuda a determinar los números primos en un rango usando la siguiente idea:

1) Asumir que todos los números excepto el 1 son primos

2) Elegir el menor primo actual $p$ que sea mayor al último primo elegido (inicialmente el último primo elegido puede ser considerado el 0)

3) Marcar a todos los múltiplos de $p$ a partir del $2p$ como no primos

4) Repetir

La siguiente implementación es más sencilla de analizar:

```C++
for(int i=2; i<=n; i++){
       if(primo[i]){
           for(int j=2*i; j<=n; j+=i){
               primo[j] = false;
           }
       }
}
```

La correctitud del algoritmo se basa en que, al inicio de cada iteración, todos los compuestos menores que el primo elegido han sido correctamente determinados.

La complejidad del algoritmo se puede analizar de la siguiente forma:

Supongamos que nuestro límite es $n$, entonces el algoritmo mostrado realiza la siguiente cantidad de iteraciones:

$$ T(n) = \sum\limits_{p \leq n, p \text{ primo}}\frac{n}{p} = n \cdot \sum\limits_{p \leq n, p \text{ primo}}\frac{1}{p} $$

Recordemos que teóricamente el *prime gap* señala que la cantidad de primos menores o iguales a $n$ es aproximadamente $\frac{n}{\ln{n}}$, por lo cual también podríamos aproximar el $k$-ésimo primo mediante $k\ln{k}$ (basta con reemplazar y notar que el resultado se aproxima a $k$).

Lo anterior nos permite aproximar la sumatoria a:

$$ \sum\limits_{p \leq n, p \text{ primo}}\frac{1}{p} \approx \frac{1}{2} + \sum\limits_{k=2}^{\frac{n}{\ln{n}}}\frac{1}{k\ln{k}} $$

No consideramos $k = 1$ y reemplazamos el $2$ directamente para evitar una división por 0.

Ahora recordamos que podemos aproximar la sumatoria por una integral, así:

$$ \sum\limits_{k=2}^{\frac{n}{\ln{n}}}\frac{1}{k\ln{k}} \approx \int\limits_{2}^{k\ln{k}}\frac{1}{x\ln{x}}dx \approx \ln{\ln{n}} $$

Finalmente:

$$ T(n) = O(n\ln{\ln{n}}) $$

## Problemas

- [SPOJ - Printing some primes](https://www.spoj.com/problems/TDPRIMES/)
- [SPOJ - Primal Fear](https://www.spoj.com/problems/VECTAR8/)
- [Codeforces - Sherlock and his girlfriend](https://codeforces.com/contest/776/problem/B)
- [Codeforces - Noldbach problem](https://codeforces.com/problemset/problem/17/A)
- [Binary Sequence of Prime Number](https://www.spoj.com/problems/BSPRIME/)

## Material para leer

- [Math note — linear sieve](https://codeforces.com/blog/entry/54090)


# Recurrencias Lineales

## Definición

Una recurrencia lineal de una serie es una relación en la cual cada elemento se halla en función de un conjunto de elementos previos con una **combinación lineal**.

* Una **combinación lineal** de un conjunto de elementos $v = \{v_{1},v_{2},\ldots,v_{n}\}$ es la siguiente expresión:

$$ x = a_{1}\cdot v_{1} + a_{2}\cdot v_{2} + \ldots + a_{n}\cdot v_{n} $$

Donde todos los $a_{i}$ son constantes.

Cada recurrencia tiene dos elementos fundamentales:

1) Casos base: Términos cuyos valores ya están pre establecidos.

2) Recurrencia: Relación entre el $n$-ésimo término y los anteriores.

### Ejemplos

1) Un ejemplo de recurrencia lineal es :

$$ x_{n} = \left\{ \begin{array}{cc} 2 & n = 1 \\ 2\cdot x_{n-1} & n > 1 \end{array}\right. $$

Cuya **forma cerrada** (expresión que solo depende del $n$ y de otras constantes) es $x_{n} = 2^{n}$.

2) Otro ejemplo más simple es la suma de los primeros $n$ enteros:

$$ S_{n} = \left\{ \begin{array}{cc} 1 & n = 1 \\ n + S_{n-1} & n > 1 \end{array}\right. $$

Cuya **forma cerrada** es conocida: $S_{n} = \frac{n(n+1)}{2}$.

### Serie de Fibonacci

La recurrencia lineal más conocida es la **Serie de Fibonacci**, la cual es:

$$ fib_{n} = \left\{ \begin{array}{cc} n & n= 0,1 \\ fib_{n-1} + fib_{n-2} & n > 1 \end{array}\right. $$

La tomaremos como referencia para la parte práctica.

## Calcular recurrencias lineales

### Manera natural

Si usamos la misma recurrencia lineal como una función recursiva obtendremos una complejidad exponencial por la cantidad de veces que tendremos que obtener el mismo término.

Si es que deseáramos el $n$-ésimo término de una recurrencia lineal y cuya dependencia es con $k$ términos anteriores entonces una cota **poco exacta** sería $O(k^{n})$.

Veamos el árbol de recursión para hallar $fib_{5}$:

![Fibonacci](https://i.stack.imgur.com/7iU1j.png)

Notemos que, en efecto, está acotada por $O(2^{5})$.

La implementación es simple:

```C++
int fib(int n){
    if(n <= 1) return n;
    return fib(n-1) + fib(n-2);
}
```

### Usando Programación Dinámica

Una manera de optimizar el cálculo de la recurrencia es usando DP con un extra de $O(n)$ de memoria para almacenar las respuestas.

Con esta mejora, notamos que cada uno de los términos será calculado 1 sola vez usando la recursión, dándonos un $O(k)$ por término calculado para hallar el $n$-ésimo (donde $k$ es la cantidad de elementos anteriores que participan en la recurrencia), finalmente obteniendo una complejidad de $O(nk)$.

Una implementación usando un arreglo de booleanos `vis` para determinar si la respuesta ya fue calculada y `memo` para  almacenar la respuesta es:

```C++
int fib(int n){
    if(n <= 1) return n;
    if(vis[n]) return memo[n];
    vis[n] = true;
    return memo[n] = fib(n-1) + fib(n-2);
}
```

Es ventajoso el no tener que cambiar demasiado la recursión natural.

### Método General

Hasta ahora los métodos que hemos visto nos ayudan a procesar hasta el término $n = 10^{7}$ en el mejor de los casos; sin embargo, ¿Qué sucede si nos piden el término $10^{9}$ o incluso $10^{18}$?

Para resolver estos casos, nos basta usar matrices para procesar el siguiente término, usaremos la siguiente forma:

Sea la recurrencia $f_{n+1} = \sum\limits_{i=0}^{k-1}a_{i}f_{n-i}$ para los $n \geq k$, entonces usaremos la matriz $M_{k\times k}$:

$$ \begin{pmatrix} a_{0} &a_{1} &a_{2} &\cdots &a_{k-2} &a_{k-1} \\ 1 &0 &0 &\cdots &0 &0 \\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ 0 &0 &0 &\cdots &1 &0 \end{pmatrix}\cdot \begin{pmatrix} f_{n} \\ f_{n-1} \\ f_{n-2} \\ \vdots \\ f_{n-k+1}\end{pmatrix} = \begin{pmatrix} f_{n+1} \\ f_{n} \\ f_{n-1} \\ \vdots \\ f_{n-k+2}\end{pmatrix} $$

Además, dado que los primeros $k$ valores están pre establecidos, podemos usar lo siguiente:

$$ \begin{pmatrix} a_{0} &a_{1} &a_{2} &\cdots &a_{k-2} &a_{k-1} \\ 1 &0 &0 &\cdots &0 &0 \\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ \vdots &\vdots &\vdots &\ddots &\vdots &\vdots \\ 0 &0 &0 &\cdots &1 &0 \end{pmatrix}^{n}\cdot \begin{pmatrix} f_{k-1} \\ f_{k-2} \\ f_{k-3} \\ \vdots \\ f_{0}\end{pmatrix} = \begin{pmatrix} f_{n+k-1} \\ f_{n+k-2} \\ f_{n+k-3} \\ \vdots \\ f_{n}\end{pmatrix} $$

Así que si usamos **Exponenciación rápida** sobre la matriz, obtendremos una complejidad de $O(k^{3}\log_{2}{n})$, la cual suele ser suficiente.

### Problemas

- [Table Divison](https://www.hackerrank.com/contests/hackerrank-all-womens-codesprint-2019/challenges/table-division)
- [Function Queries](https://www.codechef.com/CF22018/problems/CF1920)