# Clase 02

Para una mejor visualización entrar al siguiente [link](https://nbviewer.jupyter.org/github/racsosabe/Miscelanea/blob/master/UPC/Beginner%20II/Clase%2002%20-%20Complejidad%20algoritmica.ipynb)

# Complejidad

Una forma de medir un algoritmo es mediante la cantidad de memoria que este consume y la cantidad de operaciones elementales que este podría ejecutar.

## Notación asintótica

La notación asintótica nos permite referirnos al valor de una función en base a una aproximación de una cota superior. En términos generales, es un poco difícil determinar el valor de una función que desconocemos (es decir, no sabemos exactamente qué forma tiene $f(n)$), así que lo más natural es aproximar su valor.

### Big O

Definimos la función $O(f(n))$ como una familia de funciones $g(n)$ tales que:

$$ \exists n_{0}, c > 0 : |g(n)| \leq c|f(n)|, \forall n \geq n_{0} $$

Debido a la definición de $O(f(n))$, podemos deducir fácilmente que:

$$ c\cdot f(n) = O(f(n)) $$

Por lo que usualmente las constantes numéricas no intervienen al momento de denotar la función de cota $f(n)$. Por ejemplo, tenemos trivialmente que:

1. $8n \in O(n)$

2. $\log_{2}{10}n^{2} \in O(n^{2})$

3. $3\cdot 2^{n} \in O(2^{n})$

Usaremos la notación $g(n) = O(f(n))$ para referirnos a que $g(n) \in O(f(n))$, ya que esta relación se puede deducir en base al contexto.

También existen otras funciones como $\Theta$ y $\Omega$, pero estas no son tan relevantes, ya que nos interesa siempre el **peor caso** de la cantidad de operaciones posible.

## Analizando la complejidad de un algoritmo

Para poder analizar la complejidad temporal de un algoritmo, nos basta con analizar línea por línea del pseudocódigo y sumar los aportes individuales de cada una multiplicado por su frecuencia. Entonces, debemos obtener la cantidad de *operaciones elementales* que se realizan.

Una *operación elemental* es aquella que toma un tiempo constante ($O(1)$) a la computadora. Uno suele asumir que las operaciones aritméticas, de comparación de enteros, declaración y acceso de variables, así como las llamadas a las funciones son elementales.

Por ejemplo, si tenemos el algoritmo:

**Ejemplo 1**

```C++
for(int i = 0; i < n; i++){
    for(int j = 0; j < m; j++){
        ans += i * j;
    }
}
```

1) La primera línea es un `for` que se ejecutará $n$ veces y el trabajo en cada vez es de $O(1)$ (1 comparación y 1 operación aritmética). Total = $O(n)$

2) La segunda línea es un `for` que se ejecutará $n$ veces (está anidado) y el trabajo de cada vez es de $O(m)$ ($m$ comparaciones y $m$ operaciones aritméticas). Total = $O(nm)$

3) La tercera línea son se ejecutará $nm$ veces y el trabajo de cada vez es de $O(1)$ (2 operaciones aritméticas y 1 acceso de variable). Total = $O(nm)$

Por lo tanto, nuestro algoritmo tiene una complejidad de $O(nm)$.

Este ejemplo fue bastante simple, intentemos subir la dificultad:

**Ejemplo 2**

```C++
for(int i = 1; i <= n; i++){
    for(int j = i; j <= n; j += i){
        ans += j;
    }
}
```

1) La primera línea tiene un trabajo total de $O(n)$.

2) La segunda línea depende directamente del valor de $i$, en ese caso tiene un trabajo total de $\frac{n}{i}$.

3) La tercera línea también tiene un trabajo total de $\frac{n}{i}$.

Notemos que para poder obtener la complejidad del algoritmo deberemos considerar los aportes de cada $i$ posible.

**Observación 1:** El trabajo del algoritmo tiene como cota superior a $O(n^{2})$, ya que como $i \geq 1$, entonces se debe dar que $\frac{n}{i} \leq n$.

La observación 1 nos da una cota, pero esta no es tan precisa, así que consideraremos la sumatoria de los aportes. Si $T(n)$ es la complejidad del algoritmo para un $n$ dado, entonces:

$$ T(n) = \sum\limits_{i = 1}^{n}\frac{n}{i} $$

Ya que el $n$ es un factor común en todos los sumandos, tenemos que:

$$ T(n) = n \sum\limits_{i = 1}^{n}\frac{1}{i} $$

Por lo tanto, la complejidad depende principalmente de la cota superior de esta suma:

$$ \sum\limits_{i = 1}^{n}\frac{1}{i} $$

**Observación 2:** La función $f(x) = \frac{1}{x}$ es positiva y decreciente para todo $x \geq 1$.

Usando la observación 2, podemos usar la siguiente propiedad para funciones $f$ decrecientes y positivas:

$$ \sum\limits_{i = 1}^{n}f(i) \leq \int\limits_{1}^{n}f(x) dx + f(1) $$

Cabe recalcar que si $f$ es creciente, entonces el sumando extra pasa de $f(1)$ a ser $f(n)$.

Entonces, tendremos que:

$$ \sum\limits_{i = 1}^{n}\frac{1}{i} \leq \int\limits_{1}^{n}\frac{1}{x} dx + f(1) = \log{n} + 1 $$

Por lo que tendremos que una cota superior será $\log{n} + 1$, pero esta función pertenece a $O(\log{n})$, ya que para todo $n > 3$ se da que:

$$ \log{n} + 1 < 2\log{n} $$

Finalmente, tendremos que:

$$ T(n) = n \sum\limits_{i = 1}^{n}\frac{1}{i} = n\cdot O(\log{n}) = O(n\log{n}) $$

**Nota:** Esto nos dice que la suma de la cantidad de divisores de los primeros $n$ números naturales está acotada por $O(n\log{n})$.

### Método de Contribución

El método de contribución es una técnica que nos facilita tanto el cálculo de complejidades como el conteo en algunos problemas. Este se basa en agrupar los aportes individuales de manera conveniente y aprovechar dichas etiquetas para que el cálculo se haga más sencillo.

Probaremos un ejemplo un poco más complejo, más que todo porque este será un pseudocódigo y no un fragmento de código.

**Ejemplo 1**

Supongamos que tenemos un conjunto $S$ de tamaño $n$ y una función $w(s)$ asociada a cada subconjunto de $S$ y que se puede acceder en $O(1)$, entonces ejecutaremos el siguiente algoritmo:

```
Para cada subconjunto A de S:
    res <- 0
    Para cada subconjunto B de A:
        res <- w(B)
    Imprimir res
```

**¿Cuál es la complejidad de este algoritmo?**

**Observación 1:** Empecemos por algo sencillo, al igual que la Observación 1 del Ejemplo 2. La primera línea se ejecuta $2^{n}$ veces y la tercera línea se ejecuta $O(2^{n})$ veces, así que una primera cota superior será $O(4^{n})$.

Sin embargo, lo anterior no es preciso, así que deberemos intentar manipular adecuadamente la cantidad de operaciones para obtener la respuesta correcta (la cota superior más pequeña posible).

Intentemos hablar un poco más y no usar muchas expresiones matemáticas por ahora:

Para cada conjunto $A$, iteraremos sobre todos los subconjuntos del mismo. Si la cantidad de elementos de $A$ es k, entonces iteraremos sobre $2^{k}$ subconjuntos.

**Observación 2:** La cantidad de subconjuntos de $A$ que recorreremos solo depende de $|A|$, así que podemos intentar agrupar aquellos subconjuntos con igual tamaño, ya que todos ellos realizarán un trabajo de $2^{k}$.

Gracias a la observación 2, podemos pasar a las expresiones matemáticas:

$$ T(n) = \sum\limits_{k = 0}^{n}Q(n, k)2^{k} $$

Donde $Q(n, k)$ es la cantidad de subconjuntos de $S$ (que tiene tamaño $n$) con tamaño $k$.

Los límites de $k$ se justifican en que podemos tomar entre $0$ y $n$ elementos de $S$.

Ahora nuestro cálculo se reduce, en primera instancia, a determinar $Q(n, k)$:

Ya que los subconjuntos van a ser iterados una sola vez, esto quiere decir que el ordenamiento de los elementos no importa, así que podemos usar nuestros conocimientos en combinatoria para concluir que:

$$ Q(n, k) = \binom{n}{k} $$

Cuyo significado es "la cantidad de formas diferentes en las que se pueden tomar $k$ elementos de $n$ posibles".

Volvamos a nuestra complejidad:

$$ T(n) = \sum\limits_{k = 0}^{n}\binom{n}{k}2^{k} $$

Esta expresión se ve un poco intimidante, y tampoco es sencillo relacionarla con alguna fórmula conocida...¿O sí se puede?

Modificaremos un poco la expresión pero sin cambiar el resultado final:

$$ T(n) = \sum\limits_{k = 0}^{n}\binom{n}{k}2^{k}1^{n - k} $$

Por el resultado del binomio de Newton, tenemos que:

$$ T(n) = \sum\limits_{k = 0}^{n}\binom{n}{k}2^{k}1^{n - k} = (2 + 1)^{n} = 3^{n} $$

Finalmente, concluimos que:

$$ T(n) = 3^{n} = O(3^{n}). $$

Notemos que hay una diferencia bastante notable entre $3^{n}$ y $4^{n}$, sobretodo cuando $n$ es grande.

**Nota: Hacer un break **

# Problemas para resolver en clase

- [Fafa and his Company](https://codeforces.com/problemset/problem/935/A)
- [You're Given a String...](https://codeforces.com/contest/23/problem/A)
- [Heidi Learns Hashing (Easy)](https://codeforces.com/contest/1184/problem/A1)
- [Good Numbers (easy version)](https://codeforces.com/contest/1249/problem/C1)
- [Good Numbers (hard version)](https://codeforces.com/contest/1249/problem/C2)
- [Simple Equations](https://onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=2612)
- [Kaprekar Numbers](https://onlinejudge.org/index.php?option=com_onlinejudge&Itemid=8&page=show_problem&problem=915)
- [Non-square Equation](https://codeforces.com/problemset/problem/233/B)
- [GeT AC](https://atcoder.jp/contests/abc122/tasks/abc122_c?lang=en)
- [Second Order Statistics](https://codeforces.com/problemset/problem/22/A)