In [None]:
# Autor: Daniel Pinto
# Introduccion a la notacion asintotica
# Fecha: 2021/09/23 YYYY/MM/DD

from typing import List, TypeVar, Tuple, Any, Callable
from hypothesis import given, strategies as st
from IPython.display import Markdown, display

def display_(s : str) -> None:
    '''
    A way to display strings with markdown 
    in jupyter.
    '''
    display(
        Markdown(s)
    )

SUCCESS_COLOR = '#4BB543'
ERROR_COLOR   = '#B00020'

def color_text(s : str, color : str =SUCCESS_COLOR ) -> str:
    return f"<span style='color:{color}'> {s} </span>."
a      = TypeVar('a')
b      = TypeVar('b')
c      = TypeVar('c')

# Big $O$ notation


- Es una forma de calcular el **numero de operaciones** que un algoritmo realiza
  
- Analiza el numero de operaciones en **el peor de los casos**
  
- En caso de que el peor de los casos se ejecute en la misma cantidad de operaciones que en el mejor de los casos, lo llamamos $\Theta$ (theta)
notation.

- Tambien existe el _average case complexity_ para estudiar el caso promedio, pero este es sorprendentemente dificil de calcular (por cuestion de probabilidades: como se distribuye la data?)

- Muchas veces es referido como _time complexity_, sin embargo algoritmos con complejidades superiores **no siempre son mas lentos** que algoritmos con complejidades inferiores
  
- Asi que, aunque es una buena herramienta para estimar que puede ser mas eficiente, **benchmarking** siempre sera necesario.

# Un ejemplo basico: `for loops`

Consideremos el siguiente script de python que suma los primeros `n` numeros:

In [None]:
# Algoritmo a.
def suma() -> None:
    n     = 10
    sum_n = 0

    for i in range(n+1):
        sum_n = sum_n + i

    display_(f"La suma de los primeros ${n}$ numeros es: ${sum_n}$")
    #x = 2
if __name__=="__main__":
    suma()


Notemos que la funcion main realiza:


```python
# Algoritmo a.
def main():
    n     = 10                                  <- 1
    sum_n = 0                                   <- 2

    for i in range(n):                          <- n +2
        sum_n = sum_n + i                       <- n + n + 2 = 2n+2

    print(
        f"La suma de los primeros {n} numeros es: {sum_n}" <- 2n+3
        )

if __name__=="__main__":
    main()

```

$2n+3$ operaciones, por lo tanto su complejidad en tiempo es de: $O(2n+3)$


Si adicionalmente quisieramos calcular tanto la suma como el producto:

In [None]:
# Algoritmo b.
def suma_producto() -> None:
    n      = 10                                  #<- 1
    sum_n  = 0                                   #<- 2
    prod_n = 1                                   #<- 3

    for i in range(1,n):                         #<- n +3
        sum_n  = sum_n  + i                      #<- n + n + 3  = 2n+3
        prod_n = prod_n * i                      #<- 2n + 3 + n = 3n+3

    display_(
        f"La suma de los primeros ${n}$ numeros es: ${sum_n}$" #<- 3n+4
        )
    
    display_(
        f"El producto de los primeros ${n}$ numeros es: ${prod_n}$" #<- 3n+5
        )


if __name__=="__main__":
    suma_producto()


En este caso, la complejidad es $O(3n+5)$


# Comparando funciones bajo la notacion $O$

Finisimo, ya tenemos como sacar la complejidad de algoritmos simples con ciclos, y no solo eso, sino sabemos contar exactamente cuantas operaciones hacen. Sin embargo, hay una pregunta interesante que surge una vez ya sabemos el numero de pasos: cual algoritmo se comporta mejor?


En el caso anterior, parece ser que el `Algoritmo a.` tiene una menor complejidad que el `Algoritmo b.`, lo cual parece razonable, pero que pasa si tengo dos algoritmos con complejidades: $O_1 = O(n+1)$ y $O_2 = O(n+2)$? Es un poco exagerado decir que el primer algoritmo es mejor ya que hace solo 1 operacion mas, si esa operacion es un o-logico (`||`) la diferencia en tiempo es **menor** a un ciclo de cpu, basicamente poseen el mismo tiempo. Por lo tanto, necesitamos introducir algunas nociones para determinar esto.

# La matematica del asunto

Sean $f(n)$ y $g(n)$ dos funciones, entonces decimos que $f$ _domina asintoticamente a_ $g$ si y solo si:


$$
\lim_{n \rightarrow \infty} \dfrac{g(n)}{f(n)} = k, \ k \in \mathbb{R}
$$

En nuestro ejemplo anterior:

$$
\lim_{n \rightarrow \infty} \dfrac{2n+3}{3n+5} = \dfrac{2}{3} \in \mathbb{R}
$$


Esto se traduce a: $O(g(n)) = O(f(n))$, es importante resaltar que este operador **no** es simetrico, por ejemplo, sea $f(n) = n^2$ y sea $g(n) = n$, entonces:


$$
\lim_{n \rightarrow \infty} \dfrac{3n+5}{2n+3} = \dfrac{3}{2} \in \mathbb{R}
$$

$$
\lim_{n \rightarrow \infty} \dfrac{n}{n^2} = 0 \in \mathbb{R}
$$

Es decir: $O(n) = O(n^2)$, pero:

$$
\lim_{n \rightarrow \infty} \dfrac{n^2}{n} = \infty \not \in \mathbb{R}
$$

Por lo tanto: $O(n^2) \not = O(n)$


# Jerarquia Asintoticas y Propiedades:

### Jerarquia:


<center>

|    Nombre   	|    Notacion    	|
|:-----------:	|:--------------:	|
| Constante   	| $O(1)$         	|
| Log-Log     	| $O(log(log(n)$ 	|
| Logaritmico 	| $O(log(n))$    	|
| Lineal      	| $O(n)$         	|
| Lineal-Log  	| $O(n\ log(n))$  	|
| Cuadratico  	| $O(n^2)$       	|
| Cubico      	| $O(n^3)$       	|
| Polinomico  	| $O(poly(n))$   	|
| Exponencial 	| $O(2^n)$       	|
| Factorial   	| $O(n!)$        	|

</center>


### Propiedades:

- $O(k \ f(n)) = O(f(n))$
  
- $O(f(n) + g(n)) = O(max \ f(n) \ g(n))$
  
- $O(f(n) * g(n)) = O(f(n)) * O(g(n))$


# Ejercicio: Suma de matrices


Analicemos la complejidad de un algoritmo para sumar matrices:

In [None]:
# Por simplicidad definiremos una matriz como una lista de listas
Matrix    = List[List[a]]

def sum_matrix_(M : Matrix[float], N : Matrix[float], size : Tuple[int,int] ) -> Matrix[float]:
    (n_row,n_col) = size
    res : Matrix[float] = []
    for i in range(n_row): # n
        row : List[float] = [] # n
        for j in range(n_col): # n*m
            row.append(M[i][j] + N[i][j]) # n*m
        res.append(row) # n
    return res

# O(3n + 2n*m) ~ O(N*M)


def sum_matrix(M : Matrix[float], N : Matrix[float], size : Tuple[int,int] ) -> Matrix[float] :
    (n,m) = size
    res  : Matrix[float]  = [[0 for _ in range(m)] for _ in range(n)]

    # Para cada indice: 0<= i < #rows
    for i in range(n):
        # Para cada indice: 0<=j < #cols
        for j in range(m):
            res[i][j] = M[i][j] + N[i][j]
    return res

def print_num_matrix(M : Matrix[float]) -> None:
    '''
    Dada una matriz de numeros
    la impre de manera bonita con los numeros
    alineados a la derecha.
    '''
    maxNum : float = max(
            list(
            map (lambda row: max(row),M)
            )
        )
    
    digits : int = len(str(maxNum))

    for row in M:
        print(list(map(lambda n: f"{n:>{digits}}"  ,row)))


if __name__=="__main__":
    N : Matrix[float] = [ [0,1,2]
                        , [3,4,5]
                        , [6,7,8]
                        ]

    M : Matrix[float] = [ [ 2, 4, 6]
                        , [ 8,10,12]
                        , [14,16,18]
                        ]

    display_("$N+M$ is:")
    print_num_matrix(sum_matrix_(N,M,(3,3)))


Cual es la complejidad si:

1. $N=M$? ~$O(N^2)$
2. $N \not = M$? ~$O(NM)$