# Análisis de complejidad algorítmica

Una característica representativa de las competiciones de programación es el análisis de los algoritmos antes de submeterlos. 

Esto se debe a que las restricciones puestas en estos tipos de problemas suelen ser inteligentemente escogidos. 

Muchos algoritmos pueden resolver un problema, pero algunos son más eficientes que otros.


¿Cómo podemos saber si nuestro algoritmo es lo suficientemente eficiente?

Primeramente, un computador típico hoy en día puede realizar aproximadamente *100 millones*, o *$10^8$* operaciones por segundo.

Una operación se refiere a cualquiera de los siguientes elementos de un código:
- Asignar o leer una variable
- Una suma, resta, multiplicación, división o exponenciación
- Alguna operación binaria (comparación `==`, `and`, `or`, u otros)
- Llamar a cualquier función built-in de python (pop, push, split, etc)

In [None]:
# Ejemplo 1
# ¿Cuántas operaciones se hacen en esta célula?
a = 1
for i in range(10):
    a += i

## Notación O

La notación O mayúscula nos permite estimar cuántas operaciones necesita nuestro programa para finalizar. Con una estimativa de cuántas operaciones tenemos disponibles, podemos saber si nuestro algoritmo es lo suficientemente bueno.

1. Primeramente, debemos identificar cuáles son las variables de entrada. Supongamos que hay una sola, digamos que es `n`
2. Ahora debemos calcular la cantidad de operaciones que realizar nuestro algoritmo. Como el valor de la cantidad de operaciones puede depender de la variable de entrada `n`, obtenemos una expresión que depende de `n`. 
3. El término dominante de la función es aquel que crece más rápido cuando `n` se vuelve grande. Este término dominante es igual a la complejidad computacional de nuestro algoritmo, denotado por $O(expresión)$

In [None]:
# Ejemplo
n = int(input())
a = 0
for i in range(n): # 3n operaciones
    a = n**2 + n # Una asignación + una potenciación + una suma = 3 operaciones
for i in range(n): # 4n^2 operaciones
    for j in range(n):
        a += i * j # Una multiplicación + una asignación = 2 operaciones
# Total: 4n^2 + 3n

### Análisis

1. En el ejemplo anterior hay una sola variable de entrada, `n`.
2. La cantidad de operaciones depende de `n` y es aproximadamente igual a $4n^2+3n$.
3. El término dominante siempre es aquel cuyo exponente es mayor. Es decir, aquel término de mayor grado. Por ejemplo, supongamos que $n=100$. Entonces $4n^2 = 40000$, mientras que $3n = 300$. En ese sentido, $4n^2$ es el término dominante. Por lo tanto, el algoritmo tiene una complejidad $O(2n^2)$. En la notacion O, las constantes no importan, entonces podemos escribir también $O(n^2)$. 

## Análisis (2)

Suponiendo que $n = 100$, eso significa que un algoritmo $O(n^2)$ necesita aproximadamente $10000$ operaciones. Es decir, podemos estimar que va a necesitar $10000/10^8=1/10^3$ segundos, es decir, $0.001 s = 1 ms$, un milisegundo. 

La siguiente tabla nos puede servir para estimar la complejidad que debemos esperar para resolver un problema




| $n$        | Peor complejidad$^*$ | Ejemplo |
| --------   | -------              | -------- |
| $\leq 10$  | $O(n!)$, $O(n^6)$    | Permutaciones |
| $\leq 18$  | $O(2^n \times n^2)$  | Problema del viajante + programación dinámica |
| $\leq 22$  | $O(2^n \times n)$    | Programación dinámica + representación binaria |
| $\leq 26$  | $O(2^n)$             | Búsqueda de subconjuntos |
| $\leq 100$ | $O(n^4)$             | Cuatro bucles foor anidados |
| $\leq 450$ | $O(n^3)$             | Algoritmo FLoyd-Warshall |
| $\leq 2500$| $O(n^2\cdot\log_2(n))$| Dos bucles for anidados + búsqueda binaria  |
|$\leq 10k$ | $O(n^2$              | Ordenamiento burbuja|
|$\leq 4.5M$ | $O(n\cdot\log_2(n))$ | Ordenamiento merge  | 
|$\leq 100M$ | $O(n)$, $O(\log_2(n))$, $O(1)$| Fórmula cerrada |



$^*$Suponiendo que tenemos 100 millones de operaciones disponibles para realizarlos en 1 segundo.

## Algunos consejos

1. Si tenemos un bucle con $n$ iteraciones, y cada iteración tiene complejidad $O(f(n))$, entonces el bucle exterior tiene complejidad $O(nf(n))$. En particular, $k$ bucles anidados donde el bucle más interno solo hace una operación, tiene complejidad $O(n^k)$. 

In [None]:
n = int(input())
for i in range(n): # O(n^3)
    for j in range(n): # O(n^2)
        for k in range(n): # O(n)
            print(i*j*k) # O(1)

2. Si tenemos dos secciones de código que no están anidados, y tienen complejidades $O(f_1(n))$ y $O(f_2(n))$, entonces la complejidad de las dos secciones juntas es $O(f_1(n) + f_2(n))$

In [None]:
n = int(input())
for j in range(n): # O(n^2)
    for k in range(n): # O(n)
        print(i*j*k) # O(1)
        
for i in range(n): # O(n^3)
    for j in range(n): # O(n^2)
        for k in range(n): # O(n)
            print(i*j*k) # O(1)
            
# Total: O(n^2 + n^3) = O(n^3)

3. Para calcular la complejidad de una función recursiva, necesitamos estimar cuántas llamadas se hacen hasta llegar al caso base. 

La complejidad de esta función es $O(n)$

In [None]:
def recursiveFun(n):
    if (n <= 0):
        return 1
    else
        return 1 + recursiveFun(n-5)

Pero la complejidad de esta función es $O(2^n)$.

In [2]:
def recursiveFun4(n, m, o):
    if (n <= 0):
        return m + o
    else:
        recursiveFun4(n-1, m+1, o)
        recursiveFun4(n-1, m, o+1)

## Ejemplos y ejercicios

### Ejemplo 1:
Función que devuelve `True` si objetivo está dentro de lista. 
La variable de entrada es el tamaño de la lista, $n$. 

Dependiendo de dónde está el objetivo ubicado en la lista, la cantidad de operaciones muda. Recordemos que la notación O es un proceso intrínsecamente inexacto. Sobre el punto, tenemos un par de opciones
1. Considerar el peor caso posible como representativo de la cantidad de operaciones necesarias
2. Considerar el promedio de los casos que podemos recibir

Elegir cuál opción es la adecuada no es una tarea fácil, y depende mayormente de la experiencia del programador. 

In [None]:
def busqueda_lineal(lista, objetivo):
    for i in range(len(lista)):
        if lista[i] == objetivo:
            return True
    return False

En el peor de los casos, la búsqueda lineal necesita aproximadamente $n$ operaciones. Por lo tanto, la complejidad es $O(n)$.

Es más difícil estimar el promedio, pues no sabemos qué tan común es que el objetivo no esté en la lista. Si el objetivo está dentro de la lista, podríamos estimar que necesita recorrer hasta más o menos la mitad de la lista, es decir, $n/2$. La complejidad es $O(n/2) = O(n)$ (pues las constantes no importan).

En este caso, ambos análisis concuerdan, lo cual suele ocurrir, pero no siempre.

### Ejemplo 2:

La búsqueda binaria es un algoritmo que cumple el mismo objetivo que el ejemplo anterior, pero asume que la lista está *ordenada*. La complejidad del algoritmo es $O(\log_2(n))$.

In [None]:
def busqueda_binaria(lista, objetivo):
    izquierda, derecha = 0, len(lista) - 1
    while izquierda <= derecha:
        medio = (izquierda + derecha) // 2
        if lista[medio] == objetivo:
            return medio
        elif lista[medio] < objetivo:
            izquierda = medio + 1
        else:
            derecha = medio - 1
    return -1

### Ejemplo 3:

Ordenamiento burbuja es un algoritmo que ordena una lista

Complejidad $O(n^2)$, pues hay dos bucles anidados y la operación más interna es de complejidad constante

In [None]:
def ordenamiento_burbuja(lista):
    n = len(lista)
    for i in range(n): # O(n^2)
        for j in range(0, n-i-1): # O(n)
            if lista[j] > lista[j+1]: # O(1)
                lista[j], lista[j+1] = lista[j+1], lista[j]

### Ejemplo 4:

Multiplicación de dos matrices $A$ y $B$. Vemos que la función consta de dos partes. La definición de `resultado`, y los bucles anidados. La complejidad total es la tuma de las dos complejidades. 

La definición de `resultado` consta de dos bucles for anidados, luego su complejidad es aproximadamente $O(n^2)$.

Los tres bucles anidados tienen como operación más interna una multiplicación, una suma y una asignación. Su complejidad interna es $O(1)$, y por lo tanto los bucles tienen complejidad $O(3n^3)$. 

La complejidad total es $O(3n^3 + n^2) = O(n^3)$. 


In [None]:
def multiplicar_matrices(A, B):
    resultado = [[0 for _ in range(len(B[0]))] for _ in range(len(A))]
    for i in range(len(A)):
        for j in range(len(B[0])):
            for k in range(len(B)):
                resultado[i][j] += A[i][k] * B[k][j]
    return resultado


### Ejemplo 5:

Muchas vecces hay más de una variable de entrada. La expresión que determina la complejidad pued depender de todas las variables que necesites, pues el objetivo final siempre es aproximar si tu algoritmo va a terminar o no. Por ejemplo, la siguiente función calcula el menor valor en una matriz aleatoria de tamaño $m \times n$. 

In [8]:
from random import random
def minimo(m, n):
    minimo = 2
    for i in range(m):
        for j in range(n):
            valor = random()
            if valor < minimo:
                minimo = valor
    print("El minimo es: ", minimo)
    
minimo(4, 3)

El minimo es:  0.07347415539741864


La complejidad del algoritmo es $O(mn)$. 

## Ejercicios

### Ejercicio 1

¿Cuál es la complejidad de la siguiente función?

In [None]:
def encontrar_maximo(lista):
    maximo = lista[0]
    for i in range(1, len(lista)):
        if lista[i] > maximo:
            maximo = lista[i]
    return maximo

### Ejercicio 2

¿Cuál es la complejidad de la siguiente función?

In [None]:
def imprimir_pares(n):
    for i in range(n):
        for j in range(n):
            print(i, j)

### Ejercicio 3

¿Cuál es la complejidad de la siguiente función?

In [None]:
def suma_pares(lista):
    total = 0
    for i in range(len(lista)):
        for j in range(i+1, len(lista)):
            total += lista[i] + lista[j]
    return total

### Ejercicio 4
¿Cuál es la complejidad de la siguiente función?

In [None]:
def fibonacci(n):
    if n <= 1:
        return n
    else:
        return fibonacci(n-1) + fibonacci(n-2)

### Ejercicio 5

¿Cuál es la complejidad de la siguiente función?

In [None]:
def verificar_duplicados(lista):
    for i in range(len(lista)):
        for j in range(i+1, len(lista)):
            if lista[i] == lista[j]:
                return True
    return False