<a href="https://colab.research.google.com/github/RodolfoFigueroa/madi2022-1/blob/main/2_Analizando_Complejidad_en_Algoritmos.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

En esta sesión veremos algunos ejemplos de algoritmos (unos nuevos, y otros que ya hemos visto) y analizaremos sus complejidades, ya sea en tiempo, memoria o ambas. Comenzaremos con algunas cosas que ya hemos visto antes.

**Ejemplo 1.** En la práctica de inducción, teníamos el siguiente problema:

Encuentra el valor de $$\Big\lfloor \frac{1}{2}\Big \rfloor + \Big\lfloor \frac{2}{2}\Big \rfloor + \cdots + \Big\lfloor \frac{n}{2}\Big \rfloor$$

Este problema se puede resolver de forma sencilla utilizando un ciclo for, en donde cada iteración vamos agregando un nuevo sumando al valor de la suma hasta ese momento. ¿Qué complejidad tiene hacer esto en tiempo y en memoria?

En tiempo, es $O(n)$, pues estamos haciendo $n$ operaciones, una en cada ciclo. En memoria, es constante, pues lo único que tenemos que ir recordando es el valor de la suma en cada momento, es decir, es $O(1)$.

Nosotros habíamos encontrado una fórmula, teniendo ya la fórmula para esta suma, ¿cómo cambian las complejidades? Como podemos aplicar la fórmula para el valor de la suma, tenemos que hacer una cantidad constante de operaciones, lo que reduce el tiempo de $O(n)$ a $O(1)$, mientras que la complejidad de memoria se mantiente constante.

**Ejemplo 2.** Pasemos a un ejemplo más interesante. Supongamos que tenemos que diseñar un algoritmo tal que dado un entero positivo $n$ y un número real $x$, tenemos que encontrar el valor de $x^n$, pero utilizando únicamente operaciones básicas (suma, resta, multiplicación y división).

Un primer algoritmo para hacer esto sería lo siguiente:

In [None]:
def potencia(x, n):
  p = x
  for i in range(2, n+1):
    p = p*x
    print(p)
  return p

print(potencia(2,10))

4
8
16
32
64
128
256
512
1024
1024


¿Cuáles son las complejidades de este algoritmo? En tiempo, nos toma $O(n)$, pues estamos iterando $n$ veces y en cada una hacemos una cantidad constante de operaciones, mientras que es constante en memoria, pues sólo actualizamos el valor de $p$ en cada iteración. 

¿Cómo podemos optimizar este algoritmo? Notemos que si $n = 2k$, entonces $x^n = (x^k)^2$, mientras que si $n = 2k+1$, $x^n = (x^k)^2 \cdot x$. Usemos esto para obtener un algoritmo que sea mejor en cuanto a tiempo de ejecución.

In [None]:
def potencia_2(x, n):
  if(n == 1):
    return x
  p = potencia_2(x, n//2)
  if(n%2):
    return x*p*p
  else:
    return p*p
 
print(potencia_2(2, 10))

1024


Notemos que ahora el tiempo de ejecución disminuye considerablemente, pues hacemos un promedio de $log_2(n)$ iteraciones, en donde hacemos una cantidad constante de operaciones en cada iteración, por lo que la complejidad en tiempo del algoritmo es $O(log(n)$. Sin embargo, la complejidad en cuanto a memoria se ve afectada, ya que nuestra pila de recursión alcanza un promedio de $log_2(n)$ de profundidad, lo que hace que la complejidad de nuestro nuevo algoritmo en memoria sea $O(log(n))$.

Este ejemplo ilustra algo que es muy común en análisis de algoritmos, en muchas ocasiones es conveniente sacrificar un poco de memoria a cambio de una gran mejora en el tiempo de ejecución, pues bajar el tiempo de $O(n)$ a $O(log(n))$ es una gran mejora, mientras que aumentar la complejidad en espacio de $O(1)$ a $O(log(n))$ no es tan significativo. La programación dinámica nos permite trabajar situaciones similares, donde almacenar valores suele ser muy conveniente para poder mejorar el tiempo de ejecución de los algoritmos.

Regresemos a analizar un poco más a fondo el ejemplo que acabamos de ver. La forma en la que lidiamos con esto es comunmente conocida como exponenciación binaria, ¿por qué es útil? Bien podríamos haber utilizado alguna de las muchas funciones que nos permiten conocer las potencias de números en python. Sin embargo, pensemos en el siguiente problema: 

Encuentra el residuo de $1234567^{1234567}$ al ser dividido por $10^9+7 = 10000007$ (este número se usa mucho pues es grande y es primo). Elevar el número definitivamente no es una opción, ¿qué podemos hacer? Podemos utilizar exponenciación binaria y en cada paso obtener la congruencia correspondiente:

In [None]:
mod = 1000000007

def potencia_mod(x, n, mod):
  if(n == 1):
    return x%mod
  p = potencia_2(x, n//2)
  p = (p*p)%mod
  if(n%2):
    return (x*p)%mod
  else:
    return p
  
print(potencia_mod(1234567, 1234567, mod))

496463181


**Ejemplo 3.** Recordemos una sucesión de la que hemos hablado en el pasado: la sucesión de Fibonacci. Supongamos que se nos pide encontrar el $n-$ésimo valor de esta sucesión, es decir, $F_n$.

Un primer algoritmo para hacer esto, sería hacer una recursión que calcule los valores de Fibonacci:

In [None]:
def fib(n):
  if(n == 0):
    return 0
  if(n == 1):
    return 1
  return fib(n-1)+fib(n-2)

print(fib(8))

21


¿Cuáles son las complejidades de este algoritmo? Notemos que la pila de recursión tiene como longitud máxima $n$, y como no guardamos variables, se concluye que la complejidad en memoria del algoritmo es $O(n)$. Supongamos que ya se tienen los valores de $fib(n-1)$ y $fib(n-2)$, en ese caso, al llamar $fib(n)$, se hace una cantidad constante de operaciones, entonces la complejidad en tiempo será determinada por la cantidad de veces que llamamos a la función $fib$, veamos que como para cada $n > 1$, requerimos llamar a la función $fib$ dos veces, se concluye que la complejidad en tiempo es $O(2^n)$.

¿Cómo mejorar esto? ¿Qué pasa si guardamos los valores de los Fibonaccis que vamos calculando? Es decir, guardamos el valor de $F_k$ la primera vez que llamemos a $fib(k)$.

In [None]:
n = int(input())

Fs = [-1]*(n+1)

def fib2(k):
  if(k == 0):
    return 0
  if(k == 1):
    return 1
  if(Fs[k] != -1):
    return Fs[k]
  else:
    Fs[k] = fib2(k-1)+fib(k-2) 
    return Fs[k]

print(fib2(n))

8
21


¿Cuáles son las complejidades de este algoritmo? En cuanto a memoria, tenemos lo mismo que en el algoritmo anterior en la pila de recursión, y además estamos agregando $Fs[]$, pero tiene una cantidad lineal de entradas, por lo que la complejidad en espacio sigue siendo $O(n)$. La complejidad en tiempo mejora considerablemente, pues ahora $fib(k)$ llama a $fib(k-1), fib(k-2)$ únicamente una vez,  lo que permite que la complejidad ahora sea $O(n)$.

Hemos ilustrado de nuevo el principio de la programación dinámica, guardar valores suele ser muy útil para reducir considerablemente la complejidad en tiempo de un algoritmo.

Estos algoritmos nos permiten encontrar el valor de $F_n$ de manera recursiva, ¿lo podemos hacer de forma iterativa? Es decir, de atrás para adelante. Sí podemos:

In [None]:
def fib3(n):
  if(n == 0):
    return 0
  if(n == 1):
    return 1
  c = 1
  k1 = 0
  k2 = 1
  while(c != n):
    temp = k1
    k1 = k2
    k2 = temp + k1
    c = c+1
  return k2

print(fib3(8))

21


¿Cuáles son las complejidades de este algoritmo? En cuanto a memoria, notemos que ocupamos constante en la pila de recursión (llamamos sólo una vez a $fib3(n)$), y nuestras únicas variables son $c, k1, k2$, por lo que la complejidad en espacio es $O(1)$. La complejidad en tiempo es $O(n)$, pues hacemos el $while$ hasta llegar a $n$, sumando $1$ a $c$ en cada paso. 

Esto nos muestra algo que también es bastante común, hacer un algoritmo de forma iterativa suele hacerlo más eficiente, ya sea en espacio, en tiempo o ambas. Sin embargo, muchas veces es muy complicado pasar de algo recursivo a algo iterativo.

**Ejemplo 4.** Analicemos las complejidades de el algoritmo de DFS, que vimos anteriormente. Recordemos el cómo era este algoritmo, exploramos los caminos de la gráfica hasta llegar a algún vértice que ya había sido visitado, y nos regresamos al vértice anterior para continuar explorando:

In [None]:
n = 8
p = 1/3

G = nx.gnp_random_graph(n, p)
print(G.edges, '\n')
nx.draw(G, with_labels=True, font_weight='bold', node_color='#71A125')

vis = [0]*n

def dfs(v):
  vis[v] = 1
  print(v)
  for u in G.adj[v]:
    if vis[u] == 0 :
      dfs(u)
  return

dfs(0)

Estamos analizando la complejidad únicamente del algoritmo, es decir, podemos omitir por el momento el espacio que ocupa la gráfica $G$ por sí misma. Sea $n$ la cantidad de vértices y $m$ la cantidad de aristas. En cuanto a memoria, tenemos el vector $vis$ que guarda $n$ valores, y en cuanto a la pila de recursión, podría darse el caso en el que se llegue a una profundidad de $n$, entonces, la complejidad en espacio es $O(n)$. Para la complejidad en tiempo, notemos que cada arista puede ser usada a lo más una vez, y exploramos a partir de cada vértice exactamente una vez, por lo que la complejidad en tiempo de DFS es $O(n + m)$.

**Ejercicios**

1.   Determina las complejidades en tiempo y espacio del algoritmo de BFS visto en clases pasadas.
2.   Considera el siguiente problema: Dado un entero $n$, encuentra el valor de $1! + 2! + \cdots + n!$. 

  a)   Describe e implementa un algoritmo que tenga complejidad $O(1)$ en espacio, ¿cuál es su complejidad en tiempo? 
  
  b)   Describe e implementa un algoritmo que tenga complejidad $O(n)$ en tiempo, ¿cuál es su complejidad en espacio?



*Ejercicio 1.* A continuación se muestra el código de la implementación de BFS que vimos antes:

In [None]:
from collections import deque 

n = 10
p = 0.25

G = nx.gnp_random_graph(n, p)
print(G.nodes)
print(G.edges, '\n')
nx.draw(G, with_labels=True, font_weight='bold', node_color='#71A125')

vis = [0]*n

def bfs(v):
  q = deque()
  vis[v] = 1
  q.append(v)
  while(q):
    u = q.popleft()
    print(u)
    for w in G.adj[u]:
      if vis[w] == 0:
        vis[w] = 1
        q.append(w)
  print('\n')
  return
    
bfs(0)

Escribe aquí o sube una foto donde determines las complejidades en tiempo y espacio de este algoritmo, argumentando por qué lo son.

*Ejercicio 2. a)* Describe aquí el algoritmo solicitado.

In [None]:
#(Aquí va el código de la implementación del algoritmo que describiste en la celda anterior)

*Ejercicio 2. b)* Describe aquí el algoritmo solicitado.

In [None]:
#(Aquí va el código de la implementación del algoritmo que describiste en la celda anterior)