# Algoritmos y Estructuras de Datos. 

## - Clase 11 - Computabilidad y Complejidad Computacional - 

## Complejidad Computacional

- Análisis Experimental   
    - Cómo ver cuanto tiempo un algoritmo consume? 
    - Más alla del examen experimental.  
- Alguna funciones matemáticas importantes 
    - Funciiones más usadas   
    - Comparación del crecimiento de una función  
- Análisis Asintótico 
    - Notación "Big-Oh".
    - Análisis Comparativo  
- Ejemplos



### Complejidad Computacional

- Análisis Experimental   

- Alguna funciones matemáticas importantes 

- Análisis Asintótico 

- Ejemplos

#### Análisis Experimental

Ya escrito un algoritmo, podemos estudiar su tiempo de ejecución, realizando varios tests con diferentes datos de entrada y registrar el tiempo que el agoritmo toma en cada ejecución.  

Podemos utilizar la función <code>time()</code> provista por Python:  


In [None]:
from time import time

# tiempo de comienzo
start_time = time( ) 

## EJECUCIÓN DEL ALGORITMO

#tiempo de finalización
end_time = time( ) 
# timepo transcurrido
elapsed = end_time - start_time 


Este resultado de la función <code>time()</code> esta expresado en segundos desde **epoch** como un número de coma flotante. La fecha específica de la época y el manejo de los **leap seconds** depende de la plataforma. En Windows y la mayoría de los sistemas Unix, la época es el 1 de enero de 1970, 00:00:00 (UTC) y los segundos bisiestos no se cuentan para el tiempo en segundos desde la época. Esto se conoce comúnmente como Tiempo Unix.




Medir el tiempo de esta forma es un buen punto de entrada, pero no es una solución escalable a nivel general (solo podemos medir casos practicos y no generales). Cabe destacar, que nuestro algoritmo, en este caso, esta compitiendo y haciendo uso compartido del CPU lo cual afectara la "aproximación" de nuestro resultado. 

Una mejor métrica, podria ser, calcular el número de ciclos de CPU (intrucciones átomicas) realizadas.


**Ejemplo:**

<img src="https://drive.google.com/uc?id=1blh7uh5UFkF1HudyWNKXt--lw03hwCEi" style="width: 500px;" />

#### Desafios del Análisis Experimental

Los resultados experimentales son importantes cuando estamos "afinando" un algoritmo considerado para producción. Algunas limitaciones de método:   

- Estos tiempos son dificiles de comparar, ya que estan restrigidos a una "instalación" (hardware/software) en particular.

- Los experimentos esta limitados a los "sets de datos de entrada", por ello, no incluyen "todos los posibles casos".

- El algoritmo debe esta "finalizado".


Esta última es la limitación mas importante, ya que en las etapas de desarollo y diseño del algoritmo han finalizado. Es decir, si el algoritmo no es eficiente, debemos comenzar nuevamente. 


#### Más alla del Análisis Experimental


Nuestro objetivo es desarrollar un método para analizar la eficiencia de un algoritmo, tal que:

- Análizar un algoritmo independientemente del hardware o entorno de desarrollo.

- Reliza un estudio de "alto-nivel" sobre la especificación del algoritmo, y no sobre su implementación.

- Toma en cuenta todos los possibles sets de datos. 


#### Cantidad de "operaciones primitivas"

Para análizar el tiempo de ejecución de un algoritmo sin realizar experimentos, debemos analizar la "descripción del algoritmo", ya sea en su implementación en Python, o pseudo-código. Definimos el conjunto de operaciones primitivas como:   

- Realizar una asignación.
- Determinar si el objeto tiene un identificador asociado.
- Realizar una operación artimetica.
- Comparar dos valores (numericos)
- Acceder a un elemento de una lista usando su indice. 
- Llamadas a función (el tiempo de ejecución de una función sera considerado aparte)
- Return de una función. 


#### Medir las operaciones en función del "tamaño de la entrada" 


Para capturar el "crecimiento" del tiempo de ejecución de un algoritmo, associaremos una función $f(n)$ (generalemnte llamada $T(n)$) que caracteriza el número de operaciones primitivas realizadas en función de una entrada de tamaño $n$. 


#### Poner el foco en "el peor caso" 


Un algoritmo puede ser sumamente eficiente para un tipo de valores de entrada, y comportarse de manera distinta en otros cassos (e.g. Busqueda vs. Busqueda Binaria, Alg. de Ordenamiento). Lamentablemente el análisis del "caso promedio" no es una tarea sencilla, generalemnte, primero se requiere de un estudio estadistico de los datos de entrada.  

Ejemplo:  


<img src="https://drive.google.com/uc?id=<ID of image>
tabla2.png" style="width: 500px;" />





El análisis del "peor caso" es mas simple. Permite la generación de mejores algoritmos (aunque menos optimizados, eso es "otro tema"). 


#### Algunas funciones matemáticas útiles


**La función constante:**


$$ f(n) = c $$
 
 
Cualquier función constante puede ser escrita como: 

*si* $g(n)=1$, entonces $f(n) = c \, g(n)$.



**La función logaritmo:**


$$ f(n) = log_b n $$

La base mas usada es $b= 2$ ya que muchos algoritmos reducen su ejecución reduciendo el problema en dos partes.


**La función lineal:**


$$ f(n) = n $$


Por ejemplo, recorrer un arreglo con un ciclo <code>for</code>.


**La función N-Log-N:**


$$ f(n) = n log n $$


**La función cuadratica:**


$$ f(n) = n^2 $$


La función cuadratica generalmente aparece cuando tenemos ciclos <code>for</code> anidados. En la primer iteración realizamos una operación, luego dos, ..., y asi sucecivamente.

$$ 1 + 2 + 3 + \ldots + (n-2) + (n-1) + n \approx \frac{n \, (n+1)}{2} $$


<img src="https://drive.google.com/uc?id=<ID of image>
cuadratica.png" style="width: 500px;" />


 
**La función cubica y otros polinomios:** 

Cubica: 

$$ f(n) = n^3 $$


Polinomios: 

$$ f(n) = a_0 + a_1 n + a_2 n^2 + a_3 n^3 + \ldots + a_d n^d $$


Generalemnte el termino de mayor grado es considerado. 


Sumas y Series:

$$\sum_{i=a}^{b} f(i) = f(a) + f(a+1) + f(a+2) + \ldots + f(b) $$


$$\sum_{i=1}^{n} i = \frac{n \, (n+1)}{2} $$


Tmabien pdemos escribir los polinomios de esta manera:

$$f(n) = \sum_{i=0}^{d} a_i n^i $$



**La función exponencial:**


$$ f(n) = b^n $$


Sumas Geometricas: 

$$\sum_{i=0}^{n} a^i = 1 + a + a^2 + \ldots + a^n = \frac{a^{n+1}-1}{a-1} $$

Ejemplo:

$$ 1 + 2 + 4 + 8 + \ldots + 2^{n-1} = 2^n -1 $$


#### Comparación de estas funciones

<img src="https://drive.google.com/uc?id=1i4s8Ce7GROYFi79UyHX5hkcSwy2Y49bD" style="width: 500px;" />

<img src="https://drive.google.com/uc?id=1Q2xWGFjH-yEMMIheaXbjia84YUicy2Pq" style="width: 800px;" />

### Análisis Asintotico

En general estamos interesados en el **crecimiento proporcional** del tiempo que consume un algoritmo dada una entrada de tamaño $n$.


#### La notación "Big-Oh"

<img src="https://drive.google.com/uc?id=1pxCw8r61gWN0K_inLI7GwVp4n0LtHoLE" style="width: 600px;" />

**Ejemplo:**

La función $ 8n + 5 $ es del orden de ejecución $O(n)$. 


#### Ejemplos:

<img src="https://drive.google.com/uc?id=139HXClNbZ9dV0htguJyDLucOj5H_HOjE" style="width: 800px;" />


In [12]:
# Tiempo cuadratico
def prefix_average1(S):
    """Return list such that, for all j, A[j] equals average of S[0], ..., S[j].""" 
    n = len(S)
    A=[0]*n
    for j in range(n):
        total = 0
        for i in range(j + 1):
            total += S[i]
    A[j] = total / (j+1)
    return A

lista=[1,4,8,9,1,2,7,6,5]
prefix_average1(lista)

[0, 0, 0, 0, 0, 0, 0, 0, 4.777777777777778]

In [13]:
# Tiempo cuadratico
def prefixaverage2(S):
    """Return list such that, for all j, A[j] equals average of S[0], ..., S[j]."""
    n = len(S)
    A=[0]*n 
    for j in range(n):
        A[j] = sum(S[0:j+1]) / (j+1) 
    return A

lista=[1,4,8,9,1,2,7,6,5]
prefixaverage2(lista)

[1.0,
 2.5,
 4.333333333333333,
 5.5,
 4.6,
 4.166666666666667,
 4.571428571428571,
 4.75,
 4.777777777777778]

In [14]:
# Tiempo Lineal
def prefixaverage3(S):
    """Return list such that, for all j, A[j] equals average of S[0], ..., S[j]."""
    n = len(S)
    A=[0]*n
    total = 0
    for j in range(n):
        total += S[j]
        A[j] = total / (j+1)
    return A

lista=[1,4,8,9,1,2,7,6,5]
prefixaverage3(lista)

[1.0,
 2.5,
 4.333333333333333,
 5.5,
 4.6,
 4.166666666666667,
 4.571428571428571,
 4.75,
 4.777777777777778]

In [15]:
# Tiempo cubico
def disjoint1(A, B, C):
    """Return True if there is no element common to all three lists."""
    for a in A:
        for b in B: 
            for c in C:
                if a == b == c: 
                    return False
    return True

lista1=[1,4,8,9,1,2,7,6,5]
lista2=[22,4,3,11,37,4,0,-1,-3]
lista3=[100,1,5,4,11,77,70,65,5]
disjoint1(lista1,lista2,lista3)

False

In [16]:
# Tiempo cuadratico
def disjoint2(A, B, C):
    """Return True if there is no element common to all three lists."""
    for a in A:
        for b in B: 
            if a == b:
                for c in C: 
                    if a == c:
                        return False 
    return True

lista1=[1,4,8,9,1,2,7,6,5]
lista2=[22,4,3,11,37,4,0,-1,-3]
lista3=[100,1,5,4,11,77,70,65,5]
disjoint2(lista1,lista2,lista3)

False

In [17]:
# Tiempo cuadrartico
def unique1(S):
    """Return True if there are no duplicate elements in sequence S."""
    for j in range(len(S)):
        for k in range(j+1, len(S)): 
            if S[j] == S[k]:
                return False 
    return True

lista1=[1,4,8,9,1,2,7,6,5]
unique1(lista)

False

In [19]:
# Tiempo n * log(n)

def unique2(S):
    """Return True if there are no duplicate elements in sequence S."""
    temp = sorted(S)
    for j in range(1, len(temp)):
        if temp[j-1] == temp[j]: 
            return False
    return True


lista1=[1,4,8,9,1,2,7,6,5]
unique1(lista)

False

## ADICIONAL

https://www.campusmvp.es/recursos/post/Rendimiento-de-algoritmos-y-notacion-Big-O.aspx

https://www.freecodecamp.org/espanol/news/explicacion-de-la-notacion-big-o-con-ejemplo/