![Geomática](../Recursos/img/geo_logo.jpg)
# Introducción a Jupyter

**Sesión 6:** Algoritmos y análisis de algoritmos

En el mundo de la computación, ya sea que uno se dedique a la ingeniería o a la ciencia, siempre es necesario conocer los aspectos fundamentales de cómo funcionan ciertas herramientas. Este conocimiento es lo que diferencia a una persona que, al momento de desarrollar, confía ciegamente en lo que hace y una persona que tiene pleno conocimiento de la integridad informática de lo que está usando y/o haciendo.

Las estructuras de datos son un tema que todo desarrollador debería de saber y que, lamentablemente, no se cumple. Esto último se puede dar motivos variados tales como directamente no estudiar la asignatura, ignorarla por completo, no entenderla, etc.

Nosotros abordaremos este tema de forma ejecutiva, pero tratando de ser lo más precisos posible. __Por favor, en cualquier momento que le surja alguna duda, no dude en preguntar.__

### ¿Por qué es tan importante tener conocimiento de este tema?
En el mundo del desarrollo, desafortunadamente, hay mucha gente que aprende empíricamente y considera que con eso ya es suficiente. ¿Eso está mal? No, por supuesto que no. El problema radica en que, eventualmente, dichos desarrolladores pueden llegar a tener que programar algoritmos o software que trabajen con grandes cantidades de datos y que estos sean implementados usando las técnicas convencionales o _del día a día_.

Muchas veces, esta clase de problemas son los que generan enormes cuellos de botella o pérdidas de rendimiento en el software.
Un ejemplo donde se evidencia mucho la inexperiencia o carencia de experticia es en la industria de los videojuegos. No es de extrañar que, en especial en casas indie, muchas veces los videojuegos, en tareas simples pero computacionalmente costosas, tengan problemas de rendimiento.

## Notación Big O
La notación "Big O" u "O grande", es la forma en la que se representa un concepto que vamos a profundizar llamado la "Cota superior asintótica". Esta cota, aunque suene extraña o compleja, tiene detrás un concepto sencillo de entender, consiste en una función matemática que representa el "coste" máximo que tendría un algoritmo, en uno de sus casos, al momento de ser ejecutado. Aún suena un poco raro, así que veamos un ejemplo.

Tenemos dos funciones, una llamada __f(x)__ la cual representa la cota superior asintótica, la otra llamada __g(x)__ que representa el costo computacional hipotético de un algoritmo en tiempo de ejecución.

La función f(x) nos representa el costo computacional máximo que dicho algoritmo g(x). Dado que f(x) es asintótica respecto a g(x), está garantizado que g(x) nunca tocará ni superará el valor de f(x) en ningún momento, para todo su dominio.

![image.png](attachment:image.png)

La cota superior es de extrema utilidad para documentar la eficacia de los algoritmos, debido a que esta, en términos prácticos, nos dice cuántos recursos como máximo puede llegar a tomar.

Existen otros dos tipos de cota, pero la más popular es la Big O.

### ¿Cómo se representa esta notación?
Una vez entendido el concepto, podemos empezar a usarlo. Esta notación es muy simple de usar y de interpretar. Para todo algoritmo que se le quiera documentar su costo computacional usando el Big O, es tan simple como escribir lo siguiente: __O(*f(x)*)__, donde f(x) es la función que acota asintóticamente dicho algoritmo.

Por ejemplo, para un algoritmo muy popular y fácil, que veremos un poco más adelante, llamado organización por burbuja, tiene una complejidad computacional O(n²).

### ¿Cómo se usa o cómo lo interpreto?
Si tenemos un algoritmo con complejidad similar al del ejemplo anterior O(n²), la forma de interpretar su eficacia es simple, para un caso n=2, dicha función nos devolvería O(2²) = 4. Es decir, para un caso simple de 2 elementos, al algoritmo le toma el cuadrado de estos elementos como recursos computacionales. ¿Eso es bueno? No, para nada. Lo ideal es que se consuma igual o menos recursos. Ahí es donde uno puede empezar a clasificar el poder de ciertos algoritmos basado en su complejidad computacional denotada por la notación.

En últimas, un algoritmo cuya complejidad computacional sea O(n) es notablemente más eficaz que uno con complejidad O(n²). Lo mismo se puede decir de uno O(log(n)) respecto a uno O(n).
#### Categorías de eficacia
Lo anterior nos lleva a poder clasificar la eficacia de los algoritmos y darles un nombre:

|Notación|Nombre|
|---|---|
|$$O(1)$$| Constante|
|$$O(\log_x(\log_x(n)))$$| Sublogarítmico|
|$$O(\log_x(n))$$| Logarítimico|
|$$O(\sqrt{n})$$| Sublineal|
|$$O(n)$$| Lineal|
|$$O(n\log_x(n))$$| Lineal logarítmica|
|$$O(n^{2})$$| Cuadrática o de segundo orden|
|$$O(n^{c})$$| Potencial fija|
|$$O(c^{n}), n>1$$| Exponencial|
|$$O(n!)$$| Factorial|
|$$O(n^{n})$$| Potencial exponencial|

#### Tipos de casos
Los algoritmos generalmente se documentan con 3 posibles casos, el mejor, el promedio y el peor. Esto es útil para uno poder elegir dependiendo de los contextos.
- __Mejor de los casos__: Es cuando un algoritmo recibe sus parámetros de tal forma que consume la menor cantidad de recursos computacionales. La complejidad computacional siempre será menor que los dos demás casos.
- __Caso promedio__: Es lo que generalmente ocurrirá con el algoritmo. De hecho, la complejidad de un algoritmo se mide con este caso, dado que es el más probable.
- __Peor de los casos__: Es lo opuesto al mejor de los casos. Su complejidad computacional generalmente es superior al caso promedio.

### ¿Cómo determino la cota superior?
Aquí es donde viene la parte difícil, determinar la cota superior de un algoritmo implica aplicar un análisis numérico sobre este, el cual, dependiendo de la estrategia que desempeñe el algoritmo, puede ser fácil o increiblemente complejo. Además, para esto hay que conocer el algoritmo y enteder cómo funciona, por lo que veremos algunos algoritmos sencillos y luego los analizaremos.

Al dicho proceso se le denomina __análisis de algoritmos__.

In [None]:
# PUNTO DE PARTIDA. UNA LISTA DE 5000 ELEMENTOS DESORDENADOS.
from numpy import random
random.seed(2021)
lista_o = [i for i in range(5000)]
random.shuffle(lista_o)
print (lista_o[:20]) #Comprobamos que está desordenado

### Algoritmos sencillos de ordenamiento
Vamos a aprender algunos algoritmos de ordenamiento sencillos: el ordenamiento por burbuja y el ordenamiento por inserción.
#### Ordenamiento por burbuja
El ordenamiento por burbuja es la forma más fácil e intuitiva de ordenar, consiste en comparar un elemento con el siguiente de tal forma que, dependiendo de la forma que estemos ordenando (en este caso será de menor a mayor), se intercambien.

Este procedimiento de comparación debe de hacerse por cada elemento dentro de la lista. A continuación un gif que representa gráficamente su funcionamiento.
<img src="https://upload.wikimedia.org/wikipedia/commons/c/c8/Bubble-sort-example-300px.gif">

El código del algormitmo, sin optimizaciones, es el siguiente:

In [None]:
lista = lista_o.copy() # Copiamos la lista desordenada.
# Ordenamiento por burbuja. Recomendado hacer una prueba de escritorio con [11,3,12,1]
n = len(lista)
for i in range(n):
    for j in range(n-i-1):
        if (lista[j] > lista[j+1]):
            temp = lista[j+1]
            lista[j+1] = lista[j]
            lista[j] = temp
print (lista[:20])

#### Ordenamiento por inserción
Este algoritmo de ordenamiento es ligeramente más complicado que el que vimos anteriormente, no obstante, también es fácil de entender. La idea general de este algoritmo es tomar un elemento como base e insertarlo en la posición donde este sea estrictamente menor (o mayor), es decir, es igual a cuando nosotros ordenamos cartas. En el gif de a contiunación queda mucho más claro:
<img src="https://upload.wikimedia.org/wikipedia/commons/0/0f/Insertion-sort-example-300px.gif">

In [None]:
lista = lista_o.copy() # Copiamos la lista desordenada.
# Ordenamiento por inserción.

n = len(lista)
for i in range(1,n): # Se empieza desde el segundo elemento, debido a que vamos a proceder a hacer inserciones.
    valorActual = lista[i] # Elemento base
    posicionActual = i
    
    while (posicionActual > 0 and lista[posicionActual -1 ] > valorActual):
        # Aquí movemos a la posición actual el elemento que está antes y le restamos 1 a la posición actual
        # de tal forma que, potencialmente, se repita el mismo procedimiento.
        lista[posicionActual] = lista[posicionActual - 1]
        posicionActual -= 1
    lista[posicionActual] = valorActual # Ya llegamos a una posición donde podemos insertar nuestro elemento base
print (lista[:20])

#### Ejercicio: Haga una prueba de escritorio usando el algoritmo de ordenamiento de inserción (12 mins)
Organice la lista [11,3,12,1]

#### Ejercicio: Convierta ambos algoritmos presentados en funciones de Python (3 mins)
Las funciones deben llamarse o_burbuja y o_insercion, respectivamente. Deben tomar como parámetro la lista a ordernar y no deben retornar nada.

In [None]:
# Escribe tus funciones en esta celda y ejecútala


In [None]:
# Prueba si tus funciones sirven. No modifiques este código.
listita = [37,1,-10,44,5,98,19,80]
l1 = listita.copy()
l2 = listita.copy()
o_burbuja(l1)
o_insercion(l2)
print (l1, l2)

#### Ejercicio: Vea este vídeo (5 mins)
[Varios algoritmos de ordenamiento visualizados](https://www.youtube.com/watch?v=OOBBI-kSChM)

## Análisis de algoritmos
Ya llegamos a la parte complicada. Ya conocemos dos algoritmos muy sencillos para ordenar una lista, ahora podemos proceder a analizarlos. 

Para esto, hay dos formas de analizarlos, la primera es __rápida y poco precisa__, pero es muy útil para tener una idea base de __al menos__ cuanto va a consumir un algoritmo. La segunda forma es __lenta, compleja y muy precisa__, esta última es la que se aplica cuando se requiere la máxima precisión sobre el consumo computacional de un algoritmo, pero toma tiempo y práctica dominarlo, aparte de excelentes conocimientos de matemáticas. Vamos a explicar en qué consisten ambas formas.

- __Forma 1 | Inspección general__: Esta forma de análisis consiste en ver línea por línea el algoritmo en busca de ciclos o recursiones, una vez se identifica uno de estos, se toma o especula cuántas veces va a entrar al ciclo/recursión en un caso promedio, llámese N dichas veces. Ahora viene la parte interesante, si dicho ciclo/recursión está anidado, se multiplican las N veces que se llamaron por las N veces del ciclo anterior. En caso de no ser un ciclo anidado, se suma cada una de las Ns. Una vez se llega al final del algoritmo, muy seguramente se termine con un polinomio, en cuyo caso se descarta todo menos el polinomio de mayor grado, al cual se le remueve el coeficiente (si tiene). Este último será la complejidad computacional hecha por un análisis por inspección general. Es rápido, pero muy seguramente poco preciso, es por esto que se usa este análisis solo para saber __al menos__ cuanto podría consumir un algoritmo en un caso promedio.
    - Ejemplo: Análisis por inspección del algoritmo burbuja, resultado O(n²) ![image-2.png](attachment:image-2.png)
    
- __Forma 2 | Análisis completo__: Esta forma de análisis consiste en ver línea por línea el algoritmo, tomar en cuenta su comportamiento y realizar un análisis numérico dependiendo de los ciclos o recursiones que este tenga. El procedimiento para hacerlo es similar al análisis anterior, con la diferencia de que en este caso todos los polinomios resultantes se van teniendo en cuenta sin descartar. Debido a que la naturaleza de estas operaciones generalmente da polinomios complejos y no lineales, muchas veces se aplican ténicas y operaciones matemáticas avanzadas como la sustitución, sumatorias, productorios, incluso integrales. Esto se complica mucho más cuando se require analizar funciones recursivas. Al finalizar se toma la variable con mayor grado del polinomio como complejidad computacional.
    - Ejemplo: Análisis completo al algoritmo burbuja, resultado O(n²)
        - Se indetifica que el algoritmo hace, para la primera iteración n-1 operaciones, luego n-2, n-3, ..., 1, 0. Es decir:        (n-1) + (n-2) + (n-3) + ... + 2 + 1 + 0 lo que es igual a 0 + 1 + 2 + ... + (n-2) + (n-1). Esto es lo mismo que decir
            la sumatoria desde cero hasta n-1. Por propiedades de las sumatorias, podemos añadirle 1 al indice y al límite superior, quedando que es igual a lo siguiente:$$ \sum_{i=0}^{n-1}i = \sum_{i=1}^{n}i$$
        - Por la fórmula de sumatoria de Gauss sabemos que: $$ \sum_{i=1}^{n}i = \frac{n(n+1)}{2}$$
        - Operando, tenemos lo siguiente: $$ \frac{n^{2}+n}{2} = \frac{n^{2}}{2} + \frac{n}{2}$$
        - Se toma el mayor orden del polinomio como la complejidad, siendo esta O(n²)

#### Ejercicio: Haga un análisis por inspección a la siguiente función (15 mins)
Entienda qué hace la función, luego haga el análisis por inspección de la función y diga su complejidad computacional.

In [None]:
matriz = [
    [101, 112, 143],
    [204, 225, 256],
    [307, 338, 369]
]
def comprobarAlgo(matriz):
    suma = 0
    for filas in matriz:
        for columna in filas:
            suma += columna
    for i in range(2,suma):
        if (suma%i == 0):
            return (suma, False)
    return (suma, True)
print (comprobarAlgo(matriz))

### Quicksort
Finalmente, vamos a hablar del algoritmo de ordenamiento más rápido de todos. El Quicksort.

Este algoritmo es todo un veterano, fue creado en 1959 por Tony Hoare y publicado en 1961. A pesar de ser tan viejo, es muy usado en la actualidad debido a que es el mejor algoritmo de ordenamiento, demostrado matemáticamente. Su funcionamiento se basa en una muy conocida estrategia denominada "divide y vencerás". La idea principal de este algoritmo es partir los arreglos a organizar en varios subarreglos, de a dos cada vez y organizar estos pequeños arreglos uno por uno. De esta forma, se logra organizar la totalidad de un arreglo en muy pocos pasos.

Su complejidad computacional es la siguiente:

|Caso|Complejidad|
|---|---|
|Mejor|$$O(n\log_2(n))$$|
|Promedio|$$O(n\log_2(n))$$|
|Peor|$$O(n^{2})$$|


In [None]:
# Implementación del quicksort
def particion(lista, inicio, fin):
    pos = inicio

    for i in range(inicio, fin): 
        if lista[i] < lista[fin]:
            temp = lista[i]
            lista[i] = lista[pos]
            lista[pos] = temp
            pos += 1
    temp = lista[pos]
    lista[pos] = lista[fin]
    lista[fin] = temp
    return pos

def quicksort_recursivo(lista, inicio, fin):
    if inicio < fin: 
        pos = particion(lista, inicio, fin)
        quicksort_recursivo(lista, inicio, pos - 1)
        quicksort_recursivo(lista, pos + 1, fin)

In [None]:
lista = lista_o.copy()
quicksort_recursivo(lista,0,len(lista)-1)
print (lista[:20])

### Perfilemos los algoritmos aprendidos
Veámos qué tan potentes son cada uno de ellos.

In [None]:
import cProfile
NUMEROTE = 3*10**4 # Un millón de elementos
LA_LISTA_DESORDENADA = [i for i in range(NUMEROTE)]
random.shuffle(LA_LISTA_DESORDENADA)

In [None]:
L1 = LA_LISTA_DESORDENADA.copy()
cProfile.run('quicksort_recursivo(L1, 0, len(L1)-1)')

In [None]:
L2 = LA_LISTA_DESORDENADA.copy()
cProfile.run('o_burbuja(L2)')

In [None]:
L3 = LA_LISTA_DESORDENADA.copy()
cProfile.run('o_insercion(L3)')