# Performance


## Tabla de contenidos
***




***

Si logras elegir las estructuras de datos correctas, con los algoritmos correctos, performance no debería ser algo por lo que preocuparse. Lo cual no significa que debas ignorar el performance completamente.

## ¿Qué es performance?
A lo largo de este notebook, se intentará medir y mejorar el performance en términos de uso de uso/tiempo de CPU y uso de memoria.

Notar que un algoritmo rápido usando un core de una sola CPU puede ser outperformed en términos de ejecución por un algoritmo más lento que es fácilmente paralelizable dados suficientes cores de CPU.

## Midiendo el performance de la CPU y tiempo de ejecución

Cuando se habla de performance de la CPU, se puede medir
- "Wall time" (el tiempo absoluto en el reloj)
- Tiempo relativo (cuando se comparan múltiples ejecuciones o múltiples funciones)
- Tiempo de CPU usado.
- Inspeccionado ciclos de CPU y contadores de loops
Dependiendo de como se esté midiendo el performance, el impacto puede ser gigantesco.

## Timeit - comparando el rendimiento de fracciones de código
Antes de empezar a mejorar la ejecución de la CPU, se debe contar con un método confiable para medir. Python tiene un módulo llamado `timeit` con el propósito específico de medir el tiempo de ejecución de bits de código. Ejecuta un bit de código muchas veces para asegurar que existe la menor variación posible. Es muy útil si se quiere comparar fragmentos de código.

In [5]:
!python -m timeit x=[]; [x.insert(0, i) for i in range(10000)]

20 loops, best of 5: 15 msec per loop


In [6]:
!python -m timeit x=[]; [x.append(i) for i in range(10000)]

500 loops, best of 5: 461 usec per loop


In [7]:
!python -m timeit x=[i for i in range(10000)]

500 loops, best of 5: 219 usec per loop


Lo anterior también se puede implementar como un script

In [10]:
import timeit

def test_list():
    return(list(range(10000)))

def test_list_comprehension():
    return [i for i in range(10000)]

def test_append():
    x = []
    for i in range(10000):
        x.append(i)
        
    return x

def test_insert():
    x = []
    for i in range(10000):
        x.insert(0, i)
        
    return x


def benchmark(function, number = 100, repeat= 10):
    times = timeit.repeat(function, number=number, globals=globals())
    
    time = min(times) / number
    print(f"{number} loops, best of {repeat}: {time:9.6f}s :: {function.__name__}")
    
if __name__ == "__main__":
    benchmark(test_list)
    benchmark(test_list_comprehension)
    benchmark(test_append)
    benchmark(test_insert)

100 loops, best of 10:  0.000092s :: test_list
100 loops, best of 10:  0.000221s :: test_list_comprehension
100 loops, best of 10:  0.000426s :: test_append
100 loops, best of 10:  0.015036s :: test_insert


## cProfile - Encontrando los componentes más lentos