# Ejemplo sobre desempeño

Este ejercicio tiene el propósito de mostrar diferentes maneras de resolver el mismo problema y cómo se puede mejorar el desempeño de los cálculos. hay tres diferentes paradigmas a usar:

- **Idiomas y paradigmas**: enfoque de implementación, uso adecuado de estructuras de datos, evitar loops a través de vectorización o el uso depaquetes apropiados.
- **Compilación**: python se puede compilar estática o dinámicamente para que las funciones compiladas corran más rápido.
- **Paralelización**: utilizar cálculos paralelos tomando ventaja del hardware.

A continuación se considerarán tres maneras de hacer un mismo ejercicio: evaluar una expresión compleja en un arreglo de números. Se evalúa la función $f(x) = \log(x) + \cos(x)^2$ 3,000,000 de veces.

## Opción 1

Define la función y se evalúa a través de un for loop

In [1]:
import math
loops = 3000000

In [2]:
a = range(1,loops)

In [3]:
def f(x):
    return 3*math.log(x) + math.cos(x)**2

In [4]:
%timeit r = [f(x) for x in a]

1.11 s ± 46 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


## Opción 2

Se usa Numpy que precompila la función

In [5]:
import numpy as np

In [6]:
a = np.arange(1,loops)

In [7]:
%timeit r = 3*np.log(a) + np.cos(a)**2

59.4 ms ± 6 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## Opcion 3

Usando el paquete numexpr se compila la expresión para mejorar el desempeño sobre Numpy

In [8]:
import numexpr as ne

In [9]:
ne.set_num_threads(1)

8

In [10]:
f = '3*log(a) + cos(a)**2'

In [11]:
%timeit r = ne.evaluate(f)

31.6 ms ± 3.39 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


## Opción 4

Esta opción usa numexpr pero parareliza los cálculos para tomar ventaja del número de procesadores

In [12]:
ne.set_num_threads(8)

1

In [13]:
%timeit r = ne.evaluate(f)

6.14 ms ± 287 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
