### Reduction operation: the sum of the numbers in the range [0, a)

In [None]:
# Para aceptar un argumento al ejecutar el script (número de elementos, value)
import sys

if len(sys.argv) > 1:
    value = int(sys.argv[1])
else:
    value = 10**6  # valor por defecto

In [1]:
import time

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = 1000000

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.0355074405670166 seconds
33.3 ms ± 85.1 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



# Ejercicios
## a)

In [8]:
lista = [i for i in range(value)]

def suma_for(iterable):
    """Suma todos los elementos de un iterable con un bucle for"""
    x = 0
    for i in iterable:
        x += i
    return x

# Cálculo del tiempo para suma_for()
tiempo_inicial = time.time()
suma = suma_for(lista)
tiempo_final = time.time()

%timeit -r 2 suma_for(lista)

print("Tiempo empleado con un bucle for:", tiempo_final - tiempo_inicial, "s.\nValor:", suma, "\n")

# Cálculo del tiempo para sum()
tiempo_inicial = time.time()
suma = sum(lista)
tiempo_final = time.time()

%timeit -r 2 sum(lista)

print("Tiempo empleado con la función sum():", tiempo_final - tiempo_inicial, "s.\nValor:", suma)

35.4 ms ± 168 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.026766538619995117 s.
Valor: 499999500000 

5.96 ms ± 56.1 μs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Tiempo empleado con la función sum(): 0.006240367889404297 s.
Valor: 499999500000


## b)

In [2]:
import numpy as np

In [10]:
array = np.array(lista) # de lista a array

# Cálculo del tiempo para suma_for()
tiempo_inicial = time.time()
suma = suma_for(array)
tiempo_final = time.time()

%timeit -r 2 suma_for(array)

print("Tiempo empleado con un bucle for:", tiempo_final - tiempo_inicial, "s.\nValor:", suma, "\n")

# Cálculo del tiempo para numpy.sum()
tiempo_inicial = time.time()
suma = np.sum(array)
tiempo_final = time.time()

%timeit -r 2 np.sum(array)

print("Tiempo empleado con la función numpy.sum():", tiempo_final - tiempo_inicial, "s.\nValor:", suma)

51.8 ms ± 28.6 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.05297398567199707 s.
Valor: 499999500000 

201 μs ± 464 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con la función numpy.sum(): 0.0004031658172607422 s.
Valor: 499999500000


## c)
En cuanto a tiempos, el código original y el enfoque con listas y bucle for rinden tiempos similares. Sin embargo, la función sum() acelera el cálculo usando listas, reduciendo el tiempo en un orden de magnitud. También sorprende que con el bucle for, con arrays sea más lento que con listas. El bucle con numpy no aprovecha la vectorización. Sin embargo, usando numpy.sum() el rendimiento se dispara y se obtiene el mejor tiempo, del orden de centenas de microsegundos.

# 3.3. Numba con Jupyter notebook y uso de colas

In [6]:
from numba import njit
import numpy as np
import time

array = np.array([i for i in range(value)]) # de lista a array

# Definición de funciones con @njit

@njit
def suma_for_numba(iterable):
    """Suma todos los elementos de un iterable con un bucle for"""
    x = 0
    for i in iterable:
        x += i
    return x

@njit
def suma_numpy_numba(array):
    """Suma todos los elementos de un array"""
    return np.sum(array)

# Forzar compilación previa
suma_for_numba(array)
suma_numpy_numba(array)

# Cálculo del tiempo para suma_for_numba()
tiempo_inicial = time.time()
suma = suma_for_numba(array)
tiempo_final = time.time()

%timeit -r 2 suma_for_numba(array)

print("Tiempo empleado con un bucle for y njit:", tiempo_final - tiempo_inicial, "s.\nValor:", suma, "\n")

# Cálculo del tiempo para numpy.sum()
tiempo_inicial = time.time()
suma = suma_numpy_numba(array)
tiempo_final = time.time()

%timeit -r 2 suma_numpy_numba(array)

print("Tiempo empleado con la función numpy.sum() y njit:", tiempo_final - tiempo_inicial, "s.\nValor:", suma)

480 μs ± 1.88 μs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con un bucle for y njit: 0.000614166259765625 s.
Valor: 499999500000 

179 μs ± 211 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Tiempo empleado con la función numpy.sum() y njit: 0.00023937225341796875 s.
Valor: 499999500000


Un aspecto importante a tener en cuenta con la compilación just-in-time de njit es el tiempo que tarda en compilar la función la primera vez que esta se ejecuta. En este ejercicio se ha optado por contabilizar sólo el tiempo de ejecución pura, forzando una primera ejecución de las funciones al principio. Sin esta primera ejecución, se mediría también el tiempo de compilación.

Se observa una notable mejora en el tiempo para el bucle for con njit: de 52 ms a 0.5 ms, dos órdenes de magnitud. Parece también mejorar el tiempo al combinar el decorador njit con numpy.sum(), aunque la diferencia es relativamente pequeña, de 20 microsegundos, y realmente son valores muy similares (200 y 180 microsegundos, sin y con njit). Observamos que los programas de Python que no usan librerías especializadas como NumPy se ven muy beneficiados por Numba en cuanto a rendimiento para este tipo de cálculos. Aun así, el uso de las funciones de NumPy sigue siendo superior en rendimiento en este caso.

In [None]:
## c) Con sbatch

*Salida con value = 10^7:*

Time taken by reduction operation: 0.05936598777770996 seconds
56.4 ms ± 30.6 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

         Computing the sum of numbers in the range [0, value): 499999500000

42 ms ± 438 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.04042768478393555 s.
Valor: 499999500000

7.65 ms ± 42.5 μs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Tiempo empleado con la función sum(): 0.007712125778198242 s.
Valor: 499999500000
90.2 ms ± 27.5 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.09067678451538086 s.
Valor: 499999500000

272 μs ± 17.1 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con la función numpy.sum(): 0.0004885196685791016 s.
Valor: 499999500000
385 μs ± 5.81 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con un bucle for y njit: 0.0004928112030029297 s.
Valor: 499999500000

248 μs ± 13.1 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con la función numpy.sum() y njit: 0.0003139972686767578 s.
Valor: 499999500000

==========================
*Salida con value = 10^8:*

Time taken by reduction operation: 0.057073116302490234 seconds
61.2 ms ± 6.45 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

         Computing the sum of numbers in the range [0, value): 499999500000

42.6 ms ± 5.27 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.04008078575134277 s.
Valor: 499999500000

7.6 ms ± 105 ns per loop (mean ± std. dev. of 2 runs, 100 loops each)
Tiempo empleado con la función sum(): 0.0077114105224609375 s.
Valor: 499999500000
96.5 ms ± 1.88 ms per loop (mean ± std. dev. of 2 runs, 10 loops each)
Tiempo empleado con un bucle for: 0.09326386451721191 s.
Valor: 499999500000

271 μs ± 10.4 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con la función numpy.sum(): 0.0004801750183105469 s.
Valor: 499999500000
385 μs ± 25.2 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con un bucle for y njit: 0.0004837512969970703 s.
Valor: 499999500000

246 μs ± 3.01 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Tiempo empleado con la función numpy.sum() y njit: 0.0003116130828857422 s.
Valor: 499999500000