### Reduction operation: the sum of the numbers in the range [0, a)

In [2]:
import time
import sys

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = int(sys.argv[1])

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.03647303581237793 seconds
35.7 ms ± 352 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



In [4]:
lista_tiempo = list(range(value))
len(lista_tiempo)

1000000

In [5]:
#Calculando tiempo con Bucle for:#
def reduc_operation(lista):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in lista:
        x += i
    return x

time_init = time.time()
suma_for = reduc_operation(lista_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con for ha sido: ", tiempo_calculado, "segundos")

#Calculando el tiempo con sum:#

time_init = time.time()
suma_sum = sum(lista_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con sum ha sido: ", tiempo_calculado, "segundos")

El tiempo tardado en calcularlo con for ha sido:  0.029098987579345703 segundos
El tiempo tardado en calcularlo con sum ha sido:  0.006203889846801758 segundos


In [6]:
import numpy as np

#Suma array con for:

array_tiempo = np.array(lista_tiempo)

def reduc_operation_array(array):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in array:
        x += i
    return x

time_init = time.time()
suma_array = reduc_operation_array(array_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con el bucle for en arrays ha sido: ", tiempo_calculado, "segundos")

#Suma array con funcion sum:
def suma_numpy(array):
    suma = np.sum(array)
    return suma

time_init = time.time()
suma_array_funcion = suma_numpy(array_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con np.sum ha sido: ", tiempo_calculado, "segundos")

El tiempo tardado en calcularlo con el bucle for en arrays ha sido:  0.052587032318115234 segundos
El tiempo tardado en calcularlo con np.sum ha sido:  0.0004744529724121094 segundos


Los resultados muestran que el bucle for es la forma más lenta de realizar el proceso, tardando casi dos decimas más de segundo que usando el bucle for directamente sobre una lista. Sin embargo vemos que al usar la funcion sum(lista) el tiempo disminuye de forma drástica, debido a que esta es una función optimizada para esto.

Cuando aplicamos arrays de numpy comprobamos que al usar un bucle for el tiempo es incluso superior al que tardabamos usando directamente el bucle for sobre un valor dado. Esto es debido a que cuando usamos el bucle for sobre un array, python tiene que convertir cada elemento del array a un entero de python y luego aplicar la suma, lo que hace que tarde más que sumando directamente.

Por último, cuando aplicamos la funcion np.sum() sobre el array de numpy vemos que el tiempo que tardamos es 10 veces menor que al usar la funcion sum() nativa de python.

In [8]:
import numpy as np
from numba import njit
import time

# Convertir lista a array de numpy
array_tiempo = np.array(lista_tiempo)  # o mejor: np.arange(10**6)

# --- Función con bucle for acelerada por Numba ---
@njit
def reduc_operation_array(array):
    """Compute the sum of the numbers in the array."""
    x = 0
    for i in array:
        x += i
    return x

# Llamada inicial para compilar
reduc_operation_array(array_tiempo)

# Medir tiempo real después de compilación
time_init = time.time()
suma_array = reduc_operation_array(array_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con el bucle for en arrays (Numba) ha sido:", tiempo_calculado, "segundos")

# --- Función con np.sum acelerada por Numba ---
@njit
def suma_numpy(array):
    return np.sum(array)

# Llamada inicial para compilar
suma_numpy(array_tiempo)

# Medir tiempo real después de compilación
time_init = time.time()
suma_array_funcion = suma_numpy(array_tiempo)
time_fin = time.time()
tiempo_calculado = time_fin - time_init

print("El tiempo tardado en calcularlo con np.sum (Numba) ha sido:", tiempo_calculado, "segundos")


El tiempo tardado en calcularlo con el bucle for en arrays (Numba) ha sido: 0.0006580352783203125 segundos
El tiempo tardado en calcularlo con np.sum (Numba) ha sido: 0.00039958953857421875 segundos


Vemos que gracias a numba el tiempo ha disminuido aún mas, aunque en este caso en primer lugar antes de poder calcular el tiempo, hemos debido de compilar la función, debido a que si no parecería que el tiempo aumenta. Al medir el tiempo que tarda en ejecutarse la funcion una vez compilada comprobamos que es bastante menor con numba que sin usarlo.

In [None]:
# Resultados obtenido al lanzar este notebook de jupyter con slurm con value = 10000000

Time taken by reduction operation: 0.5513074398040771 seconds
541 ms ± 635 μs per loop (mean ± std. dev. of 2 runs, 1 loop each)

         Computing the sum of numbers in the range [0, value): 49999995000000

El tiempo tardado en calcularlo con for ha sido:  0.45085906982421875 segundos
El tiempo tardado en calcularlo con sum ha sido:  0.07785654067993164 segundos
El tiempo tardado en calcularlo con el bucle for en arrays ha sido:  0.9550795555114746 segundos
El tiempo tardado en calcularlo con np.sum ha sido:  0.006514787673950195 segundos
El tiempo tardado en calcularlo con el bucle for en arrays (Numba) ha sido: 0.006586313247680664 segundos
El tiempo tardado en calcularlo con np.sum (Numba) ha sido: 0.006394147872924805 segundos


In [None]:
# Resultados obtenido al lanzar este notebook de jupyter con slurm con value = 100000000

Time taken by reduction operation: 5.291839838027954 seconds
5.25 s ± 38.2 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)

         Computing the sum of numbers in the range [0, value): 4999999950000000

El tiempo tardado en calcularlo con for ha sido:  4.096487760543823 segundos
El tiempo tardado en calcularlo con sum ha sido:  0.7770230770111084 segundos
El tiempo tardado en calcularlo con el bucle for en arrays ha sido:  9.38063907623291 segundos
El tiempo tardado en calcularlo con np.sum ha sido:  0.06534790992736816 segundos
El tiempo tardado en calcularlo con el bucle for en arrays (Numba) ha sido: 0.0643928050994873 segundos
El tiempo tardado en calcularlo con np.sum (Numba) ha sido: 0.06412601470947266 segundos

