## Reduction operation: the sum of the numbers in the range [0, value)

In [None]:
import sys
#captura el parámetro desde la línea de comandos
if len(sys.argv) > 1:
    value=int(sys.argv[1]) #para converir el argumento de la línea de comandos a entero
else:
    value = 5*10**4 #Valor predeterminado si no se pasa ningún parámetro
print(f"El valor de 'value' es: {value}")


In [1]:

import numpy as np

def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

# Secuencial
X = np.random.rand(value)

# Para imprimir los pimeros valores del array

# print(X[0:12])

# Utilizando las operaciones mágicas de ipython

tiempo = %timeit -r 2 -o -q reduc_operation(X)

print("\nTiempo tardado por la función reduc operation usando una función:", tiempo)

print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")

# Utilizando numpy.sum()

tiempo = %timeit -r 2 -o -q np.sum(X)

print("Tiempo tardado por reduc operation usando numpy.sum():", tiempo)

print("Now, the result using numpy.sum():", np.sum(X),"\n ")

# Utilizando numpy.ndarray.sum()

tiempo= %timeit -r 2 -o -q X.sum()

print("Tiempo tardado por reduc operation numpy.ndarray.sum():", tiempo)

print("Now, the result using numpy.ndarray.sum():", X.sum())




Time taken by reduction operation using a function: 44.8 ms ± 237 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)
And the result of the sum of numbers in the range [0, value) is: 24833.52592394871

Time taken by reduction operation using numpy.sum(): 90.9 µs ± 282 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.sum(): 24833.525923948546 
 
Time taken by reduction operation using numpy.ndarray.sum(): 72.8 µs ± 628 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.ndarray.sum(): 24833.525923948546


In [16]:
print("\nApartado utilizando multiprocesing")

import time
from multiprocessing import Pool

if __name__ == "__main__":
    q1 = int(value / 4)
    q2 = int(value / 2)
    q3 = int(3 * value / 4)
    
    # Se inicializa pool con 1 proceso
    start = time.time()
    with Pool(processes=1) as pool:  
        resultado1 = pool.map(reduc_operation, [np.arange(0, value)])  # Pasar el array NumPy
    end = time.time()
    print(f"\nResultado usando 1 proceso: {resultado1}, Tiempo: {end - start:.4f} segundos")
    
    # Se inicializa pool con 2 procesos
    start = time.time()
    with Pool(processes=2) as pool:  
        resultado2 = pool.map(reduc_operation, [np.arange(0, q2), np.arange(q2, value)])  # 2 arrays
    end = time.time()
    print(f"Resultado usando 2 procesos: {resultado2}, Tiempo: {end - start:.4f} segundos")
   
    # Se inicializa pool con 4 procesos
    start = time.time()
    with Pool(processes=4) as pool:  
        resultado3 = pool.map(reduc_operation, [np.arange(0, q1), 
                                                np.arange(q1, q2), 
                                                np.arange(q2, q3), 
                                                np.arange(q3, value)])  # 4 arrays
    end = time.time()
    print(f"Resultado usando 4 procesos: {resultado3}, Tiempo: {end - start:.4f} segundos")


Resultado usando 1 proceso: [1249975000], Tiempo: 0.0997 segundos
Resultado usando 2 procesos: [312487500, 937487500], Tiempo: 0.1094 segundos
Resultado usando 4 procesos: [78118750, 234368750, 390618750, 546868750], Tiempo: 0.1575 segundos


In [20]:
print("\nApartado utilizando numba")
import numba

@numba.njit
def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

# Secuencial
X = np.random.rand(value)

# Para imprimir los pimeros valores del array

# print(X[0:12])

# Utilizando las operaciones mágicas de ipython

tiempo = %timeit -r 2 -o -q reduc_operation(X)

print("\nTiempo tardado por la función reduc operation usando una función", tiempo)


print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")


# Utilizando numpy.sum()

tiempo = %timeit -r 2 -o -q np.sum(X)

print("Tiempo tardado por reduc operation usando numpy.sum():", tiempo)

print("Now, the result using numpy.sum():", np.sum(X),"\n ")


# Utilizando numpy.ndarray.sum()

tiempo= %timeit -r 2 -o -q X.sum()

print("Tiempo tardado por reduc operation usando numpy.ndarray.sum():", tiempo)

print("Now, the result using numpy.ndarray.sum():", X.sum())


Time taken by reduction operation using a function: 224 µs ± 7.91 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 25055.899014552662

Time taken by reduction operation using numpy.sum(): 110 µs ± 1.51 µs per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.sum(): 25055.899014552502 
 
Time taken by reduction operation using numpy.ndarray.sum(): 81.1 µs ± 118 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.ndarray.sum(): 25055.899014552502


In [27]:
print("\nApartado utilizando numba con paralelización")
      
from numba import njit, prange
@numba.njit(parallel=True)
def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in prange(A.size):
        s += A[i]
    return s
    
# Secuencial
X = np.random.rand(value)

# Para imprimir los pimeros valores del array
#print(X[0:12])

# Utilizando las operaciones mágicas de ipython

tiempo = %timeit -r 2 -o -q reduc_operation(X)

print("\nTiempo tardado por la función reduc operation usando una función:", tiempo)


print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")


# Utilizando numpy.sum()

tiempo = %timeit -r 2 -o -q np.sum(X)

print("Tiempo tardado por reduc operation usando numpy.sum():", tiempo)

print("Now, the result using numpy.sum():", np.sum(X),"\n ")


# Utilizando numpy.ndarray.sum()

tiempo= %timeit -r 2 -o -q X.sum()

print("Tiempo tardado por reduc operation usando numpy.ndarray.sum():", tiempo)

print("Now, the result using numpy.ndarray.sum():", X.sum())


Time taken by reduction operation using a function: 19.4 ms ± 2.13 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 24956.35326737832

Time taken by reduction operation using numpy.sum(): 95.9 µs ± 178 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.sum(): 24956.353267378327 
 
Time taken by reduction operation using numpy.ndarray.sum(): 73.4 µs ± 918 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Now, the result using numpy.ndarray.sum(): 24956.353267378327


In [None]:
#Cuando lo mandamos mediante un script de Bash a la cola Pascal vemos que el tiempo difiere a lo mostrado aquí
#Lo primero que hay que decir es que todos los tiempos aumentan, pero sobre todo el tiempo en el que solo se usa la función sin ningún paquete, por ejemplo mientras que ejecutando la primera celda desde el jupyer el tiempo que tarda es 44.8 milisengundos, pasa a tardar casí 45 segundos.
#En la segunda celda utilizando multiprocesing vemos que cuantos más núcleos se utilizen mas se reduce el tiempo, siendo una reducción casi lineal, porque si se aumenta por 2 el número de núcleos prácticamente se reduce por dos el tiempo de ejecución.
#AL utiilizar Numba por si solo vemos que el tiempo que tarda aumenta una barbaridad cuando se trata de la función, se reduce el tiempo más de 200 veces. En las demás operaciones no disminuye porque están ya mucho más optimizadas con numpy
#Por último, al utilizar Numba con paralelización el tiempo vuelve a disminuir sobre todo en la primera operación, reduciendo el tiempo casi en 10 veces respecto a la otra celda. En las otras operaciones se mantiene prácticamente igual, lo que indica que Numpy ya está paralelizada.