## Reduction operation: the sum of the numbers in the range [0, value)

In [None]:
import sys
value = int(sys.argv[1])
print("Valor usado:", value)

In [5]:
import numpy as np

In [8]:
def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

# Secuencial
#value = 5*10**4
X = np.random.rand(value)

# Para imprimir los pimeros valores del array
# print(X[0:12])


# Utilizando las operaciones mágicas de ipython
tiempo = %timeit -r 2 -o -q reduc_operation(X)
print("\nTime taken by reduction operation using a function:", tiempo)
print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")


# Utilizando numpy.sum()
tiempo = %timeit -r 2 -o -q np.sum(X)
print("\nTime taken by reduction operation using numpy.sum():", tiempo)
print("Now, the result using numpy.sum():", np.sum(X),"\n ")


# Utilizando numpy.ndarray.sum()
tiempo= %timeit -r 2 -o -q X.sum()
print("\nTime taken by reduction operation using numpy.ndarray.sum():", tiempo)
print("Now, the result using numpy.ndarray.sum():", X.sum())


Time taken by reduction operation using a function: 499 ms ± 3.44 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 249844.08241193838

Time taken by reduction operation using numpy.sum(): 806 µs ± 3.74 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Now, the result using numpy.sum(): 249844.0824119457 
 
Time taken by reduction operation using numpy.ndarray.sum(): 751 µs ± 65.2 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Now, the result using numpy.ndarray.sum(): 249844.0824119457


### Apartado A)
**Usando la librería multiprocessing**

In [3]:
from multiprocessing import Pool
import time

In [15]:
# value = 5*10**7
# X = np.random.rand(value)

In [16]:
#value = 5*10**5
#X = np.random.rand(value)

In [21]:
print("\033[1m" + "\nApartado A" + "\033[0m", "Usando la librería multiprocessing")

#Megabucle
for i in [1, 2, 4]:
    #División del array en subarrays más pequeños
    if i == 1:
        Y = [X[0:value]] 
    elif i == 2:
        Y = [X[0:int(value / 2)], X[int(value / 2):value]]  
    elif i == 4:
        Y = [X[0:int(value / 4)], X[int(value / 4):int(value / 2)], X[int(value / 2):int(3 * value / 4)], X[int(3 * value / 4):value]] 

    #Función para aplicar el multiprocessing
    def suma_con_multiprocessing():
        with Pool(processes=i) as pool:
            resultados = pool.map(reduc_operation, Y)
        return sum(resultados)

    #%timeit
    tiempo = %timeit -r 2 -o -q suma_con_multiprocessing()

    #time.time()
    start_time = time.time()
    suma_con_multiprocessing()
    end_time = time.time() 
    
    print(f"\nResultados para la operación de reducción con {i} procesos:")
    print(f"Tiempo con %time: {tiempo}")
    print(f"Tiempo con time.time(): {end_time - start_time:.4f} segundos")
    print(f"Resultado:", suma_con_multiprocessing())


[1mApartado A[0m Usando la librería multiprocessing

Resultados para la operación de reducción con 1 procesos:
Tiempo con %time: 545 ms ± 2.23 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Tiempo con time.time(): 0.5584 segundos
Resultado: 249844.08241193838

Resultados para la operación de reducción con 2 procesos:
Tiempo con %time: 332 ms ± 1.22 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Tiempo con time.time(): 0.3347 segundos
Resultado: 249844.0824119404

Resultados para la operación de reducción con 4 procesos:
Tiempo con %time: 251 ms ± 6.08 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Tiempo con time.time(): 0.2501 segundos
Resultado: 249844.08241194714


### Apartado B)
**Usando la librería Numba**

In [23]:
from numba import njit, prange

In [31]:
print("\033[1m" + "\nApartado B" + "\033[0m", "Usando la librería Numba")

#Versión original
def reduc_operation(A):
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

tiempo = %timeit -r 2 -o -q reduc_operation(X)
print("\nTiempo para la versión original:", tiempo, sep="\n")
print("Resultado:", reduc_operation(X))

#Versión optimizada con @njit
@njit
def reduc_operation_njit(A):
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

tiempo = %timeit -r 2 -o -q reduc_operation_njit(X)
print("\nTiempo para la versión original con @njit:", tiempo, sep="\n")
print("Resultado:", reduc_operation_njit(X))

#Versión paralelizada con @njit(parallel=True)
@njit(parallel=True)
def reduc_operation__njit_parallel(A):
    s = 0.0
    for i in prange(A.size):
        s += A[i]
    return s


# value = 5 * 10**6 
# X = np.random.rand(value) 

tiempo = %timeit -r 2 -o -q reduc_operation__njit_parallel(X)
print("\nTiempo para la versión con @njit(parallel=True):", tiempo, sep="\n")
print("Resultado:", reduc_operation__njit_parallel(X))

[1mApartado B[0m Usando la librería Numba

Tiempo para la versión original:
473 ms ± 6.06 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Resultado: 249844.08241193838

Tiempo para la versión original con @njit:
2.04 ms ± 5.48 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)
Resultado: 249844.08241193838

Tiempo para la versión con @njit(parallel=True):
2.41 ms ± 81.7 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Resultado: 249844.08241194556


### Apartado C)
**Comentando los resultados.**
- El uso de los paquetes multiprocessing y Numba acelera de una forma muy notoria el tiempo que le toma a la función hacer la suma sobre el array.
- El aumento de tiempo que se produce al usar 4 procesos con multiprocessing o al usar prange con Numba, es debido al tamaño del array. Cuanto más grande sea el array, la parelización será más productiva. Al probar las funciones con un array más grande (5*10^7) sí se produce una mejora de tiempo.
- Entre ambas librerías, parece ser Numba la que consigue un mayor rendimiento. 