## Opción 1

In [5]:
from multiprocessing import Pool
import numpy as np

# Modificamos la función de reducción para incluir los parámetros ini y fin
def sum_multiprocessing(A, ini, fin):
    """Calcula la suma de los elementos del array A en el rango [ini, fin)."""
    return sum(A[ini:fin])

if __name__ == "__main__":
    # Tamaño del array y generación de datos aleatorios
    value = 10_000_000
    X = np.random.random(value)
    
    # Caso 1: Usando un solo proceso
    with Pool(1) as p:
        tiempo1 = %timeit -r 2 -o -q p.starmap(sum_multiprocessing, [(X, 0, value)])
        print(f"Tiempo utilizando un proceso: {tiempo1.best:.5f} segundos")
    
    # Caso 2: Usando dos procesos
    with Pool(2) as p:
        iterable = [
            (X, 0, value // 2), 
            (X, value // 2, value)
        ]
        tiempo2 = %timeit -r 2 -o -q p.starmap(sum_multiprocessing, iterable)
        print(f"Tiempo utilizando dos procesos: {tiempo2.best:.5f} segundos")
    
    # Caso 3: Usando cuatro procesos
    with Pool(4) as p:
        iterable = [
            (X, 0, value // 4), 
            (X, value // 4, value // 2),
            (X, value // 2, 3 * value // 4), 
            (X, 3 * value // 4, value)
        ]
        tiempo4 = %timeit -r 2 -o -q p.starmap(sum_multiprocessing, iterable)
        print(f"Tiempo utilizando cuatro procesos: {tiempo4.best:.5f} segundos")


Tiempo utilizando un proceso: 0.63894 segundos
Tiempo utilizando dos procesos: 0.41882 segundos
Tiempo utilizando cuatro procesos: 0.39817 segundos


#### Resultados en hpc-bio-pascal:

Ejecutando el notebook con 50000000 elementos
Time taken by reduction operation using a function: 44.8 s ± 16.9 ms per loop (m
ean ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 24998564.598627
73

Time taken by reduction operation using numpy.sum(): 59.1 ms ± 121 µs per loop (
mean ± std. dev. of 2 runs, 10 loops each)
Now, the result using numpy.sum(): 24998564.598626237

Time taken by reduction operation using numpy.ndarray.sum(): 60 ms ± 952 µs per
loop (mean ± std. dev. of 2 runs, 10 loops each)
Now, the result using numpy.ndarray.sum(): 24998564.598626237
Tiempo con 1 proceso: 33.636868 segundos
Tiempo con 2 procesos: 18.706067 segundos
Tiempo con 4 procesos: 12.031207 segundos


Al usar el paquete multiprocessing, el tiempo de ejecución disminuye considerablemente al aumentar el número de procesos, reduciéndose casi a la mitad al duplicar los procesos. Por ejemplo, con 1 proceso el tiempo fue de 33.637 segundos, con 2 procesos bajó a 18.706 segundos, y con 4 procesos se redujo a 12.031 segundos. Esto demuestra lo eficiente que puede ser dividir la carga de trabajo entre varios núcleos.