In [None]:
librería multiprocessing

In [1]:
import numpy as np
from multiprocessing import Pool

def suma_parcial(arr, inicio, fin):
    """Realiza la suma de los elementos del arreglo entre las posiciones inicio y fin."""
    return np.sum(arr[inicio:fin])

tamaño_arreglo = 5 * 10**4  # Longitud del arreglo
datos = np.random.rand(tamaño_arreglo)  # Generación de datos aleatorios

# Ejecución secuencial
print("Tiempo para la suma secuencial:")
tiempo_secuencial = %timeit -r 2 -o -q np.sum(datos)
print(f"Duración usando numpy.sum(): {tiempo_secuencial}")
print(f"Resultado suma secuencial: {np.sum(datos)}\n")

def obtener_segmentos(longitud, procesos):
    """Divide el arreglo en segmentos según el número de procesos especificado."""
    if procesos == 1:
        return [(0, longitud)]
    elif procesos == 2:
        mitad = longitud // 2
        return [(0, mitad), (mitad, longitud)]
    elif procesos == 4:
        cuarto = longitud // 4
        return [(0, cuarto), (cuarto, 2*cuarto), (2*cuarto, 3*cuarto), (3*cuarto, longitud)]
    else:
        raise ValueError("Número de procesos no soportado. Elija 1, 2 o 4.")

# Uso de multiprocessing
for procesos in [1, 2, 4]:
    print(f"\nTiempo para la suma con {procesos} procesos:")

    segmentos = obtener_segmentos(tamaño_arreglo, procesos)

    # Función que ejecuta la suma en paralelo
    def ejecutar_suma_paralela():
        with Pool(processes=procesos) as pool:
            resultados = pool.starmap(suma_parcial, [(datos, inicio, fin) for inicio, fin in segmentos])
        return sum(resultados)

    tiempo_paralelo = %timeit -r 2 -o -q ejecutar_suma_paralela()
    resultado_paralelo = ejecutar_suma_paralela()

    print(f"Duración usando {procesos} procesos: {tiempo_paralelo}")
    print(f"Resultado suma con {procesos} procesos: {resultado_paralelo}")

Tiempo para la suma secuencial:
Duración usando numpy.sum(): 14.3 µs ± 41.8 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Resultado suma secuencial: 25002.375345280336


Tiempo para la suma con 1 procesos:
Duración usando 1 procesos: 5.69 ms ± 417 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Resultado suma con 1 procesos: 25002.375345280336

Tiempo para la suma con 2 procesos:
Duración usando 2 procesos: 6.17 ms ± 1.82 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Resultado suma con 2 procesos: 25002.375345280336

Tiempo para la suma con 4 procesos:
Duración usando 4 procesos: 12.8 ms ± 127 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
Resultado suma con 4 procesos: 25002.375345280336


In [None]:
librería cupy

In [2]:
import cupy as cp
import numpy as np
import time

tamaño_arreglo = 5 * 10**4
datos_cpu = np.random.rand(tamaño_arreglo)

datos_gpu = cp.asarray(datos_cpu)

inicio_gpu = time.time()
resultado_gpu = cp.sum(datos_gpu)
fin_gpu = time.time()

tiempo_gpu = (fin_gpu - inicio_gpu) * 1e6  

print(f"Tiempo usando CuPy: {tiempo_gpu:.2f} µs")
print(f"Resultado usando CuPy: {resultado_gpu}")

Tiempo usando CuPy: 10386.71 µs
Resultado usando CuPy: 25001.306367191675


In [None]:
 librería numba

In [3]:
import numba
import numpy as np
import time

tamaño_arreglo = 5 * 10**4
datos_cpu = np.random.rand(tamaño_arreglo)

@numba.njit(parallel=True)
def suma_paralela(arr):
    """Suma los elementos del arreglo utilizando paralelismo."""
    total = 0.0
    for i in numba.prange(arr.size):
        total += arr[i]
    return total

inicio_numba = time.time()
resultado_numba = suma_paralela(datos_cpu)
fin_numba = time.time()

tiempo_numba = fin_numba - inicio_numba

print(f"Tiempo usando Numba: {tiempo_numba:.6f} segundos")
print(f"Resultado usando Numba: {resultado_numba}")

Tiempo usando Numba: 0.441472 segundos
Resultado usando Numba: 24943.03038160226


In [None]:
Suma secuencial con NumPy