## Reduction operation: the sum of the numbers in the range [0, value)

In [5]:
import sys

# Detectar si se está ejecutando en Jupyter Notebook
if 'ipykernel' in sys.modules:
    print("Ejecutando en Jupyter Notebook. Usando valor predeterminado.")
    value = 50_000_000  # Valor predeterminado para Jupyter
else:
    # Ejecutando desde línea de comandos
    try:
        if len(sys.argv) > 1:
            value = int(sys.argv[1])
        else:
            value = 50_000_000  # Valor predeterminado
    except ValueError:
        print("Error: El argumento proporcionado no es un número válido.")
        sys.exit(1)

print(f"Tamaño del array (value): {value}")

Ejecutando en Jupyter Notebook. Usando valor predeterminado.
Tamaño del array (value): 50000000


In [1]:
import numpy as np

def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

# Secuencial

value = 5*10**4

X = np.random.rand(value)

# Para imprimir los pimeros valores del array

# print(X[0:12])

# Utilizando las operaciones mágicas de ipython

tiempo = %timeit -r 2 -o -q reduc_operation(X)

print("Time taken by reduction operation using a function:", tiempo)


print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")


# Utilizando numpy.sum()

tiempo = %timeit -r 2 -o -q np.sum(X)

print("Time taken by reduction operation using numpy.sum():", tiempo)

print("Now, the result using numpy.sum():", np.sum(X),"\n ")


# Utilizando numpy.ndarray.sum()

tiempo= %timeit -r 2 -o -q X.sum()

print("Time taken by reduction operation using numpy.ndarray.sum():", tiempo)

print("Now, the result using numpy.ndarray.sum():", X.sum())




Time taken by reduction operation using a function: 2.62 ms ± 8.27 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
And the result of the sum of numbers in the range [0, value) is: 24995.051343753086

Time taken by reduction operation using numpy.sum(): 7.88 µs ± 8.1 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Now, the result using numpy.sum(): 24995.051343752984 
 
Time taken by reduction operation using numpy.ndarray.sum(): 7.14 µs ± 0.478 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Now, the result using numpy.ndarray.sum(): 24995.051343752984


In [1]:
import numpy as np
from multiprocessing import Pool

# Función original
def reduc_operation(array):
    suma = 0.0
    for num in array:
        suma += num
    return suma

# Función paralela usando multiprocessing
def parallel_reduc_operation(array, num_procs):
    # Dividir el array en fragmentos
    chunks = np.array_split(array, num_procs)
    
    # Crear un pool de procesos
    with Pool(processes=num_procs) as pool:
        results = pool.map(reduc_operation, chunks)
    
    # Combinar los resultados parciales
    return sum(results)

# Crear un array grande para pruebas
N = 50_000_000
array = np.random.rand(N)

# Ejecutar la función paralela
num_procs = 4  # Número de procesos
result = parallel_reduc_operation(array, num_procs)
print(f"Resultado paralelo: {result}")

Resultado paralelo: 25000109.696162842


In [2]:
from numba import njit, prange
import time

# Optimización con Numba
@njit
def reduc_operation_numba(array):
    suma = 0.0
    for num in array:
        suma += num
    return suma

# Paralelismo con Numba
@njit(parallel=True)
def parallel_reduc_operation_numba(array):
    suma = 0.0
    for i in prange(len(array)):
        suma += array[i]
    return suma

# Medir tiempo con reduc_operation_numba
start_time = time.time()
result_numba = reduc_operation_numba(array)
end_time = time.time()
print(f"Resultado Numba: {result_numba}")
print(f"Tiempo con Numba: {end_time - start_time:.2f} segundos")

# Medir tiempo con parallel_reduc_operation_numba
start_time = time.time()
result_parallel_numba = parallel_reduc_operation_numba(array)
end_time = time.time()
print(f"Resultado Numba Paralelo: {result_parallel_numba}")
print(f"Tiempo con Numba Paralelo: {end_time - start_time:.2f} segundos")

Resultado Numba: 25000109.696159493
Tiempo con Numba: 1.57 segundos
Resultado Numba Paralelo: 25000109.696163636
Tiempo con Numba Paralelo: 15.48 segundos


In [None]:
a) Librería multiprocessing:

In [3]:
import numpy as np
from multiprocessing import Pool
import time

# Función original
def reduc_operation(array):
    """Compute the sum of the elements in the array."""
    suma = 0.0
    for num in array:
        suma += num
    return suma

# Crear un array grande para pruebas
value = 50_000_000  # Tamaño del array
array = np.random.rand(value)  # Array con valores aleatorios en (0,1)

# Función para dividir el array y calcular en paralelo
def parallel_reduc_operation(array, num_procs):
    """Dividir el array en partes iguales y calcular la suma en paralelo."""
    chunks = np.array_split(array, num_procs)
    with Pool(processes=num_procs) as pool:
        results = pool.map(reduc_operation, chunks)
    return sum(results)

# Calcular tiempos para diferentes números de procesos
for num_procs in [1, 2, 4]:
    start_time = time.time()
    result = parallel_reduc_operation(array, num_procs)
    end_time = time.time()
    print(f"Resultado con {num_procs} procesos: {result}")
    print(f"Tiempo tomado con {num_procs} procesos: {end_time - start_time:.2f} segundos\n")

Resultado con 1 procesos: 25001634.986487128
Tiempo tomado con 1 procesos: 73.47 segundos

Resultado con 2 procesos: 25001634.986488536
Tiempo tomado con 2 procesos: 38.95 segundos

Resultado con 4 procesos: 25001634.986487955
Tiempo tomado con 4 procesos: 19.89 segundos



In [None]:
b) Libreria Numba:

In [4]:
from numba import njit, prange
import time

# Función original optimizada con Numba
@njit
def reduc_operation_numba(array):
    """Compute the sum of the elements in the array using Numba."""
    suma = 0.0
    for num in array:
        suma += num
    return suma

# Función paralela optimizada con Numba
@njit(parallel=True)
def reduc_operation_numba_parallel(array):
    """Compute the sum of the elements in the array using Numba with parallel processing."""
    suma = 0.0
    for i in prange(len(array)):
        suma += array[i]
    return suma

# Crear un array grande para pruebas
value = 50_000_000  # Tamaño del array
array = np.random.rand(value)  # Array con valores aleatorios en (0,1)

# Medir tiempo para reduc_operation_numba
start_time = time.time()
result_numba = reduc_operation_numba(array)
end_time = time.time()
print(f"Resultado con reduc_operation_numba: {result_numba}")
print(f"Tiempo tomado con reduc_operation_numba: {end_time - start_time:.2f} segundos\n")

# Medir tiempo para reduc_operation_numba_parallel
start_time = time.time()
result_numba_parallel = reduc_operation_numba_parallel(array)
end_time = time.time()
print(f"Resultado con reduc_operation_numba_parallel: {result_numba_parallel}")
print(f"Tiempo tomado con reduc_operation_numba_parallel: {end_time - start_time:.2f} segundos\n")

Resultado con reduc_operation_numba: 25002952.04017637
Tiempo tomado con reduc_operation_numba: 0.68 segundos

Resultado con reduc_operation_numba_parallel: 25002952.040175498
Tiempo tomado con reduc_operation_numba_parallel: 15.49 segundos



In [None]:
d) Resultados

In [None]:
1. Operación de Reducción con reduc_operation:

Tiempo de ejecución: 2.62 ms ± 8.27 µs (promedio de 100 ejecuciones).
Resultado de la suma: 24995.051343753086.
Esta función implementada de manera secuencial muestra un tiempo significativamente mayor comparado con las 
optimizaciones basadas en librerías más eficientes. Esto se debe al bucle explícito y a la naturaleza interpretada de Python

In [None]:
2. Uso de numpy.sum():

Tiempo de ejecución: 7.88 µs ± 8.1 ns.
Resultado de la suma: 24995.051343752984.
Al utilizar numpy.sum, el tiempo de ejecución se reduce drásticamente. Esto se debe a que Numpy utiliza
implementaciones altamente optimizadas en C, lo que elimina la sobrecarga de la interpretación de Python

In [None]:
3. Uso de numpy.ndarray.sum():

Tiempo de ejecución: 7.14 µs ± 0.478 ns.
Resultado de la suma: 24995.051343752984.
Este método interno de Numpy es igualmente eficiente que numpy.sum(), ya que ambas funciones están implementadas 
de forma nativa en bajo nivel.

In [None]:
4. Paralelismo con multiprocessing:

Con 1 proceso: 73.47 segundos, resultado: 25001634.986487128.
Con 2 procesos: 38.95 segundos, resultado: 25001634.986488536.
Con 4 procesos: 19.89 segundos, resultado: 25001634.986487955.
Comentario: La implementación paralela muestra una reducción notable en el tiempo de ejecución a medida que aumenta el número 
de procesos. Sin embargo, la ganancia en tiempo no es lineal debido a la sobrecarga asociada con la creación y coordinación 
de procesos.

In [None]:
5. Optimización con Numba:

Versión secuencial (@njit): 0.68 segundos, resultado: 25002952.04017637.
Versión paralela (@njit(parallel=True)): 15.49 segundos, resultado: 25002952.040175498.
El decorador @njit logra una mejora significativa en el tiempo de ejecución al compilar el código en tiempo de ejecución. 
Sin embargo, la versión paralela presenta un tiempo mayor que la secuencial, probablemente debido a la sobrecarga en la gestión 
de hilos en un entorno compartido o a un uso ineficiente de los recursos disponibles.