## Reduction operation: the sum of the numbers in the range [0, value)

In [5]:
import numpy as np
import sys
import cupy as cp
import time

def reduc_operation(A):
    """Compute the sum of the elements of Array A in the range [0, value)."""
    s = 0
    for i in range(A.size):
        s += A[i]
    return s

# Secuencial
value = int(sys.argv[1])
X = np.random.rand(value)

# Para imprimir los primeros valores del array
# print(X[0:12])

# Utilizando las operaciones mágicas de ipython
tiempo = %timeit -r 2 -o -q reduc_operation(X)
print("Time taken by reduction operation using a function:", tiempo)
print(f"And the result of the sum of numbers in the range [0, value) is: {reduc_operation(X)}\n")

# Utilizando numpy.sum(
tiempo = %timeit -r 2 -o -q np.sum(X)
print("Time taken by reduction operation using numpy.sum():", tiempo)
print("Now, the result using numpy.sum():", np.sum(X),"\n ")

# Utilizando numpy.ndarray.sum()
tiempo= %timeit -r 2 -o -q X.sum()
print("Time taken by reduction operation using numpy.ndarray.sum():", tiempo)
print("Now, the result using numpy.ndarray.sum():", X.sum())

Time taken by reduction operation using a function: 5.2 ms ± 231 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)
And the result of the sum of numbers in the range [0, value) is: 24873.067406323546

Time taken by reduction operation using numpy.sum(): 14.8 µs ± 11.8 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Now, the result using numpy.sum(): 24873.06740632327 
 
Time taken by reduction operation using numpy.ndarray.sum(): 12.5 µs ± 17.9 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Now, the result using numpy.ndarray.sum(): 24873.06740632327


## APARTADO 3.3 a)

In [10]:
import cupy as cp  # Importamos Cupy
import time

# Generamos un array aleatorio en la GPU utilizando cupy.random
X = cp.random.rand(value)

# Medimos el tiempo de cp.sum usando time.time()
start_time = time.time()
a = cp.sum(X)
end_time = time.time()

print(f"El tiempo utilizando cp.sum medido con time.time() es {end_time - start_time} segundos")

# Usamos %timeit para medir el tiempo de ejecución de cp.sum
execution_time = %timeit -r 2 -o -q cp.sum(X)

print("\nTiempo empleado por la operación de reducción utilizando cp.sum y %timeit():", execution_time)
print("Ahora, el resultado utilizando cp.sum():", cp.sum(X), "\n")



El tiempo utilizando cp.sum medido con time.time() es 0.00020456314086914062 segundos

Tiempo empleado por la operación de reducción utilizando cp.sum y %timeit(): 17.2 µs ± 26.7 ns per loop (mean ± std. dev. of 2 runs, 100,000 loops each)
Ahora, el resultado utilizando cp.sum(): 25027.632934017005 



## APARTADO 3.3 d) 

## OUTPUT:

Ejecutamos el script de reducción para value = 5000000
Time taken by reduction operation using a function: 433 ms ± 832 µs per loop (me
an ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 2499835.6728516
663

Time taken by reduction operation using numpy.sum(): 1.8 ms ± 106 ns per loop (m
ean ± std. dev. of 2 runs, 1,000 loops each)
Now, the result using numpy.sum(): 2499835.672851525 
 
Time taken by reduction operation using numpy.ndarray.sum(): 1.79 ms ± 19.1 ns p
er loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Now, the result using numpy.ndarray.sum(): 2499835.672851525
El tiempo utilizando cp.sum medido con time.time() es 0.008644819259643555 segun
dos

Tiempo empleado por la operación de reducción utilizando cp.sum y %timeit(): 155
 µs ± 0.311 ns per loop (mean ± std. dev. of 2 runs, 10,000 loops each)
Ahora, el resultado utilizando cp.sum(): 2500257.4883779464 

Ejecutamos el script de reducción para value = 50000000
Time taken by reduction operation using a function: 4.33 s ± 2.08 ms per loop (m
ean ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 24999068.158428
125

Time taken by reduction operation using numpy.sum(): 18.9 ms ± 2.56 µs per loop 
(mean ± std. dev. of 2 runs, 100 loops each)
Now, the result using numpy.sum(): 24999068.158425972 
 
Time taken by reduction operation using numpy.ndarray.sum(): 18.9 ms ± 6.05 µs p
er loop (mean ± std. dev. of 2 runs, 100 loops each)
Now, the result using numpy.ndarray.sum(): 24999068.158425972
El tiempo utilizando cp.sum medido con time.time() es 0.009028196334838867 segun
dos

Tiempo empleado por la operación de reducción utilizando cp.sum y %timeit(): 1.4
9 ms ± 29.8 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Ahora, el resultado utilizando cp.sum(): 24999222.600845523 

Ejecutamos el script de reducción para value = 500000000
Time taken by reduction operation using a function: 43 s ± 15.5 ms per loop (mea
n ± std. dev. of 2 runs, 1 loop each)
And the result of the sum of numbers in the range [0, value) is: 250006375.91254
255

Time taken by reduction operation using numpy.sum(): 195 ms ± 155 µs per loop (m
ean ± std. dev. of 2 runs, 1 loop each)
Now, the result using numpy.sum(): 250006375.91250515 
 
Time taken by reduction operation using numpy.ndarray.sum(): 195 ms ± 154 µs per
 loop (mean ± std. dev. of 2 runs, 10 loops each)
Now, the result using numpy.ndarray.sum(): 250006375.91250515
El tiempo utilizando cp.sum medido con time.time() es 0.014815330505371094 segun
dos

Tiempo empleado por la operación de reducción utilizando cp.sum y %timeit(): 14.
9 ms ± 1.53 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Ahora, el resultado utilizando cp.sum(): 249994488.19692183 

## CONCLUSIONES

1. **Secuencial (`reduc_operation`)**:
   - Es extremadamente ineficiente para datos grandes, con tiempos lineales que escalan muy mal.

2. **NumPy (`numpy.sum` y `numpy.ndarray.sum`)**:
   - Muy eficiente, aprovecha optimizaciones internas de la CPU.
   - Ideal para tamaños pequeños y medianos de arrays.

3. **CuPy (`cp.sum`)**:
   - Es la opción más rápida para datos grandes gracias al paralelismo masivo de las GPUs.
   - Supera a NumPy en rendimiento para tamaños masivos de arrays.

4. **Recomendaciones**:
   - Usar **NumPy** para operaciones en CPU.
   - Usar **CuPy** si se dispone de GPU para datos masivos.
   - Evitar implementaciones secuenciales para cualquier caso práctico.

