### Reduction operation: the sum of the numbers in the range [0, a)

In [3]:
import time
import sys

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

if len(sys.argv) > 1:
    try:
        value = int(sys.argv[1])
    except ValueError:
        print("Error: el argumento debe ser un entero")
        sys.exit(1)
else:
    value = 1000000  # Valor por defecto si no se indica nada

print("Ejecutando con value =", value)

# Secuencial

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n") 

Time taken by reduction operation: 0.2612435817718506 seconds
256 ms ± 176 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



In [4]:
# Ejercicio 3.2:

# a) Uso de listas
lista = list(range(value))

# a.1) Suma usando bucle for
initialTime = time.time()
suma_lista = 0
for i in lista:
    suma_lista += i
finalTime = time.time()
print("Time with list + for:", finalTime - initialTime, "seconds")

# a.2) Suma usando sum()
initialTime = time.time()
suma_builtin = sum(lista)
finalTime = time.time()
print("Time with list + sum():", finalTime - initialTime, "seconds")

# Validación
print("Resultado con sum(lista):", suma_builtin)

# Con timeit
%timeit -r 2 sum(lista)

Time with list + for: 0.4806859493255615 seconds
Time with list + sum(): 0.04690814018249512 seconds
Resultado con sum(lista): 499999500000
30.4 ms ± 410 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)


In [5]:
import numpy as np

# b) Conversión a array de numpy
array = np.array(lista)

# b.1) Suma con bucle for
initialTime = time.time()
suma_np_for = 0
for i in array:
    suma_np_for += i
finalTime = time.time()
print("Time with numpy array + for:", finalTime - initialTime, "seconds")

# b.2) np.sum()
initialTime = time.time()
suma_np = np.sum(array)
finalTime = time.time()
print("Time with numpy + np.sum():", finalTime - initialTime, "seconds")
print("Resultado con np.sum:", suma_np)

# Con timeit
%timeit -r 2 np.sum(array)

Time with numpy array + for: 0.9612452983856201 seconds
Time with numpy + np.sum(): 0.0023126602172851562 seconds
Resultado con np.sum: 499999500000
1.39 ms ± 4.86 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)


### Comparativa entre Python puro, listas, y NumPy
Los resultados obtenidos han sido los siguientes:
#### a) Listas de Python
- **Bucle for sobre lista:** ~0.44 segundos
- **sum(lista):** ~0.031 segundos
- **%timeit sum(lista):** ~29.8 ms por ejecución
Usar `sum()` directamente sobre la lista es significativamente más rápido que recorrerla manualmente con un bucle `for`. Esto se debe a que `sum()` está implementada en C internamente, lo que la hace mucho más eficiente que un bucle de Python.
#### b) Arrays de NumPy
- **Bucle for sobre array:** ~0.94 segundos
- **np.sum(array):** ~0.0025 segundos
- **%timeit np.sum(array):** ~1.4 ms por ejecución

Aunque los arrays de NumPy ofrecen ventajas para operaciones, recorrerlos manualmente con un bucle `for` es incluso más lento que hacerlo sobre listas.
Sin embargo, el uso de `np.sum()` proporciona el mejor rendimiento de todos los métodos probados. Es ideal para trabajar con grandes volúmenes de datos.

In [7]:
# Ejercicio 3.3:

from numba import njit

@njit
def reduc_with_loop_numba(arr):
    total = 0
    for i in arr:
        total += i
    return total

value = 10**6
arr = np.arange(value)

# Medición con time.time()
start = time.time()
result_numba = reduc_with_loop_numba(arr)
end = time.time()
print("Time with Numba + for:", end - start, "seconds")
print("Resultado con Numba + for:", result_numba)

# Medición precisa usando timeit
%timeit -r 2 reduc_with_loop_numba(arr)

Time with Numba + for: 0.485706090927124 seconds
Resultado con Numba + for: 499999500000
1.49 ms ± 6.52 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)


## Resultados con Numba:
El uso del decorador `@njit` de Numba ha reducido significativamente el tiempo de ejecución respecto al bucle for con listas o arrays de NumPy. Aunque np.sum() sigue siendo más rápido, Numba permite acelerar funciones personalizadas y bucles complejos.
