### Reduction operation: the sum of the numbers in the range [0, a)

CÓDIGO ORIGINAL 

In [13]:
import time

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = 1000000

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.2821805477142334 seconds
256 ms ± 673 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



3.2a) CÓDIGO USANDO LISTAS

In [5]:
import time

# Crear la lista con 10**6 elementos usando range
value = 1000000
mi_lista = list(range(value))

# a) Usando un bucle for
def suma_con_for(mi_lista):
    initialTime = time.time()
    total_for = 0
    for num in mi_lista:
        total_for += num
    finalTime = time.time()
    return total_for, (finalTime - initialTime)

# b) Usando la función sum
def suma_con_sum(mi_lista):
    initialTime = time.time()
    total_sum = sum(mi_lista)
    finalTime = time.time()
    return total_sum, (finalTime - initialTime)

# Medir tiempo usando las funciones
total_for, tiempo_for = suma_con_for(mi_lista)
total_sum, tiempo_sum = suma_con_sum(mi_lista)

# Mostrar los resultados
print("Time taken by for loop:", tiempo_for, "seconds")
print("Time taken by sum function:", tiempo_sum, "seconds")

print("\nUsing %timeit magic command (for loop):")
%timeit -r 2 suma_con_for(mi_lista)

print("\nUsing %timeit magic command (sum function):")
%timeit -r 2 suma_con_sum(mi_lista)

print(f"\nTotal sum computed by for loop: {total_for}")
print(f"Total sum computed by sum function: {total_sum}")


Time taken by for loop: 0.22751212120056152 seconds
Time taken by sum function: 0.02989482879638672 seconds

Using %timeit magic command (for loop):
224 ms ± 1.48 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)

Using %timeit magic command (sum function):
30 ms ± 90.7 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)

Total sum computed by for loop: 499999500000
Total sum computed by sum function: 499999500000


3.2b) CÓDIGO USANDO NUMPY

In [7]:
import time
import numpy as np

# Convertir la lista a un array de numpy
mi_array = np.array(mi_lista)

# a) Usando un bucle for
def suma_con_for(mi_array):
    initialTime = time.time()
    total_for = 0
    for num in mi_array:
        total_for += num
    finalTime = time.time()
    return total_for, (finalTime - initialTime)

# b) Usando la función sum de NumPy
def suma_con_sum(mi_array):
    initialTime = time.time()
    total_sum = np.sum(mi_array)
    finalTime = time.time()
    return total_sum, (finalTime - initialTime)

# Medir tiempo usando las funciones
total_for, tiempo_for = suma_con_for(mi_array)
total_sum, tiempo_sum = suma_con_sum(mi_array)

# Mostrar los resultados
print("Time taken by for loop:", tiempo_for, "seconds")
print("Time taken by NumPy sum function:", tiempo_sum, "seconds")

print("\nUsing %timeit magic command (for loop):")
%timeit -r 2 suma_con_for(mi_array)

print("\nUsing %timeit magic command (sum function):")
%timeit -r 2 suma_con_sum(mi_array)

print(f"\nTotal sum computed by for loop: {total_for}")
print(f"Total sum computed by NumPy sum function: {total_sum}")


Time taken by for loop: 0.6532104015350342 seconds
Time taken by NumPy sum function: 0.0013697147369384766 seconds

Using %timeit magic command (for loop):
632 ms ± 6.12 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)

Using %timeit magic command (sum function):
1.36 ms ± 1.32 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)

Total sum computed by for loop: 499999500000
Total sum computed by NumPy sum function: 499999500000


3.2c) EXPLICACIÓN DE RESULTADOS
Tras comparar los resultados de la ejecución del código original, listas y usando numpy; he podido observar como el uso del bucle for, era menos eficiente en cada caso que el uso de la función sum, esto se debe a que Python al usar el bucle for tiene que iterar explícitamente sobre cada elemento de la lista. Por otro lado el uso de la función sum, esta optimizada en C y el tiempo de ejecución se reduce aprovechando la velocidad del lenguaje compilado. Pero al usar numpy que tambien esta escrita en C se aprovecha que esta ha sido diseñada específicamente para operaciones numéricas y esta altamente optizada para el trabajo con gran cantidad de datos, observando que el tiempo de ejecución es aún menor.

3.3a) USANDO DECORADOR @NJIT DE NUMBA

In [22]:
import time
import numpy as np
from numba import njit  # Importa numba correctamente

# Convertir la lista a un array de numpy
value = 1000000
mi_array = np.arange(value)  # Usamos np.arange para crear el array de manera más eficiente

# a) Usando un bucle for
@njit  # El decorador debe aplicarse a la función fuera de su cuerpo
def suma_con_for(mi_array):
    total_for = 0
    for num in mi_array:
        total_for += num
    return total_for

# b) Usando la función sum de NumPy
@njit  # Aplicamos el decorador también a esta función 
def suma_con_sum(mi_array):
    return np.sum(mi_array)

# Medir tiempo usando las funciones con %timeit (no es necesario time.time)
print("\nUsing %timeit magic command (for loop with @njit):")
%timeit -r 2 suma_con_for(mi_array)

print("\nUsing %timeit magic command (sum function with @njit):")
%timeit -r 2 suma_con_sum(mi_array)

# Medir el tiempo manualmente si es necesario
def medir_tiempos():
    start_time = time.time()
    total_for = suma_con_for(mi_array)
    time_for = time.time() - start_time

    start_time = time.time()
    total_sum = suma_con_sum(mi_array)
    time_sum = time.time() - start_time

    print(f"Time taken by for loop with @njit: {time_for} seconds")
    print(f"Time taken by NumPy sum function with @njit: {time_sum} seconds")
    
    print(f"\nTotal sum computed by for loop with @njit: {total_for}")
    print(f"Total sum computed by NumPy sum function with @njit: {total_sum}")

# Llamar a la función para medir los tiempos manualmente (opcional)
medir_tiempos()



Using %timeit magic command (for loop with @njit):
1.63 ms ± 10.5 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)

Using %timeit magic command (sum function with @njit):
995 µs ± 2.6 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)
Time taken by for loop with @njit: 0.0016541481018066406 seconds
Time taken by NumPy sum function with @njit: 0.0009558200836181641 seconds

Total sum computed by for loop with @njit: 499999500000
Total sum computed by NumPy sum function with @njit: 499999500000


3.3b) EXPLICACIÓN DE LOS RESULTADOS NUMBA Vemos que el uso del decorador @njit mejora significativamente el rendimiento del bucle for, unas 400 veces más rápido, pero tiene un menor impacto en el uso de np.sum debido a que esta funcion ya está optimizada en C; por tanto la opción de numpy sigue siendo la mas acertada por su rapidez y eficiencia en el manejo de gran cantidad de datos. 