### Reduction operation: the sum of the numbers in the range [0, a)

In [5]:
import time
import sys

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

#value = 1000000
N = int(sys.argv[1])

initialTime = time.time()
suma = reduc_operation(N)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(N)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.27259325981140137 seconds
259 ms ± 1.28 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



### Apartado 3.2 a)

Apartado 3.2 a) Ver el tiempo que se tarda en sumar todos los elementos de la lista usando bucles for y usando la funcion sum

In [6]:
# Primero importamos la time
import time
import sys

# Definimos una funcion que sume los elementos de la lista 
def suma_con_for(lista):
    total_suma=0
    for i in lista:
        total_suma+=i
    return total_suma

# Definimos una funcion que sume los elementos de una lista con sum
def suma_con_sum(lista):
    total_sum=sum(lista)
    return total_sum

# Defino el numero 
#valor=1000000
N = int(sys.argv[1])
lista=list(range(N))

# Calculo los tiempos 

initialTime = time.time()
suma_1 = suma_con_for(lista)
finalTime = time.time()
print("Time taken using a for loop:", (finalTime - initialTime), "seconds")
# Utilizando las operaciones mágicas de ipython
%timeit -r 2 suma_con_for(lista)

initialTime = time.time()
suma_2 = suma_con_sum(lista)
finalTime = time.time()
print("Time taken using sum:", (finalTime - initialTime), "seconds")
%timeit -r 2 suma_con_sum(lista)

Time taken using a for loop: 0.22977757453918457 seconds
202 ms ± 175 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)
Time taken using sum: 0.03136277198791504 seconds
30.3 ms ± 4.32 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)


### Apartado 3.2 b)

Apartado 3.2 b) Calcular los tiempos usando numpy con bucle for y sum

In [7]:
# Importamos time y numpy
import time
import numpy as np
import sys

# Defino una funcion que sume los elementos del array con un bucle for 
def sum_array_for(array):
    total=0
    for i in array:
        total +=i
    return total
# Defino una funcion que sume el array usando np.sum(array)
def sum_array_con_numpy_sum(array):
    total=np.sum(array)
    return total


# Defino el numero 
#valor=1000000
N = int(sys.argv[1])
lista=list(range(N))
# Creating a 1D array
array = np.array(lista)

initialTime = time.time()
suma_3 = sum_array_for(array)
finalTime = time.time()
print("Time taken using a for loop with numpy array:", (finalTime - initialTime), "seconds")
%timeit -r 2 sum_array_for(array)

initialTime = time.time()
suma_4 = sum_array_con_numpy_sum(array)
finalTime = time.time()
print("Time taken using numpy.sum():", (finalTime - initialTime), "seconds")
%timeit -r 2 sum_array_con_numpy_sum(array)

Time taken using a for loop with numpy array: 0.6770846843719482 seconds
676 ms ± 133 µs per loop (mean ± std. dev. of 2 runs, 1 loop each)
Time taken using numpy.sum(): 0.0020987987518310547 seconds
1.39 ms ± 755 ns per loop (mean ± std. dev. of 2 runs, 1,000 loops each)


### Apartado 3.2 c)

En el código original podemos ver la diferencia entre time.time() que mide la duración entre dos puntos de ejecución y la función mágica %timeit que nos muestra el tiempo promedio de las ejecuciones así como su desviación estándar por lo que es más representativo del rendimiento del código.

En el apartado donde trabajamos con listas, vemos que el tiempo utilizando un bucle for es mucho mayor, de hecho vemos que la función sum es bastante más rápida. Esto es debido a que la función sum está optimizada en C dentro de Python y, por el contrario, el bucle for debe ser interpretado en Python.

En el apartado donde trabajamos con arrays numpy, vemos que sumar manualmente con un bucle for los elementos de un array es unas 500 veces más lento aproximadamente que hacerlo con np.sum(). Esto se debe a que np.sum() es una función universal de numpy y, por tanto, es una funcion optimizada para operar con arrays de numpy de manera vectorizada usando implementaciones de C. Usar un bucle for con arrays de numpy no es una buena idea porque pierde las ventajas principales de numpy, que son las operaciones vectorizadas y la gestión eficiente de datos en memoria contigua, diseñadas para evitar iteraciones manuales. Comparado con sumar elementos en una lista como vemos en el apartado anterior usando un bucle for, el tiempo con numpy puede ser aún mayor debido al overhead adicional que implica acceder a los elementos de un array de numpy desde Python.
Por tanto, vemos que para poder optimizar esta función la mejor idea sería utilizar arrays de numpy y, además, utilizar una función universal como vemos en el apartado final.

### Apartado 3.3 a)

Vamos a acelerar los tiempos de ejecución utilizando el paquete Numba 

In [8]:
# Importamos todas las librerias necesarias
import time
import numpy as np
from numba import njit
import sys

# Defino una funcion que sume los elementos del array con un bucle for y la decoramos con @njit
@njit
def sum_array_for_numba(array):
    total=0
    for i in array:
        total +=i
    return total
# Defino una funcion que sume el array usando np.sum(array) y la decoro con @njit
@njit
def sum_array_con_numpy_sum_numba(array):
    total=np.sum(array)
    return total


# Defino el numero 
#valor=1000000
N = int(sys.argv[1])
lista=list(range(N))
# Creating a 1D array
array = np.array(lista)

initialTime = time.time()
suma_5 = sum_array_for_numba(array)
finalTime = time.time()
print("Time taken using a for loop with numpy array with numba:", (finalTime - initialTime), "seconds")
%timeit -r 2 sum_array_for_numba(array)

initialTime = time.time()
suma_6 = sum_array_con_numpy_sum_numba(array)
finalTime = time.time()
print("Time taken using numpy.sum() with numba:", (finalTime - initialTime), "seconds")
%timeit -r 2 sum_array_con_numpy_sum_numba(array)

Time taken using a for loop with numpy array with numba: 0.484757661819458 seconds
1.48 ms ± 6.81 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)
Time taken using numpy.sum() with numba: 0.45430469512939453 seconds
988 µs ± 2.94 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)


### Apartado 3.3 b)

Como podemos observar en los resultados, el tiempo medido con time.time no resulta muy fiable, ya que incluye el tiempo de compilación inicial de numba, lo que explica la discrepancia con respecto a %timeit, que descarta dicha compilación y mide únicamente las ejecuciones optimizadas. 
Si comparamos los tiempos usando %timeit, podemos ver que la suma de cada elemento del array con un bucle for mejora considerablemente al usar numba, ya que convierte el bucle lento en python puro en código máquina altamente optimizado. Ya que, como vimos anteriormente, usar un bucle for y numpy no era buena idea, sin embargo, gracias a la decoración conseguimos optimizar este proceso. Lo mismo ocurre con la función np.sum, que ya era rápida al ser parte de numpy, pero al combinarla con numba, se reduce aún más el tiempo de ejecución.
En conclusión, estos resultados demuestran que numba es particularmente útil en operaciones basadas en bucles explícitos o funciones complejas que aprovechan numpy, optimizando significativamente su rendimiento y reduciendo los tiempos incluso en operaciones ya optimizadas.