### Reduction operation: the sum of the numbers in the range [0, a)

In [21]:
import time
import sys

#Main program
N = int(sys.argv[1])

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

initialTime = time.time()
suma = reduc_operation(N)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(N)

print(f"\n \t Computing the sum of numbers in the range [0, N): {suma}\n")

ValueError: invalid literal for int() with base 10: '-f'

### Apartado 3.2 A)

a) Usando bucle for y b) usando función sum

In [7]:
import time
N = int(sys.argv[1])
lista = list(range(N))
# a)
#función para suma con bucle for
def suma(lista):
    x = 0
    for i in lista:
        x+=i
    return x
    
#Definición de parámetros
initialTime = time.time()
suma_for = suma(lista)
finalTime = time.time()
print("Time taken by using for loop:", (finalTime - initialTime), "seconds")

#usando las funciones magicas de python
%timeit -r 2 suma(lista)



# b) 
def suma_sum(lista2):
    suma_s = sum(lista2)         
    return suma_s
#Parámetros
lista2 = list(range(N)) 
initialTime = time.time()    
suma_s = suma_sum(lista2)
finalTime = time.time()
print("Time taken by sum function", (finalTime - initialTime), "seconds")

%timeit -r 2 suma_sum(lista2)

Time taken by using for loop: 0.20399832725524902 seconds
203 ms ± 12.3 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Time taken by sum function 0.030318021774291992 seconds
30.1 ms ± 36.7 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)


### Apartado 3.2 B)

In [12]:
#Se importa la libreria numpy
import time
import numpy as np
lista = list(range(N))
array = np.array(lista)

# a) suma de los elementos del array con bucle for
def suma_forloop(array):
    suma = 0
    for num in array:
        suma += num
    return suma

initialTime = time.time()
sumafor = suma_forloop(array)
finalTime = time.time()
print("Time taken with loop:", (finalTime - initialTime), "seconds")
#con funcion magica de python:
%timeit -r 2 suma_forloop(array)

# b) suma de los elementos del array con sum
def suma_sum_numpy(array):
    return np.sum(array)

# Medir el tiempo usando Numba
initialTime = time.time()
suma = suma_sum_numpy(array)
finalTime = time.time()
print("Time taken by sum function:", (finalTime - initialTime), "seconds")

%timeit -r 2 np.sum(array)

Time taken with loop: 0.6750853061676025 seconds
651 ms ± 1.5 ms per loop (mean ± std. dev. of 2 runs, 1 loop each)
Time taken by sum function: 0.0019197463989257812 seconds
1.4 ms ± 8.69 µs per loop (mean ± std. dev. of 2 runs, 1,000 loops each)


### Apartado 3.2 C)

En el código original se obtiene bastante tiempo porque se está calculando el tiempo de la realización de un bucle for por lo que puede
ser bastante lento sobre todo cuando se trata de sumar valores tan grandes que van desde 0 a 1000000. Al utilizar el time.time el tiempo
se calcula de forma imprecisa mientras que la función mágica %timeit que estima dos veces nos da una estimación más real con 
desviación típica.
A continuación, se observa que utilizando listas y ejecutando el mismo proceso anterior el tiempo se reduce un poco, aunque 
tampoco mucho porque las listas también son bastante lentas. Sin embargo, cuando eliminamos el bucle for en el apartado b, aunque
se conserva la lista se reduce significativamente el tiempo de ejecución, esto se debe a que se está usando la función
de numpy sum. Eliminando el bucle for python, se ahorra de interpretar cada iteración, verificar el elemento, realizar la suma,etc.
Con la funcion sum nos ahorramos todo este proceso, aunque aplicado sobre listas sigue siendo un poco bajo el rendimiento.
Es por eso que se utilizan en el siguiente apartado los arrays, ya que en un array, Numpy vectoriza las operaciones,
lo que significa que puede aprovechar las optimizaciones a nivel de hardware, como los registros de CPU y la paralelización en
múltiples núcleos de procesamiento. Aún así, se puede ver que en el apartado 3.2 b. a. el tiempo aumenta considerablemente (mucho
más que el original) esto es porque se está usando un bucle for de python y ala vez Numpy, lo cual es contradictorio y limita el potenical de numpy.
Finalmente, cuando se quita este bucle for en el apartado b. se puede comprobar que se obtiene el menor tiempo de todas las pruebas,
ya que se está usando arrays y Numpy, que es lo más eficiente.

### Apartado 3.3 a)

In [None]:
#Se importa la libreria numpy
import time
import numpy as np
from numba import njit
lista = list(range(N))
array = np.array(lista)

# a) suma de los elementos del array con bucle for decorando con @njit
@njit
def suma_forloop(array):
    suma = 0
    for num in array:
        suma += num
    return suma

initialTime = time.time()
sumafor = suma_forloop(array)
finalTime = time.time()
print("Time taken with loop:", (finalTime - initialTime), "seconds")
#con funcion magica de python:
%timeit -r 2 suma_forloop(array)

# b) suma de los elementos del array con sum decorando con @njit
@njit
def suma_sum_numpy(array):
    return np.sum(array)

# Medir el tiempo usando Numba
initialTime = time.time()
suma = suma_sum_numpy(array)
finalTime = time.time()
print("Time taken by sum function:", (finalTime - initialTime), "seconds")

%timeit -r 2 suma_sum_numpy(array)


### Apartado 3.3 b)

Con la implementación del paquete numba y el decorador @njit se pueden observar los siguientes resultados:
-Una reducción de tiempo en la ejecución de la suma con bucle for con respecto al apartado 3.2 b, lo cual
es lógico ya que @njit, mejora significativamente el rendimiento de los bucles for porque elimina la sobrecarga
de interpretación de Python, optimiza el código y lo convierte en instrucciones nativas que la CPU puede ejecutar de manera más eficiente.
-En el segundo resultado, con la función sum, podemos ver lo que parecen discrepancias pero no lo son.
Nos da un menor tiempo de ejecución en el apartado 3.2 con respecto al 3.3 midiendo el tiempo con time.time(), esto
se debe a que time.time(), en el apartado 3.3 está midiendo también el tiempo de compilación de @njit, 
mientras %time mide el tiempo promedio de ejecuciones repetidas, por lo que no se tendría en cuenta el tiempo de ejecución.
