### Reduction operation: the sum of the numbers in the range [0, a)

In [11]:
import time

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = 1000000

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.03618335723876953 seconds
33.3 ms ± 756 μs per loop (mean ± std. dev. of 2 runs, 10 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



Vamos a realizar el **apartado a)**. 

In [13]:
import sys
#Para poder introducir el tamaño por terminal
#tama = 1000000
tama = int(sys.argv[1])
print("\n", "El valor introducido por terminal es", tama, "\n")

#Ejecutamos list() para que sea de tipo lista
lista = list(range(tama))

#Con este bucle vamos sumando cada valor de la lista a una variable
suma = 0

inicio_for = time.time()
for num in lista:
    suma += num
final_for = time.time()

print("Tiempo que emplea en sumar listas mediante un bucle for:", round((final_for - inicio_for), 5), "segundos")
print("La suma obtenida es", suma, "\n")

#Hacemos uso de la función sum
inicio_sum = time.time()
resultado = sum(lista)
final_sum = time.time()

print("Tiempo que emplea en sumar la función sum:", round((final_sum - inicio_sum), 5), "segundos")
print("La suma obtenida es de", resultado, "\n")


 El valor introducido por terminal es 1000000 

Tiempo que emplea en sumar listas mediante un bucle for: 0.06639 segundos
La suma obtenida es 499999500000 

Tiempo que emplea en sumar la función sum: 0.0058 segundos
La suma obtenida es de 499999500000 



Procedemos a realizar el **apartado b)** con numpy.

In [16]:
import numpy as np

#Convertimos la lista en un array de numpy
array = np.array(lista)

#Sumamos los valores del array con un bucle for
suma = 0

inicio_for = time.time()
for num in array:
    suma += num
final_for = time.time()

print("Tiempo que emplea en sumar arrays de numpy mediante un bucle for:", round((final_for - inicio_for), 5), "segundos")
print("La suma obtenida es", suma, "\n")

#Hacemos uso de la función sum
inicio_sum = time.time()
resultado = np.sum(array)
final_sum = time.time()

print("Tiempo que emplea en sumar la función sum de numpy:", round((final_sum - inicio_sum), 6), "segundos")
print("La suma obtenida es de", resultado, "\n")


Tiempo que emplea en sumar arrays de numpy mediante un bucle for: 0.0935 segundos
La suma obtenida es 499999500000 

Tiempo que emplea en sumar la función sum de numpy: 0.000422 segundos
La suma obtenida es de 499999500000 



**----Resultados obtenidos----**

Los resultados obtenidos muestran diferencias significativas de rendimiento entre los distintos métodos utilizados. Como podemos observar en los resultados, el uso de bucles `for` en Phyton es el enfoque más lento, debido al número de veces que se recorre la lista. En cambio, cuando utilizamos la función `sum()` sobre listas observamos una mejora, acelerando el proceso aproximadamente 10 veces. Esto se debe a que la función evita el coste del bucle.

Si utilizamos la librería Numpy, vemos que iterar un array con `for` empeora el rendimiento, siendo más lento (aprox. 1.5x) que la iteracción de la lista. Esto se debe a que Numpy no esta optimizado para iteraciones elemento a elemento. Sin embargo, la función `np.sum()` porporciona un rendimiento mucho más rápido que el resto de procesos estudiados (aprox. 13 veces más rápido que el empleo de `sum()` sobre listas). Esto se debe a la implementación vectorizada y el uso eficiente de operaciones. 

**----------------------------**


### 3.3 Apartado aplicando Numba

Comenzamos con el **apartado a)**


In [1]:
from numba import njit 

In [None]:
#Como a numba solo le podemos pasar funciones convertimos los bucles en funciones
@njit
def sum_for(arr):
    suma = 0
    for num in arr:
        suma += num
    return suma
    
#Ponemos esta línea para que compile primero y no muestre el tiempo que tarda en compilar
total0 = sum_for(array) 

#Ejemplo con bucle for + Numba
inicio_for_n = time.time()
total = sum_for(array)
final_for_n = time.time()

print("Tiempo que emplea en sumar arrays de numpy mediante un bucle for optimizado con Numba:", round((final_for_n - inicio_for_n), 5), "segundos")
print("La suma obtenida es", total, "\n")

#Hacemos uso de la función sum + Numba
@njit
def array_sum(arr):
    resultado = np.sum(arr)
    return resultado

inicio_sum = time.time()
total2 = array_sum(array)
final_sum = time.time()

print("Tiempo que emplea en sumar la función sum de numpy optimizado con Numba:", round((final_sum - inicio_sum), 6), "segundos")
print("La suma obtenida es de", total2, "\n")

**----Comentario resultados obtenidos----**

Como podemos observar por los tiempos empleados, cuando trabajamos con Numba sobre bucles explícitos que iteran listas o arrays de Numpy, Numba permite acelerar el proceso (aproximadamnete 2x). Esto se debe a que Numba compila el código a bajo nivel y evita la interpretación de Phyton en cada iteración. 

Sin embargo, para funciones de Numpy como `np.sum()`, Numba no aporta mejora y puede incluso retrasarlo un poco, como ocurre en este caso, debido a la sobrecarga de la función compilada. 

Si queremos aumentar el rendimiendo lo que podríamos aplicar es la paralelización con Numba, aplicando prange para distribuir las iteraciones en varios hilos, lo que permite acelerar los bucles sobre arrays grandes.

**-----------------------------**