### Reduction operation: the sum of the numbers in the range [0, a)

FUNCIÓN EJEMPLO

In [3]:
import time

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = 1000000

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.018224477767944336 seconds
16.6 ms ± 177 µs per loop (mean ± std. dev. of 2 runs, 100 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



3.2 A)

In [14]:
import time

# Crear la lista de números del rango [0, 10**6)
value = 10**6
numeros = list(range(value))

# Método a) Usando un bucle for
initialTime_for = time.time()
suma_for = 0
for numero in numeros:
    suma_for += numero
finalTime_for = time.time()

# Método b) Usando la función sum
initialTime_sum = time.time()
suma_sum = sum(numeros)
finalTime_sum = time.time()

# Mostrar resultados
print("Método a) Usando bucle for:")
print(f"Suma: {suma_for}, Tiempo tomado: {finalTime_for - initialTime_for} segundos\n")

print("Método b) Usando función sum:")
print(f"Suma: {suma_sum}, Tiempo tomado: {finalTime_sum - initialTime_sum} segundos\n")


# Usar %timeit para medir tiempos en IPython (si estás en un entorno compatible)
try:
    get_ipython().run_line_magic('timeit', '-r 2 sum(numeros)')
except NameError:
    print("Las operaciones mágicas de %timeit sólo funcionan en entornos IPython.")

Método a) Usando bucle for:
Suma: 499999500000, Tiempo tomado: 0.47300171852111816 segundos

Método b) Usando función sum:
Suma: 499999500000, Tiempo tomado: 0.03226447105407715 segundos

30 ms ± 70.9 µs per loop (mean ± std. dev. of 2 runs, 10 loops each)


3.2 B)

In [16]:
import time
import numpy as np

def sumar_con_bucle_for(array):
    """Sumar los elementos de un array utilizando un bucle for."""
    suma = 0
    for elemento in array:
        suma += elemento
    return suma

def sumar_con_numpy_sum(array):
    """Sumar los elementos de un array utilizando numpy.sum()"""
    return np.sum(array)

def medir_tiempo(funcion, *args):
    """Medir el tiempo que tarda una función en ejecutarse."""
    start_time = time.time()
    resultado = funcion(*args)
    end_time = time.time()
    tiempo = end_time - start_time
    return resultado, tiempo

def main():
    value = 10**6

    # Crear la lista y convertirla a array
    lista = list(range(value))
    array = np.array(lista)

    # Sumar los elementos usando un bucle for
    suma_for, tiempo_for = medir_tiempo(sumar_con_bucle_for, array)
    print(f"Tiempo con bucle for (array de NumPy): {tiempo_for:.6f} segundos")

    # Sumar los elementos usando numpy.sum()
    suma_numpy, tiempo_numpy = medir_tiempo(sumar_con_numpy_sum, array)
    print(f"Tiempo con numpy.sum(): {tiempo_numpy:.6f} segundos")

    # Verificar que ambos resultados son iguales
    assert suma_for == suma_numpy, "Los resultados de las sumas no coinciden"
    print(f"\nSuma total: {suma_numpy}")

if __name__ == "__main__":
    main()

Tiempo con bucle for (array de NumPy): 0.660985 segundos
Tiempo con numpy.sum(): 0.001392 segundos

Suma total: 499999500000


3.2 C)

Los resultados muestran que:

1. El código original: 
es notablemente rápido debido a su implementación optimizada en Python, con tiempos cercanos a 0.018 segundos.

2. El uso de listas:
El bucle for resulta considerablemente más lento (0.457 segundos) debido a la sobrecarga de Python al iterar elemento por elemento.
La función sum es significativamente más eficiente (0.029 segundos), ya que está optimizada para operaciones de reducción en listas.

3. El uso de NumPy:
El bucle for es aún más lento (0.84 segundos) porque la iteración en arrays de NumPy introduce una mayor sobrecarga que en listas nativas.
La función numpy.sum es increíblemente rápida (0.0021 segundos), ya que realiza operaciones directamente en código compilado C, aprovechando instrucciones de bajo nivel y optimizaciones vectoriales.

3.3 A)

In [18]:
import time
import numpy as np
from numba import njit

@njit
def sumar_con_bucle_for(array):
    """Sumar los elementos de un array utilizando un bucle for."""
    suma = 0
    for elemento in array:
        suma += elemento
    return suma

@njit
def sumar_con_numpy_sum(array):
    """Sumar los elementos de un array utilizando numpy.sum()"""
    return np.sum(array)

def medir_tiempo(funcion, *args):
    """Medir el tiempo que tarda una función en ejecutarse."""
    start_time = time.time()
    resultado = funcion(*args)
    end_time = time.time()
    tiempo = end_time - start_time
    return resultado, tiempo

def main():
    value = 10**6

    # Crear la lista y convertirla a array
    lista = list(range(value))
    array = np.array(lista)

    # Sumar los elementos usando un bucle for
    suma_for, tiempo_for = medir_tiempo(sumar_con_bucle_for, array)
    print(f"Tiempo con bucle for (array de NumPy): {tiempo_for:.6f} segundos")

    # Sumar los elementos usando numpy.sum()
    suma_numpy, tiempo_numpy = medir_tiempo(sumar_con_numpy_sum, array)
    print(f"Tiempo con numpy.sum(): {tiempo_numpy:.6f} segundos")

    # Verificar que ambos resultados son iguales
    assert suma_for == suma_numpy, "Los resultados de las sumas no coinciden"
    print(f"\nSuma total: {suma_numpy}")

if __name__ == "__main__":
    main()

Tiempo con bucle for (array de NumPy): 0.531682 segundos
Tiempo con numpy.sum(): 0.440270 segundos

Suma total: 499999500000


3.3 B)

El tiempo con el codigo original implementando Numpy es: 
1. Con bucle for (array de NumPy): 0.668079 segundos
2. Tiempo con numpy.sum(): 0.001438 segundos

Con la implementacion de @njit es de:
1. Tiempo con bucle for (array de NumPy): 0.498631 segundos
2. Tiempo con numpy.sum(): 0.472952 segundos

En teoría, la implementación de @njit debería optimizar los tiempos, pero no se da así. Posibles explicaciones:
1. numpy.sum() ya está altamente optimizado: numpy está escrito en C y ya tiene implementaciones altamente optimizadas. Como resultado, el uso de Numba en el código que llama a numpy.sum() no necesariamente acelerará más, porque numpy.sum() ya está ejecutándose muy rápido.
2. Numba no optimiza bien las funciones de alto nivel de NumPy: Aunque Numba acelera el código que involucra operaciones en bucles, cuando usas funciones de alto nivel como numpy.sum(), Numba no puede mejorar significativamente su rendimiento, ya que estas funciones están optimizadas a un nivel más bajo dentro de numpy.
3. El overhead de Python y Numba: Para el caso presente, donde el cálculo es muy simple (solo una suma), el uso de un bucle en Python y su optimización con Numba puede no ser suficientemente beneficioso, ya que el tiempo que tarda Numba en compilar y optimizar puede ser mayor que el tiempo de ejecución del cálculo mismo.