### Reduction operation: the sum of the numbers in the range [0, a)

In [1]:
import time

def reduc_operation(a):
    """Compute the sum of the numbers in the range [0, a)."""
    x = 0
    for i in range(a):
        x += i
    return x

# Secuencial

value = 1000000

initialTime = time.time()
suma = reduc_operation(value)
finalTime = time.time()

print("Time taken by reduction operation:", (finalTime - initialTime), "seconds")

# Utilizando las operaciones mágicas de ipython
%timeit -r 2 reduc_operation(value)

print(f"\n \t Computing the sum of numbers in the range [0, value): {suma}\n")

Time taken by reduction operation: 0.08183670043945312 seconds
75.6 ms ± 1.22 ms per loop (mean ± std. dev. of 2 runs, 10 loops each)

 	 Computing the sum of numbers in the range [0, value): 499999500000



# APARTADO 3.2 a)

In [3]:
import time

def reduc_operation_list_for(lista):
    """Compute the sum of the numbers in the list using a for loop."""
    x = 0
    for i in lista:
        x += i
    return x

def reduc_operation_list_sum(lista):
    """Compute the sum of the numbers in the list using the built-in sum function."""
    return sum(lista)

# Crear una lista con 10^6 elementos
value = 10**6
lista = list(range(value))

# Suma usando bucle for
initialTime = time.time()
suma_for = reduc_operation_list_for(lista)
finalTime = time.time()
print("Time taken by reduction operation with for loop (list):", (finalTime - initialTime), "seconds")

# Suma usando la función sum()
initialTime = time.time()
suma_builtin = reduc_operation_list_sum(lista)
finalTime = time.time()
print("Time taken by reduction operation with sum() (list):", (finalTime - initialTime), "seconds")

print(f"\n\tComputing the sum of numbers in the list: {suma_for}\n")


Time taken by reduction operation with for loop (list): 0.12814784049987793 seconds
Time taken by reduction operation with sum() (list): 0.016636133193969727 seconds

	Computing the sum of numbers in the list: 499999500000



# APARTADO 3.2 b)

In [5]:
import numpy as np
import time

def reduc_operation_array_for(array):
    """Compute the sum of the numbers in the array using a for loop."""
    x = 0
    for i in array:
        x += i
    return x

def reduc_operation_array_sum(array):
    """Compute the sum of the numbers in the array using numpy's sum function."""
    return np.sum(array)

# Crear un array de NumPy con 10^6 elementos
value = 10**6
array = np.array(range(value))

# Suma usando bucle for
initialTime = time.time()
suma_for = reduc_operation_array_for(array)
finalTime = time.time()
print("Time taken by reduction operation with for loop (NumPy array):", (finalTime - initialTime), "seconds")

# Suma usando np.sum()
initialTime = time.time()
suma_numpy = reduc_operation_array_sum(array)
finalTime = time.time()
print("Time taken by reduction operation with np.sum() (NumPy array):", (finalTime - initialTime), "seconds")

print(f"\n\tComputing the sum of numbers in the array: {suma_numpy}\n")


Time taken by reduction operation with for loop (NumPy array): 0.1605381965637207 seconds
Time taken by reduction operation with np.sum() (NumPy array): 0.0008482933044433594 seconds

	Computing the sum of numbers in the array: 499999500000



# APARTADO 3.2 c)

### Explicación de Resultados

Los resultados obtenidos por los tres procedimientos muestran diferencias significativas en términos de tiempos de ejecución. A continuación, se describe cada caso:

1. **Código Original (Secuencial con `range`)**
   - Este código utiliza un bucle `for` sobre el rango `[0, a)` para realizar la operación de reducción. Aunque es sencillo y fácil de entender, no está optimizado para la gestión de memoria ni para operaciones en paralelo.
   - El tiempo de ejecución refleja las limitaciones de Python puro para manejar iteraciones elementales de manera eficiente.

2. **Código con `Lists`**
   - **Bucle `for` con listas:**
     - Similar al código original, pero aplicado a una lista explícita en lugar de un rango. Aunque ambos tiempos son comparables, operar directamente sobre listas es marginalmente más lento porque la lista ocupa más memoria y tiene un mayor costo de gestión.
   - **`sum()` con listas:**
     - La función `sum()` es significativamente más rápida porque está optimizada internamente en C. Esto evita la iteración explícita y aprovecha implementaciones de bajo nivel.

3. **Código con `NumPy`**
   - **Bucle `for` con arrays de NumPy:**
     - A pesar de que NumPy está diseñado para operaciones vectorizadas, el uso de un bucle explícito no aprovecha estas optimizaciones. De hecho, el tiempo es similar al bucle `for` con listas debido a la sobrecarga de la interfaz de NumPy.
   - **`np.sum()` con NumPy:**
     - Este es el método más rápido con diferencia. `np.sum()` está altamente optimizado para realizar operaciones vectorizadas, utilizando memoria contigua y rutinas escritas en C.

### Conclusión

1. **El método más eficiente es `np.sum()` con arrays de NumPy**, que aprovecha las optimizaciones vectorizadas y reduce el tiempo de ejecución en órdenes de magnitud.
2. **La función `sum()` en listas** también es mucho más rápida que los bucles explícitos, pero sigue siendo menos eficiente que `np.sum()` debido a la falta de optimización para memoria contigua.
3. **Los bucles `for` (ya sea en listas o NumPy)** son los menos eficientes, y reflejan las limitaciones del enfoque secuencial y la gestión de memoria en Python puro.

Por lo tanto, para operaciones de reducción en datos grandes, **NumPy es la mejor elección**, especialmente cuando se usan funciones optimizadas como `np.sum()`.


# APARTADO 3.3 a)

In [9]:
from numba import njit
import numpy as np
import time

# Definir las funciones optimizadas con Numba

@njit
def reduc_operation_array_for_numba(array):
    """Compute the sum of the numbers in the array using a for loop with Numba."""
    x = 0
    for i in array:
        x += i
    return x

@njit
def reduc_operation_array_sum_numba(array):
    """Compute the sum of the numbers in the array using numpy's sum function."""
    return np.sum(array)

# Crear un array de NumPy compatible con Numba
value = 10**6
array = np.array(range(value), dtype=np.int32)  # Usar dtype=np.int32 para compatibilidad con Numba

# Ejecutar la suma con bucle for con Numba (primera y segunda ejecución)
print("Ejecución con Numba: Bucle for")
initialTime = time.time()
suma_for_numba = reduc_operation_array_for_numba(array)  # Primera ejecución (compilación JIT)
finalTime = time.time()
print("Primera ejecución (incluye compilación JIT):", (finalTime - initialTime), "segundos")

initialTime = time.time()
suma_for_numba = reduc_operation_array_for_numba(array)  # Segunda ejecución (ya compilada)
finalTime = time.time()
print("Segunda ejecución (ya compilada):", (finalTime - initialTime), "segundos")

# Ejecutar la suma con np.sum() con Numba (primera y segunda ejecución)
print("\nEjecución con Numba: np.sum()")
initialTime = time.time()
suma_numpy_numba = reduc_operation_array_sum_numba(array)  # Primera ejecución (compilación JIT)
finalTime = time.time()
print("Primera ejecución (incluye compilación JIT):", (finalTime - initialTime), "segundos")

initialTime = time.time()
suma_numpy_numba = reduc_operation_array_sum_numba(array)  # Segunda ejecución (ya compilada)
finalTime = time.time()
print("Segunda ejecución (ya compilada):", (finalTime - initialTime), "segundos")

# Mostrar resultados
print(f"\n\tSum using for loop with Numba: {suma_for_numba}")
print(f"\tSum using np.sum() with Numba: {suma_numpy_numba}")


Ejecución con Numba: Bucle for
Primera ejecución (incluye compilación JIT): 1.0856499671936035 segundos
Segunda ejecución (ya compilada): 0.000946044921875 segundos

Ejecución con Numba: np.sum()
Primera ejecución (incluye compilación JIT): 0.22816109657287598 segundos
Segunda ejecución (ya compilada): 0.0005381107330322266 segundos

	Sum using for loop with Numba: 499999500000
	Sum using np.sum() with Numba: 499999500000


# APARTADO 3.3 b)

Cuando usamos @njit de Numba, la función decorada no se ejecuta directamente como lo haría una función normal de Python. En cambio, durante la primera ejecución, Numba compila el código Python a código máquina optimizado para la arquitectura de tu CPU. Esto añade un costo inicial de compilación que se refleja en un tiempo más alto. En las ejecuciones posteriores, la función ya está compilada, por lo que se ejecuta mucho más rápido (directamente en código máquina).

**Bucle for con Numba:**
Mejora mucho porque Python puro gestiona bucles de forma interpretada, lo que añade una gran sobrecarga. Cada operación dentro del bucle se traduce a múltiples llamadas a nivel bajo. Numba convierte el bucle en código máquina, eliminando esta sobrecarga y acelerando las operaciones elementales (suma, iteración).
Resultado: El tiempo baja de 1 segundo en la primera ejecución a menos de 1 milisegundo en la segunda.

**np.sum() con Numba:**
No mejora tanto porque np.sum() ya está implementado y optimizado en C dentro de NumPy. Cuando lo llamas en Python, no pasa por el intérprete de Python, sino que ejecuta directamente el código optimizado de NumPy. Aunque decorarlo con @njit permite que Numba compile la función en la que se usa np.sum(), Numba no optimiza las funciones internas de NumPy, ya que estas son externas al ecosistema de Numba.
Resultado: np.sum() ya es muy eficiente, y el impacto de Numba es mínimo. En este caso, la mejora observada probablemente se deba a la eliminación del overhead de Python alrededor de la llamada a np.sum().
