### Reduction operation: the sum of the numbers in the range [0, a)

In [4]:
import sys

# Valor por defecto
default_value = 10**6
value = default_value

# Comprobamos si hay más de un argumento (el script en sí es el primero)
if len(sys.argv) > 1:
    # Intentamos convertir el primer argumento a un entero
    try:
        value = int(sys.argv[1])
    except ValueError:
        # Si la conversión falla (porque no es un número), usamos el valor por defecto
        print(f"Advertencia: El argumento '{sys.argv[1]}' no es un número válido. Se usará el valor por defecto: {default_value}.")
        value = default_value
    except IndexError:
        # Esto captura si sys.argv[1] no existe por alguna razón inesperada
        print(f"Advertencia: No se encontró un argumento válido. Se usará el valor por defecto: {default_value}.")
        value = default_value

print(f"Operación de reducción con {value} elementos")

Advertencia: El argumento '-f' no es un número válido. Se usará el valor por defecto: 1000000.
Operación de reducción con 1000000 elementos


In [5]:
import time

# Crear lista de 10**6 elementos
lista = list(range(10**6))

# a) Suma con bucle for
start = time.time()
total = 0
for num in lista:
    total += num
end = time.time()
print(f"Suma con for sobre lista: {total}, tiempo: {end - start:.4f} s")

# b) Suma con función sum
start = time.time()
total = sum(lista)
end = time.time()
print(f"Suma con sum(lista): {total}, tiempo: {end - start:.4f} s")


Suma con for sobre lista: 499999500000, tiempo: 0.4455 s
Suma con sum(lista): 499999500000, tiempo: 0.0310 s


In [6]:
import numpy as np

# Convertir la lista anterior a un array de numpy
array = np.array(lista)

# a) Suma con bucle for
start = time.time()
total = 0
for num in array:
    total += num
end = time.time()
print(f"Suma con for sobre array NumPy: {total}, tiempo: {end - start:.4f} s")

# b) Suma con numpy.sum
start = time.time()
total = np.sum(array)
end = time.time()
print(f"Suma con np.sum(array): {total}, tiempo: {end - start:.4f} s")


Suma con for sobre array NumPy: 499999500000, tiempo: 0.9365 s
Suma con np.sum(array): 499999500000, tiempo: 0.0025 s


In [7]:
from numba import njit
import numpy as np
import time

# Decorador de Numba para compilación
@njit
def suma_numba_loop(arr):
    total = 0
    for i in range(len(arr)):
        total += arr[i]
    return total

array_np = np.arange(10**6)

# a) Suma con bucle for y numba
start = time.time()
resultado = suma_numba_loop(array_np)
end = time.time()
print("Suma con Numba + for:", resultado)
print("Tiempo con Numba + for:", end - start)

# b) Suma directa con numpy (sin Numba, como referencia)
start = time.time()
resultado = np.sum(array_np)
end = time.time()
print("Suma con NumPy sum():", resultado)
print("Tiempo con NumPy sum():", end - start)



Suma con Numba + for: 499999500000
Tiempo con Numba + for: 3.9789562225341797
Suma con NumPy sum(): 499999500000
Tiempo con NumPy sum(): 0.002428293228149414


### Comparación de rendimiento entre los métodos

1. **Código original**: Implementa la suma con un bucle for, recorriendo un rango de números. Es la forma más básica y lenta, ya que no utiliza estructuras optimizadas.
2. **Con listas de Python**:
   - El bucle for sigue siendo lento, aunque un poco más rápido que el código original.
   - Usar `sum(lista)` es mucho más eficiente, ya que está optimizado internamente.
3. **Con NumPy**:
   - El bucle for sobre un array de NumPy es algo más rápido que sobre listas, pero aún ineficiente comparado con métodos vectorizados.
   - Usar `np.sum(array)` es el método más rápido, ya que NumPy opera a nivel de bajo nivel en C.

En resumen, el uso de estructuras de datos optimizadas como `numpy.array` y funciones vectorizadas (`np.sum`) permite mejorar considerablemente el rendimiento en operaciones de reducción como esta.
