In [None]:
# Imports y argumentos

import numpy as np
import time
import sys
from multiprocessing import Pool
from numba import njit, prange

value = int(sys.argv[1])
ncores = int(sys.argv[2])

print("========================================")
print("Reducción de array")
print(f"Número de elementos: {value}")
print(f"Número de núcleos: {ncores}")
print("========================================")


In [None]:
#Generación del array

A = np.random.rand(value)

In [None]:
# Código original (SIN optimizar)

def reduc_operation(A):
    s = 0.0
    for i in range(len(A)):
        s += A[i]
    return s

if ncores == 1:
    print("\n--- Código original en Python ---")
    t0 = time.time()
    res = reduc_operation(A)
    t1 = time.time()
    print("Resultado:", res)
    print("Tiempo:", t1 - t0, "s")

# Código original (Con Numpy)
print("\n--- NumPy sum ---")
t0 = time.time()
res_np = np.sum(A)
t1 = time.time()
print("Resultado:", res_np)
print("Tiempo:", t1 - t0, "s")


In [None]:
# Multiprocessing

def split_array(A, n):
    return np.array_split(A, n)

def reduc_mp(A, nproc):
    chunks = split_array(A, nproc)
    with Pool(processes=nproc) as pool:
        partial = pool.map(reduc_operation, chunks)
    return sum(partial)


print("\n--- multiprocessing Pool ---")
t0 = time.time()
res_mp = reduc_mp(A, ncores)
t1 = time.time()
print("Resultado:", res_mp)
print("Tiempo:", t1 - t0, "s")


In [None]:
# Numba secuencial

@njit
def reduc_operation_numba(A):
    s = 0.0
    for i in range(len(A)):
        s += A[i]
    return s

print("\n--- Numba njit ---")
t0 = time.time()
res_nb = reduc_operation_numba(A)
t1 = time.time()
print("Resultado:", res_nb)
print("Tiempo:", t1 - t0, "s")


In [None]:
# Numba paralelo

@njit(parallel=True)
def reduc_operation_numba_par(A):
    s = 0.0
    for i in prange(len(A)):
        s += A[i]
    return s
    
print("\n--- Numba njit(parallel=True) ---")
t0 = time.time()
res_nb_par = reduc_operation_numba_par(A)
t1 = time.time()
print("Resultado:", res_nb_par)
print("Tiempo:", t1 - t0, "s")


# Resultados y análisis:

## Resultados para value = 10⁸

**Número de núcleos: 1**

* Código original (Python):
  Resultado: 50007906.66791116
  Tiempo: 17.84 s

* NumPy sum:
  Resultado: 50007906.66791143
  Tiempo: 0.066 s

* Multiprocessing Pool:
  Resultado: 50007906.66791116
  Tiempo: 19.61 s

* Numba `@njit`:
  Resultado: 50007906.66791116
  Tiempo: 1.42 s

* Numba `@njit(parallel=True)`:
  Resultado: 50007906.66791116
  Tiempo: 0.58 s

---

**Número de núcleos: 2**

* NumPy sum:
  Resultado: 50000780.04739862
  Tiempo: 0.097 s

* Multiprocessing Pool:
  Resultado: 50000780.04738442
  Tiempo: 10.44 s

* Numba `@njit`:
  Resultado: 50000780.047405854
  Tiempo: 0.62 s

* Numba `@njit(parallel=True)`:
  Resultado: 50000780.04738442
  Tiempo: 0.52 s

---

**Número de núcleos: 4**

* NumPy sum:
  Resultado: 49998405.76012544
  Tiempo: 0.066 s

* Multiprocessing Pool:
  Resultado: 49998405.760119274
  Tiempo: 6.05 s

* Numba `@njit`:
  Resultado: 49998405.76012519
  Tiempo: 0.62 s

* Numba `@njit(parallel=True)`:
  Resultado: 49998405.760119274
  Tiempo: 0.49 s

---

**Número de núcleos: 8**

* NumPy sum:
  Resultado: 50002923.89202167
  Tiempo: 0.066 s

* Multiprocessing Pool:
  Resultado: 50002923.892021865
  Tiempo: 3.60 s

* Numba `@njit`:
  Resultado: 50002923.89200575
  Tiempo: 0.62 s

* Numba `@njit(parallel=True)`:
  Resultado: 50002923.89202187
  Tiempo: 0.49 s

---

## Resultados para value = 10⁹

**Número de núcleos: 1**

* Código original (Python):
  Resultado: 500006733.3883506
  Tiempo: 178.93 s

* NumPy sum:
  Resultado: 500006733.38829154
  Tiempo: 0.69 s

* Multiprocessing Pool:
  Resultado: 500006733.3883506
  Tiempo: 196.71 s

* Numba `@njit`:
  Resultado: 500006733.3883506
  Tiempo: 2.46 s

* Numba `@njit(parallel=True)`:
  Resultado: 500006733.3883506
  Tiempo: 1.62 s

---

**Número de núcleos: 2**

* NumPy sum:
  Resultado: 499998726.16406137
  Tiempo: 0.69 s

* Multiprocessing Pool:
  Resultado: 499998726.164073
  Tiempo: 114.07 s

* Numba `@njit`:
  Resultado: 499998726.1641369
  Tiempo: 1.69 s

* Numba `@njit(parallel=True)`:
  Resultado: 499998726.164073
  Tiempo: 1.05 s

---

**Número de núcleos: 4**

* NumPy sum:
  Resultado: 500005251.1686902
  Tiempo: 0.71 s

* Multiprocessing Pool:
  Resultado: 500005251.1686384
  Tiempo: 60.70 s

* Numba `@njit`:
  Resultado: 500005251.1683349
  Tiempo: 2.43 s

* Numba `@njit(parallel=True)`:
  Resultado: 500005251.16863847
  Tiempo: 0.77 s

---

**Número de núcleos: 8**

* NumPy sum:
  Resultado: 500015928.327814
  Tiempo: 0.69 s

* Multiprocessing Pool:
  Resultado: 500015928.32780725
  Tiempo: 35.52 s

* Numba `@njit`:
  Resultado: 500015928.3279121
  Tiempo: 1.76 s

* Numba `@njit(parallel=True)`:
  Resultado: 500015928.32780725
  Tiempo: 0.67 s

---

# **ANÁLISIS COMPARATIVO DE RESULTADOS (10⁸ vs 10⁹)**

Nuevamente, los resultados muestran el impacto del tamaño del problema en la eficiencia de las distintas estrategias de reducción. Para **10⁸ elementos**, el código original en Python requiere alrededor de **18 s**, mientras que para **10⁹ elementos** el tiempo aumenta hasta **179 s**, lo que evidencia su mala escalabilidad. NumPy, en cambio, mantiene tiempos más pequeños, pasando de **~0.06 s** a **~0.69 s**, lo que indica un escalado casi lineal y una implementación altamente optimizada.

El uso de **multiprocessing** presenta una mejora progresiva al aumentar el número de núcleos en ambos casos. Sin embargo, incluso con **8 cores**, los tiempos siguen siendo algo elevados (**~3.6 s para 10⁸** y **~35.5 s para 10⁹**), debido al alto overhead de creación de procesos y comunicación entre ellos, lo que limita su eficiencia.

Numba ofrece un rendimiento claramente superior. La versión `@njit` reduce el tiempo a **~0.62 s (10⁸)** y **~2.4 s (10⁹)**, mostrando un buen escalado con el tamaño del problema. Al activar el paralelismo con `@njit(parallel=True)`, se obtienen los mejores resultados en ambos casos, alcanzando **~0.49 s con 10⁸** y **~0.67 s con 10⁹** utilizando 8 núcleos.

Comparando ambos tamaños, se observa que **NumPy y Numba paralelo escalan casi linealmente**, multiplicando su tiempo aproximadamente por 10 al pasar de 10⁸ a 10⁹ elementos, mientras que el código Python y multiprocessing se ven mucho más penalizados. En conjunto, los resultados confirman que **Numba con paralelización es la estrategia más eficiente y escalable** para este tipo de operaciones numéricas con números tan grandes.