# Ejercicicio Python

**For computacionalmente pesado**

In [12]:
import numpy as np
import time

# Crear arreglos grandes
n = 1000000
a = np.random.rand(n)
b = np.random.rand(n)

# Usar un bucle for para calcular la suma de los cuadrados
start_time = time.time()
result = 0
for i in range(n):
    result += a[i]**2 + b[i]**2
end_time = time.time()

print("Resultado:", result)
print("Tiempo for:", end_time - start_time, "segundos")


Resultado: 666744.5927605826
Tiempo for: 1.330897569656372 segundos


**Vectorización usando NumPy**

In [13]:
import numpy as np
import time

# Crear arreglos grandes
n = 1000000
a = np.random.rand(n)
b = np.random.rand(n)

# Usar NumPy para calcular la suma de los cuadrados
start_time = time.time()
result = np.sum(a**2 + b**2)
end_time = time.time()

print("Resultado:", result)
print("Tiempo con vectorización:", end_time - start_time, "segundos")

Resultado: 667006.9062176275
Tiempo con vectorización: 0.00972604751586914 segundos


**Paralelización usando joblib**

In [14]:
import numpy as np
import time
from joblib import Parallel, delayed

# Crear arreglos grandes
n = 1000000
a = np.random.rand(n)
b = np.random.rand(n)

# Definir una función para calcular la suma de los cuadrados de una porción del arreglo
def suma_cuadrados(start, end):
    result = 0
    for i in range(start, end):
        result += a[i]**2 + b[i]**2
    return result

# Dividir el trabajo en partes y usar joblib para paralelizarlo
num_jobs = 4  # Número de trabajos paralelos (cambiar según el número de núcleos de tu CPU)
chunk_size = n // num_jobs

start_time = time.time()
results = Parallel(n_jobs=num_jobs)(delayed(suma_cuadrados)(i*chunk_size, (i+1)*chunk_size) for i in range(num_jobs))
result = sum(results)
end_time = time.time()

print("Resultado:", result)
print("Tiempo con paralelización:", end_time - start_time, "segundos")


Resultado: 666448.0369473177
Tiempo con paralelización: 1.4657249450683594 segundos


**Multiprocessing**

In [15]:
import numpy as np
import time
import multiprocessing as mp

# Crear arreglos grandes
n = 1000000
a = np.random.rand(n)
b = np.random.rand(n)

# Definir una función para calcular la suma de los cuadrados de una porción del arreglo
def suma_cuadrados(start, end, a, b):
    result = 0
    for i in range(start, end):
        result += a[i]**2 + b[i]**2
    return result

# Dividir el trabajo en partes y usar multiprocessing para paralelizarlo
num_processes = 4  # Número de procesos paralelos (cambiar según el número de núcleos de tu CPU)
chunk_size = n // num_processes

start_time = time.time()

# Crear un pool de procesos
pool = mp.Pool(processes=num_processes)

# Dividir el trabajo y asignarlo a los procesos
results = [pool.apply_async(suma_cuadrados, args=(i*chunk_size, (i+1)*chunk_size, a, b)) for i in range(num_processes)]

# Recoger los resultados
results = [r.get() for r in results]

# Sumar los resultados parciales
result = sum(results)
end_time = time.time()

print("Resultado:", result)
print("Tiempo con multiprocessing:", end_time - start_time, "segundos")

# Cerrar el pool
pool.close()
pool.join()

Resultado: 666385.9987621247
Tiempo con multiprocessing: 1.0203678607940674 segundos


**Comparación de tiempos**

In [16]:
import numpy as np
import time
from joblib import Parallel, delayed
import multiprocessing as mp

# Crear arreglos grandes
n = 1000000
a = np.random.rand(n)
b = np.random.rand(n)

# Función para el bucle for
def for_loop(a, b):
    result = 0
    for i in range(n):
        result += a[i]**2 + b[i]**2
    return result

# Función para la vectorización
def vectorization(a, b):
    return np.sum(a**2 + b**2)

# Función auxiliar para joblib y multiprocessing
def suma_cuadrados(start, end, a, b):
    result = 0
    for i in range(start, end):
        result += a[i]**2 + b[i]**2
    return result

# Función para joblib
def joblib_parallel(a, b):
    num_jobs = 4
    chunk_size = n // num_jobs
    results = Parallel(n_jobs=num_jobs)(delayed(suma_cuadrados)(i*chunk_size, (i+1)*chunk_size, a, b) for i in range(num_jobs))
    return sum(results)

# Función para multiprocessing
def multiprocessing_parallel(a, b):
    num_processes = 4
    chunk_size = n // num_processes

    pool = mp.Pool(processes=num_processes)
    results = [pool.apply_async(suma_cuadrados, args=(i*chunk_size, (i+1)*chunk_size, a, b)) for i in range(num_processes)]
    results = [r.get() for r in results]
    pool.close()
    pool.join()
    return sum(results)

def time_function(func, *args):
    start_time = time.time()
    result = func(*args)
    end_time = time.time()
    print(f"Resultado de {func.__name__}: {result}")
    return end_time - start_time

if __name__ == '__main__':
    for_time = time_function(for_loop, a, b)
    print(f"Tiempo con bucle for: {for_time} segundos")

    vec_time = time_function(vectorization, a, b)
    print(f"Tiempo con vectorización: {vec_time} segundos")

    joblib_time = time_function(joblib_parallel, a, b)
    print(f"Tiempo con joblib: {joblib_time} segundos")

    mp_time = time_function(multiprocessing_parallel, a, b)
    print(f"Tiempo con multiprocessing: {mp_time} segundos")


Resultado de for_loop: 666454.3555772392
Tiempo con bucle for: 0.6184866428375244 segundos
Resultado de vectorization: 666454.3555772238
Tiempo con vectorización: 0.011045694351196289 segundos
Resultado de joblib_parallel: 666454.3555772294
Tiempo con joblib: 1.4504971504211426 segundos
Resultado de multiprocessing_parallel: 666454.3555772294
Tiempo con multiprocessing: 1.056535005569458 segundos
