# Actividad 5:
# Lenguajes de programación para cómputo paralelo

### Dra. Magali Arellano Vázquez

* Materia: Cómputo de Alto Rendimiento
* Programa: Maestría en Ciencia de Datos e Información, INFOTEC
* Docente:  Dr. Juliho Castillo Colmenares
* Alumno: Rodrigo Guarneros Gutiérrez


In [6]:
import math
import time

n = int(input("Incluye el valor de n, número de divisiones en la suma de Rimman: "))

PI25DT = 3.141592653589793238462643
h = 1.0 / float(n)
sum = 0.0

start_time = time.time()

for i in range(1, n + 1):
    x = h * (float(i) - 0.5)
    sum += (4.0 / (1.0 + x * x))

pi = sum * h

end_time = time.time()

execution_time = end_time - start_time
execution_time_str = "{:.1000f}".format(execution_time)

print(f"La aproximación del valor de PI es: {pi}, con un error de {abs(pi - PI25DT)}")
print(f"El tiempo de ejecución: {execution_time} segundos")


Incluye el valor de n, número de divisiones en la suma de Rimman:  10000000


La aproximación del valor de PI es: 3.141592653589731, con un error de 6.217248937900877e-14
El tiempo de ejecución: 2.482882261276245 segundos


# Con el código de c++ y la paralelización en utilizando el fram MPI se obtiene mayor eficiencia en términos del tiempo de ejecución para el mismo número de iteraciones n=10,000,000. 

![image.png](pi2c.png)

Se obtuvo algo muy similar: 

![image.png](pi2.png)

Lo que implica una eficiencia **68.42 veces mayor en términos del tiempo de ejecución, respecto a la versión no paralela**

In [7]:
2.482882261276245/0.036291

68.41592299127181

In [8]:
!pip install mpi4py





In [12]:
from mpi4py import MPI
import math
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

n = 0
precision = 0
PI25DT = 3.141592653589793238462643
h, local_sum, global_sum, pi = 0.0, 0.0, 0.0, 0.0

if rank == 0:
    # Process 0 reads the value of 'n' and the precision factor from the user
    n = int(input("Enter the value of n: "))
    precision = int(input("Enter the precision factor: "))

# Broadcast 'n' and 'precision' from process 0 to all other processes
n = comm.bcast(n, root=0)
precision = comm.bcast(precision, root=0)

# Start measuring time
start_time = time.time()

h = 1.0 / float(n)
local_sum = 0.0

# Calculate the local sum for this process
for i in range(rank + 1, n + 1, size):
    x = h * (float(i) - 0.5)
    local_sum += (4.0 / (1.0 + x * x))

# Use MPI Reduce to combine local sums into the global sum
global_sum = comm.reduce(local_sum, op=MPI.SUM, root=0)

# Stop measuring time
end_time = time.time()

# Print rank and size of each process
print("Process {} of {} says: Local sum: {}".format(rank, size, local_sum))

# Calculate PI on process 0
if rank == 0:
    pi = global_sum * h
    print("La aproximacion del valor de PI es: {:.15f}, con un error de {:.15f}".format(pi, abs(pi - PI25DT)))
    print("Time elapsed in parallel part: {:.4f} seconds".format(end_time - start_time))


Enter the value of n:  10000000
Enter the precision factor:  3


Process 0 of 1 says: Local sum: 31415926.53589731
La aproximacion del valor de PI es: 3.141592653589731, con un error de 0.000000000000062
Time elapsed in parallel part: 2.3800 seconds


In [13]:
from mpi4py import MPI
import math
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

n = 0
precision = 0
PI25DT = 3.141592653589793238462643
h, local_sum, global_sum, pi = 0.0, 0.0, 0.0, 0.0

if rank == 0:
    # Process 0 reads the value of 'n' and the precision factor from the user
    n = int(input("Enter the value of n: "))
    precision = int(input("Enter the precision factor: "))

# Broadcast 'n' and 'precision' from process 0 to all other processes
n = comm.bcast(n, root=0)
precision = comm.bcast(precision, root=0)

# Start measuring time
start_time = time.time()

h = 1.0 / float(n)
local_sum = 0.0

# Calculate the local sum for this process
for i in range(rank + 1, n + 1, size):
    x = h * (float(i) - 0.5)
    local_sum += (4.0 / (1.0 + x * x))

# Use MPI Reduce to combine local sums into the global sum
global_sum = comm.reduce(local_sum, op=MPI.SUM, root=0)

# Stop measuring time
end_time = time.time()

# Print rank, size, and local sum of each process
print("Process {} of {} says: Rank: {}, Size: {}, Local sum: {}".format(rank, size, rank, size, local_sum))

# Calculate PI on process 0
if rank == 0:
    pi = global_sum * h
    print("La aproximacion del valor de PI es: {:.15f}, con un error de {:.15f}".format(pi, abs(pi - PI25DT)))
    print("Time elapsed in parallel part: {:.4f} seconds".format(end_time - start_time))


Enter the value of n:  10000000
Enter the precision factor:  3


Process 0 of 1 says: Rank: 0, Size: 1, Local sum: 31415926.53589731
La aproximacion del valor de PI es: 3.141592653589731, con un error de 0.000000000000062
Time elapsed in parallel part: 2.4270 seconds


In [14]:
from mpi4py import MPI
import math
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

n = 0
precision = 0
PI25DT = 3.141592653589793238462643
h, local_sum, global_sum, pi = 0.0, 0.0, 0.0, 0.0

if rank == 0:
    # Process 0 reads the value of 'n' and the precision factor from the user
    n = int(input("Enter the value of n: "))
    precision = int(input("Enter the precision factor: "))

# Broadcast 'n' and 'precision' from process 0 to all other processes
n = comm.bcast(n, root=0)
precision = comm.bcast(precision, root=0)

# Start measuring time
start_time = time.time()

h = 1.0 / float(n)
local_sum = 0.0

# Calculate the local sum for this process
for i in range(rank + 1, n + 1, size):
    x = h * (float(i) - 0.5)
    local_sum += (4.0 / (1.0 + x * x))

# Use MPI Reduce to combine local sums into the global sum
global_sum = comm.reduce(local_sum, op=MPI.SUM, root=0)

# Stop measuring time
end_time = time.time()

# Print rank, size, and local sum of each process
print("Process {} of {} says: Rank: {}, Size: {}, Local sum: {}".format(rank, size, rank, size, local_sum))

# Calculate PI on process 0
if rank == 0:
    pi = global_sum * h
    print("La aproximacion del valor de PI es: {:.15f}, con un error de {:.15f}".format(pi, abs(pi - PI25DT)))
    print("Time elapsed in parallel part: {:.4f} seconds".format(end_time - start_time))


Enter the value of n:  10000000
Enter the precision factor:  4


Process 0 of 1 says: Rank: 0, Size: 1, Local sum: 31415926.53589731
La aproximacion del valor de PI es: 3.141592653589731, con un error de 0.000000000000062
Time elapsed in parallel part: 2.3541 seconds


In [15]:
mpiexec -n 4 python pi_parallel.py

SyntaxError: invalid syntax (3354355059.py, line 1)

# Referencias

- [@Dra. Magali Arellano, 2023], Clasificación según Flynn, lecciones para la Unidad 2 de la materia de Cómputo de Alto Rendimiento. Disponible en: https://aulavirtual.infotec.mx/pluginfile.php/84972/mod_label/intro/02_1_Clasificacio%CC%81n_flynn.pdf 

- [@Dra. Magali Arellano, 2023], Tipos de paralelismo, lecciones para la Unidad 2 de la materia de Cómputo de Alto Rendimiento. Disponible en:  https://aulavirtual.infotec.mx/pluginfile.php/84972/mod_label/intro/02_2_tipos_paralelismo.pdf


In [16]:
len()

TypeError: len() takes exactly one argument (0 given)

In [None]:
4km/h a m/s   4km/h x 1000m/1km x 1h/3600s

In [17]:
4000/3600


1.1111111111111112

In [18]:
from mpi4py import MPI
import math
import time

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

n = 0
precision = 0
PI25DT = 3.141592653589793238462643
h, local_sum, global_sum, pi = 0.0, 0.0, 0.0, 0.0

if rank == 0:
    # Como insumos el numero de divisiones del intervalo y el factor de precisión
    # Entendido como el número de decimales que deseamos utilizar
    n = int(input("Indica el valor de n para la suma de Riemann: "))
    precision = int(input("Indica por favor el factor de precisión: "))

# Transmisión de 'n' y la 'precisión' del  process 0 a todos los procesos
n = comm.bcast(n, root=0)
precision = comm.bcast(precision, root=0)

# Inicia el proceso y se registra el tiempo inicial
start_time = time.time()

h = 1.0 / float(n) # el tamaño de cada incremento dado n
local_sum = 0.0 # se inicializa la suma

# Calcula la suma local con la función proporcionada
for i in range(rank + 1, n + 1, size):
    x = h * (float(i) - 0.5)
    local_sum += (4.0 / (1.0 + x * x))

# Utiliza MPI para combinar las sumas locales dentro de la suma global
global_sum = comm.reduce(local_sum, op=MPI.SUM, root=0)

# Se registr el tiempo de finalización del algorimo en su parte paralela
end_time = time.time()

# Resultados: Se imprime el Rank (número de orden), size (cantidad de procesos mpi)
# y la suma local de cada proceso
print("Proceso {} de {} el Rank (número de orden) es: {}, Size (cantidad de procesos) es: {}, Suma local es: {}".format(rank, size, rank, size, local_sum))

# Se calcula PI
if rank == 0:
    pi = global_sum * h
    print("La aproximación del valor de PI es: {:.15f}, con un error de {:.15f}".format(pi, abs(pi - PI25DT)))
    print("Tiempo total de ejecución en la parte paralela: {:.4f} segundos".format(end_time - start_time))


Indica el valor de n para la suma de Riemann:  10000000
Indica por favor el factor de precisión:  4


Proceso 0 de 1 el Rank (número de orden) es: 0, Size (cantidad de procesos) es: 1, Suma local es: 31415926.53589731
La aproximación del valor de PI es: 3.141592653589731, con un error de 0.000000000000062
Tiempo total de ejecución en la parte paralela: 4.1026 segundos


# Cadena de mensajes

In [1]:
from mpi4py import MPI
import time

# Nota: El programa se guarda en el archivo mensajes_paralelo2.py y se ejecuta con base en MS MPI
# La línea de comando es: $ mpiexec -n 4 python mensajes_paralelo2.py
# Elaboró: Rodrigo Guarneros Gutiérrez 

# dependencias
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

# preguntar por el número de procesos, debe ser menor al número de núcleos especificados en mpiexec, por ejemplo 
#  mpiexec -n 4 python mensajes_paralelo2.py
if rank == 0:
    num_processes = int(input("Introudce por favor el número de procesos (entre 2 y el número de núcleos): "))
else:
    num_processes = None


# Se transmite el número de procesos seleccionado por el usuario
num_processes = comm.bcast(num_processes, root=0)

# Se registra el tiempo inicial
start_time = time.time()

received_message = "Este mensaje es para"
received_initial = "Hola soy el proceso 0"

if rank == 0:
    print(received_initial)


# Envío y recepción encadenada de los mensajes
for i in range(1, num_processes):
    if rank == i:
        received_message = comm.recv(source=i-1)
        print(f"Soy el proceso {rank} y he recibido el mensaje de {i - 1} que dice: {received_message}")
    elif rank == i - 1:
        message = received_initial
        comm.send(message, dest=i)

# Se registra el tiempo de finalización del algoritmo
end_time = time.time()

# Se calcula el tiempo total de ejecución
total_elapsed_time = comm.reduce(end_time - start_time, op=MPI.SUM, root=0)

# Se imprime el tiempo total para conocimiento del usuario
if rank == 0:
    print(f"El tiempo total de este algoritmo fue de: {total_elapsed_time} segundos")

# Se concluye el proceso MPI
MPI.Finalize()


Introudce por favor el número de procesos (entre 2 y el número de núcleos):  4


Hola soy el proceso 0


Exception: Invalid rank, error stack:
MPI_Send(buf=0x000002289A5ED270, count=36, MPI_BYTE, dest=1, tag=0, MPI_COMM_WORLD) failed
Invalid rank has value 1 but must be nonnegative and less than 1

Enter the number of processes (must be at least 2): 4
Hola soy el proceso 0
Soy el proceso 1 y he recibido el mensaje de 0 que dice: Hola soy el proceso 0
Soy el proceso 2 y he recibido el mensaje de 1 y dice que 0 envio este mensaje: Soy el proceso 3 y he recibido el mensaje de 2 y dice que 0 envio este mensaje: Hola soy el proceso 0
El tiempo total de este algoritmo fue de: 0.0050466060638427734 segundos


In [2]:
from mpi4py import MPI
import sys
import numpy as np

def main():
    comm = MPI.COMM_WORLD
    rank = comm.Get_rank()
    size = comm.Get_size()

    tama = 100

    if len(sys.argv) > 1:
        tama = int(sys.argv[1])

    # Distribute the work evenly among processes
    local_tama = tama // size
    remainder = tama % size

    # Calculate the start and end indices for each process
    start = rank * local_tama
    end = start + local_tama

    if rank == size - 1:
        end += remainder

    # Create and fill the local arrays
    local_VectorA = np.arange(start + 1, end + 1)
    local_VectorB = np.arange(start * 10 + 10, end * 10 + 10)

    # Perform the local dot product
    local_total = np.sum(local_VectorA * local_VectorB)

    # Reduce the local totals to get the global total
    global_total = comm.reduce(local_total, op=MPI.SUM, root=0)

    if rank == 0:
        print(f"Total = {global_total}")

if __name__ == "__main__":
    main()


ValueError: invalid literal for int() with base 10: '-f'

# Referencias
- Microsoft MPI Documentation (mpiexec). Consultado el viernes 6 de octubre. Disponible en: 
https://learn.microsoft.com/en-us/powershell/high-performance-computing/mpiexec?view=hpc19-ps&source=recommendations