<a href="https://colab.research.google.com/github/ManuelR-D/PrograCTP2/blob/main/Ejercicios_2_MPI.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Programacion Concurrente TP2 Parte2 MPI 

Para este ejercicio se ha optado por aplicar el tema teórico **MPI** (Message Passing Interface). La finalidad del ejercicio es ampliar el conocimiento sobras la manera que posee Python para implementar la comunicación entre distintos procesos con el uso de una librería denominada **MPI4py** [1]. Para más información puede consultar la última revisión en [2].

Este ejercicio fue presentado por alumnos del curso 2020.

---
## 2.1. Ejercicio - Hola Mundo con MPI


### 2.1.1. Preguntas del ejercicio

Ejecute este ejemplo para $4$ o más instancias y responda:

a) ¿Qué función realiza la instancia maestra? ¿Qué función realizan las instancias esclavas?

La instancia maestra inicializa a las esclavas, luego les envia mensajes para que ejecuten un trabajo: se envia un mensaje a cada instancia esclava con un numero aleatorio entre `Min_tiempo_sleep` y `Max_tiempo_sleep`. Luego se queda esperando un receive del trabajo hecho por cada instancia esclava y finalmente suma a un contador la cantidad de trabajo hecho. Esto se repite en loop hasta que se reparte todo el trabajo.

Las instancias esclavas ejecutan el metodo `doWork()` el cual implica hacer un receive del mensaje enviado por la instancia maestra el cual contiene un numero, luego se suspende la ejecucion durante una cantidad de tiempo igual a ese numero y finalmente se envia un mensaje a la instancia maestra de que se termino de ejecutar el trabajo.

b) ¿Cuántas de esas instancias ejecuta la función `main()`, `initWork()` y `doWork()`?

Todas las instancias (4) ejecutan `main()`. Solo la maestra (1) ejecuta `initWork()` y solo las esclavas (4-1) ejecutan `doWork()`

c) ¿Cómo se diferencian los mensajes de trabajo o de finalización?

Con el `tag` del status del trabajo. Cada mensaje tiene un tag que permite se leido para modificar el flujo de ejecucion.

d) ¿Cómo implementaría la función BLAS `axpy()` con este patrón?¿Sería eficiente? *Tips*: Pide solo el planteo, no la implementación.

Dado que hay que hacer una multiplicacion de un escalar por un vector, se podria hacer distribuir la longitud del vector de manera uniforme entre la cantidad de procesos (Map) y multiplicar cada posicion por el valor escalar. Luego juntar todos los resultados parciales en otro vector en la instancia maestra (Reduce *) utilizando mensajes para comunicar los resultados.

Una estrategia similar se aplicaria a la suma de de los vectores. Se podria distribuir la longitud de los vectores de manera uniforme entre la cantidad de procesos, comunicar los valores por mensajes, hacer las sumas y luego reducir el resultado a otro vector en la instancia maestra usando otro mensaje para comunicar.

e) ¿Qué sucede cuando solo ejecuta con una sola instancia?

Nunca se ejecuta el metodo `doWork()` puesto que hay un condicional que impide que el proceso con `rank = 0` pueda ejecutarlo

f) *Punto opcional*: El código que ejecutan las instancias esclavas, tienen un error en su lógica. ¿Cómo se podría solucionar?

El send que hace el esclavo al maestro podria ser asincronico, puesto que el siguiente receive es sincronico y lo unico que debe esperar el esclavo es la respuesta del maestro con el nuevo trabajo a hacer. No hay necesidad por parte del esclavo de espera a que el maestro confirme la recepcion de su trabajo finalizado.

###2.1.2. Armado del ambiente

Es en donde se instalar, por única vez, el módulo MPI4py de Python en el cuaderno.

In [1]:
! pip install mpi4py

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/
Collecting mpi4py
  Downloading mpi4py-3.1.4.tar.gz (2.5 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m2.5/2.5 MB[0m [31m34.6 MB/s[0m eta [36m0:00:00[0m
[?25h  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
Building wheels for collected packages: mpi4py
  Building wheel for mpi4py (pyproject.toml) ... [?25l[?25hdone
  Created wheel for mpi4py: filename=mpi4py-3.1.4-cp310-cp310-linux_x86_64.whl size=3365632 sha256=bab6452867e76a907397531f1022ab8604391f1cfddd0d7a64b1893e31a30459
  Stored in directory: /root/.cache/pip/wheels/e8/1b/b5/97ec4cfccdde26e0f3590ad6e09a5242d508dff09704ef86c1
Successfully built mpi4py
Installing collected packages: mpi4py
Successfully installed mpi4py-3.1.4


### 2.1.3. Código del programa en Lenguaje Python 

In [2]:
%%writefile Ejercicio2.py
from mpi4py import MPI
import numpy as np
import time

# --------------------------------------------
# Formulario
Max_tiempo_sleep =   5#@param {type: "slider", min: 1, max: 10}
Min_tiempo_sleep =   0#@param {type: "slider", min: 0, max: 10}
# --------------------------------------------

# --------------------------------------------
# Constantes de comunicacion
WORK_FLAG = 1
END_WORK_FLAG = 2
# --------------------------------------------

def main():
    comm = MPI.COMM_WORLD # Instanciamos el tipo de comunicador a utilizar.
    id = comm.Get_rank()  # Obtenemos el id como atributo del proceso que se ejecuta.

    # Utilizamos el 0 para definir al procesos Maestro, cualquier otro id sera un esclavo.
    if (id == 0) :
        init() # Llamamos funcion init para eventos que requeriremos inicialmente solo 1 vez.
        numProcesses = comm.Get_size()  # Obtenemos el numero de procesos totales ejecutados.
        numTasks = (numProcesses-1)*4 # Se setea el numero de tareas.
        workTimes = generateTasks(numTasks) # Se generan las tareas, en este caso seran 
        print("El jefe crea {} horas de descanso de sus empleados:".format(workTimes.size), flush=True)
        print(workTimes, flush=True)
        initWork(comm, workTimes, numProcesses)
    else:
        doWork(comm)

def generateTasks(numTasks):
    #TODO: Cambiar la semilla del random para que se generen efectivamente diferentes numeros.
    np.random.seed(1000) 
    return np.random.randint(low=Min_tiempo_sleep, high=Max_tiempo_sleep, size=numTasks)

def init():
  print()
  print("Version MPI4py utilizada: {}".format(MPI.Get_version()), flush=True)
  print()
  print( "------------------------------------", flush=True)
  print( "Sistema de trabajo Suizo:", flush=True)
  print( "------------------------------------", flush=True)
  print()

def initWork(comm, workTimes, numProcesses):
    totalWork = workTimes.size
    workcount = 0
    recvcount = 0

    print("Jefe enviando las tareas iniciales:", flush=True)
    for id in range(1, numProcesses):
        if workcount < totalWork:
            work=workTimes[workcount]
            comm.send(work, dest=id, tag=WORK_FLAG) # Envia mensaje de iniciar trabajo con el dato correspondiente del array.
            workcount += 1
            print("Jefe envia trabajo y {} hs de descanso al empleado {}.".format(work, id), flush=True)
    print( "------------------------------------", flush=True)

    # Mientras haya trabajo, se recibe el resultado de los empleados y se sigue enviando MAS trabajo.
    while (workcount < totalWork) :
        stat = MPI.Status() 
        workTime = comm.recv(source=MPI.ANY_SOURCE, status=stat) # Recivimos resultados de los empleados.
        recvcount += 1
        workerId = stat.Get_source() # Obtenemos el identificador del empleado.
        print("Jefe recibe trabajo completado {} del empleado {}.".format(workTime, workerId), flush=True)
        #send next work
        work=workTimes[workcount]
        comm.send(work, dest=workerId, tag=WORK_FLAG) 
        workcount += 1
        print("Jefe envia nuevo trabajo y {} hs de descanso al empleado {}.".format(work, workerId), flush=True)

    while (recvcount < totalWork):
        stat = MPI.Status()
        workTime = comm.recv(source=MPI.ANY_SOURCE, status=stat)
        recvcount += 1
        workerId = stat.Get_source()
        print("Jefe recibe trabajo completado {} del empleado {}.".format(workTime, workerId), flush=True)

    for id in range(1, numProcesses):
        comm.send(0, dest=id, tag=END_WORK_FLAG)


def doWork(comm):
    while(True):
        stat = MPI.Status() # Obtiene el estado actual del empleado.
        waitTime = comm.recv(source=0, tag=MPI.ANY_TAG, status=stat) # Obtiene lo enviado por el Jefe.
        print("Soy el empleado con id {}, toca descanzo por {} hs.".format(comm.Get_rank(), waitTime), flush=True)

        if (stat.Get_tag() == END_WORK_FLAG):
            print("Marca tarjeta el empleado {}.".format(comm.Get_rank()), flush=True)
            return
        time.sleep(waitTime)
        comm.send(waitTime, dest=0)

main()


Writing Ejercicio2.py


### 2.1.4 Ejecución del programa

In [3]:
# --------------------------------------------
#@title Parámetros de ejecución { vertical-output: true }
NRO =   4#@param {type: "number"}
# --------------------------------------------

! mpirun --allow-run-as-root --oversubscribe -np $NRO python Ejercicio2.py


Version MPI4py utilizada: (3, 1)

------------------------------------
Sistema de trabajo Suizo:
------------------------------------

El jefe crea 12 horas de descanso de sus empleados:
[3 0 3 4 1 0 1 0 1 4 3 4]
Jefe enviando las tareas iniciales:
Jefe envia trabajo y 3 hs de descanso al empleado 1.
Jefe envia trabajo y 0 hs de descanso al empleado 2.
Jefe envia trabajo y 3 hs de descanso al empleado 3.
------------------------------------
Soy el empleado con id 2, toca descanzo por 0 hs.
Jefe recibe trabajo completado 0 del empleado 2.
Jefe envia nuevo trabajo y 4 hs de descanso al empleado 2.
Soy el empleado con id 2, toca descanzo por 4 hs.
Soy el empleado con id 3, toca descanzo por 3 hs.
Soy el empleado con id 1, toca descanzo por 3 hs.
Jefe recibe trabajo completado 3 del empleado 3.
Jefe envia nuevo trabajo y 1 hs de descanso al empleado 3.
Soy el empleado con id 3, toca descanzo por 1 hs.
Jefe recibe trabajo completado 3 del empleado 1.
Soy el empleado con id 1, toca descanzo

---
# Bibliografía

[1] MPI4py: https://mpi4py.readthedocs.io/en/stable/

[2] La versión oficial de MPI (Versión 4): https://www.mpi-forum.org/docs/mpi-4.0/mpi40-report.pdf

