<a href="https://colab.research.google.com/github/jugernaut/ProgramacionEnParalelo/blob/desarrollo/MPI/MPI_SCP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>MPI (Intercambio de Mensajes)</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M.en.C. Miguel Angel Pérez León</i></h5>
    <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
    <h5 align="center"><i>Ayudante: Mario Arturo Nieto Butron</i></h5>
  <h5 align="center"><i>Materia: Seminario de programación en paralelo</i></h5>
  </font>

#Introducción

Hoy en día existe una gran cantidad de lenguajes para realizar computo en paralelo. Muchos de ellos, lenguajes de alto nivel que facilitan (y ocultan) muchos de los aspectos de manejar computo en paralelo.

Sin embargo hasta el momento no existe un solo lenguaje de alto nivel (por ejemplo java o python) que haya sido aceptado ampliamente por la comunidad del computo en paralelo.

La mayor parte del computo en paralelo se realiza utilizando lenguajes como *Fortran o C*, con funciones aumentadas (Message Passing Intreface MPI) que realizan el pase de mensajes entre procesos.

MPI continua siendo el estándar mas popular para el modelo de programación en paralelo mediante pase de mensajes.

Podríamos decir que la mayoría de las p.c's. actuales dan soporte para MPI y a su vez existen bibliotecas gratuitas que permiten realizar computo en paralelo.

Al igual que OpenMP, MPI es un conjunto de bibliotecas, funciones y directivas de compilador (API) que permite programar en paralelo en conjunto con lenguajes como* Fortran, C o C++*.

La principal característica de MPI es que este no se basa en un modelo de memoria compartida, por lo que la comunicación entre procesos se realiza mediante paso de mensajes.

Originalmente este API surgió con la intención de ser usado en un cluster (mediante una red), sin embargo con las crecientes mejoras en las arquitecturas de computadoras, MPI fue adaptado para sacar provecho de las mismas.

<center>
<img src="https://github.com/jugernaut/Numerico2021/blob/master/Imagenes/MPI/modelo.png?raw=1" width="600"> 
</center>

En estas 2 imágenes se muestra el modelo empleado por MPI, en el cuál no se tiene una memoria compartida (como con OpenMP) y los procesos se comunican mediante la red (network). Sin embargo en las arquitecturas actuales, en las cuales se tienen múltiples CPU's en una (o mas placas madre), la comunicación entre los mismos se realiza mediante el **BUS del sistema** que substituye a la red.

<center>
<img src="https://github.com/jugernaut/Numerico2021/blob/master/Imagenes/MPI/distributed_mem.gif?raw=1" width="600"> 
</center>

A diferencia de como funciona OpenMP, en MPI se tienen múltiples hilos (procesos ligeros) desde que comienza y hasta que termina el programa y la comunicación entre los distintos procesos se realiza mediante pase de mensajes.

<center>
<img src="https://github.com/jugernaut/Numerico2021/blob/master/Imagenes/MPI/initfinal.png?raw=1" width="600"> 
</center>



# Desempeño

Como ya se menciono MPI surge de la necesidad de realizar programación en paralelo sin asumir que se cuenta con una arquitectura en la cuál se tiene memoria compartida.




## ¿Como funciona?

La forma tradicional de la programación en paralelo empleando paso de mensajes es la siguiente:

*   Desde el momento en que se ejecuta un programa, se genera el número de procesos que llevaran a cabo el algoritmo.
*   Los procesos se comunican entre si enviando mensajes con la información necesaria.
*   Al termino de la o las secciones en paralelo, se junta el resultado del computo que hayan llevado a cabo los procesos.
*   Se devuelve un único resultado.

## Ventajas

La principal diferencia entre MPI y OpenMPes que en este ultimo, se comienza y se termina con un solo hilo y en MPI desde que comienza el algoritmo se tienen varios procesos activos.

Su principal ventaja es que **no se requiere arquitectura de memoria compartida** por lo que MPI puede ser empleando en casi cualquier sistema de computo en paralelo.

Los elementos que intervienen cuando se emplea MPI son: el **proceso que envía, el que recibe y el mensaje**.

Dependiendo de si el proceso que envía el mensaje requiere esperar o no, podemos pensar en que el paso de mensajes es de tipo **síncrono** o **asíncrono**.

Dentro del paso de mensajes síncrono se engloba a las **llamadas a procedimiento remoto**, que son muy populares en las arquitecturas cliente/servidor.

# MPI (API)

Una vez que se tiene claro el funcionaiento de MPI, veamos los componentes principales de este API, que al igual que OpenMP se trata de un conjunto de bibliotecas, funciones y directivas de compilador.

## Funciones importantes

Con MPI básicamente lo que tendremos son funciones y algunas de ellas son:

*   *MPI_Init*: instrucción que indica que haremos uso de MPI, si ella no es posible utilizar MPI.
*   *MPI_Comm_rank*: devuelve el identificador de un proceso.
*   *MPI_Comm_size*: muestra el numero de procesos.
*   *MPI_Reduce*: operación de reducción como en OpenMP.
*   *MPI_Finalize*: desconecta las funciones de MPI.
*   *MPI_Barrier*: función para sincronizar los procesos existentes.
*   *MPI_Wtime*: devuelve el tiempo en el momento de ser llamada.
*   *MPI_Wtick*: determina la precisión del timer.



 

# Compilación y Ejecución

Dado que MPI sigue siendo un API construido sobre el lenguaje *C/C++*, compilar y ejecutar un programa creado con MPI es similar a como se compila y ejecuta cualquier programa escrito en *C/C++*.

En esta sección verwmos como compilar y ejecutar programas escritos mediante MPI tanto en google colab como en un equipo local.

## MPI en Google Colab

Normalmente una vez iniciada la sesión de *google colab*, esta ya cuenta con todo lo necesario para compilar y ejecutar un programa usando MPI.

In [None]:
# variable de tipo String que en si es el programa
codigo = """
#include <mpi.h> //biblioteca de MPI
#include <stdio.h>

int main(int argc, char** argv) {
    // Llamada principal a las funciones de MPI
    MPI_Init(NULL, NULL);

    // Se obtiene el numero de procesos y se guarda en 
    int tam_mundo;
    MPI_Comm_size(MPI_COMM_WORLD, &tam_mundo);

    // Obtenemos el ID de cada proceso
    int id_proceso;
    MPI_Comm_rank(MPI_COMM_WORLD, &id_proceso);

    // Obtenemos el nombre del procesador
    char nombre_procesador[MPI_MAX_PROCESSOR_NAME];
    int tam_nombre;
    MPI_Get_processor_name(nombre_procesador, &tam_nombre);

    // Se imprime el mensaje completo
    printf("Hola mundo desde el procesador %s, id %d de un total de %d processors\\n",
           nombre_procesador, id_proceso, tam_mundo);

    // Cerramos las herramientas de MPI.
    MPI_Finalize();
}
"""

# se crea el archivo con permisos para escribir mediante python
archivo_texto = open("hola.c", "w")
# se escribe el programa en el archivo 
archivo_texto.write(codigo)
# se cierra el buffer de escritura
archivo_texto.close()

Una vez que ya se creó el archivo llamado *hola.c* lo siguiente es compilar el programa con el comando *mpicc*, de manera muy similar a como se hace con OpenMP.

In [None]:
!mpicc hola.c -o hola

En caso de no tener errores, podemos proceder a ejecutar el programa (binario hola) notando que la bandera *--allow-run-as-root* solo se debe usar en *google colab*.

La bandera *-np numero*, indica el número de procesos que se usarán al momento de la ejecución del programa.

In [None]:
!mpirun --allow-run-as-root -np 4 hola

Hola mundo desde el procesador f9fc85deca0a, id 0 de un total de 4 processors
Hola mundo desde el procesador f9fc85deca0a, id 1 de un total de 4 processors
Hola mundo desde el procesador f9fc85deca0a, id 2 de un total de 4 processors
Hola mundo desde el procesador f9fc85deca0a, id 3 de un total de 4 processors


## MPI en equipo local

De igual manera que OpenMP, una vez instalado el compilador y herramientas del lenguaje C (al menos en s.o. Linux) el API de MPI ya esta incluido con estas.

De tal forma que compilar y ejecutar código que emplea directivas y funciones de MPI es tan sencillo como:

Para compilar: 

*\$mpicc codigoc.c -o (salida.o) hola*

El comando anterior compila (y en caso de no haber errores) y genera un archivo ejecutable (binario) que puede ser ejecutado de la siguiente manera:

*\$mpirun hola*

Para ejecutar, se puede usar la bandera -np para indicar el numero de procesos que se desean generar:

*\$mpirun hola -np numero procesos*

#Glosario

Proceso: En el contexto de MPI un proceso, es un conjunto de instrucciones que son ejecutadas por el CPU.

Asíncrono: En computación un evento (proceso) asíncrono es aquel no tiene correspondencia temporal con otro evento. 

# Referencias

1. Michaell J. Quuin: Parallel Programming in C with OpenMP and MPI.
2. https://lsi.ugr.es/jmantas/ppr/ayuda/mpi_ayuda.php
3. Dongarra Foster: Source Book of parallel computing.