# ¿Por qué MPI?
## Message Passing Interface
- Es el estándar $\textbf{de facto}$ para computación paralela en infraestructura de HPC (high performance computing)
- Tiene una amplia y bien establecida comunidad (desde 1994)
- Existe un gran ecosistema de herramientas y aplicaciones construidas sobre MPI

# Sistemas de memoria distribuida

### En un sistema de memoria distribuida, cada procesador tiene su propia memoria privada
### Una red interconecta a cada uno de los procesadores
### La ejecución de los programas se da de manera asíncrona, por lo que la sincronización debe de venir explícitamente por parte del programador

#  Paradigma de paso de mensajes
- Un programa paralelizado con MPI se descompone en cada uno de sus procesos, que de ahora en adelante llamaremos de manera indistinta $\textbf{ranks}$
- Cada proceso tiene una porción de los datos del programa en su memoria privada
- La comunicación entre los procesos se hace explícita mediante mensajes definidos por el programador
- Los canales de comunicación siguen el orden FIFO (first-in-first-out), o sea, el primer mensaje que llega es el primero que se procesa

# Características del paradigma de paso de mensajes
- Universalidad: se adecúa a distintos procesadores de distintas arquitecturas conectados a través de una red
- Expresividad: es útil para expresar cualquier tipo de algoritmo paralelo
- Rendimiento: las implementaciones pueden explotar de manera eficiente el hardware en el que ejecutan
- Simplicidad: los principios del paradigma son operaciones de comunicación tradicional

# ¿Qué es la Interfaz de Paso de Mensajes (MPI)?

- MPI es un estándar para operaciones de paso de mensajes
- Las operaciones se expresan como funciones, subrutinas o métodos dependiendo del lenguaje y la implementación
- Tiene como meta: 
    - Permitir la comunicación eficiente
    - Traslapar temporalmente las operaciones de comunicación y computación
    - Permitir implementaciones que puedan ser utilizadas en ambientes heterogéneos
- Algunas de sus implementaciones:
    - Open-source: MPICH, OpenMPI
    - Propietarias: Cray, IBM, Intel, etc.
- Lenguajes:
    - C/C++, Fortran, Python, Perl, Ruby, R, Java, CL, Haskell

# Procesos (ranks) de MPI
- Cada uno tiene:
 - Memoria privada
 - Un identificador único que corresponde a una numeración secuencial [0->n-1] (donde n es la cantidad de procesos que se lanzan)
 <img src = "ranks.png">

# Comunicadores
- Los comunicadores son estructuras organizacionales en las que se acomodan los ranks para facilitar la comunicación
- Todos los ranks están bajo un comunicador global (COMM_WORLD), pero se puede crear otros comunicadores con grupos de ranks específicos
<img src= "groups_comms.gif">

## Dentro de un comunicador, a cada proceso se le asigna un identificador único
## Sólo los procesos dentro de un mismo comunicador pueden enviarse mensajes entre sí


# Importación e instrucciones
## Lo primero que hay que hacer para ejecutar mpi en python en el cluster kabré es ejecutar en la consola de bash el siguiente comando:
#### module load intelpython/3.5
- Para importar la biblioteca utilizamos
    from mpi4py import MPI

- Para ejecutar los programas desde consola utilizamos $ \textbf{mpirun} $

# Instrucciones básicas de MPI
- Obtener el comunicador global:
    - comm = MPI.COMM_WORLD
    
- Tamaño del comunicador (cuántos procesos tiene):
    - size = comm.Get_size()
 
- Obtener el número de rank:
    - rank = comm.Get_rank()

# Ver ejemplo de código: hola.py

# Comunicación punto a punto
- Son instrucciones sincronizadas para enviar mensajes desde un rank emisor a uno receptor
<img src="send.png">

# Ver ejemplo de código: ejemplo_send_rcv.py

# Ejercicio
### Vamos a implementar un programa en paralelo que sea como un "ping-pong". El programa debe de enviar un mensaje con un contador que se intercambia entre dos ranks 1000 veces. El rank 1 va a incrementar el contador cada vez que lo recibe.

# Ejercicio
### Implemente un programa paralelo en python que cree un círculo de ranks. Cada uno genera un número aleatorio entre 0 y 100. El programa luego computa en cada rank la suma de todos los valores haciéndolos circular entre todos los ranks

<img src = "ring.png">

# Problemas con comunicación con bloqueo

### En el rank 0:
     comm.send(dato, dest=1)
     otro_dato = comm.recv(source = 1)
    
### En el rank 1:
     comm.send(otro_dato, dest=0)
     dato = comm.recv(source = 0)

- La comunicación con bloqueo sólo avanza a la siguiente instrucción si la operación de comunicación termina exitosamente
- Esto quiere decir que el receive debe de estar listo del otro lado para obtener el dato
- Si no se tiene cuidado, podría darse un $\textbf{deadlock}$

<img src = "deadlock.png">

# ¿Cómo resolver deadlocks?

## Reorganizar operaciones send & receive
    - Una estrategia podría ser que los ranks pares envíen primero y los impares reciban
    
## Dejar que MPI se encargue de eso
    - A través de la operación sendrecv
    
## Utilizar comunicación sin bloqueo
    - Isend y IRecv

# Ver ejemplo ejemplo_sendrecv.py

# Operaciones de comunicación colectiva
- Instrucciones que intercambian datos que incluye a todos los ranks dentro de un comunicador
- El rank raíz ($\textbf{root}$) indica la fuente o el destino de la operación
- Todos los ranks dentro del comunicador deben de llamar a la misma operación colectiva
- Estas operaciones pueden ayudar a implementar diferentes patrones de comunicación:
    - Uno a muchos
    - Muchos a uno
    - Muchos a muchos
- Pueden servir para diferentes propósitos:
    - Traspaso de datos
    - Computación colectiva
    - Sincronización
 


-  $\textbf{broadcast: }$ Comunucación uno a muchos
    
    comm.bcast(datos, root = 0)
    
- $\textbf{reduce: }$ Comunicación de muchos a uno
    
    comm.reduce(datos, op=MPI.SUM, root=0)
    
    
     - otros ejemplos de operaciones que se pueden hacer con reduce:
      - $\textbf{MPI.MAX}$
      - $\textbf{MPI.MIN}$
      - $\textbf{MPI.PROD}$
      
- $\textbf{comm.Barrier()}$ bloquea la ejecución de los procesos hasta que todos hayan llegado alcanzado ese punto en la ejecución del código. Es una buena herramienta para sincronizar procesos hasta un punto, así se tendrá certeza de que todos los procesos han ejecutado las instrucciones hasta ese punto.
    
<img src="coll.png">

# Ejercicio
### Escriba un programa donde integre numéricamente el área debajo de la curva $ f(x) = \frac{4}{1+x^2}$ entre 0 y 1 para aproximar el valor de $ \pi $ utilizando la regla trapezoidal:
- Se divide el intervalo de integración
- Se le asignan subintervalos a los procesos
- Cada proceso calcula una suma parcial
- Al final se suman todas las parciales para obtener una aproximación de $\pi$


- El ancho de cada sub-intervalo es de $1/n$ donde n es la cantidad de procesos
- La altura del segmento se calcula con la función $f(x)$
<img src="piFunction.png" style="width: 300px;">

   - $\textbf{scatter: }$ Reparte un conjunto de datos entre los distintos ranks
   - $\textbf{gather: }$ Recoge los datos de los distintos ranks y los unifica en una sola estructura
   
<img src="ops.jpeg">

# Ver ejemplos Gather y Scatter


# MPI + NumPy

- $\textbf{mpi4py}$ provee una forma de comunicar datos como arrays de NumPy entre procesos
    - Para hacer esto, se utilizan las mismas funciones que hemos visto antes, pero su primera letra se usa con mayúscula
    - Además tienen algunos otros parámetros que hay que especificar, como el buffer que se desea enviar y el buffer para recibir los datos
 
# Ver ejemplo ejemplo_send_numpy.py

# Ejercicio
- Cargue los datos del archivo velocidades.txt en un array de numpy y distribúyalos en 4 procesos.
- Aplíquele la siguiente función a cada uno de los datos:
$$ f(v) = \frac{\pi^2  v  k^2}{2v^{1/2}}$$

Con k = 0.667

- Posteriormente, recopile todos los datos y grafique el resultado de la función en un sólo proceso.