# ¿Por qué MPI?
## Message Passing Interface
- Es el estándar $\textbf{de facto}$ para computación paralela en infraestructura de HPC (high performance computing)
- Tiene una amplia y bien establecida comunidad (desde 1994)
- Existe un gran ecosistema de herramientas y aplicaciones construidas sobre MPI

#  Paradigma de paso de mensajes
- Un programa paralelizado con MPI se descompone en cada uno de sus procesos, que de ahora en adelante llamaremos de manera indistinta $\textbf{ranks}$
- Cada $\textbf{rank}$ tiene una porción de los datos del programa en su memoria privada
- La comunicación entre los $\textbf{ranks}$ se hace explícita mediante mensajes
- Los canales de comunicación siguen el orden FIFO (first-in-first-out), o sea, el primer mensaje que llega es el primero que se procesa

# Single-Program Multiple Data (SPMD)
- Todos los procesos ejecutan $\textbf{el mismo código}$, pero acceden a una porción diferente de los datos
- Los procesos se lanzan simultáneamente
- La comunicación se da:
 - Mensajes punto a punto
 - Operaciones de comunicación colectiva

# Ranks de MPI
- Cada uno tiene:
 - Memoria privada
 - Un identificador único que corresponde a una numeración secuencial [0->n-1] (donde n es la cantidad de ranks que se lanzan)
 <img src = "ranks.png">

# Comunicadores
- Los comunicadores son estructuras organizacionales en las que se acomodan los ranks para facilitar la comunicación
- Todos los ranks están bajo un comunicador global, pero se puede crear otros comunicadores con grupos de ranks específicos
<img src= "groups_comms.gif">

# Importación e instrucciones
## Lo primero que hay que hacer para ejecutar mpi en python en el cluster kabré es ejecutar en la consola de bash el siguiente comando:
#### module load intelpython/3.5
- Para importar la biblioteca utilizamos
    from mpi4py import MPI

- Para obtener información importante sobre cada rank:
    - comm = MPI.COMM_WORLD
    - rank = MPI.COMM_WORLD.Get_rank()
    - size = MPI.COMM_WORLD.Get_size()

# Comunicación punto a punto
- Son instrucciones sincronizadas para enviar mensajes desde un rank emisor a uno receptor
<img src="send.png">

# Ejemplo
### Vamos a implementar un programa en paralelo llamado "ping-pong". El programa debe de enviar un mensaje con un contador que se intercambia entre dos ranks 1000 veces. El rank 1 va a incrementar el contador cada vez que lo recibe.

# Ejercicio
### Implemente un programa paralelo en python que cree un círculo de ranks. Cada uno genera un número aleatorio entre 0 y 100. El programa luego computa en cada rank la suma de todos los valores haciéndolos circular entre todos los ranks
### Para generar números aleatorios utilice from random import randint
### La instrucción randint luego puede generar un número aleatorio dentro de un rango [x,y] de esta forma
## randint(x,y)
<img src = "ring.png">

# Operaciones de comunicación colectiva
- Instrucciones que intercambian datos que incluye a todos los ranks dentro de un comunicador
- El rank raíz ($\textbf{root}$) indica la fuente o el destino de la operación
    -  $\textbf{broadcast: }$ Comunucación uno a muchos
    
    comm.bcast(datos, root = 0)
    
    - $\textbf{reduce: }$ Comunicación de muchos a uno
    
    comm.reduce(data, op=MPI.SUM, root=0)
    
     - otros ejemplos de operaciones que se pueden hacer con reduce:
      - $\textbf{MPI.MAX}$
      - $\textbf{MPI.MIN}$
      - $\textbf{MPI.PROD}$
      
    - $\textbf{comm.Barrier()}$ bloquea la ejecución de los procesos hasta que todos hayan llegado alcanzado ese punto en la ejecución del código. Es una buena herramienta para sincronizar procesos hasta un punto, así se tendrá certeza de que todos los procesos han ejecutado las instrucciones hasta ese punto.
    
<img src="coll.png">

# Ejercicio
### Escriba un programa donde cada rank tenga un número aleatorio y obtenga la suma de todos los valores en los ranks utilizando únicamente bcast y reduce

   - $\textbf{scatter: }$ Reparte un conjunto de datos entre los distintos ranks
   - $\textbf{gather: }$ Recoge los datos de los distintos ranks y los unifica en una sola estructura
   
<img src="ops.jpeg">

# Ejemplos Gather y Scatter


# MPI + NumPy

- $\textbf{mpi4py}$ provee una forma de comunicar datos como arrays de NumPy entre procesos
    - Para hacer esto, se utilizan las mismas funciones que hemos visto antes, pero su primera letra se usa con mayúscula
    - Además tienen algunos otros parámetros que hay que especificar, como el buffer que se desea enviar y el buffer para recibir los datos
 
# Ejemplo