<a href="https://colab.research.google.com/github/jugernaut/ProgramacionEnParalelo/blob/main/OpenMP/OpenMP_SCP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<font color="Teal" face="Comic Sans MS,arial">
  <h1 align="center"><i>OpenMP (memoria compartida)</i></h1>
  </font>
  <font color="Black" face="Comic Sans MS,arial">
  <h5 align="center"><i>Profesor: M.en.C. Miguel Angel Pérez León</i></h5>
    <h5 align="center"><i>Ayudante: Jesús Iván Coss Calderón</i></h5>
    <h5 align="center"><i>Ayudante: Mario Arturo Nieto Butron</i></h5>
  <h5 align="center"><i>Materia: Seminario de programación en paralelo</i></h5>
  </font>

# Introducción

Aun en la década de los 80's adquirir una computadora con múltiples procesadores era costoso, incluso actualmente el precio de una computadora depende en gran medida del numero de procesadores que tenga.

Actualmente comprar una computadora con varios CPU's y que estos CPU's contengan varios núcleos es relativamente accesible.

Es posible escribir programas en paralelo que muestres buen desempeño empleando MPI, pero si la arquitectura lo permite (memoria compartida) se logra un mejor desempeño haciendo uso OpenMP.

OpenMP es un conjunto de bibliotecas, funciones y directivas de compilador (API) que permite programar en paralelo en conjunto con lenguajes como Fortran, C o C++.

Es importante recordar que OpenMP se basa en la idea de dividir (fork) una tarea grande en tareas mas pequeñas, para que finalmente sean unidos (join) los resultados.

A continuación se muestra el modelo de programación en paralelo mediante memoria compartida.

<center>
<img src="https://github.com/jugernaut/Numerico2021/blob/master/Imagenes/openmp/mem.PNG?raw=1" width="600"> 
</center>

Diagrama del paradigma fork-join.

<center>
<img src="https://github.com/jugernaut/ProgramacionEnParalelo/blob/desarrollo/Imagenes/OpenMP/thread3.png?raw=1" width="600"> 
</center>

En esta imágen, la linea azul muestra el avance del cómputo con respecto al tiempo.

<center>
<img src="https://github.com/jugernaut/ProgramacionEnParalelo/blob/desarrollo/Imagenes/OpenMP/thread4.png?raw=1" width="600">
</center> 

# Desempeño

La idea detrás de esta forma de procesamiento en paralelo, es dividir y vencer.

## ¿Cómo funciona?

La forma tradicional de la programación en paralelo empleando **memoria compartida** es la siguiente:

• Cuando un programa comienza su ejecución un solo hilo llamado **hilo maestro** es activado.

• El hilo maestro ejecuta la parte secuencial del algoritmo. En las secciones del algoritmo donde se requiera operaciones en paralelo, el hilo maestro genera (fork) **hilos adicionales** (esclavos).

• El hilo maestro y los hilos adicionalmente creados, **trabajan de manera concurrente (o en paralelo)** a través de las secciones del algoritmo en paralelo.

• Al termino de la o las secciones en paralelo, los hilos adicionales son **destruidos o suspendidos**.

• Finalmente el control vuelve al hilo maestro y se **unen** (join) los resultados.

## Ventajas

La principal diferencia entre OpenMP y MPI es que en este ultimo, todos los procesos permanecen activos, mientras que en OpenMP se comienza con un solo hilo y se termina con un solo hilo.

Se puede pensar en la programación secuencial como un caso especial de la programación en paralelo usando memoria compartida (OpenMP).

La programación en paralelo usando memoria compartida abarca algoritmos en los cuales se tiene un único ciclo for que se ejecuta con varios hilos, hasta aquellos algoritmos en los que la mayoria del codigo se ejecuta en paralelo.

Por lo tanto este modelo de programación en paralelo soporta paralelización incremental, lo que significa que, un algoritmo secuencial puede ser transformado en uno en paralelo un bloque a la vez.

En contraste, al emplear MPI es necesario replantear el diseño del algoritmo, de manera tal que desde un principio funcione en paralelo.

# OpenMP (API)

Una vez que se tiene claro el funcionaiento de OpenMP, veamos los componentes principales de este API (interfaz de programación de aplicación).

## Directivas de compilador

Una directiva de compilador en *C/C++* es llamada **pragma**.

La palabra pragma, es la contracción de ''información pragmática''.

Pragma es una forma de comunicarle información al compilador, esta información no es esencial en el sentido del que el compilador puede ignorar dicha información y aun así compilar el código.

Sin embargo la información dentro del pragma puede ayudar al compilador a optimizar el algoritmo.

Al igual que otras lineas que proveen información al compilador, un pragma comienza con #.

## Otras directivas de compilador

Algunas de las directivas de compilador más importantes que veremos en esta sección son:

1. **parallel**: que se usa antes de un bloque que sera ejecutado en paralelo por varios hilos.

2. **for**: se usa antes de un ciclo for para indicar que las iteraciones de este ciclo serán ejecutadas en paralelo.

3. **parallel for**: es una combinación de las 2 directivas previas.

4. **sections**: indica que un conjunto de bloques sera ejecutado en paralelo.

5. **parallel sections**: combinación de prallel y sections.

6. **critical**: se usa para indicar que una sección sera critica, por ejemplo para indicar que una sección de código solo puede ser accesible por un hilo a la vez.

7. **single**: se usa antes de un bloque que sera ejecutado por un solo hilo.

## Funciones importantes

Algunas funciones importantes que veremos en esta sección son:

1. **omp_get_num_procs**: devuelve el numero de CPU's que tenga el núcleo en el cual se esta ejecutando el hilo.

2. **omp_get_num_threads**: devuelve el numero de hilos activos en la actual región en paralelo.

3. **omp_get_thread_num**: devuelve el identificador del hilo.

4. **omp_set_num_threads**: permite establecer el numero de hilos que ejecutaran el código de la sección en paralelo.

# Compilación y Ejecución

La manera en la que se compila (revisión sintática) y se ejecuta un programa codificado mediante OpenMP, es muy similar a como se compila y se ejecuta cualquier programa escrito en *C/C++*.

## Ejemplo

Otra de las grandes ventajas de OpenMP es que una vez instalado el compilador y herramientas del lenguaje C (al menos en s.o. Linux) el API de OpenMP ya esta incluido con estas.

De tal forma que compilar y ejecutar codigo que emplea directivas y funciones de OpenMP es tan sencillo como:

*   Para compilar: *\$gcc -o (salida.o) -fopenmp codigoc.c*

El comando anterior compila (y en caso de no haber errores) y genera un archivo ejecutable (binario) que puede ser ejecutado de la siguiente manera:
 
*   Para ejecutar:  *\$./salida.o*

# Glosario

**Hilo** (Thread): También conocido como proceso ligero, es el encargado de ejecutar tareas sencillas dentro de algún algoritmo. Varios hilos pueden conformar un proceso.

**Núcleo** (core): En computación, un núcleo es una parte del microprocesador que se encarga de leer y ejecutar tareas. Actualmente se puede adquirir computadoras que cuenten con varios CPU's y que a su vez, estos contengan varios núcleos. 

# Referencias

1. Michaell J. Quuin: Parallel Programming in C with OpenMP and MPI.
2. https://hpc-wiki.info/hpc/OpenMP
3. Dongarra Foster: Source Book of parallel computing.