**1) OMP_NUM_THREADS environment variable**



In [None]:
%%writefile hello_world.c

#include <stdio.h>
#include <omp.h>

int main() {
  #pragma omp parallel
    {
      printf("Hello from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  return 0;
}

Writing hello_world.c


In [None]:
!gcc -fopenmp hello_world.c -o hello_world.exe

In [None]:
!./hello_world.exe

Hello from 0 out of 2
Hello from 1 out of 2


In [None]:
!OMP_NUM_THREADS=3 ./hello_world.exe

Hello from 1 out of 3
Hello from 0 out of 3
Hello from 2 out of 3


In [None]:
!OMP_NUM_THREADS=5 ./hello_world.exe

Hello from 1 out of 5
Hello from 4 out of 5
Hello from 3 out of 5
Hello from 0 out of 5
Hello from 2 out of 5


Si no defino la cantidad de hilos que quiero crear, OpenMP toma por defecto el número del núcleos del sistema donde está corriendo. En el caso de Google Collab, este número es 2. Este valor puede ser modificado incluso después de compilar al asignarle un valior diferente a la variable OMP_NUM_THREADS en la ejecución del programa.

Esta variable puede ser modificada durante la ejecución porque es una variable de entorno, y las variables de entorno no están guardadas en el código compilado del programa, si no queson parámetros que el sistema operativo proporciona a los procesos cuando estos se ejecutan.

**2) OMP_THREAD_LIMIT environment variable**

In [None]:
%%writefile hello_world.c

#include <stdio.h>
#include <omp.h>

int main() {
  #pragma omp parallel
    {
      printf("Hello from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  return 0;
}

Overwriting hello_world.c


In [None]:
!gcc -fopenmp hello_world.c -o hello_world.exe

In [None]:
!OMP_THREAD_LIMIT=4 OMP_NUM_THREADS=1000 ./hello_world.exe

Hello from 1 out of 4
Hello from 0 out of 4
Hello from 3 out of 4
Hello from 2 out of 4


Como se explicó en el punto anterior, la variable de entorno OMP_NUM_THREADS puede modificar la cantidad a hilos a usar durante la ejecución. Pero hay otra variable de entorno que la restringe, y es la variable OMP_THREAD_LIMIT. Podemos observar que a pesar de haber definido OMP_NUM_THREADS como 1000, solo se crearán 4 hilos pues este es el límite determinado por OMP_THREAD_LIMIT.

De no existir este límite, el programa hubiera creado 1000 hilos. Esto se puede evidenciar a continuación

In [None]:
!OMP_NUM_THREADS=1000 ./hello_world.exe

Hello from 0 out of 1000
Hello from 1 out of 1000
Hello from 4 out of 1000
Hello from 8 out of 1000
Hello from 6 out of 1000
Hello from 33 out of 1000
Hello from 18 out of 1000
Hello from 37 out of 1000
Hello from 17 out of 1000
Hello from 38 out of 1000
Hello from 16 out of 1000
Hello from 39 out of 1000
Hello from 19 out of 1000
Hello from 40 out of 1000
Hello from 20 out of 1000
Hello from 10 out of 1000
Hello from 21 out of 1000
Hello from 9 out of 1000
Hello from 22 out of 1000
Hello from 11 out of 1000
Hello from 23 out of 1000
Hello from 12 out of 1000
Hello from 24 out of 1000
Hello from 7 out of 1000
Hello from 29 out of 1000
Hello from 14 out of 1000
Hello from 30 out of 1000
Hello from 15 out of 1000
Hello from 32 out of 1000
Hello from 28 out of 1000
Hello from 58 out of 1000
Hello from 27 out of 1000
Hello from 57 out of 1000
Hello from 25 out of 1000
Hello from 59 out of 1000
Hello from 36 out of 1000
Hello from 60 out of 1000
Hello from 35 out of 1000
Hello from 61 out o

**3) omp_set_num_threads() API call**

In [None]:
%%writefile omp_set_num_threads.c

#include <stdio.h>
#include <omp.h>

int main() {
  omp_set_num_threads(4);
  #pragma omp parallel
    {
      printf("Hello from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  return 0;
}

Writing omp_set_num_threads.c


In [None]:
!gcc -fopenmp omp_set_num_threads.c -o omp_set_num_threads.exe

In [None]:
!./omp_set_num_threads.exe

Hello from 3 out of 4
Hello from 0 out of 4
Hello from 2 out of 4
Hello from 1 out of 4


In [None]:
!OMP_NUM_THREADS=1000 ./omp_set_num_threads.exe

Hello from 3 out of 4
Hello from 2 out of 4
Hello from 0 out of 4
Hello from 1 out of 4


Es posible modificar la cantidad de hilos a usar directamente desde el código por medio de la variable omp_set_num_threads (Se escribe en minúscula a comparación de la versión variable de entorno, que se escribe en mayúscula). Esta variable tiene precedencia sobre la variable de entorno, esto significa que así durante la ejecución le asigne un valor a OMP_NUM_THREADS, la cantidad de hilos acrear será el valor de omp_set_num_threads. Como se puede observar en el ejercicio, el programa corrió con 4 hilos a pesar de que se asignó OMP_NUM_THREADS=1000

**4) num_threads()**

In [None]:
%%writefile num_threads.c

#include <stdio.h>
#include <omp.h>

int main() {
  #pragma omp parallel num_threads(4)
    {
      printf("Hello from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  return 0;
}

Writing num_threads.c


In [None]:
!gcc -fopenmp num_threads.c -o num_threads.exe

In [None]:
!./num_threads.exe

Hello from 0 out of 4
Hello from 3 out of 4
Hello from 1 out of 4
Hello from 2 out of 4


In [None]:
!OMP_NUM_THREADS=1000 ./num_threads.exe

Hello from 0 out of 4
Hello from 2 out of 4
Hello from 3 out of 4
Hello from 1 out of 4


Otra manera de definir el número de hilos es directamente en el contructor de openMP, al añadir el argumento num_threads(n) a la instrucción #pragma omp parallel, donde n es el número de hilos. Al igual que usando la variable omp_set_num_threads, definirlo en el constructor tiene precedencia sobre la variable de entorno OMP_NUM_THREADS. Es por esto que el programa solo creó 4 hilos a pesar de que se asignó OMP_NUM_THREADS=1000.

El argumento num_threads(n) también tiene precedencia sobre omp_set_num_threads, como se puede apreciar a continuación, el programa creó 3 hilos en vez de 5.

In [None]:
%%writefile num_threads.c

#include <stdio.h>
#include <omp.h>

int main() {
  omp_set_num_threads(5);
  #pragma omp parallel num_threads(3)
    {
      printf("Hello from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  return 0;
}

Overwriting num_threads.c


In [None]:
!gcc -fopenmp num_threads.c -o num_threads.exe

In [None]:
!./num_threads.exe

Hello from 0 out of 3
Hello from 1 out of 3
Hello from 2 out of 3


**5) Mixed number of threads**

In [None]:
%%writefile num_threads_mixed.c

#include <stdio.h>
#include <omp.h>

int main() {
  #pragma omp parallel
    {
      printf("Using default or OMP_NUM_THREADS from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

  omp_set_num_threads(2);
  #pragma omp parallel
  {
    printf("Using omp_set_num_threads(2) from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
  }

  #pragma omp parallel num_threads(4)
  {
    printf("using num_threads(4) clause from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
  }
  return 0;
}

Writing num_threads_mixed.c


In [None]:
!gcc -fopenmp num_threads_mixed.c -o num_threads_mixed.exe

In [None]:
!OMP_NUM_THREADS=1 ./num_threads_mixed.exe

Using default or OMP_NUM_THREADS from 0 out of 1
Using omp_set_num_threads(2) from 0 out of 2
Using omp_set_num_threads(2) from 1 out of 2
using num_threads(4) clause from 1 out of 4
using num_threads(4) clause from 0 out of 4
using num_threads(4) clause from 3 out of 4
using num_threads(4) clause from 2 out of 4


Un programa no tiene que utilizar la misma cantidad de hilos durante toda su ejecución, esto es debido a las Internal Control Variables. Estas son variables internas que OpenMP utiliza para  gestionar varios aspectos de la ejecución en paralelo, tales como: cómo ejecutar bloques de código paralelo, cuántos hilos usar, cómo distribuir el trabajo entre ellos, etc.

**6) The if() clause**

In [None]:
%%writefile parallel_if.c

#include <stdio.h>
#include <omp.h>

int main() {

  #pragma omp parallel if(0) num_threads(1000)
    {
      printf("Hi from %d out of %d\n", omp_get_thread_num(), omp_get_num_threads());
    }

    return 0;
}

Writing parallel_if.c


In [None]:
!gcc -fopenmp parallel_if.c -o parallel_if.exe

In [None]:
!./parallel_if.exe

Hi from 0 out of 1


Otra de las características de OpenMP son los condicionales if(predicado); si el predicado es verdadero (o un número diferente de 0) el programa se ejecutará en paralelo, pero si es falso (o 0) se ejecutará de manera secuencial. Es por esto que nuestro programa solo usa un hilo, la expresión if(0) retorna falso así que la función se realiza de manera secuencial, representado por un solo hilo.

**7) Programs relying on number of threads**

In [None]:
%%writefile lock_program.c

#include <stdio.h>
#include <omp.h>

int main() {

  int a_var = 0;
  #pragma omp parallel shared(a_var)
  {
    if (omp_get_thread_num() == 0) {
      while(a_var == 0);
    } else {
          #pragma omp atomic
          a_var++;
    }
  }

    return 0;
}

Writing lock_program.c


In [None]:
!gcc -fopenmp lock_program.c -o lock_program.exe

In [None]:
!OMP_NUM_THREADS=4 ./lock_program.exe

In [None]:
!OMP_NUM_THREADS=1 timeout 10 ./lock_program.exe || if [ $? -eq 124 ]; then echo "Program took too long"; fi

Program took too long


En este programa hay un hilo que se encontrará en espera hasta que otro hilo modifique el valor de la variable compartida. Es por esto que se bloquea cuando solo hay un hilo, pues el valor de la variable nunca va a cambiar y el ciclo en el que se encuentra nunca va a terminar

In [None]:
%%writefile lock_safe_program.c

#include <stdio.h>
#include <omp.h>

int main() {

  int a_var = 0;

    // Revisar si el número de hilos es adecuado
    int num_threads_to_create = omp_get_max_threads();
    if (num_threads_to_create <2) {
        printf("Early termination. insufficient number of threads\n");
        return -1;
    }

    printf("I'm starting\n");
    #pragma omp parallel shared(a_var)
    {
        if (omp_get_thread_num()==0) {
            printf("running with %d threads\n", omp_get_num_threads());
            printf("I'm waiting for any other thread\n");
            while(a_var == 0);
        } else {
            #pragma omp atomic
            a_var++;
        }
    }
    printf("I've finished\n");

    return 0;
}

Writing lock_safe_program.c


In [None]:
!gcc -fopenmp lock_safe_program.c -o lock_safe_program.exe

In [None]:
!OMP_NUM_THREADS=4 ./lock_safe_program.exe

I'm starting
running with 4 threads
I'm waiting for any other thread
I've finished


In [None]:
!OMP_NUM_THREADS=1 ./lock_safe_program.exe

Early termination. insufficient number of threads


Para evitar que esto pase se verifica primero que hayan al menos dos hilos para que el programa se pueda realizar en paralelo y el valor de la variable compartida pueda ser modificado a pesar de que un hilo
se encuentra en un ciclo infinito. Para que un programa se ejecute en paralelo se necesitan por lo menos dos hilos.