# Introdução à OpenMP
#### _bootcamp_ da Escola Supercomputador Santos Dumont - 2025
por Calebe de Paula Bianchini

### Você lembra como funciona OpenMP?

![Threads](./img/omp_threads.png)

Na Figura anterior, a execução sequencial (representada pela linha contínua) pode ser dividida em outras _threads_. O próprio OpenMP faz essa divisão. A primeira dessas divisões foi feita na primeira Região Paralela da Figura em 4 _threads_ (numeradas de 1 a 4). Os pontos de divisão e junção desta Região são chamados, respectivamente, de _fork_ e _join_. Esse _fork/join_ acontece em todas as regiões paralelas - repare novamente na Figura.

No nosso contexto, uma _thread_ é uma unidade básica de computação, com início, meio e fim, que representa a execução de uma sequência de instruções. Se existem 4 _threads_, como na Figura, elas podem ser executadas por CPUs (ou _cores_) de qualquer forma - isso significa que 2 (ou mais) _threads_ podem ser executadas na __mesma__ CPU. Neste caso, obviamente, a CPU terá seu tempo de uso compartilhadao entre essas _threads_ e, consequentemnte, troca de contexto (na Figura a seguir, pode-se ler, ao invés de Processo _Thread_):

![troca de contexto](./img/teo_troca_contexto.png)

A partir desses conceitos fundamentais de sistemas operacionais, podemos, então entender que o OpenMP é uma poderosa ferramenta que implementa um modelo de programação, fornecendo tanto diretivas desse modelo quanto uam API para o uso de sua biblitoeca, quanto possibilidade de configurações no ambiente de execução de sua aplicação paralela.

![Camadas OpenMP](./img/omp_camadas.png)

Vamos ver um primeiro exemplo de uso do OpenMP e dos controles das _threads_.

In [1]:
%%writefile omp_parallel.c

#include <stdio.h>
#include <omp.h>
int main(int argc, char *argv[]){   /*omp_parallel.c */
#pragma omp parallel
    {
    int tid = omp_get_thread_num();
    printf ("Alo da thread %d. \n", tid);
    }
    return 0;
}

Writing omp_parallel.c


Em seguida, compilamos o nosso código:

In [2]:
!gcc -fopenmp omp_parallel.c -o omp_parallel -Wall

Por fim, vamos executar e descobrir quantas _threads_ foram criadas.

In [3]:
!./omp_parallel

Alo da thread 1. 
Alo da thread 0. 


Podemos também controlar a quantidade de _threads_ criadas. A partir do exemplo anterior, e usando o ambiente de execução e avariável de ambiente __OMP\_NUM\_THREADS__, podemos definir o total de _threads_ que deve ser usada em uma região paralela:

In [4]:
!OMP_NUM_THREADS=8 ./omp_parallel

Alo da thread 2. 
Alo da thread 1. 
Alo da thread 3. 
Alo da thread 4. 
Alo da thread 5. 
Alo da thread 6. 
Alo da thread 7. 
Alo da thread 0. 


Já está claro que a ordem de execução não pode ser garantida, já que cada uma das _threads_ são independentemente uma das outras e sua execução está intimamente ligada ao escalonador (seja do OpenMP, seja do SO).

Maiores detalhes sobre Programação Paralela e OpenMP, vejam:

* __Programação Paralela e Distribuída__ _com MPI, OpenMP e OpenACC para computação de alto desempenho_, em [Casa do Código](https://www.casadocodigo.com.br/products/livro-programacao-paralela).

