### Tópicos especiais em sistemas embarcados - 2023.2
#### Prof. Josenalde Barbosa de Oliveira - TADS@UFRN

### Atividade 1: desenvolver código com paradigma paralelo para estimar o número PI

Embora existam outras formas, para nosso objetivo o número PI pode ser aproximado pela série de N termos:

$\pi = 4 \left ( \frac{1}{1} - \frac{1}{3} + \frac{1}{5} - \frac{1}{7} + \cdots + (-1)^n \frac{1}{2N+1}\right ) $

Um exemplo de código SERIAL (ou com apenas 1 thread, a thread main) para resolver o problema é:

```C
double factor = 1.0;
double sum = 0.0;
for (i = 0; i < n; i++, factor = -factor) {
    sum += factor/(2i+1);
}
pi = 4.0sum;
```

Uma ideia de paralelização, é dividir os N termos entre T threads. Vamos assumir que N é divisível por T para uma distribuição balanceada (load balance). Seja $\bar{N}=\dfrac{N}{T}$. Assim a thread(0) somará os termos na faixa $0..N-1$. A thread(1) somará os próximos $\bar{N}$ termos, na faixa $N..2N-1$. Ou seja, para a thread(q) a faixa será $q\bar{N}..(q+1)\bar{N}-1$. Se $q\bar{N}$ é par, o termo é POSITIVO, em caso contrário, é NEGATIVO.

Abaixo tem-se um exemplo de código com a variável SOMA compartilhada entre as T threads, sem controle à eventual seção crítica:

```C
void* calcPartialPI sum(void* rank) {
    long my_rank = (long) rank; //typecast
    double factor;
    long long i;
    long long my_n = n/T;
    long long my_first i = my_n*my_rank;
    long long my_last i = my_first_i + my_n;

    if (my_first_i % 2 == 0) /* my first i is even */
        factor = 1.0;
    else /* my first i is odd */
        factor = -1.0;

    for (i = my_first_i; i < my_last_i; i++, factor = -factor) {
            sum += factor/(2i+1);
    }

    return NULL;
} 
```

Pede-se:

a) PIparallel_1: Elaborar versão do código incluindo seção crítica controlada por MUTEX dentro do loop, tal como em: https://github.com/josenalde/parallel_programming_rtos/blob/main/src/pthread_count3s_mutex_1.cpp

b) PIparallel_2: Elaborar versão do código incluindo seção crítica controlada por MUTEX fora do loop, com variável privada da soma de contribuição de cada thread, tal como em: https://github.com/josenalde/parallel_programming_rtos/blob/main/src/pthread_count3s_mutex_3.cpp E na folha 7 do slide arquivo setopics4.pdf disponível no SIGAA da disciplina.

<img src=atividade1.png>

c) PIserial: Elaborar versão do código serial, sem paralelismo

d) criar tabela comparativa das letras a) e b) para o caso de 1 thread por core e de 2 threads por core. Exemplo: se a CPU tem 4 cores e até 2 threads por core, fazer para T=4 e T=8. Se tem 08 cores, fazer para T=8 e T=16. Na tabela deixar claro qual a CPU em que está rodando a aplicação. Se for no replit, informar apenas o número de threads.
Pode ser usado o método presente nos arquivos acima para calcular o tempo, usando clock()
A tabela resumo deve ter aparência como neste exemplo, comparando o caso SERIAL com os dois casos PARALELOS: formatar número de saída com 12 casas decimais, com cout.precision(12) e na hora de exibir uma variável, suponha x, fazer cout << fixed << x;

Apresentar na tabela a coluna com o PI calculado e a coluna com o tempo médio de 10 execuções.

<img src=atividade2.png>