# Programação Paralela

Team: Pedro Menezes, Roberto Santos

Para a realização dessa atividade, foi selecionado o problema da multiplicação de matrizes, utilizando a linguagem python para o notebook e linguagem C para a realização e execução dos códigos, junto à linguagem será utilizada a biblioteca OpenMP uma ferramenta utilizada para programação com o paradigma paralela no modelo de memória compartilhada. Os resultados alcançados serão apresentados após a execução dos códigos sequencial e paralelo.

## Execução Sequencial

In [2]:
%%writefile mm.c
#include <stdio.h>
#include <stdlib.h>
#include <omp.h>

void initializeMatrix(int *matrix, int size)
{
  for(int i = 0; i < size; i++)
    for(int j = 0; j < size; j++)
      matrix[i * size + j] = rand() % (10 - 1) * 1;
}

void printMatrix(int *matrix, int size)
{
  for(int i = 0; i < size; i++)
  {
    for(int j = 0; j < size; j++)
      printf("%d\t", matrix[i * size + j]);
    printf("\n");
  }
  printf("\n");
}

int main(int argc, char **argv)
{
 int size = atoi(argv[1]);  
 int i, j, k;
 double t1, t2;

 int  *A = (int *) malloc (sizeof(int)*size*size);
 int  *B = (int *) malloc (sizeof(int)*size*size);
 int  *C = (int *) malloc (sizeof(int)*size*size);

 initializeMatrix(A, size);
 initializeMatrix(B, size);

 t1 = omp_get_wtime();
   for(i = 0; i < size; i++)
    for(j = 0; j < size; j++)
      for(k = 0; k < size; k++)
        C[i * size + j] += A[i * size + k] * B[k * size + j];
 t2 = omp_get_wtime();

 printf("%d\t%f\n",size, t2-t1);

 //printMatrix(A,size);
 //printMatrix(B,size);
 //printMatrix(C,size);

 return 0;
}

Writing mm.c


#### Explicação do Código

 No código acima, é realizado a multiplicação de duas matrizes de tamanho N, o tamanho é determinado pelo usuário na execução do código. Para a atividade, será realizada a multiplicação de duas matrizes 1000x1000.

Como podemos ver no código acima, foi utilizada a biblioteca OpemMP, apesar disso toda a execução do código é sequencial, a biblioteca está sendo utilizada somente para a medição do tempo de execução.

### Execução do Código Sequencial

Para a execução do código é necessário chamar a diretiva -fopenmp para que ele seja compilado junto à biblioteca.

In [3]:
!gcc mm.c -o mm -fopenmp

In [4]:
!./mm 1000

1000	4.716444


## Execução Paralela com a Diretiva OpenMP

In [5]:
%%writefile mm.c
#include <stdio.h>
#include <stdlib.h>
#include <omp.h>

void initializeMatrix(int *matrix, int size)
{
  for(int i = 0; i < size; i++)
    for(int j = 0; j < size; j++)
      matrix[i * size + j] = rand() % (10 - 1) * 1;
}

void printMatrix(int *matrix, int size)
{
  for(int i = 0; i < size; i++)
  {
    for(int j = 0; j < size; j++)
      printf("%d\t", matrix[i * size + j]);
    printf("\n");
  }
  printf("\n");
}

int main (int argc, char **argv)
{
 int size = atoi(argv[1]);  
 int i, j, k;
 double t1, t2;

 int  *A = (int *) malloc (sizeof(int)*size*size);
 int  *B = (int *) malloc (sizeof(int)*size*size);
 int  *C = (int *) malloc (sizeof(int)*size*size);

 initializeMatrix(A, size);
 initializeMatrix(B, size);

 t1 = omp_get_wtime();
 #pragma omp parallel for private(i, j, k)
   for(i = 0; i < size; i++)
    for(j = 0; j < size; j++)
      for(k = 0; k < size; k++)
        C[i * size + j] += A[i * size + k] * B[k * size + j];
 t2 = omp_get_wtime();

 printf("%d\t%f\n",size, t2-t1);

 //printMatrix(A,size);
 //printMatrix(B,size);
 //printMatrix(C,size);

 return 0;
}

Overwriting mm.c


#### Explicação do código

Para a execução em paralelo, só é necessário incluir a diretiva '#pragma omp parallel for private(i, j, k)' e indicar quais variáveis serão privadas para a memória compartilhada.

### Execução do Código Paralelo

Novamente utilizamos a diretiva para compilação, porém, agora utilizamos outra chamada para a execução paralela, em que informamos o número de threads a serem utilizadas na execução do código. Esse número pode ser alterado e deve ser avaliado para a seleção da melhor quantidade para cada máquina, por questões de simplicidade, esse valor exato não será avaliado.

In [6]:
!gcc mm.c -o mm -fopenmp

In [7]:
!OMP_NUM_THREADS=16 ./mm 1000

1000	1.277463


## Análise de Resultados

A partir da execução dos dois códigos, foi observado que o código sequencial teve um tempo de execução de 4,71644 segundos, enquanto o código paralelo apresentou um tempo de 1,277463 segundos, caracterizando um speed-up de aproximadamente 3,70. Esses valores poderiam ser melhorados, a partir de outras análises, uso de outros paradigmas ou execução em outra máquina.