<a href="https://colab.research.google.com/github/adigenova/uohpmd/blob/main/code/MPI_OPenMP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
!apt install mpich libomp-dev

In [2]:
%%writefile mpi_openmp_e1.c

#include <stdio.h>
#include <stdlib.h>
//we load omp/mpi
#include <omp.h>
#include <mpi.h>
// defines the MPI_THREADS_MODE
#define MPI_THREAD_STRING(level)  \
        ( level==MPI_THREAD_SERIALIZED ? "THREAD_SERIALIZED" : \
                ( level==MPI_THREAD_MULTIPLE ? "THREAD_MULTIPLE" : \
                        ( level==MPI_THREAD_FUNNELED ? "THREAD_FUNNELED" : \
                                ( level==MPI_THREAD_SINGLE ? "THREAD_SINGLE" : "THIS_IS_IMPOSSIBLE" ) ) ) )

int main(int argc, char ** argv)
{
    /* Estos son los soportes de hilos deseados y disponibles.
        Se puede utilizar un código híbrido en el que todas las llamadas MPI se realizan desde el hilo principal (FUNNELED).
        Si los hilos realizan llamadas MPI, MULTIPLE es el apropiado. */
    int requested=MPI_THREAD_FUNNELED, provided;

    /* Intentamos activar los hilos MPI usando el modo requerido: MPI_THREAD_FUNNELED*/
    MPI_Init_thread(&argc, &argv, requested, &provided);
    if (provided<requested)
    {
        printf("MPI_Init_thread provee %s cuando %s fue solicitado.  Terminando el programa. \n",
               MPI_THREAD_STRING(provided), MPI_THREAD_STRING(requested) );
        exit(1);
    }

    int world_size, world_rank;

    MPI_Comm_size(MPI_COMM_WORLD,&world_size);
    MPI_Comm_rank(MPI_COMM_WORLD,&world_rank);

    printf("Hola desde %d de total :%d  procesos\n", world_rank, world_size);

    //ocupamos openMP para crear una seccion paralela
    #pragma omp parallel
    {
        int omp_id  =omp_get_thread_num();
        int omp_num =omp_get_num_threads();
        printf("MPI rank # %2d OpenMP thread # %2d of %2d \n", world_rank, omp_id, omp_num);
        fflush(stdout);
    }

    MPI_Finalize();
    return 0;
}

Writing mpi_openmp_e1.c


In [3]:
! mpicc -o mpi_openmp_e1 mpi_openmp_e1.c  -fopenmp

In [5]:
%env OMP_NUM_THREADS=3
! mpirun --oversubscribe --allow-run-as-root -np 4 ./mpi_openmp_e1

env: OMP_NUM_THREADS=3
Hola desde 0 de total :4  procesos
Hola desde 1 de total :4  procesos
Hola desde 3 de total :4  procesos
Hola desde 2 de total :4  procesos
MPI rank #  1 OpenMP thread #  1 of  3 
MPI rank #  1 OpenMP thread #  2 of  3 
MPI rank #  2 OpenMP thread #  1 of  3 
MPI rank #  1 OpenMP thread #  0 of  3 
MPI rank #  2 OpenMP thread #  2 of  3 
MPI rank #  2 OpenMP thread #  0 of  3 
MPI rank #  0 OpenMP thread #  0 of  3 
MPI rank #  0 OpenMP thread #  1 of  3 
MPI rank #  0 OpenMP thread #  2 of  3 
MPI rank #  3 OpenMP thread #  0 of  3 
MPI rank #  3 OpenMP thread #  1 of  3 
MPI rank #  3 OpenMP thread #  2 of  3 


## Producto Punto

In [9]:
%%writefile ppunto.c

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <omp.h>

#define VECTOR_SIZE 1000

int main(int argc, char* argv[]) {
    int rank, size;
    int local_size, local_start, local_end;
    double* vectorA, * vectorB;
    double local_sum = 0.0, global_sum = 0.0;

    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    // Calcular el tamaño local de los vectores
    local_size = VECTOR_SIZE / size;
    local_start = rank * local_size;
    local_end = local_start + local_size;

    // Asignar memoria para los vectores locales
    vectorA = (double*)malloc(local_size * sizeof(double));
    vectorB = (double*)malloc(local_size * sizeof(double));

    // Inicializar vectores locales
    #pragma omp parallel for
    for (int i = local_start; i < local_end; i++) {
        vectorA[i - local_start] = 1.0;  // Inicializar vectorA con 1.0
        vectorB[i - local_start] = 2.0;  // Inicializar vectorB con 2.0
    }

    // Calcular el producto escalar local
    #pragma omp parallel for reduction(+:local_sum)
    for (int i = 0; i < local_size; i++) {
        local_sum += vectorA[i] * vectorB[i];
    }

    printf("El producto escalar local es: %lf %d\n", local_sum, rank);
    // Reducir los resultados locales en un resultado global
    MPI_Reduce(&local_sum, &global_sum, 1, MPI_DOUBLE, MPI_SUM, 0, MPI_COMM_WORLD);

    // El proceso 0 imprime el resultado
    if (rank == 0) {
        printf("El producto escalar global es: %lf\n", global_sum);
    }

    // Liberar memoria y finalizar MPI
    free(vectorA);
    free(vectorB);
    MPI_Finalize();

    return 0;
}


Overwriting ppunto.c


In [10]:
! mpicc -o ppunto ppunto.c  -fopenmp

In [11]:
%env OMP_NUM_THREADS=4
! mpirun --oversubscribe --allow-run-as-root -np 4 ./ppunto

env: OMP_NUM_THREADS=4
El producto escalar local es: 500.000000 0
El producto escalar local es: 500.000000 3
El producto escalar local es: 500.000000 2
El producto escalar local es: 500.000000 1
El producto escalar global es: 2000.000000


In [12]:
%%writefile ppunto_pt.c
#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <pthread.h>

#define ARRAY_SIZE 1000000

// Estructura que contiene los datos que se pasan a cada hilo
struct ThreadData {
    int* array;
    int local_size;
    int local_sum;
};

// Función que se ejecuta en cada hilo para calcular la suma local
void* calculateSum(void* arg) {
    struct ThreadData* data = (struct ThreadData*)arg;
    for (int i = 0; i < data->local_size; i++) {
        data->local_sum += data->array[i];
    }
    return NULL;
}

int main(int argc, char* argv[]) {
    int rank, size;
    int* data;
    int local_size, local_start, local_end;
    int local_sum = 0;
    pthread_t* threads;

    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    // Calcular el tamaño local del array
    local_size = ARRAY_SIZE / size;
    local_start = rank * local_size;
    local_end = local_start + local_size;

    // Asignar memoria para el array local
    data = (int*)malloc(local_size * sizeof(int));
    threads = (pthread_t*)malloc(size * sizeof(pthread_t));

    // Inicializar el array local con valores aleatorios
    for (int i = 0; i < local_size; i++) {
        data[i] = rand() % 10; // Valores aleatorios entre 0 y 9
    }

    // Crear hilos para calcular la suma local en paralelo
    struct ThreadData threadData;
    threadData.array = data;
    threadData.local_size = local_size;
    threadData.local_sum = 0;

    pthread_create(&threads[rank], NULL, calculateSum, &threadData);

    // Esperar a que todos los hilos terminen
    pthread_join(threads[rank], NULL);

    // Realizar una operación de reducción para obtener la suma global
    MPI_Reduce(&threadData.local_sum, &local_sum, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD);

    // El proceso 0 imprime la suma global
    if (rank == 0) {
        printf("Suma global: %d\n", local_sum);
    }

    // Liberar memoria y finalizar MPI
    free(data);
    free(threads);
    MPI_Finalize();

    return 0;
}


Writing ppunto_pt.c


In [13]:
! mpicc -o ppunto_pt ppunto_pt.c -lpthread

In [14]:
! mpirun --oversubscribe --allow-run-as-root -np 4 ./ppunto_pt

Suma global: 4501204


In [18]:
%%writefile ppunto_ptv2.c
#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <pthread.h>

#define ARRAY_SIZE 1000000
#define NUM_THREADS_PER_PROCESS 4

// Estructura que contiene los datos que se pasan a cada hilo
struct ThreadData {
    int* array;
    int local_size;
    int local_start;
    int local_sum;
};

// Función que se ejecuta en cada hilo para calcular la suma local
void* calculateSum(void* arg) {
    struct ThreadData* data = (struct ThreadData*)arg;
    for (int i = data->local_start; i < data->local_start + data->local_size; i++) {
        data->local_sum += data->array[i];
    }
    return NULL;
}

int main(int argc, char* argv[]) {
    int rank, size;
    int* data;
    int local_size, local_start, local_end;
    int local_sum = 0;
    pthread_t threads[NUM_THREADS_PER_PROCESS];
    struct ThreadData threadData[NUM_THREADS_PER_PROCESS];

    MPI_Init(&argc, &argv);
    MPI_Comm_rank(MPI_COMM_WORLD, &rank);
    MPI_Comm_size(MPI_COMM_WORLD, &size);

    // Calcular el tamaño local del array
    local_size = ARRAY_SIZE / (size * NUM_THREADS_PER_PROCESS);
    local_start = rank * local_size * NUM_THREADS_PER_PROCESS;
    local_end = local_start + local_size * NUM_THREADS_PER_PROCESS;

    // Asignar memoria para el array local
    data = (int*)malloc(local_size * NUM_THREADS_PER_PROCESS * sizeof(int));

    // Inicializar el array local con valores aleatorios
    for (int i = 0; i < local_size * NUM_THREADS_PER_PROCESS; i++) {
        data[i] = rand() % 10; // Valores aleatorios entre 0 y 9
    }

    // Crear y lanzar múltiples hilos para calcular la suma local en paralelo
    for (int i = 0; i < NUM_THREADS_PER_PROCESS; i++) {
        threadData[i].array = data;
        threadData[i].local_size = local_size;
        threadData[i].local_start = i * local_size;
        threadData[i].local_sum = 0;

        pthread_create(&threads[i], NULL, calculateSum, &threadData[i]);
    }

    // Esperar a que todos los hilos terminen
    for (int i = 0; i < NUM_THREADS_PER_PROCESS; i++) {
        pthread_join(threads[i], NULL);
        local_sum += threadData[i].local_sum;
    }

    // Realizar una operación de reducción para obtener la suma global
    int global_sum = 0;
    MPI_Reduce(&local_sum, &global_sum, 1, MPI_INT, MPI_SUM, 0, MPI_COMM_WORLD);

    // El proceso 0 imprime la suma global
    if (rank == 0) {
        printf("Suma global: %d\n", global_sum);
    }

    // Liberar memoria y finalizar MPI
    free(data);
    MPI_Finalize();

    return 0;
}


Overwriting ppunto_ptv2.c


In [19]:
! mpicc -o ppunto_ptv2 ppunto_ptv2.c -lpthread

In [None]:
! mpirun --oversubscribe --allow-run-as-root -np 4 ./ppunto_ptv2

## Matrix multiplication with MPI and OpenMP

In [21]:
%%writefile mpi_openmp_matrix_mult.c

/*
 * Un programa simple para multiplicar matrices
 * (Matrix_A  X  Matrix_B) => Matrix_C
 */

#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
#include <omp.h>

#include <time.h>


#define ARRAY_SIZE 10

typedef int matrix_t[ARRAY_SIZE][ARRAY_SIZE];

matrix_t MA,MB,MC;

/*
Rutina para multiplicar una fila por una columna y colocar un elemento en
matriz resultante.
*/
void mult(int size,
	  int row,
	  int column,
    int rowl,
	  matrix_t MA,
	  matrix_t MB,
	  int *MC)
{
  int position;
  //int row_l=0;
  MC[rowl]= 0;
  for(position = 0; position < size; position++) {
     MC[rowl] = MC[rowl] +
     ( MA[row][position]  *  MB[position][column] ) ;

  }
}

//colocamos valores random 1-10 en las matrices
void inicializamos_matriz(int size,
                    matrix_t MX)
{
    int   row, column;
    srand(time(0));
    for(row = 0; row < size; row++) {
    for (column = 0; column < size; column++) {
      MX[row][column]=rand()%10;
    }
  }
}

void imprimir_matriz(int size,
                    matrix_t MX)
{
    int   row, column;
    for(row = 0; row < size; row ++) {
    for (column = 0; column < size; column++) {
      printf("%5d ",MX[row][column]);
    }
    printf("\n");
  }
}

void imprimir_matriz2(int sizer,int sizec,
                    int *MX)
{
    int   row, column,i=0;
    for(row = 0; row < sizer; row++) {
    for (column = 0; column < sizec; column++) {
      printf("%5d ",MX[i]);
      i++;
    }
    printf("\n");
  }
}


// inicializamos valores y calcula los resultados

int main(void)
{
  int      size, row, column;

  size = ARRAY_SIZE;

//puntero a la matriz resultante
int *final_matrix;
int num_worker, rank;
MPI_Init(NULL, NULL);
MPI_Comm_size(MPI_COMM_WORLD, &num_worker);
MPI_Comm_rank(MPI_COMM_WORLD, &rank);

if(rank == 0){
  // inicializamos los valores de la MA
  inicializamos_matriz(size, MA);
  //inicializamos los valores de la MB
  inicializamos_matriz(size, MB);
  //imprimimos
  printf("La matriz A es;\n");
  imprimir_matriz(size,MA);
  printf("La matriz B es;\n");
  imprimir_matriz(size,MB);
  //reservamos la memoria para la matriz final
    final_matrix = (int *) malloc(sizeof(int*) * size*size);
}


MPI_Bcast(MA, size*size , MPI_INT, 0, MPI_COMM_WORLD);
MPI_Bcast(MB, size*size , MPI_INT, 0, MPI_COMM_WORLD);

//chequeamos si proceso 1 recibio la información
if(rank == 1){
  printf("id:%d La matriz A es;\n",rank);
  imprimir_matriz(size,MA);
  printf("id:%d La matriz B es;\n",rank);
  imprimir_matriz(size,MB);
}

// determinamos la fila de inicio y fin para la proceso trabajador
int startrow = rank * ( size / num_worker);
int endrow = ((rank + 1) * ( size / num_worker)) -1;
//calculamos las sub-matrices
int number_of_rows = size / num_worker;
int *result_matrix = (int *) malloc(sizeof(int*) * number_of_rows * size);
    //multiplicamos
    int rowl=0;
    #pragma omp parallel for collapse(2)
    for(row = startrow;  row <= endrow; row++) {
     for (column = 0; column < size; column++) {
      mult(size, row, column,rowl, MA, MB, result_matrix);
      rowl++;
      int omp_id  =omp_get_thread_num();
      int omp_num =omp_get_num_threads();
      #pragma omp critical
      printf("row: %d col=%d, OpenMP_hilo=%d MPI_rank_process=%d\n", row,column, omp_get_thread_num(),rank);
      fflush(stdout);
      }
    }



//recolectamos los resutlados de la matriz
    MPI_Gather(result_matrix, number_of_rows*size, MPI_INT,
           final_matrix, number_of_rows*size,  MPI_INT, 0, MPI_COMM_WORLD);

  //imprimimos la matriz luego de recolectar los resultados
  if(rank == 0){
  printf("La matriz resultante C es (MPI/OpenMP);\n");
  imprimir_matriz2(size,size,final_matrix);
  }

 MPI_Finalize();

  return 0;
}



Writing mpi_openmp_matrix_mult.c


In [22]:
 ! mpicc -o mpi_openmp_matrix_mult mpi_openmp_matrix_mult.c  -fopenmp

In [None]:
%env OMP_NUM_THREADS=3
! mpirun --oversubscribe --allow-run-as-root -np 5 ./mpi_openmp_matrix_mult