Después de haber instalado MPI procedemos a importarlo así como las otras funciones que nos puedans servir como numpy

In [1]:
from mpi4py import MPI
import numpy as np
import random
import pandas as pd
from numpy import genfromtxt

Para comprobar que MPI se instaló correctamente, usamos el ejemplo visto en clase.

In [2]:
%%writefile mpi_example1.py 
from mpi4py import MPI

comm = MPI.COMM_WORLD # all available processors to communicate 
rank = comm.Get_rank() # give ranks to processors, local variable for e/ processor
size = comm.Get_size() # each processor identifies the total processors 

print("Hello World from rank ", rank, " out of ", size, " processors ")

Overwriting mpi_example1.py


In [3]:
! mpiexec -n 4 python mpi_example1.py

Hello World from rank  1  out of  4  processors 
Hello World from rank  2  out of  4  processors 
Hello World from rank  0  out of  4  processors 
Hello World from rank  3  out of  4  processors 


### Pregunta 2

#### a.Que un procesador genere dos numpy array diferentes, cada uno de 1,000,000 observaciones. Llamar “num1” y “num2” a estos numpy.

Con nuestro procesador de rango 0 generamos dos arrays de números aleatorios con 1 000 000 de observaciones cada uno que llamaremos "num1" y "num2".

In [1]:
%%writefile numpys.py 
from mpi4py import MPI

import numpy as np
import random

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

np.random.seed(1102)

if rank == 0:
    num1 = np.random.random(1000000)
    num2 = np.random.random(1000000)
    print ("El array num1 generado por el procesador",rank,"es",num1)
    print ("El array num2 generado por el procesador",rank,"es",num2)


Overwriting numpys.py


In [4]:
! mpiexec -n 1 python numpys.py

El array num1 generado por el procesador 0 es [0.3051895  0.8090249  0.70315185 ... 0.99735614 0.81987858 0.19472251]
El array num2 generado por el procesador 0 es [0.69826857 0.68300644 0.62900289 ... 0.54458017 0.73143874 0.12210111]


#### b.Enviar cada numpy a un procesador diferente. Que cada uno de los otros procesadores reciba su numpy

Procedemos a enviar "num1" al procesador de rango 1 y "num2" al procesador de rango 2.

In [109]:
%%writefile numpys2.py 
from mpi4py import MPI

import numpy as np
import random

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    random.seed (1102)
    num1 = np.random.random(1000000)
    num2 = np.random.random(1000000)
    comm.Send(num1, dest=1)
    comm.Send(num2, dest=2)
elif rank == 1:
    num1 = np.empty(1000000)
    comm.Recv(num1, source=0)
    print ("El procesador",rank,"recibio",num1)
elif rank == 2:
    num2 = np.empty(1000000)
    comm.Recv(num2, source=0)
    print ("El procesador",rank,"recibio",num2)

Overwriting numpys2.py


In [110]:
! mpiexec -n 3 python numpys2.py

El procesador 1 recibio [0.2384333  0.3055615  0.19520407 ... 0.95627573 0.03589743 0.08484793]
El procesador 2 recibio [0.54252804 0.56189207 0.26866405 ... 0.0352837  0.585326   0.6576321 ]


#### c. Que otro procesador (que no haya recibido nada) reciba “num1” y “num2” y los imprima.

Procedemos a enviar "num1" desde nuestro procesador de rango 1 y "num2" desde nuestro procesador de rango 2 a nuestro procesador de rango 3. 

In [111]:
%%writefile parte2_2.py 
from mpi4py import MPI

import numpy as np
import random

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    random.seed (1102)
    num1 = np.random.random(1000000)
    num2 = np.random.random(1000000)
    comm.Send(num1, dest=1)
    comm.Send(num2, dest=2)
elif rank == 1:
    num1 = np.empty(1000000)
    comm.Recv(num1, source=0)
    comm.Send(num1, dest=3)
elif rank == 2:
    num2 = np.empty(1000000)
    comm.Recv(num2, source=0)
    comm.Send(num2, dest=3)
elif rank == 3:
    num1 = np.empty(1000000)
    comm.Recv(num1, source=1)
    num2 = np.empty(1000000)
    comm.Recv(num2, source=2)
    print ("El procesador", rank ,"recibio",num1)
    print ("El procesador", rank, "recibio",num2)

Overwriting parte2_2.py


#### d.	Ejecute el código creado y registre el tiempo que toma realizar este ejercicio.

Procedemos a ejecutar nuestro último código. Registramos el tiempo de ejecución en nuestro código.

In [73]:
import time
start = time.time()
! mpiexec -n 4 python parte2_2.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El procesador 3 recibio [0.33677826 0.04944862 0.7758516  ... 0.28727552 0.78334879 0.27619941]
El procesador 3 recibio [0.4747214  0.22562945 0.0812673  ... 0.70758399 0.43023075 0.43450976]
El proceso tomo 1.0445482730865479 segundos


e.	En otro chunk responda: ¿existe una manera de agilizar este proceso con las herramientas de MPI? Sea detallado en su respuesta y argumentos.

### Pregunta 3

Generamos un numpy array que almacene el archivo: “tarea2.csv”, vemos cuantos elementos contiene y calculamos el máximo para tenerlo como referencia para las siguientes preguntas.

In [76]:
from numpy import genfromtxt
tarea2 = genfromtxt('tarea2.csv', delimiter=',')
print("Vemos que la base de datos tiene",tarea2.shape,"elementos.")

Vemos que la base de datos tiene (1048575,) elementos.


In [75]:
print("El máximo que deberíamos encontrar en cada proceso es",tarea2.max())

El máximo que deberíamos encontrar en cada proceso es 0.99999982


#### a.	Escribir un código que halle el valor máximo de “tarea2” usando un procesador. Imprimir el valor máximo. Registrar el tiempo de demora.

In [116]:
%%writefile p3a.py 
from mpi4py import MPI

import numpy as np
import random
from numpy import genfromtxt

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    tarea2 = genfromtxt('tarea2.csv', delimiter=',')
    maximo = tarea2.max()
    print("Nuestro máximo es efectivamente",maximo)

Overwriting p3a.py


In [119]:
import time
start = time.time()
! mpiexec -n 1 python p3a.py
end = time.time()
print("El proceso tomó",end - start,"segundos")

Nuestro máximo es efectivamente 0.99999982
El proceso tomó 3.4078052043914795 segundos


#### b.	Escribir un código que realice las siguientes indicaciones. Dividir el numpy en dos partes iguales. Que dos procesadores distintos encuentren el máximo de cada parte. Que otro procesador junte los máximos hallados y encuentre el máximo global. Este resultado debe ser igual al de 3a. Registrar el tiempo de demora.

Primero dividimos el numpy en 2 chunks fuera del código a manera de test y también para averiguar el tamaño de cada chunk pues necesitaremos esa información en nuestro código MPI.

In [88]:
tarea2_chunk = np.array_split(tarea2, 2)
tarea2_chunk

[array([0.34887171, 0.2668857 , 0.1366463 , ..., 0.57128704, 0.81662822,
        0.24393123]),
 array([0.71707726, 0.31591403, 0.57266182, ..., 0.48673952, 0.09359856,
        0.93271565])]

In [86]:
print("El tamaño de nuestro primer chunk es",tarea2_chunk[0].size)

El tamaño de nuestro primer chunk es 524288


In [89]:
print("El tamaño de nuestro segundo chunk es",tarea2_chunk[1].size)

El tamaño de nuestro segundo chunk es 524287


Escribimos un código donde el procesador 0 divide el MPI y envía los 2 chunks a los procesadores 1 y 2. 
Los procesadores 1 y 2 calculan el máximo del chunk que recibieron.
El procesador 3 recibe los máximos de los procesadores 1 y 2 calcula el máximo global a partir de ahí.

In [149]:
%%writefile p3b.py 
from mpi4py import MPI

import numpy as np
import pandas as pd
import random
from numpy import genfromtxt


comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    tarea2 = genfromtxt('tarea2.csv', delimiter=',')
    tarea2_chunk = np.array_split(tarea2, 2)
    chunk1=tarea2_chunk[0]
    chunk2=tarea2_chunk[1]
    comm.Send(chunk1, dest=1)
    comm.Send(chunk2, dest=2)
elif rank == 1:
    chunk1 = np.empty(524288)
    comm.Recv(chunk1, source=0)
    max1=chunk1.max()
    comm.Send(max1, dest=3)
    print("El procesador", rank,"encontró",max1)
elif rank == 2:
    chunk2 = np.empty(524287)
    comm.Recv(chunk2, source=0)
    max2=chunk2.max()
    comm.Send(max2, dest=3)
    print("El procesador", rank,"encontró",max2)
elif rank == 3:
    max1 = np.empty(1)
    max2 = np.empty(1)
    comm.Recv(max1, source=1)
    comm.Recv(max2, source=2)
    max3=max(max1,max2)
    print("El procesador",rank,"encontró",max3)

Overwriting p3b.py


In [150]:
import time
start = time.time()
! mpiexec -n 4 python p3b.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El procesador 1 encontró 0.99999791El proceso tomo 7.935751438140869 segundos

El procesador 2 encontró 0.99999982
El procesador 3 encontró [0.99999982]


Vemos que encontramos el mismo máximo que en 3a, es decir 0.99999982.

Probamos una alternativa donde la generación de los chunks no se hace usando MPI (no se asigna a ningún procesador en particular). Aquí los procesadores 0 y 1 toman cada uno de los 2 chunks y hallan los máximos locales mientras que el procesador 2 recibe estos máximos y halla el máximo global. 

In [151]:
%%writefile p3b2.py 
from mpi4py import MPI

import numpy as np
import pandas as pd
import random
from numpy import genfromtxt

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

tarea2 = genfromtxt('tarea2.csv', delimiter=',')
tarea2_chunk = np.array_split(tarea2, 2)
chunk1=tarea2_chunk[0]
chunk2=tarea2_chunk[1]

if rank == 0:    
    max1=chunk1.max()
    comm.Send(max1, dest=2)
    print("El procesador", rank, "encontró",max1)
elif rank == 1:
    max2=chunk2.max()
    comm.Send(max2, dest=2)
    print("El procesador",rank,"encontró",max2)
elif rank == 2:
    max1 = np.empty(1)
    max2 = np.empty(1)
    comm.Recv(max1, source=0)
    comm.Recv(max2, source=1)
    maxtot=max(max1,max2)
    print("El procesador",rank,"encontró",maxtot)

Overwriting p3b2.py


In [152]:
import time
start = time.time()
! mpiexec -n 3 python p3b2.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El procesador 1 encontró 0.99999982
El procesador 0 encontró 0.99999791
El procesador 2 encontró [0.99999982]
El proceso tomo 8.660772562026978 segundos


Este método parece ser menos eficiente que si asignamos la primera tarea a un procesador. Por ende los descartamos.

#### c.	Repetir 3b dividiendo el numpy original en tres partes. Registrar el tiempo de demora.

De nuevo vemos cual es el tamaño de los arrays.

In [127]:
tarea2_chunk2 = np.array_split(tarea2, 3)
tarea2_chunk2

[array([0.34887171, 0.2668857 , 0.1366463 , ..., 0.05235301, 0.60290039,
        0.51786804]),
 array([0.94508648, 0.17400229, 0.74788725, ..., 0.19144469, 0.04561006,
        0.76499122]),
 array([0.90580344, 0.27597395, 0.377038  , ..., 0.48673952, 0.09359856,
        0.93271565])]

In [131]:
print("El tamaño de nuestro primer chunk es",tarea2_chunk2[0].size)

El tamaño de nuestro primer chunk es 349525


In [132]:
print("El tamaño de nuestro segundo chunk es",tarea2_chunk2[1].size)

El tamaño de nuestro segundo chunk es 349525


In [133]:
print("El tamaño de nuestro tercer chunk es",tarea2_chunk2[2].size)

El tamaño de nuestro tercer chunk es 349525


Escribimos un código donde el procesador 0 divide el MPI y envía los 3 chunks a los procesadores 1, 2 y 3. 
Los procesadores 1, 2 y 3 calculan el máximo del chunk que recibieron.
El procesador 0 recibe los máximos de los procesadores 1, 2 y 3 y calcula el máximo global a partir de ahí.

In [194]:
%%writefile p3c.py 
from mpi4py import MPI

import numpy as np
import pandas as pd
import random
from numpy import genfromtxt


comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    tarea2 = genfromtxt('tarea2.csv', delimiter=',')
    tarea2_chunk = np.array_split(tarea2, 3)
    chunk1=tarea2_chunk[0]
    chunk2=tarea2_chunk[1]
    chunk3=tarea2_chunk[2]
    comm.Send(chunk1, dest=1)
    comm.Send(chunk2, dest=2)
    comm.Send(chunk3, dest=3)
    max1 = np.empty(1)
    max2 = np.empty(1)
    max3 = np.empty(1)
    comm.Recv(max1, source=1)
    comm.Recv(max2, source=2)
    comm.Recv(max3, source=3)                    
    maxtot=max(max1,max2,max3)
    print("El procesador",rank,"encontró",maxtot)    
elif rank == 1:
    chunk1 = np.empty(349525)
    comm.Recv(chunk1, source=0)
    max1=chunk1.max()
    comm.Send(max1, dest=0)
    print("El procesador", rank,"encontró",max1)
elif rank == 2:
    chunk2 = np.empty(349525)
    comm.Recv(chunk2, source=0)
    max2=chunk2.max()
    comm.Send(max2, dest=0)
    print("El procesador", rank,"encontró",max2)
elif rank == 3:
    chunk3 = np.empty(349525)
    comm.Recv(chunk3, source=0)
    max3=chunk3.max()
    comm.Send(max3, dest=0)
    print("El procesador", rank,"encontró",max3)

Overwriting p3c.py


In [196]:
import time
start = time.time()
! mpiexec -n 4 python p3c.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El procesador 1 encontró 0.99999708
El procesador 2 encontró 0.99999791
El procesador 3 encontró 0.99999982
El procesador 0 encontró [0.99999982]
El proceso tomo 7.46843147277832 segundos


Solo por curiosidad, intentaremos con la división de chunks no asignada a ningún proceso.

In [203]:
%%writefile p3c2.py 
from mpi4py import MPI

import numpy as np
import pandas as pd
import random
from numpy import genfromtxt

comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

tarea2 = genfromtxt('tarea2.csv', delimiter=',')
tarea2_chunk = np.array_split(tarea2, 3)
chunk1=tarea2_chunk[0]
chunk2=tarea2_chunk[1]
chunk3=tarea2_chunk[2]

if rank == 0:    
    max1=chunk1.max()
    comm.Send(max1, dest=3)
    print("El procesador", rank, "encontró",max1)
elif rank == 1:
    max2=chunk2.max()
    comm.Send(max2, dest=3)
    print("El procesador",rank,"encontró",max2)
elif rank == 2:
    max3=chunk3.max()
    comm.Send(max3, dest=3)
    print("El procesador",rank,"encontró",max3)
elif rank == 3:
    max1 = np.empty(1)
    max2 = np.empty(1)
    max3 = np.empty(1)
    comm.Recv(max1, source=0)
    comm.Recv(max2, source=1)
    comm.Recv(max3, source=2)
    maxtot=max(max1,max2,max3)
    print("El procesador",rank,"encontró",maxtot)

Overwriting p3c2.py


In [204]:
import time
start = time.time()
! mpiexec -n 4 python p3c2.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El procesador 0 encontró 0.99999708
El procesador 1 encontró 0.99999791
El procesador 2 encontró 0.99999982
El procesador 3 encontró [0.99999982]
El proceso tomo 8.589226245880127 segundos


Podemos ver que si no se asigna la partición de la base de datos el tiempo tomado es considerablemente mayor

In [189]:
%%writefile p3scatter.py 
from mpi4py import MPI

import numpy as np
import pandas as pd
import random
from numpy import genfromtxt


comm = MPI.COMM_WORLD
rank = comm.Get_rank()
size = comm.Get_size()

if rank == 0:
    tarea2 = genfromtxt('tarea2.csv', delimiter=',')
    data = np.array_split(tarea2, 3)
else:
    data_s=np.empty(349525)
comm.Scatter(data,data_s,root=0)

Overwriting p3scatter.py


In [190]:
import time
start = time.time()
! mpiexec -n 4 python p3scatter.py
end = time.time()
print("El proceso tomo",end - start,"segundos")

El proceso tomo 7.39187479019165 segundos


Traceback (most recent call last):
  File "p3scatter.py", line 18, in <module>
    comm.Scatter(data,data_s,root=0)
NameError: name 'data' is not defined
Traceback (most recent call last):
  File "p3scatter.py", line 18, in <module>
    comm.Scatter(data,data_s,root=0)
NameError: name 'data' is not defined
Traceback (most recent call last):
  File "p3scatter.py", line 18, in <module>
    comm.Scatter(data,data_s,root=0)
NameError: name 'data' is not defined
Traceback (most recent call last):
  File "p3scatter.py", line 18, in <module>
    comm.Scatter(data,data_s,root=0)
NameError: name 'data_s' is not defined


El procesador 1 encontró 0.99999708
El procesador 2 encontró 0.99999791
El procesador 3 encontró 0.99999982
El proceso tomo 6.837156057357788 segundos


d.	Comparar los tiempos registrados en 3a, 3b y 3c. ¿Hay una reducción del tiempo? ¿La reducción del tiempo es lineal? ¿Por qué?

Hay un aumento del tiempo. 

La reducción del tiempo no es lineal pues hay procesos que no son paralelizables (por ejemplo la división de la base de datos) por lo que no se va a poder aprovechar los nuevos procesadores para dividir absolutamente todos los procesos entre ellos. 