# Paralelismo em Python  com Process Pools

Processos permitem múltiplos fluxos paralelos de computação

* Fluxo Básico
  * Criação
  * Início da Execução
  * Em muitos casos: pontos de sincronização
    * Esperar por dados
    * Notificar outros processos que dados estão disponíveis
    * Criador do processo espera o final da execução

* O fluxo básico de processos é simplificado pela classe Pool





In [1]:
import multiprocessing
import time
import random

multiprocessing.cpu_count()

16

In [2]:
def cube(x) :
  c = x**3
  time.sleep(1)
  print(x,c)
  return c

In [3]:
cube(2)

2 8


8

In [4]:
values = range(int(20))

values = list(values)

print(values)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19]


In [5]:
results = []

start = time.time()

for x in values :
  results.append(cube(x))

done = time.time()

print("processing time: ", done-start)

0 0
1 1
2 8
3 27
4 64
5 125
6 216
7 343
8 512
9 729
10 1000
11 1331
12 1728
13 2197
14 2744
15 3375
16 4096
17 4913
18 5832
19 6859
processing time:  20.21705651283264


# Process Pools

* Process Pools em Python permitem o mapeamento de funções em um grupo de processos
* Atividade: tente alterar o número de entradas e o tamanho do Pool



In [6]:
#No caso do PC pessoal essa função demora mais, porque o tempo que o computador leva 
# para alocar a memória e organizar o processo para paralelizar é maior do que simplesmente 
# fazer sem paralelização

from multiprocessing import Pool

p=Pool(2)

values = range(int(20))

start = time.time()

results = p.map(cube,values)

done = time.time()

print("processing time: ", done-start)

print(results)

# Avaliação Preguiçosa

* pool.map quebra a entrada em pedaços, envia para os trabalhadores, e espera o resultado
  * Espera até todos os trabalhadores terminarem
* pool.imap and pool.imap_unordered permitem receber resultados assim que estiverem prontos
  * Não precisa esperar por todos trabalhadores
  * "Leve" em comparação com map
* Com uso de imap, é necessário iterar sobre os resultados


In [None]:
def cube_noprint(x) :
  c = x**3
  time.sleep(1)
  return (x,c)


In [None]:
from multiprocessing import Pool

p=Pool(2)

values = range(int(1024))

start = time.time()
results = p.imap_unordered(cube_noprint,values)
for r in results :
  print(r)
done = time.time()
print("processing time: ", done-start)

In [None]:
def cube_rand(x) :
  c = x**3
  time.sleep(random.random())
  return (x,c)

In [None]:
from multiprocessing import Pool


p=Pool(2)

values = range(int(100))

start = time.time()
results = p.imap_unordered(cube_rand,values)
for r in results :
  print(r)
done = time.time()
print("processing time: ", done-start)



# Paralelismo além de pools

* Além de Pools, Python oferece múltiplas interfaces para processamento paralelo
* Threads e Processos
  * Com função alvo
  * Como classes
* Documentação
  * https://docs.python.org/3/library/threading.html
  * https://docs.python.org/3/library/multiprocessing.html
* Mecanismo básico
  * Criação
  * Start
  * Join

