# multiprocessing
並列処理を行うためのモジュール

In [26]:
# 基本はこれをインポート
from multiprocessing import Pool, cpu_count
import time
from tqdm import tqdm 

## map

In [3]:
# mapはイテラブルなオブジェクトを引数として、指定した関数に入れた結果をiteratorとして返す。
square = lambda x: x**2
params = [1, 2, 3, 4]
map(square, params)

<map at 0x7f0f1cccfb10>

map関数に処理させたい関数と引数を入れると、iteratorが返る。

In [4]:
# iteratorなので、list化するとそれぞれの引数に対する関数の演算結果が取得できる。
# list内包表記で書けるので並列処理以外ではあまり使わない。
list(map(square, params))

[1, 4, 9, 16]

## Pool.map()とPool.imap()

In [8]:
# cpuのコア数を取得。VMのCPUを一時的に4に拡張
cpu_count()

4

In [14]:
# 並列処理用に使えるCPUリソースプール（Poolクラスのインスタンス）を用意。
p = Pool(processes=cpu_count()-1)

# 引数の時間CPUがスリープする関数。
def wait_sec(sec):
    time.sleep(sec)
    return sec ** 2

In [16]:
wait_sec(4)

16

In [19]:
before = time.time()
result = list(map(wait_sec, [1, 5, 3]))
after = time.time()
print('it took {} sec'.format(after - before))

it took 9.012224912643433 sec


In [20]:
result

[1, 25, 9]

以上の結果から、mapによる実行はデフォルトではシリアルに実行されている（シングルプロセスで実行）ことが分かる。  
Poolインスタンスを使用して並列に実行する。

In [21]:
# p.map()関数で並列に実行する。
before = time.time()
# p.map関数の戻り値はリストなので、list()は不要
result = p.map(wait_sec, [1, 5, 3])
after = time.time()
print('it took {} sec'.format(after - before))

it took 5.009413719177246 sec


In [22]:
result

[1, 25, 9]

並列化したことにより、別々のCPUで処理されて時間が短縮された。  
全体の時間は最も時間がかかるsec=5に引きずられる。  
ちなみにp.mapは全ての処理が終わるまで返り値のリストを返さないこと、リストの順番は引数の指定順になることに注意。

In [23]:
# p.imap()は並列で処理し、iteratorを返す
before = time.time()
# p.imapはiteratorを返すのでfor文で結果を逐次扱える。
for i in p.imap(wait_sec, [1, 5, 3]):
    print('{}: {} sec'.format(i, time.time() - before))
after = time.time()
print('it took {} sec'.format(after - before))

1: 1.0093603134155273 sec
25: 5.013791084289551 sec
9: 5.013989210128784 sec
it took 5.014124631881714 sec


1,5,3の順にwait_secに入るのでなく、並列に実行されることに注意。  
sec=3のときに5秒かかっているのは、for文内の処理の実行は引数の指定順となるため、  
sec=5の完了を待ってから実行されるため。sec=3自体の処理は3秒で終わっている。  
これを避けるには.imap_unorderedを使う。こうすると引数の指定順は関係なく処理が終わり次第結果を返す。

In [29]:
before = time.time()
# p.imapの戻り値はiterableなので、tqdmを使用可能
# 単に結果を返すだけならfor文にせず　result=list(tqdm(p.imap(wait_sec,[1, 5, 3],total=3)))でOK
for i in tqdm(p.imap_unordered(wait_sec, [1, 5, 3])):
    print('{}: {} sec'.format(i, time.time() - before))
after = time.time()
print('it took {} sec'.format(after - before))

1it [00:01,  1.00s/it]

1: 1.0068902969360352 sec


2it [00:03,  1.30s/it]

9: 3.0095877647399902 sec


3it [00:05,  1.67s/it]

25: 5.008234024047852 sec
it took 5.0177857875823975 sec





## 複数の引数を受け取って並列処理したい場合
imapやmapは単一の引数しか受け取れないのでラッパー関数を作って、  
複数の引数を渡す。

In [42]:
def multiply(a, b):
    return a * b

# 復習：*はunpacking operator
def wrap_multiply(args):
    return multiply(*args)

param1 = [1, 2, 3, 4]
param2 = [10, 30, 70, 20]
# param1,2の同じインデックス同士で掛け算したい。このような場合はzip関数を使うと  
# 同じインデックス同士のタプルのリストが作れる。CPUのそれぞれのジョブなので、job_argsと命名することが多い。
# [(1, 10), (2, 30), (3, 70), (4, 20)]
job_args = list(zip(param1, param2))

p = Pool(processes=cpu_count()-1)
# p.imapで指定する関数は引数を一つしか受け取れないので、multiplyではなくラッパー関数を指定する。
# 引数にはタプルのリストを入れて、ラッパー関数でアンパッキングする。
results = list(p.imap(wrap_multiply, job_args))

# リソース開放のため、忘れずに下記は実行すること。
p.close()
p.join()

In [37]:
# zip関数の返り値はiterator
#params = list(zip(param1, param2))

In [38]:
#params

[(1, 10), (2, 30), (3, 70), (4, 20)]

In [41]:
results

[10, 60, 210, 80]