In [None]:
# 멀티 프로세싱 코드
import multiprocessing
import pandas as pd
import numpy as np


#****** 기본 멀티 프로세싱 *********************************************
# 프로세싱 구조 설명 링크
# http://www.racketracer.com/2016/07/06/pandas-in-parallel/
def _apply_df(args):
    df, func, kwargs = args
    return df.apply(func, **kwargs)

def apply_by_multiprocessing(df, func, **kwargs):
    # 키워드 항목 중 workers 파라미터 추출
    workers = kwargs.pop('workers')
    
    # 위에서 가져온 workers 수로 프로세스 풀을 정의
    pool = multiprocessing.Pool(processes=workers)
    
    # 실행할 함수와 데이터프레임을 워커의 수 만큼 나눠서 작업
    result = pool.map(_apply_df, [(d, func, kwargs)
            for d in np.array_split(df, workers)])
    pool.close()
    
    # 작업 결과를 합쳐서 반환
    return pd.concat(list(result))


#**********************************************************************
def square(x):
    return x**x
    
if __name__ == '__main__':
    df = pd.DataFrame({'a':range(10), 'b':range(10)})
    apply_by_multiprocessing(df, square, axis=1, workers=4)  
    ## run by 4 processors