In [3]:
from IPython.display import Image

# Multiprocessing

## 1. process v.s. thread
- ["프로세스와 쓰레드의 차이" 출처](https://gmlwjd9405.github.io/2018/09/14/process-vs-thread.html)

### 프로세스(process)
- 정의
    - 컴퓨터에서 연속적으로 실행되고 있는 컴퓨터 프로그램
    - 메모리에 올라와 실행되고 있는 프로그램의 인스턴스(독립적인 개체)
    - 운영체제로부터 시스템 자원을 할당받는 작업의 단위
    - 즉, 동적인 개념으로는 실행된 프로그램을 의미
- 특징
    - 프로세스는 각각 독립된 메모리 영역(Code, Data, Stack, Heap의 구조)을 할당받는다.
    - 기본적으로 프로세스당 최소 1개의 스레드(메인 스레드)를 가지고 있다.
    - 각 프로세스는 별도의 주소 공간에서 실행되며, 한 프로세스는 다른 프로세스의 변수나 자료구조에 접근할 수 없음
    - 한 프로세스가 다른 프로세스의 자원에 접근하려면 프로세스 간의 통신(IPC, inter-process communication)을 사용해야 함
        - Ex. 파이프, 파일, 소켓 등을 이용한 통신 방법 이용
<img src="https://gmlwjd9405.github.io/images/os-process-and-thread/process.png" width="400">
    
### 쓰레드(thread)
- 정의
    - 프로세스 내에서 실행되는 여러 흐름의 단위
    - 프로세스의 특정한 수행 경로
    - 프로세스가 할당받은 자원을 이용하는 실행의 단위
- 특징
    - 스레드는 프로세스 내에서 각각 Stack만 따로 할당받고 Code, Data, Heap 영역은 공유
    - 스레드는 한 프로세스 내에서 동작되는 여러 실행의 흐름으로, 프로세스 내의 주소 공간이나 자원들(힙 공간 등)을 같은 프로세스 내에 스레드끼리 공유하면서 실행
    - 같은 프로세스 안에 있는 여러 스레드들은 같은 힙 공간을 공유
        - 반면에 프로세스는 다른 프로세스의 메모리에 직접 접근할 수 없음
    - 각각의 스레드는 별도의 레지스터와 스택을 갖고 있지만, 힙 메모리는 서로 읽고 쓸 수 있음
    - 한 스레드가 프로세스 자원을 변경하면, 다른 이웃 스레드(sibling thread)도 그 변경 결과를 즉시 볼 수 있음
<img src="https://gmlwjd9405.github.io/images/os-process-and-thread/thread.png" width="400">


## 2. multi-processing v.s. multi-threading

### 멀티 프로세싱(multi-processing)
- 하나의 응용프로그램을 여러 개의 프로세스로 구성하여 각 프로세스가 하나의 작업(태스크)을 처리하도록 하는 것
- 장점: 여러 개의 자식 프로세스 중 하나에 문제가 발생하면 그 자식 프로세스만 죽는 것 이상으로 다른 영향이 확산되지 않음
- 단점
    - Context Switching에서의 오버헤드
        - Context Switching 과정에서 캐쉬 메모리 초기화 등 무거운 작업이 진행되고 많은 시간이 소모되는 등의 오버헤드가 발생하게 됨
        - 프로세스는 각각의 독립된 메모리 영역을 할당받았기 때문에 프로세스 사이에서 공유하는 메모리가 없어, Context Switching가 발생하면 캐쉬에 있는 모든 데이터를 모두 리셋하고 다시 캐쉬 정보를 불러와야 함
    - 프로세스 사이의 어렵고 복잡한 통신 기법(IPC)
        - 프로세스는 각각의 독립된 메모리 영역을 할당받았기 때문에 하나의 프로그램에 속하는 프로세스들 사이의 변수를 공유할 수 없음
    <img src="https://magi82.github.io/images/2017-2-6-process-thread/02.png" width="500">
        
### 멀티 쓰레딩(multi-threading)
- 하나의 응용프로그램을 여러 개의 스레드로 구성하고 각 스레드로 하여금 하나의 작업을 처리하도록 하는 것
    - 윈도우, 리눅스 등 많은 운영체제들이 멀티 프로세싱을 지원하고 있지만 멀티 스레딩을 기본으로 하고 있음
    - 웹 서버는 대표적인 멀티 스레드 응용 프로그램
- 장점
    - 시스템 자원 소모 감소 (자원의 효율성 증대): 프로세스를 생성하여 자원을 할당하는 시스템 콜이 줄어들어 자원을 효율적으로 관리할 수 있음
    - 시스템 처리량 증가 (처리 비용 감소)
        - 스레드 간 데이터를 주고 받는 것이 간단해지고 시스템 자원 소모가 줄어들게 됨
        - 스레드 사이의 작업량이 작아 Context Switching이 빠름
    - 간단한 통신 방법으로 인한 프로그램 응답 시간 단축
        - 스레드는 프로세스 내의 Stack 영역을 제외한 모든 메모리를 공유하기 때문에 통신의 부담이 적음
- 단점
    - 주의 깊은 설계가 필요
    - 디버깅이 까다로움
    - 단일 프로세스 시스템의 경우 효과를 기대하기 어려움
    - 다른 프로세스에서 스레드를 제어할 수 없음 (즉, 프로세스 밖에서 스레드 각각을 제어할 수 없음)
        - interrupt/kill 할 수 없음
    - 멀티 스레드의 경우 자원 공유의 문제가 발생 (동기화 문제)
    - 하나의 스레드에 문제가 발생하면 전체 프로세스가 영향을 받음
    <img src="https://gmlwjd9405.github.io/images/os-process-and-thread/multi-thread.png" width="500">

## 3. python에서의 multi-processing v.s. multi-threading

- ["python 강의 정리 / 멀티쓰레드, 멀티프로세스, gevent" 출처](http://blog.naver.com/PostView.nhn?blogId=sung487&logNo=221012867298


- 파이썬은 **멀티스레딩을 지원하기 위하여 GIL(Global Interpreter Lock), 즉 전역 인터프리터 락을 도입**하여 사용
    - 따라서 **python 스레드 10개를 만들어도 실제 Pthread/윈도우 스레드가 10개가 만들어지긴 하는데, GIL때문에 동시에 하나밖에 안돌아가는 기이한 구조**
- 이것은 구현이 매우 쉬워지고 빠른 개발을 할 수 있다는 장점, BUT 멀티 코어 CPU가 보편화된 2006년 이후에는 멀티 코어를 제대로 활용하지 못하는 구조적인 문제 때문에 성능에서 밀린다는 평가를 받음
- 만일 특정 프로그램에 순진하게 CPU 코어를 2개 이상 동원하려고 할 경우, 뮤텍스(MutEx), 즉 한 스레드에 여러 개의 CPU가 연산을 행하여 내부 정보를 오염 시키는 것을 방지하는 역할을 맡는 GIL이 병목 현상을 일으켜 코어 하나를 쓸 때보다 오히려 성능이 크게 저하
    - 구글 내부에서 이미 가루가 되도록 까인 부분이라고 함
- **이런 문제점 때문에 파이썬에서 병렬 처리가 필요할 때는 다중 스레드가 아닌 다중 프로세스로 GIL을 우회**하는 방식을 사용
    - 2008년 이후에 multiprocessing이라는 모듈을 제공하는데 이 모듈은 자식 프로세스를 만드는 방향으로 다중 코어 사용 시 성능의 향상을 꾀하고 있음

<img src="https://t1.daumcdn.net/cfile/tistory/99231D465A7BD9C81C" width="400">
<img src="https://t1.daumcdn.net/cfile/tistory/9923D8495A7BD9D406" width="600">


### 그래서 뭘 써야 하는가?

- CPU 부하가 큰 작업을 돌리는 것이 아니면 GIL을 체감하기는 생각보다 쉽지 않음
- 다중 스레딩으로 CPU의 여러 코어를 최대한 이용하고 싶은 경우에는 GIL가 굉장히 아쉬운 이슈지만, CPU를 별로 쓰지 않거나 I/O가 주가 되는 작업은 유의미한 성능 차이가 없음
    - 게다가 어설프게 코어 몇개 이용해서 계산하는 것보다는 그냥 C언어로 모듈을 짜서 붙이는 게 더 빠름
- 즉, python에서 CPU를 많이 먹는 부분은 C 모듈을 짜서 붙이거나, 이미 C 모듈로 짜여있는 라이브러리를 사용하거나(Numpy, Scipy 등), 필요하다면 multiprocessing 모듈을 이용하여 멀티코어를 활용
    - 그 이상의 CPU-heavy한 작업은 처음부터 C, C++로 짜는 게 맞음
    
- **쓰레드는 가볍지만 GIL로 인해 계산 처리를 하는 작업은 한번에 하나의 쓰레드에서만 작동. 따라서 cpu 작업이 적고 I/O 작업이 많은 병렬 처리 프로그램에서 효과를 볼 수 있다.......고 하는데,**
    - 대규모 연산의 멀티코어의 성능 향상을 보기 위한 것 말고도, I/O가 주가 되는 작업(즉, 여러 개의 I/O 이벤트를 기다리는 것)을 위해서 멀티스레드를 사용하는 경우가 많은데 **이런 경우에도 복잡한 동기화를 해야 하는 멀티쓰레딩을 사용하는 건 낭비**
        - 디버깅이 어려움
        - 실제로는 I/O를 위해 기다리는 시간이 실제 I/O가 발생했을 때 필요한 처리 작업을 수행하는 시간보다 월등히 긴 경우가 많아 여러 개의 스레드를 관리하기 위한 자원만 낭비하는 꼴이기 때문

### GIL(Global Interpreter Lock)
* ["왜 Python에는 GIL이 있는가" 출처](https://dgkim5360.tistory.com/entry/understanding-the-global-interpreter-lock-of-cpython)
- GIL 정의(python wiki): CPython에서의 GIL은 Python 코드(bytecode)를 실행할 때에 여러 thread를 사용할 경우, 단 하나의 thread만이 Python object에 접근할 수 있도록 제한하는 mutex(mutual exclusion) 이다. 그리고 이 lock이 필요한 이유는 CPython이 메모리를 관리하는 방법이 thread-safe하지 않기 때문이다.
<img src="https://t1.daumcdn.net/cfile/tistory/99111E4A5A7BD82804" width="400">

#### thread-safe ?
- 아래 예제에서 print(x)의 결과가 0으로 나오는 게 엇핏 생각하기엔 정상적으로 작동하는 모습이겠지만 실제 계산을 해보면 x의 값은 전혀 이상한 숫자가 됨
- 왜 그럴까? 전역 변수 x에 두 개의 thread가 동시에 접근해서 각자의 작업을 하면서 어느 한 쪽의 작업 결과가 반영이 되지 않기 때문
    - "씹혔다"는 뜻
- 이렇게 여러 thread가 공유된 데이터를 변경함으로써 발생하는 문제를 race condition이라고도 함
- **따라서 "thread-safe하다"는 것은 thread들이 race condition을 발생시키지 않으면서 각자의 일을 수행한다는 뜻**
    
#### 왜 GIL을 선택해야 했나
- Python이 태동하던 시기에는 thread라는 개념이 없었을 당시였고, 쉽고 간결한 언어를 표방했던 Python에 많은 사용자들이 모여들고 있었음
- 수많은 C extension들이 이미 만들어졌는데, 시간이 지나서 thread 개념으로 인한 문제를 해결하기 위해서 가장 현실적인 방안은 GIL
- 거대한 커뮤니티에서 만들어낸 C extension들을 새로운 메모리 관리 방법에 맞춰서 모두 바꾸는 것은 불가능. 대신 Python이 GIL을 도입하면 C extension들을 바꾸지 않아도 됐던 것
- 이렇게 초장기에 만들어진 CPython의 GIL은 현재 Python 3가 되도록 크게 변하지 않은 부분이라고 한다. BDFL은 GIL에 대한 개선을 하고 싶은 사람들에게 이렇게 말했다.
> I’d welcome a set of patches into Py3k only if the performance for a single-threaded program (and for a multi-threaded but I/O-bound program) does not decrease.
>
>단일 thread 프로그램에서의 성능을 저하시키지 않고 GIL의 문제점을 개선할 수 있다면, 나는 그 개선안을 기꺼이 받아들일 것이다.
- 그리고 지금까지 그렇게 해서 받아들여진 개선안은 없다고 함

#### python에서의 GIL
- 단일 thread일 때는 아무런 문제가 없음
- CPU가 바쁘게 계산하는 일들은 numpy/scipy에서 GIL 바깥에서 굉장히 효율적인 C 코드로 연산할 수 있음
- 병렬 처리에 관해서는 굳이 thread가 아니더라도 multiprocessing이나 asyncio 등의 많은 선택지가 있음
- 굳이 thread 간의 동시적인 처리가 필요하다면 다른 Python implementation을 고려해봐도 됨. Jython, IronPython, Stackless Python, PyPy 등

In [11]:
# python에서 thread-safe하지 않은 예제
# 숫자가 클수록 thread-safe 하지 않음
import threading

x = 0  # A shared value

def foo():
    global x
    for i in range(10000000):
        x += 1

def bar():
    global x
    for i in range(10000000):
        x -= 1

t1 = threading.Thread(target=foo)
t2 = threading.Thread(target=bar)
t1.start()
t2.start()
t1.join()
t2.join()  # Wait for completion

print(x)

520306


## multi-processing in python

- multiprocessing 은 threading 모듈과 유사한 API를 사용하여 프로세스 스포닝(spawning)을 지원하는 패키지
    - 프로세스를 스폰(spawn) 한다는 것은 한 프로세스가 자식 프로세스를 새로 만들어 어떤 작업을 위임하는 것을 뜻함. 하지만 자식 프로세스를 만드는 방법이 한가지가 아니고, 때로 spawn 은 그 중 한가지를 가리키는 경우에 사용하기도 함
- multiprocessing 패키지는 지역과 원격 동시성을 모두 제공하며 스레드 대신 서브 프로세스를 사용하여 GIL을 효과적으로 회피
- 이것 때문에 multiprocessing 모듈은 프로그래머가 주어진 기계에서 다중 프로세서를 최대한 활용할 수 있음
- 유닉스와 윈도우에서 모두 실행 가능

### 1. very basic multi-processing

In [1]:
import multiprocessing
import time
import sys

def worker():
    """worker function"""
    print('Worker')
    return

if __name__ == '__main__':
    jobs = []
    for i in range(5):
        p = multiprocessing.Process(target=worker)
        jobs.append(p)
        p.start()

Worker
Worker
Worker
Worker
Worker


In [34]:
# worker id와 함께 출력
def worker(num):
    """thread worker function"""
    print('Worker: {}'.format(num))
    return

if __name__ == '__main__':
    jobs = []
    for i in range(5):
        p = multiprocessing.Process(target=worker, args=(i,))
        jobs.append(p)
        p.start()

Worker: 1
Worker: 2
Worker: 0
Worker: 3
Worker: 4


In [36]:
# 현재 위치와 함께 출력
def worker():
    name = multiprocessing.current_process().name
    print('{} Starting'.format(name))
    time.sleep(2)
    print('{} Exiting'.format(name))

def my_service():
    name = multiprocessing.current_process().name
    print('{} Starting'.format(name))
    time.sleep(3)
    print('{} Exiting'.format(name))

if __name__ == '__main__':
    service = multiprocessing.Process(name='my_service', target=my_service)
    worker_1 = multiprocessing.Process(name='worker 1', target=worker)
    worker_2 = multiprocessing.Process(target=worker) # use default name

    worker_1.start()
    worker_2.start()
    service.start()

Process-21 Starting
my_service Starting
worker 1 Starting
Process-21 Exiting
worker 1 Exiting
my_service Exiting


In [2]:
import sys
import logging

# multi-process 환경에서 로깅
def worker():
    print('Doing some work', flush=True)
    #sys.stdout.flush()

if __name__ == '__main__':
    multiprocessing.log_to_stderr(logging.DEBUG)
    p = multiprocessing.Process(target=worker)
    p.start()
    p.join()

[INFO/Process-6] child process calling self.run()


Doing some work


[INFO/Process-6] process shutting down
[DEBUG/Process-6] running all "atexit" finalizers with priority >= 0
[DEBUG/Process-6] running the remaining "atexit" finalizers
[INFO/Process-6] process exiting with exitcode 0


### 2. 매핑 함수들 비교

- Python3 에서는 map에서 복수의 매개변수를 사용할 수 있도록 한 starmap이 추가
- map과 map_async 는 한번에 job의 리스트가 넘겨지지만 apply와 apply_async는 하나의 job만 넘겨짐(loop가 필요)
- 하지만 apply_async는 백그라운드에서 job을 병렬로 실행

<img src="img/Capture.PNG" width="600">

In [None]:
## 실행되지는 않는 사용법 비교 예시

# map
results = pool.map(worker, [1, 2, 3])

# apply
for x, y in [[1, 1], [2, 2]]:
    results.append(pool.apply(worker, (x, y)))

def collect_result(result):
    results.append(result)

# map_async
pool.map_async(worker, jobs, callback=collect_result)

# apply_async
for x, y in [[1, 1], [2, 2]]:
    pool.apply_async(worker, (x, y), callback=collect_result)

### 3. pool

- Pool 객체는 여러 입력 값에 걸쳐 함수의 실행을 병렬 처리하고 입력 데이터를 프로세스에 분산시키는 편리한 방법을 제공
    - 데이터 병렬 처리
- 아래 예제는 자식 프로세스가 해당 모듈을 성공적으로 import할 수 있도록 모듈에서 이러한 함수를 정의하는 일반적인 방법을 보여줌
    - Pool 를 사용하는 데이터 병렬 처리의 기본 예제

In [4]:
from multiprocessing import Pool
 
## 기본적인 예제
def doubler(number):
    return number * 2
 
if __name__ == '__main__':
    numbers = [5, 10, 20]
    pool = Pool(processes=3)
    print(pool.map(doubler, numbers))

[10, 20, 40]


- apply_async 메소드를 사용하여 풀에서 프로세스의 결과를 얻을 수 있음
- get 함수를 이용해 process 의 결과를 확인 가능
- 호출한 기능에 문제가 생길 경우를 대비해서 타임아웃을 설정

In [5]:
from multiprocessing import Pool
 
def doubler(number):
    return number * 2
 
if __name__ == '__main__':
    pool = Pool(processes=3)
    result = pool.apply_async(doubler, (25,))
    print(result.get(timeout=1))

50


### 4. 프로세스 간 객체 교환(1) : Queue

- multiprocessing 은 두 가지 유형의 프로세스 간 통신 채널을 지원
- Queue는 thread-safe, process-safe
- multiprocessing 의 Queue임! 그냥 import Queue 는 쓰레드간에 사용됨

In [6]:
from multiprocessing import Process, Queue

def f(q):
    q.put([42, None, 'hello'])

if __name__ == '__main__':
    q = Queue()
    p = Process(target=f, args=(q,))
    p.start()
    print(q.get())    # "[42, None, 'hello']" 를 프린트
    p.join()

[42, None, 'hello']


### 4. 프로세스 간 객체 교환(2) : pipe

- 파이프로 연결된 한 쌍의 연결 객체를 돌려주는데 기본적으로 양방향(duplex)
- Pipe() 가 반환하는 두 개의 연결 객체는 파이프의 두 끝을 나타냄
- 각 연결 객체에는 (다른 것도 있지만) send() 및 recv() 메서드가 있음
- 두 프로세스 (또는 스레드)가 파이프의 같은 끝에서 동시에 읽거나 쓰려고 하면 파이프의 데이터가 손상될 수 있음
- 물론 파이프의 다른 끝을 동시에 사용하는 프로세스로 인해 손상될 위험은 없음

In [7]:
from multiprocessing import Process, Pipe

def f(conn):
    conn.send([42, None, 'hello'])
    conn.close()

if __name__ == '__main__':
    parent_conn, child_conn = Pipe()
    p = Process(target=f, args=(child_conn,))
    p.start()
    print(parent_conn.recv())   # "[42, None, 'hello']" 를 프린트
    p.join()

[42, None, 'hello']


### 5. 성능 비교 ?????????
- 듀얼코어 환경
- [제대로 된 결과 참고](https://doorbw.tistory.com/205)

In [9]:
from functools import partial 
from threading import Thread
import multiprocessing
import time
 
def singleCount(cnt,name):
    for i in range(1,10000001):
        cnt += 1
        if(i%5000000 == 0):
            print(name,":",i)
 
lists = ['1','2','3','4']
# single process start
cnt = 0
print(" # # SINGLE PROCESSING # # ")
start_time = time.time()
for each in lists:
    singleCount(cnt,each)
print("SINGLE PROCESSING TIME : %s\n" %(time.time()-start_time))
 
# multi process start
cnt = 0
print(" # # MULTI PROCESSING # # ")
start_time = time.time()
pool = multiprocessing.Pool(processes=4)
func = partial(singleCount, cnt)
pool.map(func, lists)
pool.close()
pool.join()
print("MULTI PROCESSING TIME : %s\n" %(time.time()-start_time))
 
#multi threading start
cnt = 0
print(" # # MULTI THREADING # # ")
start_time = time.time()
th1 = Thread(target=singleCount, args=(cnt,"1"))
th1.start()
th1.join()
th2 = Thread(target=singleCount, args=(cnt,"2"))
th2.start()
th2.join()
th3 = Thread(target=singleCount, args=(cnt,"3"))
th3.start()
th3.join()
th4 = Thread(target=singleCount, args=(cnt,"4"))
th4.start()
th4.join()
print("MULTI THREADING TIME : %s\n" %(time.time()-start_time))

 # # SINGLE PROCESSING # # 
1 : 2500000
1 : 5000000
1 : 7500000
1 : 10000000
2 : 2500000
2 : 5000000
2 : 7500000
2 : 10000000
3 : 2500000
3 : 5000000
3 : 7500000
3 : 10000000
4 : 2500000
4 : 5000000
4 : 7500000
4 : 10000000
SINGLE PROCESSING TIME : 5.079680442810059

 # # MULTI PROCESSING # # 
3 : 2500000
1 : 2500000
4 : 2500000
2 : 2500000
4 : 5000000
1 : 5000000
3 : 5000000
2 : 5000000
4 : 7500000
1 : 7500000
3 : 7500000
2 : 7500000
4 : 10000000
1 : 10000000
3 : 10000000
2 : 10000000
MULTI PROCESSING TIME : 5.637576580047607

 # # MULTI THREADING # # 
1 : 2500000
1 : 5000000
1 : 7500000
1 : 10000000
2 : 2500000
2 : 5000000
2 : 7500000
2 : 10000000
3 : 2500000
3 : 5000000
3 : 7500000
3 : 10000000
4 : 2500000
4 : 5000000
4 : 7500000
4 : 10000000
MULTI THREADING TIME : 5.264259576797485



### 6. PicklingError
- [stack overflow 글 참고: python-multiprocessing-picklingerror-cant-pickle-type-function](https://stackoverflow.com/questions/8804830/python-multiprocessing-picklingerror-cant-pickle-type-function)

- 멀티프로세싱 과정에서 아래와 같은 `PicklingError` 발생
    - 사용하는 함수가 최상위 위치에서 정의되지 않는 경우: class 내부에 정의된 함수를 사용할 수가 없음
    - 사용하는 함수가 pool 이후에 선언된 경우
        - `_pickle.PicklingError: Can't pickle <function count at 0x7f62ebfb69d8>: attribute lookup count on __main__ failed`

    - async job에 입력한 객체가 inbuilt function을 하나라도 가지고 있을 경우
        - `_pickle.PicklingError: Can't pickle <type 'function'>: attribute lookup __builtin__.function failed`

In [17]:
import multiprocessing as mp

class Foo():
    @staticmethod
    def work(self):
        pass

pool = mp.Pool()
foo = Foo()
pool.apply_async(foo.work)
pool.close()
pool.join()

- 자료로 업로드한 `multiprocessing.py`를 line_profiler로 실행하면 아래와 같은 에러가 발생
``` bash
Traceback (most recent call last):
  File "/home/lynn/.virtualenvs/data/bin/kernprof", line 11, in <module>
    sys.exit(main())
  File "/home/lynn/.virtualenvs/data/lib/python3.5/site-packages/kernprof.py", line 222, in main
    execfile(script_file, ns, ns)
  File "/home/lynn/.virtualenvs/data/lib/python3.5/site-packages/kernprof.py", line 35, in execfile
    exec_(compile(f.read(), filename, 'exec'), globals, locals)
  File "multiprocessing.py", line 46, in <module>
    multi_process(lists)
  File "/home/lynn/.virtualenvs/data/lib/python3.5/site-packages/line_profiler.py", line 115, in wrapper
    result = func(*args, **kwds)
  File "multiprocessing.py", line 23, in multi_process
    pool.map(func, lists)
  File "/usr/lib/python3.5/multiprocessing/pool.py", line 260, in map
    return self._map_async(func, iterable, mapstar, chunksize).get()
  File "/usr/lib/python3.5/multiprocessing/pool.py", line 608, in get
    raise self._value
  File "/usr/lib/python3.5/multiprocessing/pool.py", line 385, in _handle_tasks
    put(task)
  File "/usr/lib/python3.5/multiprocessing/connection.py", line 206, in send
    self._send_bytes(ForkingPickler.dumps(obj))
  File "/usr/lib/python3.5/multiprocessing/reduction.py", line 50, in dumps
    cls(buf, protocol).dump(obj)
_pickle.PicklingError: Can't pickle <function singleCount at 0x7f9595cbf9d8>: attribute lookup singleCount on __main__ failed
```

- 대안으로 `pathos.multiprocessing` 사용: [참고](https://stackoverflow.com/questions/26059764/python-multiprocessing-with-pathos)

# References
- https://magi82.github.io/process-thread/
- https://python.flowdas.com/library/multiprocessing.html
- http://blog.naver.com/PostView.nhn?blogId=parkjy76&logNo=221089918474
- https://hamait.tistory.com/755
- https://doorbw.tistory.com/205