# Chap 06 파이썬 고급 주제

# 6.1 멀티 프로세스와 멀티 스레드
<hr>

프로그램의 작업을 동시에 수행하는 방법은 멀티 프로세스와 멀티 스레드이다.

- **멀티 프로세스**
    * 별도의 메모리 영역을 가지며, 특별한 메커니즘으로만 통신 가능
    * 프로세스 간 데이터 공유와 통신용으로는 비효율적
    * 파이썬에서는 subprocess 모듈을 사용
    
- **멀티 스레드**
    * 단일 프로세스 내의 멀티 스레드는 동일한 메모리에 접근
    * threading 모듈의 처리를 ㅗㅇ해 한번에 한 스레드만 메모리 영역에 접근 가능
    * 각 프로세스가 독립적인 stack, heap, code, data 영역을 가지는 반면, 한 프로세스에 속한 스레드는 stack 영역을 제외한 메모리 영역을 공유
    
파이썬에 스레드 매커니즘이 있긴 하나, 진정한 병렬 실행이 지원되는 것은 아님. 하지만 오늘날 운영체제에서 충분히 효율적임.

## 6.1.1 subprocess 모듈

- subprocess 모듈은 '부모-자식' 프로세스 쌍을 생성하는 데 사용
- 부모 프로세스는 차례로 다른 일을 처리하는 자식 프로세스의 인스턴스를 실행
- 자식 프로세스를 사용함으로써 멀티 코어의 이점을 최대한 취하고, 동시성(concurrency) 문제를 운영체제가 알아서 처리하도록 한다

## 6.1.2 threading 모듈

- 스레드가 여러개로 분리되면, 스레드 간 데이터 고융의 복잡성이 증가
- 또한 lock과 deadlock을 회피하는 데 주의를 기울여야 함
- 파이썬에서는 단 하나의 메인 스레드만 존재
- 멀티 스레드를 사용하려면 threading 모듈 사용

- lock 관리를 위해 queue 모듈 사용
- 큐에 의존하면 자원의 접근을 직렬화할 수 있고, 이는 곧 한번에 하나의 스레드만 데이터에 접근할 수 있게 한다는 뜻(FIFO)

- worker thread가 작업을 완료했는데도 프로그램이 종료되지 않고 계속 실행되는 경우 문제가 될 수 있다
- 스레드를 데몬으로 변환하면 데몬 스레드가 실행되지 않는 즉시 프로그램이 종료
- queue.join() 메서드는 큐가 빌 때까지(큐의 모든 항목이 처리될 때까지) 기다린다

In [None]:
import queue
import threading

q = queue.Queue()

def worker(num):
    while True:
        item = q.get()
        if item is None:
            break
        # 작업을 처리한다.
        print("스레드 {0} : 처리 완료 {1}".format(num+1, item))
        q.task_done()
        
if __name__ == "__main__":
    num_worker_threads = 5
    threads = []
    for i in range(num_worker_threads):
        t = threading.Thread(target=worker, args=(i,))
        t.start()
        threads.append(t)
        
    for item in range(20):
        q.put(item)
        
    # 모든 작업이 끝날 때까지 대기한다(block).
    q.join()
    
    #워커 스레드를 종료한다(stop).
    for i in range(num_worker_threads):
        q.put(None)
    for t in threads:
        t.join()