# Fund29. 컴퓨터 파워 UP
## 멀티태스킹 (1) 멀티태스킹이란?
멀티태스킹에는 동시성, 병렬성의 2가지 동작 방식이 있다. 
- 동시성(Concurrency) : 하나의 processor가 여러 가지 task를 동시에 수행하는 개념을 **동시성**이라고 한다. 실제로는 그 processor는 특정 순간에는 1가지 task만을 수행하겠지만, 다른 task를 수행할 수 있는 시간에는 task를 전환해서 효율적으로 여러 개의 task를 동시에 수행하는 것처럼 보이는 것이다.  
- 병렬성(Parallelism) : 유사한 task를 여러 processor가 동시에 수행하는 것을 병렬성이라고 한다. 
- 병렬성이 효율을 극대화하는 것은 동시성이 요구될 때다. 이 때, 여러 개의 processor가 1개의 task를 여러 개의 subtask르 쪼개 병렬적으로 수행할 수 있기 때문이다.  


### 동기 vs 비동기 (Synchronous vs Asynchronous)
- 동기와 비동기는 동시성에서 주로 다루는 개념이다. 어떤 일을 바로 하지 못하고 대기해야 할 때 컴퓨터에서는 "바운드(bound)되엇다"라는 표현을 많이 쓴다. 어떤 일이 바운드되고 있으면 이걸 계속 기다릴지, 다른 걸 실행하는 것이 좋을지 고민할 수 있다. 
- 앞 작업이 종료되기를 무조건 기다렸다가 다음 작업을 수행하는 것은 동기(synchronized) 방식이라고 한다. 반대로 바운드되고 있는 작업을 기다리는 동안 다른 일을 처리하는 것을 비동기(asynchronous) 방식이라고 한다. 
- 동기 : 어떤 일이 순차적으로 실행됨. 요청과 요청에 대한 응답이 연속적으로 실행됨(따라서 요청에 지연이 발생하더라도 계속 대기한다)
- 비동기 : 어떤 일이 비순차적으로 실행됨. 요청과 요청에 대한 응답이 연속적으로 실행되지 않음. 특정 코드의 연산이 끝날 때까지 코드의 실행을 멈추지 않고 다음 코드를 먼저 실행하며, 중간에 실행되는 코드는 주로 콜백함수로 연결하기도 한다.  


### I/O Bound vs CPU Bound
컴퓨터가 일을 수행하면서 뭔가 기다릴 때, 즉 속도에 제한이 걸릴 때는 2가지 상황에 해당하는 경우가 대부분이다. 
- I/O Bound : 입력과 출력에서의 데이터(파일)처리에 시간이 소요될 때
- CPU Bound : 복잡한 수식 계산이나 그래픽 작업과 같은 엄청난 계산이 필요할 때

## 멀티태스킹 (2) 프로세스, 스레드, 프로파일링
### 프로세스 (Process)
- 하나의 프로그램을 실행할 때, 운영체제는 한 프로세스를 생성한다. 프로세스는 운영체제의 커널에서 시스템 자원 및 자료구조를 이용한다. 
- 프로세스는 "프로그램을 구동해 프로그램 자체와 프로그램의 상태가 메모리 상에서 실행되는 작업 단위"를 지칭한다. 
- 파이썬에서는 `os`라는 모듈에서 프로세스 관련 정보를 얻을 수 있다. 

In [1]:
import os

# process ID
print("process ID:", os.getpid())

# user ID
print("user ID:", os.getuid())

# group ID
print("group ID:", os.getgid())

# 현재 작업 중인 디렉토리
print("current Directory:", os.getcwd())

process ID: 306
user ID: 0
group ID: 0
current Directory: /aiffel/aiffel


In [2]:
!ps -ef | grep 306

root         306       7  6 03:01 ?        00:00:00 /opt/conda/bin/python -m ipykernel_launcher -f /aiffel/.local/share/jupyter/runtime/kernel-8e525c6b-315e-47b4-bfda-14cfee61407a.json
root         322     306  0 03:02 pts/0    00:00:00 /bin/bash -c ps -ef | grep 306
root         324     322  0 03:02 pts/0    00:00:00 grep 306


- 출력된 pid는 현재 jupyter 커널 프로세스였다.  


### 스레드 (Thread)
- 스레드는 어떤 프로그램 내, 특히 프로세스 내에서 실행되는 흐름의 단위다. 
- 프로세스도 자신만의 전용 메모리 공간(Heap)을 가진다. 이 때 해당 프로세스 내의 스레드들은 이 공간을 공유하지만 다른 프로세스와 공유하지는 않는다. 
- 스레드의 사용은 프로그램마다 다르다. 하나의 프로그램에서 여러 개의 스레드가 병렬적으로 처리되기도 하고, 가벼운 프로그램은 하나의 스레드를 가지기도 한다.  


### 프로파일링 (Profiling)
- 프로파일링이란 코드에서 시스템의 어느 부분이 느린지 혹은 RAM을 많이 사용하고 있는지를 확인하고 싶을 때 사용하는 기법이다. 
- 파이썬에서는 다음 명령어로 확인할 수 있다. 

In [3]:
%timeit

In [4]:
import time
time.time()

1645585334.5762286

In [5]:
import timeit
timeit.Timer()

<timeit.Timer at 0x7f264c0cb280>

In [6]:
import timeit
        
def f1():
    s = set(range(100))

    
def f2():
    l = list(range(100))

    
def f3():
    t = tuple(range(100))


def f4():
    s = str(range(100))

    
def f5():
    s = set()
    for i in range(100):
        s.add(i)

def f6():
    l = []
    for i in range(100):
        l.append(i)
    
def f7():
    s_comp = {i for i in range(100)}

    
def f8():
    l_comp = [i for i in range(100)]
    

if __name__ == "__main__":
    t1 = timeit.Timer("f1()", "from __main__ import f1")
    t2 = timeit.Timer("f2()", "from __main__ import f2")
    t3 = timeit.Timer("f3()", "from __main__ import f3")
    t4 = timeit.Timer("f4()", "from __main__ import f4")
    t5 = timeit.Timer("f5()", "from __main__ import f5")
    t6 = timeit.Timer("f6()", "from __main__ import f6")
    t7 = timeit.Timer("f7()", "from __main__ import f7")
    t8 = timeit.Timer("f8()", "from __main__ import f8")
    print("set               :", t1.timeit(), '[ms]')
    print("list              :", t2.timeit(), '[ms]')
    print("tuple             :", t3.timeit(), '[ms]')
    print("string            :", t4.timeit(), '[ms]')
    print("set_add           :", t5.timeit(), '[ms]')
    print("list_append       :", t6.timeit(), '[ms]')
    print("set_comprehension :", t7.timeit(), '[ms]')
    print("list_comprehension:", t8.timeit(), '[ms]')

set               : 1.6807625149995147 [ms]
list              : 0.8004848170003243 [ms]
tuple             : 0.7557866059996741 [ms]
string            : 0.42687667999962287 [ms]
set_add           : 5.706842617999428 [ms]
list_append       : 5.262437666000551 [ms]
set_comprehension : 3.4739122789997054 [ms]
list_comprehension: 2.9223277880009846 [ms]


- 이런 식으로 함수의 성능을 측정할 수 있다. 사실 이것은 시간을 측정하는 방법이라 프로파일링이라고 하기에 민망할 수도 있다. 
- 좀 더 엄밀히 말하면 프로파일링은 애플리케이션에서 가장 자원이 집중되는 지점을 정밀하게 찾아내는 기법이다. 
- 프로파일러는 애플리케이션을 실행시키고 각각의 함수 실행에 드는 시간을 찾아내는 프로그램이다. 즉, 코드의 병목(bottleneck)을 찾아내고 성능을 측정하는 도구다. 
- `profile` 모듈, `cProfile` 모듈과 `line_profiler` 패키지를 이용하면 높은 수준의 프로파일링이 가능하다. 

## 멀티태스킹 (3) Scale Up vs Scale Out
- 프로그램과 성능에 대한 전반적인 개념에 대해서 살펴보았다. 
- 더 포괄적인 용어로 말하면 우리는 컴퓨터 자원을 활용하기 위해 자원을 Up(업그레이드, 최적화)시킬 수도 있고, 자원을 Out(확장)시킬 수도 있다. 
- Scale-Up은 한 대의 컴퓨터의 성능을 최적화시키는 방법이고, Scale-Out은 여러 대의 컴퓨터를 한 대처럼 사용하는 것이다. 

## 파이썬에서 멀티스레드 사용하기 (1) 스레드 생성
- 파이썬에서 멀티스레드의 구현은 `threading` 모듈을 이용한다.  


### 기본 코드

In [7]:
# 음식 배달과 그릇 찾기 2가지 작업을 순차적으로 수행하는 코드
class Delivery:
    def run(self):
        print("delivery")
        
class RetriveDish:
    def run(self):
        print("Retriving Dish")
        
work1 = Delivery()
work2 = RetriveDish()

def main():
    work1.run()
    work2.run()
    
if __name__ == '__main__':
    main()

delivery
Retriving Dish


### 멀티 스레드
다음과 같이 코드를 고쳐보자. 
- threading 모듈 import하고 클래스에 Thread 상속받기

In [8]:
from threading import *

class Delivery(Thread):
	def run(self):
		print("delivery")

class RetriveDish(Thread):
	def run(self):
		print("Retriving Dish")

work1 = Delivery()
work2 = RetriveDish()

def main():
	work1.run()
	work2.run()

if __name__ == '__main__':
    main()

delivery
Retriving Dish


### 스레드 생성 확인
- 함수 이름을 출력하면 함수 객체를 확인할 수 있다. 

In [9]:
from threading import *

class Delivery:
    def run(self):
        print("delivering")

work1 = Delivery()
print(work1.run)

class Delivery(Thread):
    def run(self):
        print("delivering")

work2 = Delivery()
print(work2.run)

<bound method Delivery.run of <__main__.Delivery object at 0x7f264c087850>>
<bound method Delivery.run of <Delivery(Thread-10, initial)>>


## 파이썬에서 멀티스레드 사용하기 (2) 스레드 생성 및 사용
### 스레드 생성
- `threading` 모듈의 `Thread` 클래스를 상속받아서 구현할 수도 있지만 그대로 인스턴스화하여 스레드를 생성할 수도 있다. 
- 인스턴스화하려면 `Thread` 클래스에 인자로 `target`, `args` 값을 넣어준다. `args`에 넣은 파라미터는 스레드 함수의 인자로 넘어간다. 
- Thread 클래스에는 `start()`, `join()`과 같은 스레드 동작 관련 메서드가 있다. Thread로 실행할 함수를 정의 후 `start()`를 통해 스레드를 실행한다. 

In [10]:
from threading import *
from time import sleep

Stopped = False

def worker(work, sleep_sec):    # 일꾼 스레드
    while not Stopped:          # 그만 하라고 할때까지
        print('do ', work)      # 시키는 일을 하고
        sleep(sleep_sec)        # 잠깐 쉰다.
    print('retired..')          # 언젠가 이 굴레를 벗어나면, 은퇴할 때가 올 것이다!
        
t = Thread(target=worker, args=('Overwork', 3))    # 일꾼 스레드를 하나 생성한다. 열심히 일하고 3초간 쉰다.
t.start()    # 일꾼, 이제 일을 해야지? 😈

do  Overwork
do  Overwork
do  Overwork
do  Overwork
do  Overwork


In [11]:
# 이 코드 블럭을 실행하기 전까지는 일꾼 스레드는 종료하지 않는다.
Stopped = True    # 일꾼 일 그만하라고 세팅한다.
t.join()          # 일꾼 스레드가 종료할때까지 기다린다.. 
print('worker is gone.')

retired..
worker is gone.


## 파이썬에서 멀티프로세스 사용하기
- 파이썬에서 멀티프로세스의 구현은 `multiprocessing` 모듈을 이용해서 할 수 있다.  


### 프로세스 생성
- 프로세스도 스레드와 유사한 방법으로 생성한다. 
- `Process` 인스턴스를 만든 뒤, `target`, `args` 파라미터에 각각 함수 이름과 함수 인자를 전달한다. 

In [12]:
import multiprocessing as mp

def delivery():
    print('delivering...')
    
p = mp.Process(target=delivery, args=())
p.start()

delivering...


### 프로세스 사용
- `Process` 클래스는 `start()`, `join()`, `terminate()` 같은 프로세스 동작 관련 메서드가 있다. 

In [13]:
p.terminate()

## 파이썬에서 스레드 / 프로세스 풀 사용하기
- 사실 멀티스레드 / 프로세스 작업을 할 때 가장 많은 연산이 필요한 작업은 스레드나 프로세스를 생성하고 종료하는 일이다. 특히, 스레드 / 프로세스를 사용한 뒤에는 제대로 종료해야 컴퓨팅 리소스가 낭비되지 않는다. 
- 또한 지금까지 본 것처럼 하나씩 하나씩 실행한다고 전체적인 프로그램의 성능이 좋아지지는 않는다. 오히려 더 번거롭다. 실제로 사용할 때는 스레드 / 프로세스 풀을 사용해서 생성한다. 풀(Pool)은 스레드나 프로세스로 가득 찬 풀장이라고 생각하면 된다. 스레드 풀을 만들면 각각의 태스크들에 대해 자동으로 스레드들을 할당하고 종료한다. 
- 풀을 만드는 방법은 Queue르 사용해 직접 만드는 방법과 concurrent.futures 라이브러리의 `ThreadPoolExecutor`, `ProcessPoolExecuter` 클래스를 이용하는 두 가지 방법이 있다. 여기서는 `concurrent.futures` 모듈을 사용하는 방법을 이용해 구현해보자.  


### `concurrent.futures` 모듈 소개
- 이 모듈은 파이썬 3.2부터 추가된 모듈이다. 동시성 퓨처라고 번역해서 부르기도 하는데, 기능은 크게 4가지가 있다. 
- `Executor` 객체
- `ThreadPoolExecutor` 객체
- `ProcessPoolExecutor` 객체
- `Future` 객체  



### ThreadPoolExecutor
- `Executor` 객체를 이용하면 스레드 생성, 시작, 조인 같은 작업 시 `with` 컨텍스트 관리자와 같은 방법으로 가독성 높은 코드를 구현할 수 있다. 

In [14]:
from concurrent.futures import ThreadPoolExecutor

class Delivery:
    def run(self):
        print("delivering")
w = Delivery()

with ThreadPoolExecutor() as executor:
    future = executor.submit(w.run)

delivering


### multiprocessing.Pool
- multiprocessing.Pool.map을 통해 여러 개의 프로세스에 특정 함수를 매핑해서 병렬처리하도록 구현하는 방법이 널리 사용된다. 

In [15]:
from multiprocessing import Pool
from os import getpid

def double(i):
    print("I'm procesesing ", getpid())  # pool 안에서 이 메서드가 실행될 때 pid를 확인해보자.
    return i * 2

with Pool() as pool:
    result = pool.map(double, [1, 2, 3, 4, 5])
    print(result)

I'm procesesing I'm procesesing I'm procesesing I'm procesesing   332  333334

I'm procesesing  332

335
[2, 4, 6, 8, 10]


- `double(i)`라는 메서드가 pool을 통해 각각 다른 pid를 가진 프로세스들 위에서 multiprocess로 실행된 것을 확인할 수 있다. 

## 실전 예제 (1) futures 모듈
- `concurrent.futures` 모듈의 `ProcessPoolExecutor`를 이용해 병렬 프로그래밍을 연습해보자. 
- `concurrent.futures` 모듈은 `Executor`, `Futures`의 2가지 객체가 있다. 
- `Executor` 객체에는 `ThreadPoolExecutor`, `ProcessPoolExecutor`의 2개의 서브클래스가 있다. 
- `Executor` 객체는 `submit()`, `map()`, `shutdown()` 세 가지 메서드를 제공한다. 

## 실전 예제 (2) 튜토리얼
- `Executor` 객체의 `map()` 함수
- `ProcessPoolExecutor` 부분
- `concurrent.futures` 모듈의 `ProcessPoolExecutor`를 이용해 멀티프로세스 구현을 연습해보자. 

### 1) 문제
- 소수 판별 문제로 PRIMES 변수에 선언된 숫자들이 소수인지 아닌지를 판별한다. 

In [16]:
import math
import concurrent

PRIMES = [
    112272535095293,
    112582705942171,
    112272535095293,
    115280095190773,
    115797848077099,
    1099726899285419]

### 2) 소수판별 함수 is_prime

In [17]:
def is_prime(n):
    if n < 2:
        return False
    if n == 2:
        return True
    if n % 2 == 0:
        return False
    
    sqrt_n = int(math.floor(math.sqrt(n)))
    for i in range(3, sqrt_n + 1, 2):
        if n % i == 0:
            return False
    return True

### 3) 소수판별 함수 호출
- `main()` 함수를 따로 작성해 소수판별 함수를 호출
- 맵-리듀스 스타일로 코드를 작성하고 `map()` 함수를 `ProcessPoolExecutor()` 인스턴스에서 생성된 `executor`에서 실행시킨다. 
- `concurrent.futures` 라이브러리의 프로세스 풀에서 동작하게 하기 위해 `with`문을 써서 구현했다. 

In [18]:
def main():
    with concurrent.futures.ProcessPoolExecutor() as executor:
        for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))

- 병렬처리와 단일처리의 비교를 위해 코드를 아래와 같이 수정해보자. 
- 프로파일링을 위한 시간 계산 코드를 추가
- 단일처리로 수행했을 때의 코드를 추가, 단일처리 프로파일링을 위한 시간 계산 코드를 추가

In [19]:
import time

def main():
    print("병렬처리 시작")
    start = time.time()
    with concurrent.futures.ProcessPoolExecutor() as executor:
        for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))
    end = time.time()
    print("병렬처리 수행 시각", end-start, 's')
    
    print("단일처리 시작")
    start = time.time()
    for number, prime in zip(PRIMES, map(is_prime, PRIMES)):
        print('%d is prime: %s' % (number, prime))
    end = time.time()
    print("단일처리 수행 시각", end-start, 's')

In [20]:
main()

병렬처리 시작
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
병렬처리 수행 시각 1.8718743324279785 s
단일처리 시작
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
단일처리 수행 시각 2.7375078201293945 s
