# Multitasking
* 동시성(Concurrency) : (실제로 동시에 하는 것은 아니지만)여러가지 일을 빠르게 번갈하가며 수행하여 동시에 수행하는 것처럼 일하는 것
* 병렬성(Parallelism)

## Concurrency - 동기 vs 비동기
동시성에서 주로 다루게 될 개념입니다. 배달과 그릇 찾기 2가지 일을 반복적으로 한다고 해볼게요. 배달하고 그릇을 찾으러 갔는데 아직 그릇이 안 나왔네요. 아마 아직도 먹고 있나봐요. 그럼 기다렸다가 그릇을 찾는 게 좋을까요, 아니면 다른 곳을 먼저 배달하고 그릇을 찾는 게 더 좋을까요?

이렇게 어떤 일을 바로 하지 못하고 대기해야 하는 일을 일컬을 때 컴퓨터에서는 **바운드(bound)되었다** 라는 표현을 많이 씁니다. 이렇게 바운드되고 있으면 이걸 계속 기다려야 할지 아니면 종료되는 사이에 다른 걸 실행하는것이 좋을지 고민이 되지요.

개념을 일반화 시켜 이야기하면 작동하는 방식에 따라 앞 작업이 종료되기를 무조건 기다렸다가 다음 작업을 수행하는 것은 동기(synchronized) 방식이라고 이야기합니다. 기다리는 동안 다른 일을 처리하는 것을 비동기(asynchronous) 방식이라고 이야기합니다.

* 동기(Synchronous) : 어떤 일이 순차적으로 실행됨. 요청과 요청에 대한 응답이 동시에 실행됨. 따라서 요청에 지연이 발생하면 계속 대기한다.
* 비동기(Asynchronous) : 어떤 일이 비순차적으로 샐행됨. 요청과 요청에 대한 응답이 동시에 실행되지 않음.
    * 특정 코드의 연산이 끝날 때까지 코드의 실행을 멈추지 않고 다음 코드를 먼저 실행
    * 중간에 실행되는 코드는 주로 콜백함수로 연결한다.
    
## I/O Bound vs CPU Bound
컴퓨터가 일을 수행하면서 뭔가 기다릴 때, 즉 속도에 제한이 걸릴 때는 2가지 경우에 해당하는 경우가 대부분
* I/O 바운드: 입력과 출력에서의 데이터(파일)처리에 시간이 소요될 때.
* CPU 바운드: 복잡한 수식 계산이나 그래픽 작업과 같은 엄청난 계산이 필요할 때.

## Process
하나의 프로그램을 실행할 때, 운영체제는 한 프로세스를 생성합니다. 프로세스는 운영체제의 커널(Kernel)에서 시스템 자원(CPU, 메모리, 디스크) 및 자료구조를 이용합니다.
* 프로세스 : 프로그램을 구동하여 프로그램 자체와 프로그램의 상태가 메모리 상에서 실행되는 작업 단위
    * 예를 들어, 하나의 프로그램을 한 번 구동하면 하나의 프로세스가 메모리 상에서 실행되지만 여러 번 구동하면 여러 개의 프로세스가 실행됨.

In [1]:
import os

# process ID
print(os.getpid())

# user ID
print(os.getuid())

# group ID
print(os.getgid())

# 현재 작업중인 디렉토리
print(os.getcwd())

3468
1000
1000
/home/dasol-ubuntu/workspace/Modulabs-Dasol/Study


## Thread
어떠한 프로그램 내에서, 특히 프로세스 내에서 실행되는 흐름의 단위
* 예를 들어 요리를 만드는 프로그램이라고 한다면 김밥, 떡볶이를 만드는 각각의 요리라는 프로세스에도, 밥짓기, 재료 볶기, 끓이기 등등의 작업을 스레드에 비유할 수 있습니다. 같은 작업을 좀 더 빠르게 처리하기 위해 여러 개의 스레드를 생성하기도 합니다.
* 프로세스 : 김밥, 떡볶이를 만드는 각각의 요리사
* 이 프로세스들은 각자의 전용 주방공간(전용 메모리공간, Heap)에서 밥짓기, 재료볶기 등 작업을 병렬적으로 수행.
* 해당 프로세스 내의 스레드들은 메모리 공간을 공유하지만, 다른 프로세스와는 공유하지 않는다.

## Profiling
코드에서 시스템의 어느 부분이 느린지 혹은 어디서 RAM을 많이 사용하고 있는지를 확인하고 싶을 때 사용하는 기법
* 윈도우의 *작업 관리자*를 통해 현재 실행 중인 프로그램의 상태를 확인하는 작업을 코딩하는 것을 프로파일링이라고 한다.
* 즉, 애플리케이션에서 가장 자원이 집중되는 지점을 정밀하게 찾아내는 기법.
* 프로파일러 : 어플리케이션을 실행시키고 각각의 함수 실행에 드는 시간을 찾아내는 프로그램. 코드의 병목(bottleneck)을 찾아내고 성능을 측정해주는 도구.
* `profile`, `cProfile`, `line_profiler` 패키지를 이용하면 높은 수준의 프로파일링 가능!

In [2]:
%timeit

In [3]:
import time
time.time()

1605768724.573347

In [4]:
import timeit
timeit.Timer()

<timeit.Timer at 0x7faf41813990>

In [5]:
# 100까지 숫자를 배열로 만드는 방법에 따른 실행 시간 측정
import timeit
        
def f1():
    s = set(range(100))

    
def f2():
    l = list(range(100))

    
def f3():
    t = tuple(range(100))


def f4():
    s = str(range(100))

    
def f5():
    s = set()
    for i in range(100):
        s.add(i)

def f6():
    l = []
    for i in range(100):
        l.append(i)
    
def f7():
    s_comp = {i for i in range(100)}

    
def f8():
    l_comp = [i for i in range(100)]
    

if __name__ == "__main__":
    t1 = timeit.Timer("f1()", "from __main__ import f1")
    t2 = timeit.Timer("f2()", "from __main__ import f2")
    t3 = timeit.Timer("f3()", "from __main__ import f3")
    t4 = timeit.Timer("f4()", "from __main__ import f4")
    t5 = timeit.Timer("f5()", "from __main__ import f5")
    t6 = timeit.Timer("f6()", "from __main__ import f6")
    t7 = timeit.Timer("f7()", "from __main__ import f7")
    t8 = timeit.Timer("f8()", "from __main__ import f8")
    print("set               :", t1.timeit(), '[ms]')
    print("list              :", t2.timeit(), '[ms]')
    print("tuple             :", t3.timeit(), '[ms]')
    print("string            :", t4.timeit(), '[ms]')
    print("set_add           :", t5.timeit(), '[ms]')
    print("list_append       :", t6.timeit(), '[ms]')
    print("set_comprehension :", t5.timeit(), '[ms]')
    print("list_comprehension:", t6.timeit(), '[ms]')

set               : 1.443848689999868 [ms]
list              : 0.7554933930000516 [ms]
tuple             : 0.7691146259999186 [ms]
string            : 0.5735438649999196 [ms]
set_add           : 5.6853452969999125 [ms]
list_append       : 4.903849317000095 [ms]
set_comprehension : 5.136395587000152 [ms]
list_comprehension: 4.587925890999941 [ms]


## Scale Up vs Scale Out
* Up : 자원 업그레이드, 최적화
* Out : 자원 확장
* Scale Up : 한대의 컴퓨터의 성능을 최적화 시키는 방법
* Scale Out : 여러 대의 컴퓨터를 한 대처럼 사용

### 멀리스레드 구현하기
`threading`

In [7]:
# 기본코드
class Delivery:
    def run(self):
        print("delivery")

class RetriveDish:
    def run(self):
        print("Retriving Dish")

work1 = Delivery()
work2 = RetriveDish()

def main():
    work1.run()
    work2.run()

if __name__ == '__main__':
    main()

delivery
Retriving Dish


In [8]:
# 멀티스레드 : threding 모듈을 import하고 클래스에 Thread를 상속받음.
# thread 모듈의 Thread를 상속받아서 구현.
from threading import *

class Delivery(Thread):
    def run(self):
        print("delivery")

class RetriveDish(Thread):
    def run(self):
        print("Retriving Dish")

work1 = Delivery()
work2 = RetriveDish()

def main():
    work1.run()
    work2.run()

if __name__ == '__main__':
    main()

delivery
Retriving Dish


In [9]:
# 스레드 확인
from threading import *

class Delivery:
    def run(self):
        print("delivering")

work1 = Delivery()
print(work1.run)

class Delivery(Thread):
    def run(self):
        print("delivering")

work2 = Delivery()
print(work2.run)

<bound method Delivery.run of <__main__.Delivery object at 0x7faf41816c10>>
<bound method Delivery.run of <Delivery(Thread-6, initial)>>


* 스레드 생성 : 인스턴스화
* 인스턴스화 하려면 `Thread 클래스`에 인자로 `target`과 `args` 값을 넣어준다. `args`에 넣어 준 파라미터는 스레드 함수의 인자로 넘어감.

In [11]:
# 멀티스레드 : Thread 클래스를 인스턴스화해서 스레드 생성
from threading import *
from time import sleep

Stopped = False

def worker(work, sleep_sec):    # 일꾼 스레드입니다.
    while not Stopped:   # 그만 하라고 할때까지
        print('do ', work)    # 시키는 일을 하고
        sleep(sleep_sec)    # 잠깐 쉽니다.
    print('retired..')           # 언젠가 이 굴레를 벗어나면, 은퇴할 때가 오겠지요?
        
t = Thread(target=worker, args=('Overwork', 3))    # 일꾼 스레드를 하나 생성합니다. 열심히 일하고 3초간 쉽니다.
t.start()    # 일꾼, 이제 일을 해야지?

do  Overwork
do  Overwork


In [12]:
# 이 코드 블럭을 실행하기 전까지는 일꾼 스레드는 종료하지 않습니다. 
Stopped = True    # 일꾼 일 그만하라고 세팅해 줍시다. 
t.join()                    # 일꾼 스레드가 종료할때까지 기다립니다. 
print('worker is gone.')

retired..
worker is gone.


* 스레드 함수가 루프를 돌 때는 꼭 멈춰야 할지를 체크하는 flag를 체크하도록 설계해야 함.
* flag를 `Stopped`로 설계하였다.

### 멀티프로세스 구현하기

In [13]:
import multiprocessing as mp

def delivery():
    print('delivering...')

p = mp.Process(target=delivery, args=())
p.start()

delivering...


`Process` 클래스
```
p = mp.Process(target=delivery, args=())
p.start() # 프로세스 시작
p.join() # 실제 종료까지 기다림 (필요시에만 사용)
p.terminate() # 프로세스 종료
```

In [14]:
p.terminate()

## 스레드 / 프로세스 풀
멀티스레드/프로세스 작업을 할 때 가장 많은 연산이 필요한 작업은 바로 이런 스레드나 프로세스를 생성하고 종료하는 일. 

특히 스레드/프로세스를 사용한 뒤에는 제대로 종료해 주어야 컴퓨팅 리소스가 낭비되지 않음!!

또 지금까지 본 것처럼 하나씩 하나씩 실행한다고 전체적인 프로그램의 성능이 좋아지지는 않아요. 오히려 더 번거로울 수 있습니다. 그래서 실제로 사용할 때에는 스레드/프로세스 풀을 사용해서 생성합니다.
* Pool : 스레드나 프로세스로 가득찬 풀장. 스레드 풀을 만들면 각각의 태스크들에 대해 자동으로 스레드들을 할당하고 종료한다.
* `Queue`를 사용해서 풀 만들기
* `concurrent.futures` 라이브러리의 `ThreadPoolExecutor`, `ProcessPoolExecutor` 클래스를 이용하여 풀 만들기

### concurrent.future
자바의 `ThreadPoolExecutor`를 파이썬으로 구현한 라이브러리.
* Executor 객체
* ThreadPoolExecutor 객체
* ProcessPoolExecutor 객체
* Future 객체

#### `ThreadPoolExecutor`
Executor 객체를 이용하면 스레드 생성, 시작, 조인 같은 작업을 할 때, with 컨텍스트 관리자와 같은 방법으로 가독성 높은 코드를 구현할 수 있다.
```
with ThreadPoolExecutor() as executor:
    future = executor.submit(함수이름, 인자)
```

In [15]:
from concurrent.futures import ThreadPoolExecutor

class Delivery:
    def run(self):
        print("delivering")
w = Delivery()

with ThreadPoolExecutor() as executor:
    future = executor.submit(w.run)

delivering


#### `multiprocessing.Pool`
multiprocessing.Pool.map을 통해 여러개의 프로세스에 특정 함수를 매핑해서 병렬처리하도록 구현
* 가장 널리 사용됨!

In [17]:
from multiprocessing import Pool
from os import getpid

def double(i):
    print("I'm process ", getpid())    # pool 안에서 이 메소드가 실행될 때 pid를 확인해 봅시다.
    return i * 2

with Pool() as pool:
    result = pool.map(double, [1, 2, 3, 4, 5])
    print(result)

I'm process I'm process I'm process I'm process I'm process      480748114809

4814

4810
[2, 4, 6, 8, 10]


* double(i)이라는 메소드가 pool을 통해 각각 다른 pid를 가진 프로세스들 위에서 multiprocess로 실행되었다

#### ProcessPoolExecutor 예제
* `Executor` 객체의 `map()`
* `ProcessPollExecutor`

문제 : 소수(prime) 판별 문제. PRIMES 변수에 선언된 숫자들이 소수인지 아닌지 판별한다.

In [18]:
import math
import concurrent

PRIMES = [
    112272535095293,
    112582705942171,
    112272535095293,
    115280095190773,
    115797848077099,
    1099726899285419]

In [19]:
# 소수 판별 함수
def is_prime(n):
    if n < 2:
        return False
    if n == 2:
        return True
    if n % 2 == 0:
        return False

    sqrt_n = int(math.floor(math.sqrt(n)))
    for i in range(3, sqrt_n + 1, 2):
        if n % i == 0:
            return False
    return True

main() 함수에서 소수 판별 함수(is_prime)를 호출한다.

맵-리듀스(map-reduce)스타일로 코드를 작성하고 map() 함수를 ProcessPoolExecutor() 인스턴스에서 생성된 executor 에서 실행시킨다.

concurrent.futures 라이브러리의 프로세스 풀에서 동작하게 하기 위해 with 문을 써서 구현한다.

In [20]:
def main():
    with concurrent.futures.ProcessPoolExecutor() as executor:
        for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))

병렬처리와 단일처리의 비교를 위해 코드를 수정한다.

* 프로파일링을 위한 시간계산 코드를 추가
* 단일처리로 수행했을 때의 코드를 추가, 단일처리 프로파일링을 위한 시간계산 코드를 추가.

In [22]:
import time

def main():
    print("병렬처리 시작")
    start = time.time()
    with concurrent.futures.ProcessPoolExecutor() as executor:
        for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))
    end = time.time()
    print("병렬처리 수행 시각", end-start, 's')

    start = time.time()
    for number, prime in zip(PRIMES, map(is_prime, PRIMES)):
        print('%d is prime: %s' % (number, prime))
    end = time.time()
    print("단일처리 수행 시각", end-start, 's')

In [23]:
main()

병렬처리 시작
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
병렬처리 수행 시각 0.7673335075378418 s
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
단일처리 수행 시각 2.1389098167419434 s


## 참고 : Map-Reduce
빅데이터 처리의 기본. 여러 노드에 태스크를 분배하는 방법이다.
* Map : key-value 형태의 자료구조.
* Reduce : 맵을 정리해 나가는(줄여나가는) 방법. 

빅데이터는 'Big'이기 때문에 처리 프로세스는 최대한 단순하게 만들어야 한다. 이를 위해서 기준이 되는 값을 하나로 설정해야 프로세스가 단순해지며, 따라서 기준이 되는 값인 **키가 하나인 Map 구조를 사용**하는 것!