# 멀티태스킹

## - 동시성
- 하나의 processor가 여러 가지 task를 동시에 수행하는 개념,
-  그 processor는 특정 순간에는 1가지 task만을 수행하겠지만, 다른 task를 수행할 수 있는 시간에는 task를 전환해서 효율적으로 여러 개의 task를 동시에 수행하는 것처럼 보이는 것.

## - 병렬성
- 유사한 task를 여러 processor가 동시에 수행하는 것.
- 병렬성의 효율을 극대화하는 것은 동시성이 요구될 때임.
- 여러 개의 프로세스가 1개의 task를 여러 개의 subtask로 쪼개어 동시에 병렬적으로 수행할 수 있기 때문에.

## 바운드(bound)
- 어떤 일을 바로 하지 못하고 대기해야 하는 일

## 동기
- 앞 작업이 종료되기를 무조건 기다렸다가 다음 작업을 수행하는 것.
- 어떤 일이 순차적으로 실행됨, 요청과 요청에 대한 응답이 동시에 실행됨.
- 요청에 지연이 발생하더라도 계속 대기함.

## 비동기
- 기다리는 동안 다른 일을 처리하는 것.
- 어떤 일이 비순차적으로 실행됨.
- 요청과 요청에 대한 응답이 동시에 실행되지 않음.
- 특정 코드의 연산이 끝날 때까지 코드의 실행을 멈추지 않고 다음 코드를 먼저 실행하며, 중간에 실행되는 코드는 주로 콜백함수로 연결하기도 함.

컴퓨터가 일을 수행하면서 뭔가 기다릴 때, 즉 속도에 제한이 걸릴 때는    
- I/O 바운드: 입력과 출력에서의 데이터(파일)처리에 시간이 소요될 때.   
- CPU 바운드: 복잡한 수식 계산이나 그래픽 작업과 같은 엄청난 계산이 필요할 때.  

이렇게 두 경우에 해당하는 경우기 대부분임.

## 프로세스
- "프로그램을 구동하여 프로그램 자체와 프로그램의 상태가 메모리상에서 실행되는 작업 단위"를 지칭.
- 하나의 프로그램을 한 번 구동하면 하나의 프로세스가 메모리상에서 실행되지만 여러 번 구동하면 여러 개의 프로세스가 실행되는 것.

In [1]:
import os

# process ID
print(os.getpid())

# user ID
print(os.getuid())

# group ID
print(os.getgid())

# 현재 작업중인 디렉토리
print(os.getcwd())

13
0
0
/aiffel/aiffel/lms_practice


## 스레드
- 어떠한 프로그램 내에서, 특히 프로세스 내에서 실행되는 흐름의 단위.
- 스레드의 사용은 프로그램마다 다르지만, 가벼운 프로그램은 하나의 스레드를 가지기도 함.

## 프로파일링
- 코드에서 시스템의 어느 부분이 느린지 혹은 어디서 RAM을 많이 사용하고 있는지를 확인하고 싶을 때 사용하는 기법.
- 현재 실행 중인 프로그램의 상태를 확인하는 작업을 코딩하는 것.

In [2]:
import timeit
        
def f1():
    s = set(range(100))

    
def f2():
    l = list(range(100))

    
def f3():
    t = tuple(range(100))


def f4():
    s = str(range(100))

    
def f5():
    s = set()
    for i in range(100):
        s.add(i)

def f6():
    l = []
    for i in range(100):
        l.append(i)
    
def f7():
    s_comp = {i for i in range(100)}

    
def f8():
    l_comp = [i for i in range(100)]
    

if __name__ == "__main__":
    t1 = timeit.Timer("f1()", "from __main__ import f1")
    t2 = timeit.Timer("f2()", "from __main__ import f2")
    t3 = timeit.Timer("f3()", "from __main__ import f3")
    t4 = timeit.Timer("f4()", "from __main__ import f4")
    t5 = timeit.Timer("f5()", "from __main__ import f5")
    t6 = timeit.Timer("f6()", "from __main__ import f6")
    t7 = timeit.Timer("f7()", "from __main__ import f7")
    t8 = timeit.Timer("f8()", "from __main__ import f8")
    print("set               :", t1.timeit(), '[ms]')
    print("list              :", t2.timeit(), '[ms]')
    print("tuple             :", t3.timeit(), '[ms]')
    print("string            :", t4.timeit(), '[ms]')
    print("set_add           :", t5.timeit(), '[ms]')
    print("list_append       :", t6.timeit(), '[ms]')
    print("set_comprehension :", t5.timeit(), '[ms]')
    print("list_comprehension:", t6.timeit(), '[ms]')

set               : 1.9122603703290224 [ms]
list              : 1.2251979382708669 [ms]
tuple             : 0.9088550545275211 [ms]
string            : 0.5431835222989321 [ms]
set_add           : 6.394910856150091 [ms]
list_append       : 5.647816410288215 [ms]
set_comprehension : 6.4031782522797585 [ms]
list_comprehension: 5.712112910114229 [ms]


- 이건 시간을 측정하는 방법이라서 프로파일링이라고 하기에는 좀 애매하긴 함.

# 파이썬에서 멀티스레드 사용하기

In [3]:
# 음식 배달과 그릇 찾기 2가지 작업을 순차적으로 수행하는 코드

class Delivery:
    def run(self):
        print("delivery")

class RetriveDish:
    def run(self):
        print("Retriving Dish")

work1 = Delivery()
work2 = RetriveDish()

def main():
    work1.run()
    work2.run()

if __name__ == '__main__':
    main()

delivery
Retriving Dish


In [4]:
#멀티스레드
#threading 모듈을 import하고 클래스에 Thread를 상속받음.

from threading import *

class Delivery(Thread):
    def run(self):
        print("delivery")

class RetriveDish(Thread):
    def run(self):
        print("Retriving Dish")

work1 = Delivery()
work2 = RetriveDish()

def main():
    work1.run()
    work2.run()

if __name__ == '__main__':
    main()

delivery
Retriving Dish


In [5]:
# 스레드 생성 확인
from threading import *

class Delivery:
    def run(self):
        print("delivering")

work1 = Delivery()
print(work1.run)

class Delivery(Thread):
    def run(self):
        print("delivering")

work2 = Delivery()
print(work2.run)

<bound method Delivery.run of <__main__.Delivery object at 0x7f091acbdcd0>>
<bound method Delivery.run of <Delivery(Thread-6, initial)>>


- work2 는 다른 스레드에 할당된 것을 볼 수 있음.

In [7]:
#스레드를 인스턴스화하여 생성하기
#인스턴스화 하려면 Thread 클래스에 인자로 target과 args 값을 넣어 줌.

from threading import *
from time import sleep

Stopped = False

def worker(work, sleep_sec):    # 일꾼 스레드입니다.
    while not Stopped:          # 그만 하라고 할때까지
        print('do ', work)      # 시키는 일을 하고
        sleep(sleep_sec)        # 잠깐 쉽니다.
    print('retired..')          # 언젠가 이 굴레를 벗어나면, 은퇴할 때가 오겠지요?
        
t = Thread(target=worker, args=('Overwork', 3))    # 일꾼 스레드를 하나 생성합니다. 열심히 일하고 3초간 쉽니다.
t.start()    # 일꾼, 이제 일을 해야지? 😈

# 이 코드 블럭을 실행하기 전까지는 일꾼 스레드는 종료하지 않습니다. 
Stopped = True    # 일꾼 일 그만하라고 세팅해 줍시다. 
t.join()          # 일꾼 스레드가 종료할때까지 기다립니다. 
print('worker is gone.')

do  Overwork
retired..
retired..
worker is gone.


# 파이썬에서 멀티프로세스 사용하기
-  multiprocessing 모듈을 이용해서 멀티프로세스의 구현을 할 수 있음.

In [8]:
#프로세스 생성
#Process 인스턴스를 만든 뒤, target 과 args 파라미터에 각각 함수 이름과 함수 인자를 전달.

import multiprocessing as mp

def delivery():
    print('delivering...')

p = mp.Process(target=delivery, args=())
p.start()

delivering...


## 스레드/프로세스 풀 사용
-  스레드 풀을 만들면 각각의 태스크들에 대해 자동으로 스레드들을 할당하고 종료함.

## - 풀 만드는 방법
- Queue를 사용해서 직접 만드는 방법
- concurrent.futures 라이브러리의 ThreadPoolExecutor , ProcessPoolExecutor클래스를 이용하는 방법

### concurrent.futures 모듈을 사용하여 풀 생성

### - ThreadPoolExecutor
- Executor 객체를 이용하면 스레드 생성, 시작, 조인 같은 작업을 할 때, with 컨텍스트 관리자와 같은 방법으로 가독성 높은 코드를 구현할 수 있음.

In [9]:
from concurrent.futures import ThreadPoolExecutor

class Delivery:
    def run(self):
        print("delivering")
w = Delivery()

with ThreadPoolExecutor() as executor:
    future = executor.submit(w.run)

delivering


### - multiprocessing.Pool
- multiprocessing.Pool.map을 통해 여러 개의 프로세스에 특정 함수를 매핑해서 병렬처리하도록 구현하는 방법

In [10]:
from multiprocessing import Pool
from os import getpid

def double(i):
    print("I'm processing ", getpid())    # pool 안에서 이 메소드가 실행될 때 pid를 확인해 봅시다.
    return i * 2

with Pool() as pool:
      result = pool.map(double, [1, 2, 3, 4, 5])
      print(result)

I'm processing I'm processing I'm processing I'm processing    110I'm processing 109  
111107


108
[2, 4, 6, 8, 10]


# 병렬 프로그래밍 연습
- concurrent.futures 모듈의 ProcessPoolExecutor를 이용해서 멀티프로세스를 구현을 연습.
- Executor 객체의 map() 함수
- ProcessPoolExecutor 부분

In [11]:
import math
import concurrent
import time 


PRIMES = [
    112272535095293,
    112582705942171,
    112272535095293,
    115280095190773,
    115797848077099,
    1099726899285419]

#소수(prime) 판별 문제로 PRIMES 변수에 선언된 숫자들이 소수인지 아닌지를 판별하는 함수.
def is_prime(n):
    if n < 2:
        return False
    if n == 2:
        return True
    if n % 2 == 0:
        return False

    sqrt_n = int(math.floor(math.sqrt(n)))
    for i in range(3, sqrt_n + 1, 2):
        if n % i == 0:
            return False
    return True


#main() 함수를 따로 작성하여 소수 판별 함수(is_prime)를 호출
#병렬처리와 단일처리 비교 위해 main 함수를 아래와 같이 수정.
#프로파일링을 위한 시간 계산 코드를 추가
#단일처리로 수행했을 때의 코드를 추가
#단일처리 프로파일링을 위한 시간 계산 코드를 추가
def main():
    print("병렬처리 시작")
    start = time.time()
   
    #concurrent.futures 라이브러리의 프로세스 풀에서 동작하게 하기 위해 with 문 사용.
    with concurrent.futures.ProcessPoolExecutor() as executor:
        
        #map() 함수를 ProcessPoolExecutor() 인스턴스에서 생성된 executor 에서 실행.
        for number, prime in zip(PRIMES, executor.map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))
        end = time.time()
        print("병렬처리 수행 시각", end-start, 's')

        start = time.time()
        for number, prime in zip(PRIMES, map(is_prime, PRIMES)):
            print('%d is prime: %s' % (number, prime))
        end = time.time()
        print("단일처리 수행 시각", end-start, 's')

print(" ❣\n🌲🦕.......")
        
        
if __name__ == '__main__':
    main()

 ❣
🌲🦕.......
병렬처리 시작
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
병렬처리 수행 시각 0.829139232635498 s
112272535095293 is prime: True
112582705942171 is prime: True
112272535095293 is prime: True
115280095190773 is prime: True
115797848077099 is prime: True
1099726899285419 is prime: False
단일처리 수행 시각 2.723101854324341 s


- 병렬처리 약 0.8초
- 단일처리 약 2.7초