<a href="https://colab.research.google.com/github/stbhg5/ComputerScience/blob/main/python_ch9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

1. 프로세스와 쓰레드

In [None]:
# 멀티 쓰레드
from threading import Thread
import time

def work(work_id, start, end, result):
    total = 0
    for i in range(start, end):
        total += i
    result.append(total)

if __name__ == '__main__':
    start = time.time() # 코드가 실행되기 전 시간
    result = []
    th1 = Thread(target = work, args = (1, 0, 10000, result))
    th2 = Thread(target = work, args = (2, 10001, 20000, result))

    th1.start()
    th2.start()
    th1.join() # join() 메서드는 파이썬에게 프로세스가 종료 될 때까지 대기하도록 지시한다.
    th2.join()

    print(result)
    print(sum(result))
    print(time.time() - start) # 코드가 실행된 총 시간

[49995000, 149985000]
199980000
0.002070903778076172


In [None]:
# 멀티 프로세싱
# Pool
from multiprocessing import Pool
import os
import time

def f(x):
    print(x, os.getpid()) # 프로세스 아이디
    return x * x

print(__name__)

if __name__ == '__main__': # 자식 프로세스가 실행하게 하지 않기 위함
    start = time.time()
    p = Pool(4) # 자식 프로세스 개수(개수는 상황에 따라 다른데 효율적인 개수가 좋다. 주로 cpu 코어 개수만큼으로 설정)
    # result = p.map(f, [1, 2, 3, 4]) # 함수명, 컬렉션 자료형, map()에선 명시된 함수에 명시한 컬렉션을 적당히 Pool에 분배해준다. 이후 결과를 반환값에 저장
    result = p.map(f, range(8)) # 반환값이 리스트 자료형으로 저장됨
    p.close() # 자식 프로세스 죽임, 메모리 절약하고 문제생기게 하지 않기 위함
    print(result)
    print(time.time() - start)

__main__
0132 10134  
 410135
 510134 
10137
610135101367

 10134
 10137
[0, 1, 4, 9, 16, 25, 36, 49]
0.12463736534118652


In [None]:
# Process (멀티 쓰레드와 선언하는 방법이 비슷한 구조)
# Pool과 Process 차이점 : Pool은 풀고자하는 list 값을 맘대로 Pool에 던진다면, Process는 정확하게 함수에게 어떤 문제를 풀지 지정해준다.
import os

from multiprocessing import Process

def f(x):
    # print(os.getpid()) # 프로세스 아이디
    print(x * x)

print(__name__)

if __name__ == '__main__':
    numbers = [1, 2, 3, 4]
    proc1 = Process(target = f, args = (numbers[0],)) # args에 들어가는 자료형은 튜플. 튜플은 원소개 1개일 때 ,를 써야한다.
    proc1.start()
    proc2 = Process(target = f, args = (numbers[1],))
    proc2.start()
    proc3 = Process(target = f, args = (numbers[2],))
    proc3.start()
    proc4 = Process(target = f, args = (numbers[3],))
    proc4.start()
    proc1.join()
    proc2.join()
    proc3.join()
    proc4.join()
    # 병렬적으로 실행하기 때문에 실행 완료된 순서를 알 수 없다.

__main__
1
4
9
16


2. 실전 예제

In [2]:
# Pool에 변수 하나에 여러 개의 list를 매개변수로 넣기
import time, os
from multiprocessing import Pool

# Pool에 넣을 함수는 매개변수를 1개만 받는 함수를 선언해야 한다.
def func(x):
    return x[0] * x[1]

if __name__ == '__main__':
    start = int(time.time())
    num_pool = 2 # 100
    pool = Pool(num_pool)
    print(pool.map(func, zip(range(100), range(100)))) # 컬렉션 형태 자료형
    print('***run time(sec) :', int(time.time()) - start)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500, 2601, 2704, 2809, 2916, 3025, 3136, 3249, 3364, 3481, 3600, 3721, 3844, 3969, 4096, 4225, 4356, 4489, 4624, 4761, 4900, 5041, 5184, 5329, 5476, 5625, 5776, 5929, 6084, 6241, 6400, 6561, 6724, 6889, 7056, 7225, 7396, 7569, 7744, 7921, 8100, 8281, 8464, 8649, 8836, 9025, 9216, 9409, 9604, 9801]
***run time(sec) : 0


In [6]:
# zip() : 2개의 컬렉션 받아서 각 원소를 하나씩 압축시킨다. 반환값으로 튜플 출력.
for i in zip(range(100), range(300, 400)):
    print(i)

(0, 300)
(1, 301)
(2, 302)
(3, 303)
(4, 304)
(5, 305)
(6, 306)
(7, 307)
(8, 308)
(9, 309)
(10, 310)
(11, 311)
(12, 312)
(13, 313)
(14, 314)
(15, 315)
(16, 316)
(17, 317)
(18, 318)
(19, 319)
(20, 320)
(21, 321)
(22, 322)
(23, 323)
(24, 324)
(25, 325)
(26, 326)
(27, 327)
(28, 328)
(29, 329)
(30, 330)
(31, 331)
(32, 332)
(33, 333)
(34, 334)
(35, 335)
(36, 336)
(37, 337)
(38, 338)
(39, 339)
(40, 340)
(41, 341)
(42, 342)
(43, 343)
(44, 344)
(45, 345)
(46, 346)
(47, 347)
(48, 348)
(49, 349)
(50, 350)
(51, 351)
(52, 352)
(53, 353)
(54, 354)
(55, 355)
(56, 356)
(57, 357)
(58, 358)
(59, 359)
(60, 360)
(61, 361)
(62, 362)
(63, 363)
(64, 364)
(65, 365)
(66, 366)
(67, 367)
(68, 368)
(69, 369)
(70, 370)
(71, 371)
(72, 372)
(73, 373)
(74, 374)
(75, 375)
(76, 376)
(77, 377)
(78, 378)
(79, 379)
(80, 380)
(81, 381)
(82, 382)
(83, 383)
(84, 384)
(85, 385)
(86, 386)
(87, 387)
(88, 388)
(89, 389)
(90, 390)
(91, 391)
(92, 392)
(93, 393)
(94, 394)
(95, 395)
(96, 396)
(97, 397)
(98, 398)
(99, 399)


In [8]:
# Pool에 매개변수가 여러개인 함수를 굳이 하고싶다
import time, os
from multiprocessing import Pool
from functools import partial

def func(x, y):
    return x * y

if __name__ == '__main__':
    start = int(time.time())
    num_pool = 2 # 100
    pool = Pool(num_pool)
    print(pool.map(partial(func, y = 3), range(100))) # partial은 부분함수 - partial(함수명, 매개변수 = 값) : 매개변수는 값으로 고정, 이렇게 매개변수가 여러개지만 1개로 줄여준다.
    print('***run time(sec) :', int(time.time()) - start)

[0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30, 33, 36, 39, 42, 45, 48, 51, 54, 57, 60, 63, 66, 69, 72, 75, 78, 81, 84, 87, 90, 93, 96, 99, 102, 105, 108, 111, 114, 117, 120, 123, 126, 129, 132, 135, 138, 141, 144, 147, 150, 153, 156, 159, 162, 165, 168, 171, 174, 177, 180, 183, 186, 189, 192, 195, 198, 201, 204, 207, 210, 213, 216, 219, 222, 225, 228, 231, 234, 237, 240, 243, 246, 249, 252, 255, 258, 261, 264, 267, 270, 273, 276, 279, 282, 285, 288, 291, 294, 297]
***run time(sec) : 0


In [17]:
# Jupyter Notebook에서 멀티프로세싱 실행 - 주피터 노트북 특성상, 자식 프로세스들이 주피터 노트북 위에 뜬 함수를 잘 못 읽는다. 따라서 주피터노트북 바깥에(다른 파일에 모듈을 만들어서) 정의 해야한다.
import time, os
from multiprocessing import Pool
from test import works

def work(x):
    return x ** 2

if __name__ == '__main__':
    num_pool = 2 # 100
    pool = Pool(num_pool)
    # print(pool.map(work, range(100)))
    print(pool.map(works, range(100)))
    pool.close() # 자식 프로세스 사라짐

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81, 100, 121, 144, 169, 196, 225, 256, 289, 324, 361, 400, 441, 484, 529, 576, 625, 676, 729, 784, 841, 900, 961, 1024, 1089, 1156, 1225, 1296, 1369, 1444, 1521, 1600, 1681, 1764, 1849, 1936, 2025, 2116, 2209, 2304, 2401, 2500, 2601, 2704, 2809, 2916, 3025, 3136, 3249, 3364, 3481, 3600, 3721, 3844, 3969, 4096, 4225, 4356, 4489, 4624, 4761, 4900, 5041, 5184, 5329, 5476, 5625, 5776, 5929, 6084, 6241, 6400, 6561, 6724, 6889, 7056, 7225, 7396, 7569, 7744, 7921, 8100, 8281, 8464, 8649, 8836, 9025, 9216, 9409, 9604, 9801]
