# 스레드
- 기본적으로 메인 스레드에서 서브 스레드를 생성하면 메인 스레드는 자신의 작업을 모두 마쳤더라도   
  서브 스레드의 작업이 종료될 때 까지 기다렸다가 서브 스레드의 작업이 모두 완료되면 종료

In [16]:
import threading
import time


class Worker(threading.Thread):
    def __init__(self, name):
        super().__init__()
        self.name = name            # thread 이름 지정

    def run(self):
        print("sub thread start ", threading.currentThread().getName())
        time.sleep(3)
        print("sub thread end ", threading.currentThread().getName())


print("main thread start")
for i in range(5):
    name = "thread {}".format(i)
    t = Worker(name)                # sub thread 생성
    t.start()                       # sub thread의 run 메서드를 호출

print("main thread end")

main thread start
sub thread start  thread 0
sub thread start  thread 1
sub thread start  thread 2
sub thread start  thread 3
sub thread start  thread 4main thread end

sub thread end sub thread end  thread 0
sub thread end  thread 2
sub thread end  thread 3
sub thread end  thread 4
 thread 1


# 데몬 스레드 
- 데몬 스레드는 메인 스레드가 종료될 때 자신의 실행 상태와 상관없이 종료되는 서브 스레드 의미
- 데몬 스레드는 daemon 속성을 True로 변견해서 생성

In [15]:
import threading
import time


class Worker(threading.Thread):
    def __init__(self, name):
        super().__init__()
        self.name = name            # thread 이름 지정

    def run(self):
        print("sub thread start ", threading.currentThread().getName())
        time.sleep(3)
        print("sub thread end ", threading.currentThread().getName())


print("main thread start")
for i in range(5):
    name = "thread {}".format(i)
    t = Worker(name)                # sub thread 생성
    t.daemon = True
    t.start()                       # sub thread의 run 메서드를 호출

print("main thread end")

main thread start
sub thread start  thread 0
sub thread start  thread 1
sub thread start  thread 2
sub thread start  thread 3
sub thread start  thread 4
main thread end
sub thread end  thread 2
sub thread end  sub thread end  thread 3
sub thread end thread 1
sub thread end  thread 4
 thread 0


# Fork와 Join

## Fork 
- Fork는 메인 스레드가 서브스레드를 생성하는 것  
- 두 개의 서브 스레드를 생성하는 경우 메인 스레드를 포함하여 총 3개의 스레드가 스케줄링
  
## Join 
- Join은 모든 스레드가 작업을 마칠 때까지 기다리는 것  
- 데이터를 여러 스레드를 통해 병렬로 처리 후 그 값들을 다시 모아서 순차적으로 처리해야할 때,  
  분할한 데이터가 모든 스레드에서 처리될 때까지 기다렸다가 메인 스레드가 다시 추후 작업을 하는 경우에 사용

In [14]:
import threading
import time


class Worker(threading.Thread):
    def __init__(self, name):
        super().__init__()
        self.name = name            # thread 이름 지정

    def run(self):
        print("sub thread start ", threading.currentThread().getName())
        time.sleep(5)
        print("sub thread end ", threading.currentThread().getName())


print("main thread start")

t1 = Worker("1")        # sub thread 생성
t1.start()              # sub thread의 run 메서드를 호출

t2 = Worker("2")        # sub thread 생성
t2.start()              # sub thread의 run 메서드를 호출

t1.join()
t2.join()

print("main thread post job")
print("main thread end")

main thread start
sub thread start  1
sub thread start  2
sub thread end sub thread end  1
 2
main thread post job
main thread end


In [12]:
# 반복문을 통해 여러 서브 스레드를 생성해야하는 경우에는 
# 생성된 스레드 객체를 파이썬 리스트에 저장한 후 반복문을 이용해서 
# 각 객체에서 join( ) 메서드를 호출할 수 있습니다.

import threading
import time


class Worker(threading.Thread):
    def __init__(self, name):
        super().__init__()
        self.name = name            # thread 이름 지정

    def run(self):
        print("sub thread start ", threading.currentThread().getName())
        time.sleep(5)
        print("sub thread end ", threading.currentThread().getName())


print("main thread start")

threads = []
for i in range(3):
    thread = Worker(i)
    thread.start()              # sub thread의 run 메서드를 호출
    threads.append(thread)


for thread in threads:
    thread.join()

print("main thread post job")
print("main thread end")

main thread start
sub thread start  0
sub thread start  1
sub thread start  2
sub thread end  2
sub thread end  1
sub thread end  0
main thread post job
main thread end


# threading 모듈
- 파이썬에서 스레드를 실행하기 위해서는, threading 모듈의 threading.Thread()함수를 호출하여  
  Thread 객체를 얻은 후 Thread 객체의 start() 매서드를 호출하면 된다.
  
  - Thread : 단일 실행 스레드를 만드는 객체
  - Lock : 기본적인 락 객체
  - RLock : 재진입 가능한 락객체(이미 획득한 락을 다시 가능)
  - Condition : 다른 스레드에서 신호를 줄 때까지 기다릴 수 있는 컨디션 변수 객체
  - Event : 컨디션 변수의 일반화 버전
  - Semaphore : 정해놓은 갯수만큼의 스레드를 허용하는 동기화 객체(예를 들어 최대 50개만 동시에 실행)
  - BoundedSemaphore : 초기 설정된 값 이상으로 증가 될 수 없게 제한한 Semaphore
  - Timer : Thread 비슷하지만 실행되기 전에 지정된 시간 동안 대기
  - Barrier : 스레드들이 계속 진행할 수 있으려면 지정된 숫자의 스레드가 해당 지점까지 도달해야 하게 만듬

## 스레드 생성
- target : 스레드에서 실행할 함수
- args : target에 넘겨질 인자(tuple 형식으로 넘겨줘야함)
- kwargs : target에 넘겨질 키워드 인자(dict 형식으로 넘겨줘야함)
- daemon : 데몬 실행 여부(데몬으로 실행되는 스레드는 프로세스가 종료될 때 즉각 중단)  

Thread(name=, target=, args=, kwargs=, *, daemon=)

## 스레드 클래스 메소드/속성
- 스레드 객체를 생성했다 하더라도 해당 스레드가 바로 시작되지는 않는다. start()를 호출하면 그때 시작되는 것
    - start() : 스레드를 시작한다
    - join()  
      해당 스레드에서 실행되는 함수가 종료될 때 까지 기다린다  
      timeout= 인자를 주어 특정 시간 까지만 기다리게 할 수 있다  
      타임아웃을 초과해도 예외를 일으키지 않고 None을 리턴하므로 
      이 경우 is_alive()를 호출하여  스레드가 실행중인지를 파악할 필요가 있다
    - is_alive() : 해당 스레드가 동작중인지 확인
    - name : 스레드의 이름
    - ident : 스레드 식별자, 정수값
    - native_id : 스레드 고유 식별자. ident는 종료된 스레드 이후에 새로 만들어진 다른 스레드에 재활용할 수 있다
    - daemon  
      데몬 스레드 여부(default = False)  
      데몬 스레드 : 백그라운드에서 실행되는 스레드, 메인 스레드가 종료되면 즉시 종료되는 스레드  
      만약 데몬 스레드가 아니면 해당 서브스레드는 메인스레드가 종료될지라도 자신의 작업이 끝날 때 까지 계속 시행
      default가 False이기 때문에 별도로 지정하지 않으면 메인스레드가 종료되어도 서브스레드는 끝까지 실행된다
      
      

## 구현방식
### 스레드가 실행할 함수 혹은 메서드 작성 
- 스레드가 실행할 함수를 작성하고 그 함수명을 threading.Thread()함수의 target 아규먼트로 전달하면 된다.
- 만약 스레드가 실행할 함수에 파라미터를 전달해야 한다면, threading.Thread()의 args에 지정해주면 된다.
- args는 tuple로 파라미터를 전달하고, kwargs는 dict로 전달한다.  

In [18]:
# 아래 예제를 보면 excuteThread함수를 target으로 지정하였고,
# args에 튜플로 파라미터를 지정해주었다.
# 주의할 점은 target = executeThread()처럼 지정하면 이는 executeThread() 함수를 실행하여 리턴한 결과를
# target에 지저하는 것이 잘못된 결과가 나올 수 있다.

import threading
import urllib.request
import time

def executeThread(i):
    imageName = f"temp/image-{str(i)}.jpg"
    urllib.request.urlretrieve("https://test.com/test.jpg", imageName)

def main():
    t0 = time.time()
    threads = []
    for i in range(10):
        thread = threading.Thread(target=executeThread, args=(i,))
        threads.append(thread)
        thread.start()

    for i in threads:
        print("i ::: ", i)
        i.join()

    t1 = time.time()
    totalTime = t1- t0
    print("Total Execution Time {}".format(totalTime))


if __name__ == "__main__":
    main()

i :::  <Thread(Thread-59, started 4360)>


Exception in thread Thread-61Exception in thread Thread-62:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
Exception in thread :
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
Exception in thread Thread-60:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
Exception in thread Thread-67Exception in thread Thread-68:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
Thread-59:
Exception in thread Thread-65:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1346, in do_open
Exception in thread Thread-64:
Traceback (most recent call last):
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py

    super().connect()
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 946, in connect
        raise err
  File "C:\Users\AI\Anaconda3\lib\socket.py", line 832, in create_connection
self.sock = self._create_connection(
  File "C:\Users\AI\Anaconda3\lib\socket.py", line 844, in create_connection
        raise err
  File "C:\Users\AI\Anaconda3\lib\socket.py", line 832, in create_connection
    self.connect()
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 1447, in connect
        super().connect()
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 946, in connect
super().connect()self.sock = self._create_connection(
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 946, in connect

  File "C:\Users\AI\Anaconda3\lib\socket.py", line 844, in create_connection
        super().connect()
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 946, in connect
super().connect()
  File "C:\Users\AI\Anaconda3\lib\http\client.py", line 946, in connect
            sock.con

    return self.do_open(http.client.HTTPSConnection, req,
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open
result = self._call_chain(self.handle_open, protocol, protocol +    return self.do_open(http.client.HTTPSConnection, req,
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open

  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 494, in _call_chain
    return self.do_open(http.client.HTTPSConnection, req,
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open
            return self.do_open(http.client.HTTPSConnection, req,
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open
    return self.do_open(http.client.HTTPSConnection, req,        return self.do_open(http.client.HTTPSConnection, req,
  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open

  File "C:\Users\AI\Anaconda3\lib\urllib\request.py", line 1349, in do_open
raise URLError(err)
urllib.error.URLErro

i :::  <Thread(Thread-60, stopped 27280)>
i :::  <Thread(Thread-61, started 73076)>
i :::  <Thread(Thread-62, stopped 36816)>
i :::  <Thread(Thread-63, stopped 49504)>
i :::  <Thread(Thread-64, stopped 42156)>
i :::  <Thread(Thread-65, stopped 17668)>
i :::  <Thread(Thread-66, stopped 72736)>
i :::  <Thread(Thread-67, stopped 21764)>
i :::  <Thread(Thread-68, stopped 67944)>
Total Execution Time 23.87213921546936


# 파이썬 멀티 쓰레드와 멀티 프로세스
- 쓰레드는 threading 모듈의 Thread 함수로 쓰레드 객체를 받아 사용한다. target은 쓰레드가 실행할 함수,  
  args는 그 함수의 인자들을 의미한다. start함수로 쓰레드를 시작하고 join함수로 쓰레드가 끝날 때까지 기다린다.  

In [25]:
# 0부터 100,000,000 까지의 합을 구하는 계산 프로그램을 하나의 쓰레드로 동작하게 만들어보자
from threading import Thread

def work(id, start, end, result):
    total = 0
    for i in range(start,end):
        total += i 
    result.append(total)
    return

if __name__ == "__main__":
    START, END = 0, 100000000
    result = list()
    th1 = Thread(target=work, args=(1, START, END, result))
    th1.start()
    th1.join()

print(f'Result : {sum(result)}')

Result : 4999999950000000


In [26]:
# 다음으로 쓰레드를 추가해서 병렬로 동작하는 코드를 만들어보자
if __name__ == "__main__":
    START, END = 0, 100000001
    result = list()
    th1 = Thread(target=work, args=(1, START, END//2, result))
    th2 = Thread(target=work, args=(2, END//2, END, result))
    
    th1.start()
    th2.start()
    th1.join()
    th2.join()
    
print(f'Result : {sum(result)}')

# 싱글쓰레드와 속도가 별반 차이나지 않는 것은 파이썬의 GIL(Global Interpreter Lock)정책 때문
# 언어에서 자원을 보호하기 위해 락정책을 사용하고 그 방법 또한 다양하다. 파이썬에서는 하나의 프로세스 안에
# 모든 자원의 락을 글로벌하게 관리함으로써 한번에 하나의 쓰레드만 자원을 컨트롤하여 동작하도록 한다.
# 위의 코드에서 result라는 자원을 공유하는 두 개의 쓰레드를 동시에 실행시키지만, 
# 결국 GIL 때문에 한번에 하나의 쓰레드만 계산을 실행하여 실생 시간이 비슷한 것

Result : 5000000050000000


In [27]:
# 모듈로 멀티 프로세스 구현하기
# 위 같은 상황에서 계산을 병렬로 처리하는데 도움을 주는 것이 multiprocessing 모듈이다.
# multiprocessing 모듈은 쓰레드 대신 프로세스를 만들어 병렬로 동작

from multiprocessing import Process, Queue

def work(id, start, end, result):
    total = 0
    for i in range(start, end):
        total += i
    result.put(total)
    return

if __name__ == "__main__":
    START, END = 0, 100000000
    result = Queue()
    th1 = Thread(target=work, args=(1, START, END//2, result))
    th2 = Thread(target=work, args=(2, END//2, END, result))
    
    th1.start()
    th2.start()
    th1.join()
    th2.join()
    
    result.put('STOP')
    total=0
    while True:
        tmp = result.get()
        if tmp == 'STOP':
            break
        else:
            total += tmp
    print(f"Result:{total}")

# multiprocessing 모듈의 가장 큰 장점은 threading 모듈과 구현 방식이 거의 같아서
# 기존에 쓰레드 방식으로 구현한 코드를 쉽게 이식할 수 있다는 점이다.
# 위의 코드에서 변경된 것은 Thread 함수가 아닌 Process 함수에서 객체를 받아 사용하는 것과
# result로 Queue 객체를 사용한 것 뿐이다.

Result:4999999950000000


### Thread vs Processing
- 쓰레드는 가볍지만 GIL로 인해 계산 처리를 하는 작업은 한번에 하나의 쓰레드에서만 작동하여 CPU 작업이 적고  
  I/O작업이 많은 병렬 처리 프로그램에서 효과를 볼 수 있다.
- 프로세스는 각자가 고유한 메모리영역을 가지기 때문에 더 많은 메모리를 필요로 하지만, 각각 프로세스에서 병렬로  
  cpu 작업을 할 수 있고 이를 이용해 여러 머신에서 동작하는 분산 처리 프로그래밍도 구현할 수 있다.
- 각자의 장단점을 고려하여 자신의 프로그램에 잘 맞는 방식을 사용하면 된다.