In [1]:
# 프로세스 : 어떤 운영체제에서 실행되는 프로그램
# 각각 별도의 프로세스 -> 스레드(하나 이상)
# 멀티 스레드 : 프로세스에 여러개의 스레드가 있다면 여러가지 작업을 동시에 수행을 하는 듯한 느낌을 받을 수 있다.
# 멀티 프로세스 : 별도의 메모리 영역을 가지고 있다.
# 특별한 메커니즘으로 통신할 수 있다.
# 통신 방법?
# - 시그널, 메시지 큐, 파이프 라인, 파일을을 통신하는 IPC 방식
# 프로세스는 각 스레드에서 별도의 레지스터 집합을 불러오거나 저장할 수 있다.
# 프로세스간의 데이터를 공유하거나 통신용으로 사용하는 것은효율적이지 못하다.
# subprocess



# 멀티 스레드 : 프로세스에 여러개의스레드가 있다면 여러가지 작업을 동시에 수행을 하는 듯한 느낌을 받을 수 있다.
# 단일 프로세스 내의 멀티스레드는 동일 메모리에 접근합니다.
# threading 모듈의 처리를 통해서 한번에 한 스레드만 메모리 영역에 접근할 수 있다.
# 각 프로세스가 독립적인 스택, 힙, 코드, 데이터 영역을 가지게 되고, 한 프로세스에 속한 스레드는 스택 영역을 제외한 메모리 역영을 공유합니다.
# 

In [2]:
# subprocess 모듈
# '부모 - 자식' 프로세스 쌍을 생성을 합니다.
# 부모 프로세스는 사용자를 통해서 실행되고 차례대로 다른 일을 처리하는 자식 프로세스의 인스턴스를 실행시킵니다.
# 자식 프로세스는 실행이 되면서 멀티 코어의 이점을 최대로 가져오고, 동시성의 문제를 운영체제가 알아서 처리하도록 합니다.


In [3]:
import subprocess
subprocess.run(['sleep', '10'])

FileNotFoundError: [WinError 2] 지정된 파일을 찾을 수 없습니다

In [9]:
# threading 모듈
# 스레드가 여러개 있을 때 데이터 공유의 복잡성을 증가하게 합니다.
# 락, 데드락 회피하게 해줘야 합니다.
# 파이썬에서는 단 하나의 메인 스레드만 존재하기 때문에 멀티 스레드를 사용하려면 threading 모듈을 사용해야 합니다.
# 락을 관리하기 위해서 queue 모듈을 사용하게 되는데
# 직렬화가 가능해집니다.

import queue # 먼저 들어온게 먼저 나감, 선형 큐
import threading
q = queue.Queue()

def worker(num):
    while True:
        item = q.get()
        if item is None:
            break
        # 작업을 처리 해줍니다.
        print('스레드 {0} : 처리 완료 {1}'.format(num+1, item))
        q.task_done()
        
if __name__ == "__main__":
    worker_thread = 5
    threads = []
    for i in range(worker_thread):
        t = threading.Thread(target = worker, args=(i,)) # args=(i,) : worker_thread의 threads의 길이만큼 넣어줌.
        t.start()
        threads.append(t)
        
    for item in range(50):
        q.put(item)
    # 작업이 끝날때까지 대기
    # worker_thread 작업이 완료되었는데, 프로그램이 종료되지 않았을때
    # 데몬(demon)으로 변환해서 데몬 스레드가 실행되지 않으면
    # 프로그램을 바로 종료
    q.join()
    for i in range(worker_thread):
        q.put(None)
    for i in threads:
        t.join()

스레드 3 : 처리 완료 0
스레드 3 : 처리 완료 1스레드 1 : 처리 완료 2
스레드 1 : 처리 완료 3
스레드 1 : 처리 완료 4
스레드 1 : 처리 완료 5스레드 5 : 처리 완료 6
스레드 5 : 처리 완료 7
스레드 5 : 처리 완료 8
스레드 1 : 처리 완료 9
스레드 1 : 처리 완료 10
스레드 1 : 처리 완료 11
스레드 1 : 처리 완료 12
스레드 1 : 처리 완료 13
스레드 4 : 처리 완료 14
스레드 4 : 처리 완료 15
스레드 4 : 처리 완료 16
스레드 4 : 처리 완료 17
스레드 4 : 처리 완료 18

스레드 5 : 처리 완료 19

스레드 5 : 처리 완료 20
스레드 5 : 처리 완료 21
스레드 5 : 처리 완료 22스레드 4 : 처리 완료 23
스레드 4 : 처리 완료 24
스레드 4 : 처리 완료 25
스레드 3 : 처리 완료 26스레드 4 : 처리 완료 27
스레드 4 : 처리 완료 28
스레드 4 : 처리 완료 29
스레드 2 : 처리 완료 30
스레드 2 : 처리 완료 31
스레드 2 : 처리 완료 32


스레드 3 : 처리 완료 33
스레드 3 : 처리 완료 34
스레드 1 : 처리 완료 35스레드 5 : 처리 완료 36
스레드 5 : 처리 완료 37
스레드 5 : 처리 완료 38

스레드 1 : 처리 완료 39
스레드 1 : 처리 완료 40
스레드 3 : 처리 완료 41
스레드 3 : 처리 완료 42
스레드 3 : 처리 완료 43
스레드 2 : 처리 완료 44
스레드 2 : 처리 완료 45
스레드 2 : 처리 완료 46
스레드 1 : 처리 완료 47
스레드 4 : 처리 완료 48스레드 1 : 처리 완료 49



In [18]:
# 뮤텍스, 세마포어
# 뮤텍스 : 락
# 공유 리소스 한번에 하나의 스레드만 접근할 수 있도록 동시성 제어 정책을 강제시키기 위해서 설계
# 1부터 시작되는 정수, 배열의 인덱스를 변경할 때마다 '뮤텍스를 잠근다.'라고 한다.
from threading import Thread, Lock
import threading

def worker(mutex, data, thread_safe):
    if thread_safe:
        mutex.acquire()
    try: # try, execpt, finally 구문
        print('스레드 {0} : {1}\n'.format(threading.get_ident(), data))
    finally:
        if thread_safe:
            mutex.release()
            
if __name__ == "__main__":
    threads = []
    thread_safe = True # 예외 처리 부분
    mutex = Lock()
    for i in range(50):
        t = Thread(target = worker, args = (mutex, i, thread_safe))
        t.start()
        threads.append(t)
    for t in threads:
        t.join()

스레드 10248 : 0

스레드 14800 : 1

스레드 6400 : 2

스레드 1504 : 3

스레드 10812 : 4

스레드 9640 : 5

스레드 8344 : 6

스레드 2492 : 7

스레드 13224 : 8

스레드 1936 : 9

스레드 904 : 10

스레드 10696 : 11

스레드 10184 : 12

스레드 15152 : 13

스레드 6228 : 14

스레드 10108 : 15

스레드 14288 : 16

스레드 15004 : 17

스레드 1216 : 18

스레드 10796 : 19

스레드 4612 : 20

스레드 14972 : 21

스레드 11180 : 22

스레드 4376 : 23

스레드 13184 : 24

스레드 860 : 25

스레드 7076 : 26

스레드 10128 : 27

스레드 14316 : 28

스레드 5124 : 29

스레드 460 : 30

스레드 11456 : 31

스레드 15008 : 32

스레드 6404 : 33

스레드 14636 : 34

스레드 1304 : 35

스레드 10424 : 36

스레드 14732 : 37

스레드 13812 : 38

스레드 7092 : 39

스레드 4788 : 40

스레드 5768 : 41

스레드 10508 : 42

스레드 5584 : 43

스레드 5656 : 44

스레드 10316 : 45

스레드 3248 : 46

스레드 10168 : 47

스레드 13308 : 48

스레드 13496 : 49



In [13]:
# 세마포어 : 뮤텍스보다 더 일반적으로 사용되는 개념
# 1보다 큰 수로 사용이 가능합니다.
# 세마포어의 값은 곧 한번에 자원에 접근할 수 있는 스레드의 개수이다!
# 세마포어는 뮤텍스의 락, 언락과 비슷한 대기 및 신호작업을 지원합니다.

import threading
import time

class ThreadPool(object):
    def __init__(self):
        self.active = []
        self.lock = threading.Lock()
        
    def acquire(self, name):
        with self.lock:
            self.active.append(name)
            print('추가 : {0} | 스레드 풀 : {1}'.format(name, self.active))
    def release(self, name):
        with self.lock:
            self.active.remove(name)
            print('반환 : {0} | 스레드 풀 : {1}'.format(name, self.active))
            
def worker(semaphore, pool):
    with semaphore:
        name = threading.currentThread().getName()
        pool.acquire(name)
        time.sleep(1)
        pool.release(name)
        
if __name__ == "__main__":
    threads = []
    pool = ThreadPool()
    semaphore = threading.Semaphore(3)
    for i in range(10):
        t = threading.Thread(target = worker, name="스레드" + str(i), args = (semaphore, pool))
        t.start()
        threads.append(t)
    for i in threads:
        t.join()

추가 : 스레드0 | 스레드 풀 : ['스레드0']
추가 : 스레드1 | 스레드 풀 : ['스레드0', '스레드1']
추가 : 스레드2 | 스레드 풀 : ['스레드0', '스레드1', '스레드2']
반환 : 스레드0 | 스레드 풀 : ['스레드1', '스레드2']
추가 : 스레드3 | 스레드 풀 : ['스레드1', '스레드2', '스레드3']
반환 : 스레드1 | 스레드 풀 : ['스레드2', '스레드3']
반환 : 스레드2 | 스레드 풀 : ['스레드3']
추가 : 스레드4 | 스레드 풀 : ['스레드3', '스레드4']
추가 : 스레드5 | 스레드 풀 : ['스레드3', '스레드4', '스레드5']
반환 : 스레드3 | 스레드 풀 : ['스레드4', '스레드5']
추가 : 스레드6 | 스레드 풀 : ['스레드4', '스레드5', '스레드6']
반환 : 스레드4 | 스레드 풀 : ['스레드5', '스레드6']
추가 : 스레드7 | 스레드 풀 : ['스레드5', '스레드6', '스레드7']
반환 : 스레드5 | 스레드 풀 : ['스레드6', '스레드7']
추가 : 스레드8 | 스레드 풀 : ['스레드6', '스레드7', '스레드8']
반환 : 스레드6 | 스레드 풀 : ['스레드7', '스레드8']
추가 : 스레드9 | 스레드 풀 : ['스레드7', '스레드8', '스레드9']
반환 : 스레드7 | 스레드 풀 : ['스레드8', '스레드9']
반환 : 스레드8 | 스레드 풀 : ['스레드9']
반환 : 스레드9 | 스레드 풀 : []


In [14]:
# 데드락
# 두개 이상의 프로세스나 스레드가 서로 상대방의 작업이 끝날때까지 대기하는 상태이기 때문에 결과적으로 어떠한 작업도 완료되지
# 않은 상태를 의미합니다.
# 프로그램이 락을 할당하고 순서대로 락을 획득한다면 교착상태를 막을 수 있습니다.
# 정교한 방법은 아닙니다.
# 하지만 필요하다.

# 4개의 조건을 충족하면 데드락이 발생한다.
# 상호 배제 : element는 한번에 한 프로세스만 사용할 수 있다.
# 점유 대기 : 프로세스가 element를 가지고 있는 상태에서 다른 프로세스가 쓰는 element를 반납하기 기다리는 상황
# 비선점 : 다른 프로세스가 이미 점유한 자원을 강제로 뺏어오지 못하는 상태
# 순환 대기 : 다른 프로세스가 점유하고 있는 element를 대기하는 상태

# 스핀락
# 단일 응용프로그램 전용
# 코어당 하나의 스레드만 사용하는 고성능 컴퓨터 상황에서 바쁜 대기(Busy waiting)
# 프로세스의 한계점에 진입이 불가능할 때, 진입 가능할 때 까지 반복문을 돌면서 재시도 하는 락

# 

In [None]:
# virtualenv 설치법
pip install virtualenv

# 버전 확인
virtualenv --version

# 가상 환경 프로젝트 생성
cd 폴더 이름
virtualenv 폴더 이름

# 가상 환경 프로젝트 활성화
폴더 이름 activate

# 비활성화
가상환경 이름 deactivate


In [None]:
# virtualenvwrapper 설치법
pip install virtualenvwrapper-win

# 환경변수 설정
setx 환경변수 폴더명원하는 디렉토리 위치

# 프롬프트 껐다가 다시 킨다.
# 원하는 가상 환경 만드는 법
mkvirtualenv 가상환경 이름

# 활성화
가상환경이름 activate

# 비활성화
가상환경이름 deactivate

# workon 커맨드 사용법
workon 가상환경이름

In [None]:
# 디버깅
# pdb를 이요하면 디버깅을 할 수 있습니다.
# 보통 인터프리터를 사용해서 확인할 수 있습니다.
'''
python -i 파일명.py
디버깅 할 수 있습니다.
'''

# cmd에서 사용할 때
# python -m pdb 파일명.py

# 중단점
# pdb.set_trace

# 노트북에서 사용할 때

import pdb

pdb.set_trace()

In [1]:
# 프로파일링
# 프로그램이 매우 느리게 작동하거나
# 또는 메모리가 사용량이 많다면
# 보통 자료구조나 알고리즘을 잘못 짜서 그럼
# 코드자체가 비효율적이다.

# 1) 읽기 전용 데이터는 리스트보단 튜플을 사용한다.
# 2) 반복문을 돌린다. -> 항목이 많은 튜플, 리스트를 사용하지 않고 제네레이터를 사용한다.
# 3) 문자열 연결할 때 '+' 쓰지말고 리스트에 추가하고 리스트를 하나로 연결해라

# 좋은 예
employ = ['진혁진혁']
itmes = ['<table>']
for last, first in employ:
    items.append('<tr><td>%s, %s</td></tr>' %(last, first))
    items.append('</table>')
    employ = "".join(itmes)

# 안좋은 예
employ = '<table>'
for last, first in emply:
    employ += '<tr><td>%s, %s</td></tr>' %(last, first)
    employ += "</table>"

ValueError: too many values to unpack (expected 2)

In [2]:
employ

['진혁진혁']

In [7]:
# cprofile 모듈
# 호출 시간에 대한 세부 분석을 제공 합니다.
# 병목현상을 확인할 때 사용합니다.
import cProfile
import time

def sleep():
    time.sleep(5)
    
def print_hello():
    print('hello')
    
def main():
    sleep()
    print_hello()
    
cProfile.run('main()')

hello
         42 function calls in 5.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-7-b9a661da7065>:10(print_hello)
        1    0.000    0.000    5.000    5.000 <ipython-input-7-b9a661da7065>:13(main)
        1    0.000    0.000    4.999    4.999 <ipython-input-7-b9a661da7065>:7(sleep)
        1    0.000    0.000    5.000    5.000 <string>:1(<module>)
        3    0.000    0.000    0.000    0.000 iostream.py:197(schedule)
        2    0.000    0.000    0.000    0.000 iostream.py:309(_is_master_process)
        2    0.000    0.000    0.000    0.000 iostream.py:322(_schedule_flush)
        2    0.000    0.000    0.000    0.000 iostream.py:384(write)
        3    0.000    0.000    0.000    0.000 iostream.py:93(_event_pipe)
        3    0.000    0.000    0.000    0.000 socket.py:342(send)
        3    0.000    0.000    0.000    0.000 threading.py:1050(_wait_for

In [20]:
# timeit 모듈
# 코드 일부분의 실행 시간을 확인하는데 사용됩니다.
import timeit
timeit.timeit('a = 1 + 1')

timeit.timeit('x = sum(range(10))')

0.2971749999999247

In [None]:
# 고의로 데드락을 만드는 경우도 있나?