# 스레드를 이용하여 병렬로 처리하려면?
## threading
### 스레드를 이용하여 한 프로세스에서 2가지 이상의 일을 동시에 실행할 수 있게 하는 모듈

In [1]:
import urllib.request


def get_wikidocs(page):
    '''위키 독스에서 페이지로 지정해준 html 파일들을 저장하는 코드'''
    
    print("wikidocs page:{}".format(page))  # 페이지 호출시 출력
    resource = 'https://wikidocs.net/{}'.format(page)
    try:
        with urllib.request.urlopen(resource) as s:
            with open('wikidocs_%s.html' % page, 'wb') as f:
                f.write(s.read())
    except urllib.error.HTTPError:
        return 'Not Found'


import time

start = time.time()

pages = [12, 13, 14, 15, 17, 18, 20, 21, 22, 24]
for page in pages:
    get_wikidocs(page)

end = time.time()

print("수행시간: %f 초" % (end - start))

wikidocs page:12
wikidocs page:13
wikidocs page:14
wikidocs page:15
wikidocs page:17
wikidocs page:18
wikidocs page:20
wikidocs page:21
wikidocs page:22
wikidocs page:24
수행시간: 2.955191 초


In [2]:
#스레드 사용시
import urllib.request


def get_wikidocs(page):
    print("wikidocs page:{}".format(page))  # 페이지 호출시 출력
    resource = 'https://wikidocs.net/{}'.format(page)
    try:
        with urllib.request.urlopen(resource) as s:
            with open('wikidocs_%s.html' % page, 'wb') as f:
                f.write(s.read())
    except urllib.error.HTTPError:
        return 'Not Found'


import time
import threading

start = time.time()

pages = [12, 13, 14, 15, 17, 18, 20, 21, 22, 24]
threads = []

for page in pages:
    #wikidocs함수를 실행하는 쓰레드 t 생성 
    t = threading.Thread(target=get_wikidocs, args=(page, ))
    
    # 스레드 독립적으로 실행 
    t.start()
    
    # join()함수로 모든 스레드의 종료 시간을 측정하기위해 threads리스트에 담아둠 
    threads.append(t)

for t in threads:
    t.join()  # 스레드가 종료될 때까지 대기

end = time.time()

print("수행시간: %f 초" % (end - start))

wikidocs page:12
wikidocs page:13
wikidocs page:14wikidocs page:15

wikidocs page:17
wikidocs page:18
wikidocs page:20
wikidocs page:21
wikidocs page:22
wikidocs page:24
수행시간: 1.220127 초


# 멀티 프로세스를 이용하여 병렬로 처리하려면? 
## multiprocessing
### 멀티 프로세스를 활용하여 2가지 또는 그 이상의 일을 동시에 실행

In [3]:
# CPU 연산이 많은 heavy_work() 함수를 10번 실행하고 그 소요 시간을 측정 
import time


def heavy_work(name):
    result = 0
    for i in range(4000000):
        result += i
    print(f'{name} done')


start = time.time()

for i in range(10):
    heavy_work(i)

end = time.time()

print(f"수행시간:  {(end - start)}초")

0 done
1 done
2 done
3 done
4 done
5 done
6 done
7 done
8 done
9 done
수행시간:  5.4086644649505615초


In [4]:
# threading 모듈을 사용한 풀이 
# CPU 연산만 수행할 때는 수행 시간 단축에 큰 도움이 되지 않음 

import time


def heavy_work(name):
    result = 0
    for i in range(4000000):
        result += i
    print(f'{name} done')


if __name__ == '__main__':
    import threading

    start = time.time()
    threads = []
    for i in range(10):
        t = threading.Thread(target=heavy_work, args=(i, ))
        t.start()
        threads.append(t)

    for t in threads:
        t.join()  # 스레드가 종료될 때까지 대기

    end = time.time()

    print(f"수행시간: {(end - start)} 초")


2 done
8 done7 done
0 done
4 done
1 done

5 done
3 done6 done

9 done
수행시간: 5.3679914474487305 초


In [5]:
#multoprocessiing 모듈을 사용한 풀이
# 멀티 프로세서와 별개의 메모리를 사용하여 완전히 독립하여 병렬 프로그래밍 가능 
# 여러 개의 CPU가 있는 멀티코어 환경에서만 가능
import time


def heavy_work(name):
    result = 0
    for i in range(4000000):
        result += i
    print(f'{name} done')


if __name__ == '__main__':
    import multiprocessing

    start = time.time()
    procs = []
    for i in range(10):
        p = multiprocessing.Process(target=heavy_work, args=(i, ))
        p.start()
        procs.append(p)

    for p in procs:
        p.join()  # 프로세스가 모두 종료될 때까지 대기

    end = time.time()

    print(f"수행시간: {(end - start)} 초")

수행시간: 0.7801053524017334 초


# 병렬로 작업을 처리하려면?
## concurrent.futures
### concurrent.futures 모듈을 사용하면 같은 규칙으로 스레드와 멀티 프로세스 코드를 더 쉽게 작성 가능

In [8]:
#이 코드는 py파일로 실행해 주세요
import time


def heavy_work(name):
    result = 0
    for i in range(4000000):
        result += i
    print('%s done' % name)
    return result  # 결과를 반환하도록 변경


if __name__ == '__main__':
    import concurrent.futures

    start = time.time()

    total_result = 0
    pool = concurrent.futures.ProcessPoolExecutor(max_workers=4)

    procs = []
    for i in range(4):
        procs.append(pool.submit(heavy_work, i))

    for p in concurrent.futures.as_completed(procs):
        total_result += p.result()

    end = time.time()

    print("수행시간: %f 초" % (end - start))
    print("총결괏값: %s" % total_result)
    
    
    
#결과 

# 0 done
# 1 done
# 2 done
# 3 done
# 수행시간: 1.021849 초
# 총결괏값: 31999992000000

BrokenProcessPool: A process in the process pool was terminated abruptly while the future was running or pending.

# 시스템 명령어를 실행하려면?
## subprocess
### 다양한 방법으로 시스템 명령을 실행하는 모듈

In [6]:
import subprocess

with open('012out.txt', 'wb') as f:
    
                        # 리눅스 황경에서는 ['ls', '-l']
    out = subprocess.run(['cmd','/c', 'dir'], capture_output=True)
    f.write(out.stdout)

In [7]:
# 이를 사용하여 더 간단히 명령어 리스트 생성 가능
import shlex

command = shlex.split('cmd /c dir')
print(command)

['cmd', '/c', 'dir']


In [8]:
#복잡한 명령어 일 때 shell=True옵션 사용하여 리스트로 넘겨줄 필요 없이 전체 명렁을 하나의 문자열로 전달
import subprocess

subprocess.run('find ./ -name "*.html"|xargs grep "python"', shell=True)

CompletedProcess(args='find ./ -name "*.html"|xargs grep "python"', returncode=255)

# 원하는 작업을 원하는 시간에 실행하려면?
## sched
### 지정된 시간에 원하는 이벤트를 실행하게 하는 이벤트 스케줄러

In [9]:
def print_a(a):
    print(a)


def print_b(b):
    print(b)


def print_c(c):
    print(c)


print_a("A")
print_b("B")
print_c("C")

A
B
C


위 프로그램을 다음과 같이 실행하려면?
1. 프로그램 실행 후 5초 후에 print_a() 호출
2. 프로그램 실행 후 3초 후에 print_b() 호출
3. 프로그램 실행 후 7초 후에 print_c() 호출

In [10]:
import time
import sched

start = time.time()


def print_a(a):
    print(time.time() - start)
    print(a)


def print_b(b):
    print(time.time() - start)
    print(b)


def print_c(c):
    print(time.time() - start)
    print(c)


s = sched.scheduler()

# s.enter(딜레이 시간, 우선순위, 실행할 함수, 함수의 파라미터)
s.enter(5, 1, print_a, ('A',))  # 5초 후에 실행
s.enter(3, 1, print_b, ('B',))  # 3초 후에 실행
s.enter(7, 1, print_c, ('C',))  # 7초 후에 실행
s.run()

3.0091757774353027
B
5.015695333480835
A
7.015605211257935
C
