# "파이썬 자료구조와 알고리즘" 핵심 내용 정리

---

# Part 01 _ 헬로, 자료구조 !

---

# Chapter 01 _ 숫자

## ■ 정수

In [1]:
s = '11'
int(s, 2)

3

In [2]:
int('1101', 2)

13

<b>NOTE :</b> int 메서드의 밑을 2로 하는 경우, 2진법으로 표현된 숫자로 인식하며 10진법으로 변환한다. 문자열에서 밑 범위의 숫자를 벗어나는 값을 입력하면 ValueError가 발생한다.

In [3]:
bin(14)

'0b1110'

In [4]:
"{0:08b}".format(14)

'00001110'

<b>NOTE :</b> 정수를 이진수 꼴로 표현하려면 bin 메서드를 사용한다. 혹은 문자열 포맷팅 기능으로 위와 같이 표현할 수 있다.

## ■ 부동소수점

<b>NOTE :</b> IEEE 754는 전기 전자 기술자 협회(IEEE)에서 개발한, 컴퓨터에서 부동소수점을 표현하는 가장 널리 쓰이는 표준이다. 파이썬에서 부동소수점은 float로 나타내며 불변형이다. 단정도(single precision)방식에서 32비트 부동소수점을 나타낼 때 1비트는 부호(1:양수, 0:음수), 23비트는 유효숫자 자릿수(significant digits, 혹은 가수(mantissa)), 8비트는 지수(exponent)다.

In [5]:
print(0.2 * 3)
print(0.2 * 3 == 0.6)

0.6000000000000001
False


In [6]:
print(1.2 - 0.2)
print(1.2 - 0.2 == 1.0)

1.0
True


In [7]:
print(1.2 - 0.1)
print(1.2 - 0.1 == 1.1)

1.0999999999999999
False


In [8]:
print(0.1 * 0.1)
print(0.1 * 0.1 == 0.01)

0.010000000000000002
False


<b>NOTE :</b> 부동소수점은 이진수 분수(binary fraction)로 표현되기 때문에 함부로 비교하거나 빼면 안 된다. 2진수는 대개 10진법으로 정확하게 표현할 수 있지만, 2진법으로는 표현하기 어려운 숫자도 있다.

In [9]:
7 / 3 # 부동소수점 반환

2.3333333333333335

In [10]:
7 // 3 # 몫 반환

2

In [11]:
7 % 3 # 나머지 반환

1

In [12]:
divmod(7, 3) # 몫과 나머지 반환

(2, 1)

##  ■ 복소수, fraction 모듈, decimal 모듈

생략

## ■  2진수, 8진수, 16진수

In [13]:
bin(999)

'0b1111100111'

<b>NOTE :</b> bin(i) 메서드는 정수 i의 2진수 문자열을 반환한다.

In [14]:
oct(999)

'0o1747'

<b>NOTE :</b> oct(i) 메서드는 정수 i의 8진수 문자열을 반환한다.

In [15]:
hex(999)

'0x3e7'

<b>NOTE :</b> hex(i) 메서드는 정수 i의 16진수 문자열을 반환한다.

## [참고] 가정 설정문 (assert)

<b>NOTE :</b> assert는 뒤의 조건이 True가 아니면 AssertError를 발생한다.

In [16]:
a = 2

In [17]:
assert a == 3

AssertionError: 

<b>NOTE :</b> 왜 assert가 필요한 것일까?

어떤 함수는 성능을 높이기 위해 반드시 정수만을 입력받아 처리하도록 만들 수 있다. 이런 함수를 만들기 위해서는 반드시 함수에 정수만 들어오는지 확인할 필요가 있다. 이를 위해 if문을 사용할 수도 있고 '예외 처리'를 사용할 수도 있지만 '가정 설정문'을 사용하는 방법도 있다.

In [19]:
lists = [1, 3, 6, 3, 8, 7, 13, 23, 13, 2, 3.14, 2, 3, 7]

def test(t):
    assert type(t) is int, '정수 아닌 값이 있네'

for i in lists:
    test(i)

AssertionError: 정수 아닌 값이 있네

<b>NOTE :</b> lists에 실수가 하나 있으므로 AssertionError가 발생했다. assert 문은 다음 형식으로 작동한다.

<i>assert 조건, '메시지'</i>

'메시지'는 생략할 수 있다.

assert는 개발자가 프로그램을 만드는 과정에 관여한다. 원하는 조건의 변수 값을 보증받을 때까지 assert로 테스트 할 수 있다. 이는 단순히 에러를 찾는것이 아니라 값을 보증하기 위해 사용된다.

예를 들어 함수의 입력 값이 어떤 조건의 참임을 보증하기 위해 사용할 수 있고 함수의 반환 값이 어떤 조건에 만족하도록 만들 수 있다. 혹은 변수 값이 변하는 과정에서 특정 부분은 반드시 어떤 영역에 속하는 것을 보증하기 위해 가정 설정문을 통해 확인 할 수도 있다.

이처럼 실수를 가정해 값을 보증하는 방식으로 코딩 하기 때문에 이를 '방어적 프로그래밍'이라 부른다.

## ■  피보나치 수열

In [20]:
def fib_generator() :
    a, b = 0, 1
    while True:
        yield b
        a,  b = b, a + b

fg = fib_generator()
for _ in range(10) :
    print(next(fg), end= " ")

1 1 2 3 5 8 13 21 34 55 

## [참고] 제너레이터 (generator)

<b>NOTE :</b>  generator란 iterator를 생성해주는 함수로, 함수안에 yield 키워드를 사용한다.

genrator 특징
- iterable한 순서가 지정됨(모든 generator는 iterator)
- 느슨하게 평가된다.(순서의 다음 값은 필요에 따라 계산됨)
- 함수의 내부 로컬 변수를 통해 내부상태가 유지된다.
- 무한한 순서가 있는 객체를 모델링할 수 있다.(명확한 끝이 없는 데이터 스트림)
- 자연스러운 스트림 처리를 위 파이프라인으로 구성할수 있다.

In [21]:
fg = fib_generator()

In [22]:
next(fg)

1

In [23]:
next(fg)

1

In [24]:
next(fg)

2

In [25]:
next(fg)

3

In [26]:
next(fg)

5

In [27]:
next(fg)

8

---

# Chapter 02 _ 내장 시퀀스 타입

## ■ 깊은 복사와 슬라이싱 연산

<b>NOTE :</b> 파이썬에서 튜플, 문자열, 바이트는 불변(immutable) 객체 타입이며, 리스트와 바이트는 가변(mutable) 객체 타입이다. 일반적으로 불변 객체 타입은 가변 객체 타입보다 효율적이다.

<b>NOTE :</b> 파이썬의 모든 변수는 객체 참조(reference)이므로 가변 객체를 복사할 때는 매우 주의해야 한다. a = b라고 할 때, a는 실제 b가 가리키는(참조하는) 곳을 가리킨다. 따라서 <b>깊은 복사(deep copy)</b>의 개념을 이해해야 한다.

In [28]:
# 리스트의 깊은 복사 : 추가 객체를 생성

myList = [1, 2, 3, 4]
newList = myList[:]
print(id(myList))
print(id(newList))

1928022094984
1928021361288


In [29]:
# 얕은 복사 : 같은 객체, 원본과 동일한 필드를 참조함

newList2 = myList
print(id(myList))
print(id(newList2))

1928022094984
1928022094984


In [30]:
# 셋의 깊은 복사 : 추가 객체를 생성

people = {"버피", "에인절", "자일스"}
slayers = people.copy()
slayers.discard("자일스")
slayers.remove("에인절")
print(slayers)
print(people)

{'버피'}
{'자일스', '에인절', '버피'}


슬라이싱 연산자 정리 생략

## ■ 문자열

<b>NOTE :</b> <b>유니코드</b>는 세계 언어의 몬자를 정의하기 위한 국제 표준 코드다. 유니코드는 공백, 특수문자, 수학 및 기타 분야의 기호들도 포함하고 있다. 파이썬 3부터 모든 문자열은 일반적인 바이트가 아닌 유니코드다. 문자열 앞에 u를 붙이면 유니코드 문자열을 만들 수 있다.

In [31]:
u"잘가\u0020세상"

'잘가 세상'

<b>NOTE :</b> 위 예제에서, escape sequence는 서수 값이 0x0020인 유니코드 문자를 나타낸다. 일반적인 아스키 코드의 표현은 7비트(아스키 코드를 확장한 ANSI 코드는 8비트)이고, 유니코드 표현에는 16비트가 필요하다.

In [32]:
name = "스칼렛"
name.ljust(50, '-')

'스칼렛-----------------------------------------------'

In [33]:
name.rjust(50, '-')

'-----------------------------------------------스칼렛'

In [34]:
from datetime import datetime

today = datetime(year=2017, month=1, day=27)
print(f"{today}")
print(f"{today:%B %d, %Y}") # 날짜 포맷 지정

2017-01-27 00:00:00
January 27, 2017


<b>NOTE :</b> <b>f-string</b>은 기존의 %나 .format 방식에 비해 간결하고 직관적이며 속도도 빠르다.

## ■ 튜플 

In [35]:
import collections

Person = collections.namedtuple('Person', 'name age gender')
# Person = collections.namedtuple('Person', ['name', 'age', 'gender'])
# Person = collections.namedtuple('Person', ('name', 'age', 'gender'))
p = Person('Simon', 30, '남자')

print(p)
print(p[0])
print(p.name)

Person(name='Simon', age=30, gender='남자')
Simon
Simon


<b>NOTE :</b> 파이썬 표준 모듈 collections에는 <b>named tuple</b>이라는 시퀀스 데이터 타입이 있다. 네임드 튜플은 일반 튜플과 비슷한 성능과 특성을 갖지만, 튜플 항목을 인덱스 위치뿐만아니라 이름으로도 참조할 수 있다.

<b>collections.namedtuple</b> 메서드의 첫 번째 인수는 만들고자 하는 사용자 정의 튜플 데이터 타입의 이름이다(보통 왼쪽에 할당하는 변수의 이름과 똑같이 사용한다). 두 번째 인수는 사용자 정의 튜플 각 항목을 지정하는 '공백으로 구분된 문자열(리스트 또는 튜플로 지정해도 된다)'이다.

## ■ 리스트

In [36]:
# 조건문을 활용한 list comprehension
[y for y in range(1900, 1940) if y % 4 ==0]

[1900, 1904, 1908, 1912, 1916, 1920, 1924, 1928, 1932, 1936]

In [37]:
# 표현식을 활용한 list comprehension
[2**i for i in range(13)]

[1, 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048, 4096]

In [38]:
words = 'Buffy is awesome and a vampire slayer'.split()

e = [[w.upper(), w.lower(), len(w)] for w in words]
for i in e :
    print(i)

['BUFFY', 'buffy', 5]
['IS', 'is', 2]
['AWESOME', 'awesome', 7]
['AND', 'and', 3]
['A', 'a', 1]
['VAMPIRE', 'vampire', 7]
['SLAYER', 'slayer', 6]


## ■ 바이트와 바이트 배열

<b>NOTE :</b> 파이썬은 원시 바이트(raw byte)를 처리하는 데 사용할 수 있는 데이터 타입으로 불변 타입의 바이트(byte)와 가변 타입의 바이트 배열(bytearray)을 제공한다. 두 타입 모두 0~255 범위의 부호 없는 8비트 정수 시퀀스로 이루어진다. 바이트 타입은 문자열 타입과 유사하며, 바이트 배열 타입은 리스트 타입과 유사하다.

In [39]:
blist = [1, 2, 3, 255]

the_bytes = bytes(blist)
print(the_bytes)

the_byte_array = bytearray(blist)
print(the_byte_array)

b'\x01\x02\x03\xff'
bytearray(b'\x01\x02\x03\xff')


In [40]:
# byte 타입은 immutable
the_bytes[1] = 123

TypeError: 'bytes' object does not support item assignment

In [41]:
# bytearray 타입은 mutable
the_byte_array[1] = 123
the_byte_array

bytearray(b'\x01{\x03\xff')

In [42]:
list(the_byte_array)

[1, 123, 3, 255]

---

# Chapter 03 _ 컬렉션 자료구조

<b>NOTE :</b> <b>컬렉션(collection)</b> 자료구조는 시퀀스 자료구조와 달리, 데이터를 서로 연관시키지 않고 모아두는 컨테이너(container)다. 컬렉션 자료구조는 시퀀스 자료구조에서 봤던 속성 중 세 가지 속성을 지닌다.

- 멤버십 연산자 : in
- 크기 함수 : len(seq)
- 반복성 : 반복문의 데이터를 순회한다.

In [43]:
print(dir(set()))

['__and__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__iand__', '__init__', '__init_subclass__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'add', 'clear', 'copy', 'difference', 'difference_update', 'discard', 'intersection', 'intersection_update', 'isdisjoint', 'issubset', 'issuperset', 'pop', 'remove', 'symmetric_difference', 'symmetric_difference_update', 'union', 'update']


In [44]:
print(dir(frozenset()))

['__and__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof__', '__str__', '__sub__', '__subclasshook__', '__xor__', 'copy', 'difference', 'intersection', 'isdisjoint', 'issubset', 'issuperset', 'symmetric_difference', 'union']


<b>NOTE :</b> <b>프로즌 셋(frozen set)</b>은 셋과 달리 불변 객체이며, 셋에서 사용할 수 있는 일부 메서드를 사용할 수 없다. 곧, 프로즌 셋의 요소를 변경하는 메서드를 사용할 수 없다.

## ■ 파이썬 컬렉션 데이터 타입

<b>NOTE :</b> 파이썬의 <b>collections</b>모듈은 범용의 내장 기능보다 더 다양하고 강력한 딕셔너리 타입을 제공한다.

In [45]:
from collections import defaultdict

pairs = {("a", 1), ("b", 2), ("c", 3)}

In [46]:
# 일반 딕셔너리
d1 = {}
for key , value in pairs :
    if key not in d1 :
        d1[key] = []
    d1[key].append(value)
print(d1)

{'c': [3], 'b': [2], 'a': [1]}


In [47]:
# defaultdict

d2 = defaultdict(list)
print(d2)
for key, value in pairs :
    d2[key].append(value)
print(d2)

defaultdict(<class 'list'>, {})
defaultdict(<class 'list'>, {'c': [3], 'b': [2], 'a': [1]})


In [48]:
d2['arbitrary key']

[]

<b>NOTE :</b> <b>defaultdict</b>는 내장 딕셔너리의 모든 연산자와 메서드를 사용할 수 있고, 추가로 위와 같이 누락된 키도 처리할 수 있다.

In [49]:
from collections import OrderedDict

tasks = OrderedDict()
tasks[8031] = "백업"
tasks[4027] = "이메일 스캔"
tasks[5733] = "시스템 빌드"
tasks

OrderedDict([(8031, '백업'), (4027, '이메일 스캔'), (5733, '시스템 빌드')])

<b>NOTE :</b> <b>OrderedDict</b>는 내장 딕셔너리의 모든 메서드와 속성을 가지고 있고, 추가로 위와 같이 삽입 순서대로 항목을 저장한다.

In [50]:
from collections import Counter

seq1 = [1, 2, 3, 5, 1, 2, 5, 5, 2, 5, 1, 4]
seq_counts = Counter(seq1)
print(seq_counts)

seq2 = [1, 2, 3]
seq_counts.update(seq2)
print(seq_counts)

seq3 = [1, 4, 3]
for key in seq3 :
    seq_counts[key] += 1
print(seq_counts)

Counter({5: 4, 1: 3, 2: 3, 3: 1, 4: 1})
Counter({1: 4, 2: 4, 5: 4, 3: 2, 4: 1})
Counter({1: 5, 2: 4, 5: 4, 3: 3, 4: 2})


In [51]:
seq_counts_2 = Counter(seq3)
print(seq_counts_2)
print(seq_counts + seq_counts_2)
print(seq_counts - seq_counts_2)


Counter({1: 1, 4: 1, 3: 1})
Counter({1: 6, 2: 4, 3: 4, 5: 4, 4: 3})
Counter({1: 4, 2: 4, 5: 4, 3: 2, 4: 1})


<b>NOTE :</b> <b>카운터(counter)</b>타입은 해시 가능한(hashable) 객체를 카운팅하는 특화된 서브클래스다. collections.Counter 모듈에서 제공한다.

---

# Chapter 04 _ 구조와 모듈

## ■ 모듈

<b>NOTE :</b> 파이썬에서 <b>모듈</b>은 def를 사용하여 정의한다. def가 실행되면, 함수의 객체와 참조가 같이 생성된다. 반환값을 정의하지 않으면, 파이썬은 자동으로 None을 반환한다. 아무런 값을 반환하지 않는 함수는 프로시저(procedure)라고 부른다.

### \_\_init\_\_.py 파일

<b>NOTE :</b> <b>패키지(package)</b>는 모듈과 \_\_init\_\_.py 파일이 있는 디렉터리다. 파이썬은 \_\_init\_\_.py 파일이 있는 디렉터리를 패키지로 취급한다. 모듈 검색 경로 중 string과 같이 흔한 이름의 디렉터리에 유효한 모듈이 들어있는 경우 이러한 모듈이 검색되지 않는 문제를 방지하기 위해서다.

예) _import 폴더이름.파일모듈명_

\_\_init\_\_.py 파일은 빈 파일일 수도 있지만, 패키지의 초기화 코드를 실행하거나, \_\_all\_\_ 변수를 정의할 수도 있다.

예) <i>\_\_all\__ = ["파일1", ...]</i>

### \_\_name\_\_ 변수

In [52]:
__name__

'__main__'

In [53]:
OrderedDict.__name__

'OrderedDict'

<b>NOTE :</b> 파이썬은 모듈을 import 할 때마다 \_\_name\_\_이라는 변수를 만들고, 모듈 이름을 저장한다. 즉, 모듈을 import하여 사용하는지, 직접 실행하는지를 구분할 수 있다.

### sys 모듈

sys.path는 인터프리터가 모듈을 검색할 경로를 담은 문자열 리스트다. sys.path 변수는 PYTHONPATH 환경변수 또는 내장된 기본값 경로로 초기화된다. 환경변수를 수정하면 모듈 경로를 추가하거나 임시로 모듈 경로를 추가할 수 있다.

예) <i>sys.path.append('모듈_디렉터리_경로')</i>

### return 대 yield

<b>NOTE :</b> 파이썬에서 제너레이터(generator)는 이터레이터(iterator)를 작성하는 편리한 방법이다. 객체에 \_\_iter()\_\_와 \_\_next()\_\_ 메서드를 둘 다 정의하면 이터레이터 프로토콜을 구현한 셈이다. 이때 yield 키워드를 사용하면 편리하다.

호출자가 메서드를 호출할 때, __return__ 키워드는 반환값을 반환하고 메서드를 종료한 후, 호출자에게 제어를 반환한다. 반면 __yield__ 키워드는 각 반환값을 호출자에게 반환하고, 반환값이 모두 소진되었을 때에만 메서드가 종료된다.

이터레이터는 파이썬의 강력한 기능이다. 이터레이터는 이터레이터 프로토콜을 구현하는 컨테이너 객체라고 할 수 있는데, 컨테이너의 다음 값을 반환하는 \_\_next\_\_() 메서드와 이터레이터 자신을 반환하는 \_\_iter\_\_() 메서드를 기반으로 한다.

yield 키워드는 제너레이터 맥락에서 이터레이터를 만드는 아주 강력한 도구다. 제너레이터는 최종값을 반환하지만, 이터레이터는 __yield__ 키워드를 사용하여 코드 실행 중에 값을 반환한다. 즉, \_\_next\_\_() 메서드를 호출할 때마다 어떤 값 하나를 추출한 후 해당 __yield__ 표현식의 값을 반환한다. 이렇게 이터레이터는 __StopIteration__ 예외가 발생할때까지 값을 반환한다.

### zip

In [54]:
a = [1, 2, 3, 4, 5]
b = ['a', 'b', 'c', 'd']

print(zip(a, b))
print(list(zip(a, b)))

<zip object at 0x000001C0E721A0C8>
[(1, 'a'), (2, 'b'), (3, 'c'), (4, 'd')]


<b>NOTE :</b> __zip()__ 메서드는 2개 이상의 시퀀스를 인수로 취하여, 짧은 길이의 시퀀스를 기준으로 각 항목이 순서대로 1:1 대응하는 새로운 튜플 시퀀스를 만든다.

### filter()

In [55]:
def f(x): 
    return x % 2 != 0 and x % 3 != 0

print(f(33))
print(f(17))

False
True


In [56]:
list(filter(f, range(2, 25)))

[5, 7, 11, 13, 17, 19, 23]

<b>NOTE :</b> __filter()__ 메서드는 시퀀스의 항목들 중 함수 조건이 참(True)인 항목만 추출해서 구성된 시퀀스를 반환한다.

### map()

In [57]:
def cube(x) :
    return x*x*x

list(map(cube, range(1, 11)))

[1, 8, 27, 64, 125, 216, 343, 512, 729, 1000]

In [58]:
seq = range(8)

def square(x) :
    return x*x

list(zip(seq, map(square, seq)))

[(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25), (6, 36), (7, 49)]

<b>NOTE :</b> __map(function, list)__ 메서드는 시퀀스의 모든 항목에 함수를 적용한 결과 리스트를 반환한다.

---

# Chapter 05 _ 객체지향 설계

## ■ 클래스와 객체

### 클래스 인스턴스 생성

<b>NOTE :</b> __클래스 인스턴스 생성(class instantiation)__은 함수 표기법을 사용하여 초기 상태의 객체를 생성하는 일이다. Hello라는 클래스가 있다고 하자. 그러면 Hello()를 호출하여 객체를 생성하는데, 이때 Hello()를 생성자(constructor)라고 한다. 생성자를 호출하면 <b>Hello.\_\_new\_\_()</b>라는 특수 메서드가 호출되어 객체가 할당되고 그다음 <b>Hello.\_\_init\_\_()</b> 메서드가 객체를 초기화한다.

## ■ 디자인패턴

<b>NOTE :</b> __디자인 패턴(design pattern)__은 잘 설계된 구조의 형식적 정의를 소프트웨어 엔지니어링으로 옮긴 것이다. 다양한 디자인 패턴이 있고 이들을 사용하여 서로 다른 문제를 해결할 수 있다.

### 데커레이터 패턴

In [59]:
def my_decorator(func):
    pass

class C(object) :
    @my_decorator # my_decorator라는 함수에 아래의 method를 인자로 넣는다. 
    def method(self) :
        # 메서드 내용
        pass
    
# 위 코드가 뜻하는 바는 아래와 같다.    

class C(object) :
    def method(self) :
        # 메서드 내용
        pass
    method = my_decorator(method)

In [60]:
# 데커레이터를 이용한 벤치마킹 코드

import random
import time

def benchmark(func) :
    def wrapper(*args, **kwargs) :
        t = time.perf_counter() # 코드 실행 시간 측정
        res = func(*args, **kwargs)
        print('{0} {1}'.format(func.__name__, time.perf_counter()-t))
        return res
    return wrapper

@benchmark
def random_tree(n) :
    temp = [n for n in range(n)]
    for i in range(n + 1) :
        temp[random.choice(temp)] = random.choice(temp)
    return temp

random_tree(10000)

random_tree 0.021491399999999997


[674,
 6385,
 2076,
 3081,
 4,
 9709,
 4206,
 7120,
 5540,
 7497,
 10,
 11,
 263,
 7989,
 3427,
 7629,
 6732,
 6107,
 667,
 1111,
 4576,
 9216,
 3381,
 9603,
 24,
 7314,
 26,
 5426,
 28,
 6733,
 2180,
 31,
 9372,
 33,
 34,
 536,
 36,
 5293,
 38,
 7894,
 1987,
 4356,
 5509,
 893,
 8597,
 45,
 1613,
 655,
 894,
 7407,
 6123,
 3398,
 3970,
 550,
 6190,
 5067,
 894,
 2248,
 58,
 6379,
 60,
 4125,
 8207,
 9620,
 4653,
 65,
 2523,
 569,
 68,
 4500,
 70,
 5640,
 72,
 9260,
 9501,
 1600,
 2759,
 9810,
 7187,
 6813,
 6784,
 6519,
 82,
 5980,
 2069,
 6626,
 4497,
 87,
 5723,
 3791,
 3650,
 2188,
 92,
 651,
 1600,
 9161,
 96,
 2690,
 394,
 2814,
 7167,
 5107,
 102,
 8364,
 104,
 105,
 106,
 8058,
 108,
 2842,
 9935,
 2337,
 9641,
 5779,
 5294,
 7574,
 116,
 301,
 3259,
 7057,
 7494,
 7813,
 4739,
 140,
 6703,
 8736,
 7730,
 680,
 128,
 9171,
 7651,
 498,
 132,
 133,
 134,
 135,
 5817,
 2577,
 138,
 139,
 140,
 141,
 7502,
 1477,
 3820,
 145,
 3117,
 147,
 4587,
 6954,
 1485,
 9500,
 152,
 5021,
 

<b>NOTE :</b> __데커레이터(decorator)__패턴은 @표기를 사용해 함수 또는 메서드의 변환을 우아하게 지정해주는 도구다. 데커레이터 패턴은 함수의 객체와 함수를 변경하는 다른 객체의 래핑(wrapping)을 허용한다.

In [61]:
class A(object) :
    _hello = True
    
    def foo(self, x) :
        print("foo({0}, {1}) 실행".format(self, x))
        
    @classmethod
    def class_foo(cls, x) :
        print("class_foo({0}, {1}) 실행 {2}".format(cls, x, cls._hello))
        
    @staticmethod
    def static_foo(x) :
        print("static_foo({0}) 실행".format(x))
        
a = A()
a.foo(1)
a.class_foo(2)
A.class_foo(2)
a.static_foo(3)
A.static_foo(3)

foo(<__main__.A object at 0x000001C0E71F0710>, 1) 실행
class_foo(<class '__main__.A'>, 2) 실행 True
class_foo(<class '__main__.A'>, 2) 실행 True
static_foo(3) 실행
static_foo(3) 실행


<b>NOTE :</b> 파이썬에서 일반적으로 사용하는 데커레이터는 __@classmethod__와 __@staticmethod__가 있다. 이들은 각각 메서드를 클래스와 정적 메서드로 변환한다. __@classmethod__는 첫 번째 인수로 클래스(cls)를 사용하고, __@staticmethod__는 첫 번째 인수에 self 혹은 cls가 없다. 클래스 내 변수에 접근하려면 __@classmethod__의 첫 번째 인수를 사용할 수 있다.

# Chapter 06 _ 파이썬 고급 주제

## ■ 멀티 프로세스와 멀티 스레드

<b>NOTE :</b> 운영체제에서 실행되는 각 프로그램은 각각이 별도의 <b>프로세스(process)</b>다. 각 프로세스에는 하나 이상의 <b>스레드(thread)</b>가 있다. 한 프로세스에 여러 개의 스레드가 있다면 여러 작업을 마치 동시에 수행하는 것처럼 보인다. 이렇게 멀티 프로세스와 멀티 스레드라는 두 가지 방법을 사용하면, 프로그램의 작업 부하를 분산시킬 수 있다.

   * __멀티 프로세스__<br>
   멀티 프로세스는 별도의 메모리 영역을 가지며, 특별한 메커니즘으로만 통신할 수 있다. 프로세서는 각 스레드에 대해 별도의 레지스터 집합을 불러오거나 저장하는데, 프로세스 간 데이터 공유와 통신용으로는 비효율적이다. 파이썬에서는 멀티 프로세스 방식에 subprocess 모듈을 사용한다.
   * __멀티 스레드__<br>
   단일 프로세스 내의 멀티 스레드는 동일한 메모리에 접근한다. 스레드는 데이터 공유를 통해 간단하게 통신하는데, threading 모듈의 처리를 통해 한번에 한 스레드만 메모리 영역에 접근할 수 있다. 각 프로세스가 독립적인 스택(stack), 힙(heap), 코드(code), 데이터(data) 영역을 가지는 반면, 한 프로세스에 속한 스레드는 스택 스택 영역을 제외한 메모리 영역을 공유한다.
   

### subprocess 모듈

In [62]:
import subprocess

subprocess.run(["echo", "이것은 subprocess 입니다."])

CompletedProcess(args=['echo', '이것은 subprocess 입니다.'], returncode=0)

In [63]:
subprocess.run(["sleep", "5"]) # 5초 동안 sleep

CompletedProcess(args=['sleep', '5'], returncode=0)

### threading 모듈

In [64]:
import queue
import threading

q = queue.Queue()

def worker(num) :
    while True :
        item = q.get()
        if item is None :
            break
        # 작업을 처리한다.
        print("스레드 {0} : 처리 완료 {1}".format(num+1 , item))
        q.task_done()

num_worker_threads = 5
threads = []
for i in range(num_worker_threads) :
    t = threading.Thread(target=worker, args=(i,))
    t.start()
    threads.append(t)
    
for item in range(50) :
    q.put(item)
    
# 모든 작업이 끝날 때까지 대기한다.
q.join()

# worker 스레드를 종료한다.
for i in range(num_worker_threads) :
    q.put(None)
for t in threads :
    t.join()

스레드 1 : 처리 완료 0스레드 2 : 처리 완료 1스레드 5 : 처리 완료 2
스레드 5 : 처리 완료 3
스레드 5 : 처리 완료 4
스레드 5 : 처리 완료 5
스레드 5 : 처리 완료 6
스레드 2 : 처리 완료 7스레드 4 : 처리 완료 8스레드 3 : 처리 완료 9
스레드 3 : 처리 완료 10
스레드 3 : 처리 완료 11
스레드 3 : 처리 완료 12
스레드 3 : 처리 완료 13
스레드 3 : 처리 완료 14
스레드 3 : 처리 완료 15
스레드 3 : 처리 완료 16
스레드 3 : 처리 완료 17
스레드 3 : 처리 완료 18
스레드 3 : 처리 완료 19


스레드 3 : 처리 완료 20
스레드 3 : 처리 완료 21
스레드 3 : 처리 완료 22
스레드 3 : 처리 완료 23

스레드 1 : 처리 완료 24
스레드 1 : 처리 완료 25
스레드 1 : 처리 완료 26
스레드 1 : 처리 완료 27
스레드 1 : 처리 완료 28
스레드 1 : 처리 완료 29
스레드 1 : 처리 완료 30
스레드 1 : 처리 완료 31
스레드 1 : 처리 완료 32
스레드 1 : 처리 완료 33
스레드 1 : 처리 완료 34
스레드 1 : 처리 완료 35
스레드 1 : 처리 완료 36
스레드 1 : 처리 완료 37
스레드 1 : 처리 완료 38스레드 5 : 처리 완료 39
스레드 3 : 처리 완료 40
스레드 3 : 처리 완료 41
스레드 3 : 처리 완료 42
스레드 3 : 처리 완료 43
스레드 3 : 처리 완료 44
스레드 3 : 처리 완료 45
스레드 3 : 처리 완료 46
스레드 3 : 처리 완료 47
스레드 3 : 처리 완료 48
스레드 3 : 처리 완료 49


