Chapter 1. 파이썬 데이터 모델

why len(collection), not collection.len()?

파이썬의 장점 중 하나는 일관성

실용성 > 이론적 완벽성

파이썬 데이터 모델이 제공하는 API를 이용해 우리의 고유의 객체를 정의하면 대부분의 파이썬 상용구를 적용할 수 있다.

프레임워크를 이용해 코딩을 할 때는 프레임워크에 의해 호출되는 매서드를 구현하는데 많은 시간을 소비(ex. Pytorch의 DataLoader 구현) - 파이썬 데이터 모델도 마찬가지

파이썬 인터프리터는 특별 매서드를 호출해서 기본적인 객체 연산을 수행

특별 매서드(__[...]__())는 우리가 구현한 객체가 다음과 같은 기본적인 언어 구조체를 구현하고 지원하고 함께 사용할 수 있게 함:
반복 / 컬렉션 / 속성 접근 / 연산자 오버로딩 / 함수 및 매서드 호출 / 객체 생성 및 제거 / 문자열 표현 및 포맷 / 블록 등 콘텍스트 관리

1.1 파이썬 카드 한 벌

In [59]:
# 특별 매서트 __getitem__()과 __len()__을 이용해 여러 기능을 구현한 예시

import collections

# collections.namedtuple()로 개별 카드를 나타내는 클래스를 구현 - namedtuple은 매서드를 가지지 않는 일련의 속성으로 구성된 클래스를 만들 수 있음
Card = collections.namedtuple('Card', ['rank', 'suit'])

class FrenchDeck:
    ranks = [str(n) for n in range(2, 11)] + list('JQKA')
    suits = 'spades diamonds clubs hearts'.split()
    
    def __init__(self):
        self._cards = [Card(rank, suit) for suit in self.suits      # outer loop
                                        for rank in self.ranks]     # inner loop
    
    def __len__(self):
        return len(self._cards)
    
    def __getitem__(self, position):
        return self._cards[position]

In [60]:
beer_card = Card('7', 'diamonds')
beer_card

Card(rank='7', suit='diamonds')

In [61]:
deck = FrenchDeck()
# 일반적인 파이썬 컬렉션과 마찬가지로 len() 함수를 통해 카드의 수를 반환
len(deck)

52

In [62]:
# 카드 덱에서 특정 카드를 읽어 올 수 있음
deck[0]

Card(rank='2', suit='spades')

In [63]:
deck[-1]

Card(rank='A', suit='hearts')

In [64]:
import random

# 파이썬은 시퀀스에서 항목을 무작위로 골라내는 random.choice() 매서드를 제공 - 특별 매서드를 정의해 이를 이용할 수 있음
random.choice(deck)

Card(rank='10', suit='clubs')

특별 매서드를 통해 파이썬 데이터 모델을 사용할 때의 두 가지 장점
- 사용자가 표준 연산을 수행하기 위해 클래스 자체에서 구현한 임의의 매서드명을 암기할 필요가 없다. (ex. 항목 수를 size()로 구현 했는지 length()로 구현 했는지 등)
- 파이썬 표준 라이브러리에서 제공하는 풍부한 기능을 별도로 구현할 필요 없이 바로 사용할 수 있다. (ex. random.choice())

In [65]:
# __getitem__() 매서드는 self._cards의 [] 연산자에 작업을 위임하므로 deck 객체는 slicing도 자동으로 지원
deck[:3]

[Card(rank='2', suit='spades'),
 Card(rank='3', suit='spades'),
 Card(rank='4', suit='spades')]

In [66]:
# Ace 만 가져오기
deck[12::13]

[Card(rank='A', suit='spades'),
 Card(rank='A', suit='diamonds'),
 Card(rank='A', suit='clubs'),
 Card(rank='A', suit='hearts')]

In [67]:
# 반복
for card in deck:
    print(card)

Card(rank='2', suit='spades')
Card(rank='3', suit='spades')
Card(rank='4', suit='spades')
Card(rank='5', suit='spades')
Card(rank='6', suit='spades')
Card(rank='7', suit='spades')
Card(rank='8', suit='spades')
Card(rank='9', suit='spades')
Card(rank='10', suit='spades')
Card(rank='J', suit='spades')
Card(rank='Q', suit='spades')
Card(rank='K', suit='spades')
Card(rank='A', suit='spades')
Card(rank='2', suit='diamonds')
Card(rank='3', suit='diamonds')
Card(rank='4', suit='diamonds')
Card(rank='5', suit='diamonds')
Card(rank='6', suit='diamonds')
Card(rank='7', suit='diamonds')
Card(rank='8', suit='diamonds')
Card(rank='9', suit='diamonds')
Card(rank='10', suit='diamonds')
Card(rank='J', suit='diamonds')
Card(rank='Q', suit='diamonds')
Card(rank='K', suit='diamonds')
Card(rank='A', suit='diamonds')
Card(rank='2', suit='clubs')
Card(rank='3', suit='clubs')
Card(rank='4', suit='clubs')
Card(rank='5', suit='clubs')
Card(rank='6', suit='clubs')
Card(rank='7', suit='clubs')
Card(rank='8', sui

In [68]:
# 뒤에서부터 반복
for card in reversed(deck):
    print(card)

Card(rank='A', suit='hearts')
Card(rank='K', suit='hearts')
Card(rank='Q', suit='hearts')
Card(rank='J', suit='hearts')
Card(rank='10', suit='hearts')
Card(rank='9', suit='hearts')
Card(rank='8', suit='hearts')
Card(rank='7', suit='hearts')
Card(rank='6', suit='hearts')
Card(rank='5', suit='hearts')
Card(rank='4', suit='hearts')
Card(rank='3', suit='hearts')
Card(rank='2', suit='hearts')
Card(rank='A', suit='clubs')
Card(rank='K', suit='clubs')
Card(rank='Q', suit='clubs')
Card(rank='J', suit='clubs')
Card(rank='10', suit='clubs')
Card(rank='9', suit='clubs')
Card(rank='8', suit='clubs')
Card(rank='7', suit='clubs')
Card(rank='6', suit='clubs')
Card(rank='5', suit='clubs')
Card(rank='4', suit='clubs')
Card(rank='3', suit='clubs')
Card(rank='2', suit='clubs')
Card(rank='A', suit='diamonds')
Card(rank='K', suit='diamonds')
Card(rank='Q', suit='diamonds')
Card(rank='J', suit='diamonds')
Card(rank='10', suit='diamonds')
Card(rank='9', suit='diamonds')
Card(rank='8', suit='diamonds')
Card(r

In [69]:
# 컬렉션에 __contains__() 매서드가 없다면 in 연산자는 차례대로 검색
Card('Q', 'hearts') in deck

True

In [70]:
Card('7', 'beasts') in deck

False

In [71]:
# 정렬

suit_values = dict(spades=3, hearts=2, diamonds=1, clubs=0)

# 숫자(rank)로 순위를 정하고 (A>K>Q>J>10>9>...>2), 숫자가 같다면 스페이드>하트>다이아몬드>클로버 순
def spades_high(card):
    rank_value = FrenchDeck.ranks.index(card.rank)
    return rank_value * len(suit_values) + suit_values[card.suit]

# 오름차순 나열
for card in sorted(deck, key=spades_high):
    print(card)

Card(rank='2', suit='clubs')
Card(rank='2', suit='diamonds')
Card(rank='2', suit='hearts')
Card(rank='2', suit='spades')
Card(rank='3', suit='clubs')
Card(rank='3', suit='diamonds')
Card(rank='3', suit='hearts')
Card(rank='3', suit='spades')
Card(rank='4', suit='clubs')
Card(rank='4', suit='diamonds')
Card(rank='4', suit='hearts')
Card(rank='4', suit='spades')
Card(rank='5', suit='clubs')
Card(rank='5', suit='diamonds')
Card(rank='5', suit='hearts')
Card(rank='5', suit='spades')
Card(rank='6', suit='clubs')
Card(rank='6', suit='diamonds')
Card(rank='6', suit='hearts')
Card(rank='6', suit='spades')
Card(rank='7', suit='clubs')
Card(rank='7', suit='diamonds')
Card(rank='7', suit='hearts')
Card(rank='7', suit='spades')
Card(rank='8', suit='clubs')
Card(rank='8', suit='diamonds')
Card(rank='8', suit='hearts')
Card(rank='8', suit='spades')
Card(rank='9', suit='clubs')
Card(rank='9', suit='diamonds')
Card(rank='9', suit='hearts')
Card(rank='9', suit='spades')
Card(rank='10', suit='clubs')
Ca

FrenchDeck이 암묵적으로 object를 상속 받지만(python2에서는 명시적으로 상속을 작성해야 했지만, `Class FrenchDeck(object):`, python3에서는 기본적으로 상속받음, `Class FrenchDeck:`), 상속 대신 데이터 모델과 구성을 이용해서 기능들을 가져온다.

즉, FrenchDeck은 표준 파이썬 시퀀스처럼 작동하므로 반복 및 슬라잇ㅇ 등의 핵심 언어 기능 및 random의 choice(), reversed(), sorted() 등의 함수와 같이 표준 라이브러리를 사용 가능
이러한 구성 덕분에 `__len__()`과 `__getitem__()` 매서드는 모든 작업을 list 객체인 self._cards에 떠넘길 수 있음

Cf. 카드 셔플링을 할 수 있을까?
No! 불변 객체이기 떄문 -> 캡슐화를 어기고 _cards 속성을 직접 조작하지 않는 한 카드의 값과 위치를 바꿀 수 없다.
--> 11장에서 `__setitem__()`으로 해결

1.2 특별 메서드는 어떻게 사용되나?

특별 메서드는 우리가 아니라 파이썬 인터트리터가 호출하기 위한 것이다.
ex. 소스 코드에서는 `my_object.__len__()`으로 직접 호출하지 않고, `len(my_object)` 형태로 호출 -> 파이썬 인터프리터가 우리가 구현한 `__len__()` 메서드를 호출

그러나 내장 자료형(ex. list, str, bytearray)의 경우 파이썬 인터프리터는 순쉬운 방법을 선택 (ex. CPython의 경우 len() 메서드는 메모리에 있는 모든 가변 크기 내장 객체를 나타내는 pyVarObject C 구조체의 ob_size필드의 값을 반환) -> 메서드를 호출하는 방법보다 빠름

종종 득별 메서드가 암묵적으로 호출괸다.
ex. `for in x:` -> `iter()` 호출 -> 이 함수는 `x.__iter__()` 호출

일반적으로 사용자 코드에서 특별 메서드를 직접 호출하는 경우는 거의 없음 -> 관련된 내장 함수를 호출하는 것이 좋음 - 이 내장 함수들이 해당 특별 메서드를 호출
하지만 내장 데이터형의 경우 특별 메서드를 호출하지 않고 더 빠른 방법을 사용(cf. 14.12 'iter() 함수 들여다보기')

주의) 사용자 정의 속정을 만들때 이중 언더바를 가진 __foo__와 같은 형태의 속성명은 피하자 - 현재 이런 속성명이 사용되고 있지 않더라도 나중에 특별한 의미를 갖도록 정의될 수 있기 때문

1.2.1 수치형 흉내내기

연산자에 사용자 정의 객체가 응답할 수 있게 해주는 몇몇 특별 메서드들이 있다(자세한 내용은 13장 참조).

In [72]:
# 2차원 유클리드 벡터를 나타내는 클래스 구현
# cf. 내장된 complex 형을 이용해 2차원 벡터를 표현할 수도 있지만, 우리가 정의한 클래스는 n차원으로 쉽게 확장 가능(14장 참조).

import math

class Vector:
    
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y
        
    def __repr__(self):
        return 'Vector(%r, %r)' % (self.x, self.y)
    # cf. %r > %s : 출력할 속성의 표준 표현을 가져오기 위해 %r을 사용하는 것이 좋음.
    # 우리의 생성자는 문자열이 아닌 숫자를 인수로 받으므로 Vector('1', '2')가 아닌 Vector(1, 2)임
    
    def __abs__(self):
        return math.hypot(self.x, self.y)
    
    def __add__(self, other):
        x = self.x + other.x
        y = self.y + other.y
        return Vector(x, y)
    
    def __mul__(self, scalar):
        return Vector(self.x * scalar, self.y * scalar)
    
    def __bool__(self):
        # 벡터의 크기가 0이면 False, 그렇지 않으면 True
        # 가독성은 떨어지지만 이렇게 구현하면 제곱, 제곱근 연산을 수행하지 않는다.
        return bool(self.x or self.y)

In [73]:
v1 = Vector(2, 4)
v2 = Vector(2, 1)
v1 + v2

Vector(4, 5)

In [74]:
v = Vector(3, 4)
abs(v)

5.0

In [75]:
v * 3

Vector(9, 12)

In [76]:
abs(v * 3)

15.0

1.2.2 문자열 표현

`__repr__()` 특별 메서드는 객체를 문자열로 표현하기 위해 `repr()` 내장 메서드에 의해 호출된다.
만약 `__repr__()`가 구현되어 있지 않다면 `<[class 이름] object at [메모리 주소]>`와 같은 형태로 출력된다.

문자열 포맷팅에서 %r / !r 에서도 표현식의 결과에 `repr()`을 호출

`__repr__()` 메서드가 반환한 문자열은 명확해야 하며, 가능하면 표현된 객체를 재생성하는 데 필요한 소스코드와 일치해야 한다. (ex. `Vector(1, 2)` > `Vector('1', '2')` or `vec(1, 2)`)

`__repr__()` vs `__str__()`
`__str__()`는 생성자에 의해 호출되며 `print()` 함수에 의해 암묵적으로 사용된다. 사용자에게 보여주기 적당한 형태의 문자열을 반환해야 한다.
두 특별 메서드 중 하나만 구현해야 한다면 -> `__repr__()`을 구현 : 파이썬 인터프리터는 `__str__()` 메서드가 구현되어 있지 않을 때 대책으로 `__repr__()` 메서드를 호출하기 때문

1.2.3 산술 연산자

`__add__()` -> `+` / `__mul__()` -> `*` / ...

중위 연산자는 의례적으로 피연산자를 변경하지 않고 객체를 새로 만든다.

주의! 이 예제에서 구현한 코드는 Vector에 숫자를 곱할 수 있지만 그 반대는 x (교환법칙 x) -> `__rmul__()` 특별 메서드를 이용해 수정 (13장 참조)

1.2.4 사용자 정의형의 boolean 값

파이썬에도 bool 형은 있지만, if나 while 문, 혹은 and, or, not에 대한 피연산자로서 boolean형이 필요한 곳에는 어떠한 객체라도 사용할 수 있다.
x가 참인지 거짓인지 판단하기 위해 파이썬은 `bool(x)`을 적용하며, 이 함수는 항상 True나 False를 반환한다.
`bool(x)`는 `x.__bool__()`을 호출한다.

`__bool__()`이나 `__len__()`을 구현하지 않은 경우, 기본적으로 사용자 정의 클래스 객체는 `true`로 간주된다.

`__bool__()`이 구현되어 있지 않으면 파이썬은 `x.__len__()`을 호출하며, 이 특별 메서드가 `0`을 반환하면 `False`를 그렇지 않으면 `True`를 반환한다.

주의! 우리가 정의한 객체를 `__bool__()` 특별 메서드가 어떻게 파이썬 표준 라이브러리 문서의 내장 자료형(https://docs.python.org/ko/3/library/stdtypes.html#truth)에 정의된 참값 검사 규칙을 적용하는지 살펴보자.

1.3 특별 메서드 개요

파이썬 언어 참조 문서의 '데이터 모델'장(https://docs.python.org/ko/3/reference/datamodel.html) 참조

1.4 왜 len()은 메서드가 아닐까?

실용성 > 순수성

len(x)는 x가 내장형의 객체일 때 아주 빨리 실행된다.
컬렉션에 들어 있는 항목 수를 가져오는 연산은 자주 발생하므로 str, list, memoryview 등의 다양한 기본형 객체에 대해 효율적으로 작동해야 한다.

즉, len()은 abs()와 마찬가지로 파이썬 데이터 모델에서 특별한 대우를 받으므로 메서드라고 부르지 않는다.
그러나 __len__() 특별 메서드 덕분에 우리는 정의한 객체에서 len() 메서드를 직접 정의할 수 있다.
이것은 내장형 객체의 효율성과 언어의 일관성 간의 타협점을 어느 정도 찾은 것이다.

1.5 요약
특별 메서드를 구현하면 사용자 정의 객체도 내장형 객체처럼 작동하게 되어, 파이썬스러운 표현력 있는 코딩 스타일을 구사할 수 있다.

파이썬 객체는 기본적으로 자신을 문자열 형태로 제공해야 하는데, 디버깅 및 로그에 사용하는 형태(`__repr__()`)와 사용자에게 보여주기 위한 형태(`__str__()`)가 있다.

시퀀스를 흉내 내기 위해 특별 메서드가 널리 사용된다. -> 2장
자신만의 시퀀스 캑체를 구현하는 방법 -> 10장

연산자 오버로딩 덕분에 파이썬은 내장형에서 decimal.Decimal과 fractions.Fraction에 이르기까지 중위 산술 연산을 지원하는 다양한 수치형을 제공한다.
다양한 연산자 구현 방법 -> 13장

나머지 특별 메서드의 사용과 구현은 이 책의 모든 부분에서 설명한다.

1.6 읽을거리

데이터 모델 ~= 객체 모델 = 메타객체 프로토콜
객체 모델: 특정 컴퓨터 프로그래밍 언어에서 일반적인 객체의 속성(핵심 언어 구조체에 대한 API)