# The Python Data Model

## Python Data Model == Python Object Model

첫 장을 들어가며 가장 궁금한 것이 타이틀입니다. 과연 `Python Data Model`이 뭘까요?

[Object model](https://en.wikipedia.org/wiki/Object_model) 의 정의가 `The properties of objects in a specific programming language` 랍니다. 그 정의처럼 파이썬에서 클래스, 오브젝트가 어떤 속성들을 갖는지를 정의한 것입니다.

그럼, 왜 Python Object Model이 아니라 Data Model 이라고 부르나요? 관례상 섞어부르는 것 같습니다. [정식문서](https://docs.python.org/3/reference/datamodel.html) 에는 Data Model 이라고 부르네요.

## Pythonic
동시에 자주 나오는 단어가 `Pythonic`입니다. 많이 들어보셨겠지만 잘 모르겠죠? 예제를 봅시다.

예제1) 스트링의 길이를 잴 때 어떻게 하나요?

In [1]:
len("this is my string")

17

네, 우리는 `len(my_string)`을 사용하지 `my_string.size()`라고 하지 않습니다.

에제2) 맵(딕셔너리)에서 키에 해당하는 값을 가져올때에 어떻게 하나요?

In [2]:
my_dict = {'my_key1': 2, 'my_key2': 4}
my_dict['my_key1']

2

네, 우리는 `my_dict['my_key1']`을 사용하지 `my_dict.get('my_key1')`을 사용하지 않습니다.

이렇게, 간단한 [built-in function](https://docs.python.org/3/library/functions.html) 들로 편의성을 가져다주는 파이썬의 속성을 `Pythonic`이라고 합니다.

`Python Data Model` 과 `Pythonic` 은 함께 알아두어야 합니다.

## Example: Pythonic Card Deck

`Python Data Model`이란 파이썬의 객체의 속성에 관한 특성이라고 했습니다. 쉽게 풀어쓰자면, 클래스를 정의할 때에 어떤 특별 메소드를 정의하는가입니다.

여기서는 `FrenchDeck`이라는 클래스를 정의합니다. `__len__`, `__getitem__` 이라는 특별함수를 재 정의하여, 파이쏘닉한 객체를 만드는 실험을 해보죠.

In [3]:
import collections

Card = collections.namedtuple('Card', ['rank', 'suit'])

class FrenchDeck:
    ranks = [str(n) for n in range(2, 11)] + list('JQKA')
    suits = 'spades diamonds clubs hearts'.split()
    
    def __init__(self):
        self._cards = [Card(rank, suit) for suit in self.suits
                       for rank in self.ranks]
    
    def __len__(self):
        return len(self._cards)
    
    def __getitem__(self, position):
        return self._cards[position]

In [4]:
deck = FrenchDeck()
len(deck)

52

In [5]:
print(deck[0])
print(deck[-1])

Card(rank='2', suit='spades')
Card(rank='A', suit='hearts')


In [6]:
suit_values = dict(spades=3, hearts=2, diamonds=1, clubs=0)

def spades_high(card):
    rank_value = FrenchDeck.ranks.index(card.rank)
    return rank_value * len(suit_values) + suit_values[card.suit]

for card in sorted(deck, key=spades_high)[:5]:
    print(card)
print()
for card in sorted(deck, key=spades_high)[-5:]:
    print(card)

Card(rank='2', suit='clubs')
Card(rank='2', suit='diamonds')
Card(rank='2', suit='hearts')
Card(rank='2', suit='spades')
Card(rank='3', suit='clubs')

Card(rank='K', suit='spades')
Card(rank='A', suit='clubs')
Card(rank='A', suit='diamonds')
Card(rank='A', suit='hearts')
Card(rank='A', suit='spades')


## Example: Vector

`Vector` 라는 다른 예제를 줍니다. 여기서는, `__repr__`, `__abs__`, `__bool__`, `__add__`, `__mul__`을 정의합니다.

이 예제는 알아두시면, Chapter 9, 10 등에서 다시 사용됩니다.

In [7]:
from math import hypot

class Vector:
    def __init__(self, x=0, y=0):
        self.x = x
        self.y = y
        
    def __repr__(self):
        return f'Vector({self.x!r}, {self.y!r})'
    
    def __abs__(self):
        return hypot(self.x, self.y)
    
    def __bool__(self):
        return bool(abs(self))
    
    def __add__(self, other):
        x = self.x + other.x
        y = self.y + other.y
        return Vector(x, y)
    
    def __mul__(self, scalar):
        return Vector(self.x * scalar, self.y * scalar)

In [8]:
v1 = Vector(2, 4)
v2 = Vector(2, 1)
v1 + v2

Vector(4, 5)

In [9]:
v = Vector(3, 4)
print(abs(v))
print(v * 3)
print(abs(v * 3))

5.0
Vector(9, 12)
15.0


## repr() vs str()

책에서는 [stackoverflow의 첫번째 Alex 의 답변](https://stackoverflow.com/questions/1436703/difference-between-str-and-repr) 이 좋다고 합니다. 저는 두번째 짧은 답변이 더 좋습니다.

- `__repr__` is for developers
- `__str__` is for customers

## Special Methods

[정식문서](https://docs.python.org/3/reference/datamodel.html)에 모든 스페셜 메소드들이 다 나옵니다.

보통 객체에 대해서 `dir()`이나 `vars()`해서 나오는 언더바 둘 붙은 함수들이 스페셜 메소드들입니다.

In [10]:
dir(Vector)

['__abs__',
 '__add__',
 '__bool__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__']

책은 3.4를 중심으로 써져있기에, 3.5부터 도입된 것들은 나오지 않습니다. 예를들어, 다음 것들이 있습니다.

- Coroutine: `object.__await__(self)`
- Asynchronous Iterators: `object.__aiter__(self)`
- Asynchronous Context Manager: `object.__aenter__(self)`

## The Zen of Python

`len()`을 조금 더 설명하며 [Zen of Python](https://en.wikipedia.org/wiki/Zen_of_Python)을 언급합니다.

`import this` 라는 이스터 에그를 실행하면 나오니 한번씩 읽어두세요.

In [11]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
