### Preface 
해당 문서는 Python [공식문서](https://docs.python.org/3.6/reference/datamodel.html)의 data model 부분과 [Fluent Python](http://1.droppdf.com/files/X06AR/fluent-python-2015-.pdf)의 1장과 9장을 주로 참고하여 작성.<br>

현재는 Python data model에서 기본이라 생각되는 아래의 2가지 사항만 다룸.<br>
1. Object
2. Special method

그 외에도 `The standard type hierarchy`, `Coroutines`에 관한 내용이 있으니, 자세한 내용은 [공식문서](https://docs.python.org/3.6/reference/datamodel.html)
를 참조.

# Python Data Model

Python data model은 **"Python을 framework로 표현"**하여, **"Python스러움(Pythonic)이 가능한 핵심기반"**을 제공.<br>
list, tuple, dict, string등의 내장자료형은 Pythonic하게 사용이 가능하며, 사용자 정의 자료형(Class)도 special method를 통해 내장자료형처럼 Pythonic하게 동작이 가능.<br>

Pythonic은 모호한 개념이지만, "객체지향 언어로 절차지향 처럼 코딩하지 않는 것"과 비슷한 뉘앙스를 갖음.<br>
Pythonic에 대한 사항은 `import this`를 통해 알 수 있음.<br>

In [1]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


import this의 번역된 내용은 아래와 같음.<br>

파이썬 선(禪), [Tim Peters](https://stackoverflow.com/users/2705542/tim-peters) 지음

아름다움이 추함보다 좋다.<br> 
명시가 암시보다 좋다.<br> 
단순함이 복잡함보다 좋다.<br> 
복잡함이 꼬인 것보다 좋다.<br> 
수평이 계층보다 좋다.<br> 
여유로운 것이 밀집한 것보다 좋다.<br> 
가독성은 중요하다.<br> 
특별한 경우라는 것은 규칙을 어겨야 할 정도로 특별한 것이 아니다.<br> 
허나 실용성은 순수성에 우선한다.<br> 
오류 앞에서 절대 침묵하지 말지어다.<br> 
명시적으로 오류를 감추려는 의도가 아니라면. 모호함을 앞에 두고, 이를 유추하겠다는 유혹을 버려라.<br> 
어떤 일에든 명확한 - 바람직하며 유일한 - 방법이 존재한다.<br> 
비록 그대가 우둔하여 그 방법이 처음에는 명확해 보이지 않을지라도.<br> 
지금 하는게 아예 안하는 것보다 낫다.<br> 
아예 안하는 것이 지금 *당장*보다 나을 때도 있지만.<br> 
구현 결과를 설명하기 어렵다면, 그 아이디어는 나쁘다.<br> 
구현 결과를 설명하기 쉽다면, 그 아이디어는 좋은 아이디어일 수 있다.<br>
네임스페이스는 대박 좋은 아이디어다 -- 마구 남용해라! 

## 1. Object

Object 는 Python에서 제공하는 data를 위한 뼈대.<br>
Python에서 **"모든 data는 object로 표현되거나 object의 관계로 표현"**.<br>
모든 "object는 **identity**, **type**, **value**를 갖음".<br>

예상외로(?) 가장 간단한 object 생성 코드는 아래와 같음.

In [2]:
a = 1
b = 2
c = 2
print(a)
print(b)
print(c)

1
2
2


### a) Identity
Object의 identity는 절대 바꿀 수 없음. Objcet가 저장된 memory의 주소라 생각해도 무방.<br>
**`is` 연산자는 두 object의 identity를 비교**하는 연산자.<br>
**`id()` 함수는 object의 identity를 integer로 리턴**.<br>

identity 관련 실행코드는 아래와 같다.

In [3]:
print('ID of a: ', id(a))
print('ID of b: ', id(b))
print('ID of c: ', id(c), '\n')
print('a is a?: ', a is a)
print('b is b?: ', b is b)
print('a is b?: ', a is b)
print('b is c?: ', b is c)

ID of a:  1757726448
ID of b:  1757726480
ID of c:  1757726480 

a is a?:  True
b is b?:  True
a is b?:  False
b is c?:  True


### b) Type

Object의 type은 절대 바꿀 수 없음. Type은 object가 지원하는 **"operation과 가능한 value를 결정"**.<br>
**`type()`함수로 object의 type을 확인 가능.**

Type 관련 실행코드는 아래와 같다.

In [4]:
type_a = type(a)
type_b = type(b)

print(type_a)
print(type_b)
print(type(c))

<class 'int'>
<class 'int'>
<class 'int'>


### c) Value
Object의 **"Type에 따라 value는 변하거나 변할 수 없음"**.<br>
Value가 변할 수 있는 object를 **"mutable"** 하다고 말함.<br>
Value가 변할 수 없는 object를 **"immutable"** 하다고 말함.<br>

기본 제공되는 Object의 type별로 mutability를 구분하면 아래와 같음.<br>
**mutable: dictionaries, lists**<br>
**immutable: numbers, strings, tuples**<br> 

**`==` 연산자는 두 object의 value를 비교**하는 연산자.<br>

Mutable type 관련 실행코드는 아래와 같다.

In [17]:
## Mutable
# List
list_a = [1,2,3,4,5]
list_b = list_a
list_c = [1,2,3,4,5]

print("Name \t identity \t type \t values")
print("list_a: ", id(list_a), type(list_a), list_a)
print("list_b: ", id(list_b), type(list_b), list_b)
print("list_c: ", id(list_c), type(list_c), list_c)
print("list_a == list_b?: ", list_a == list_b, "| list_a is list_b?: ", list_a is list_b)
print("list_a == list_c?: ", list_a == list_c, "| list_a is list_c?: ", list_a is list_c)

list_b += [6]

print("\nName \t identity \t type \t values")
print("list_a: ", id(list_a), type(list_a), list_a)
print("list_b: ", id(list_b), type(list_b), list_b)
print("list_c: ", id(list_c), type(list_c), list_c)
print("list_a == list_b?: ", list_a == list_b, "| list_a is list_b?: ", list_a is list_b)
print("list_a == list_c?: ", list_a == list_c, "| list_a is list_c?: ", list_a is list_c)

Name 	 identity 	 type 	 values
list_a:  2522313031752 <class 'list'> [1, 2, 3, 4, 5]
list_b:  2522313031752 <class 'list'> [1, 2, 3, 4, 5]
list_c:  2522313032264 <class 'list'> [1, 2, 3, 4, 5]
list_a == list_b?:  True | list_a is list_b?:  True
list_a == list_c?:  True | list_a is list_c?:  False

Name 	 identity 	 type 	 values
list_a:  2522313031752 <class 'list'> [1, 2, 3, 4, 5, 6]
list_b:  2522313031752 <class 'list'> [1, 2, 3, 4, 5, 6]
list_c:  2522313032264 <class 'list'> [1, 2, 3, 4, 5]
list_a == list_b?:  True | list_a is list_b?:  True
list_a == list_c?:  False | list_a is list_c?:  False


list_a를 참조하고 있는 list_b를 변경하였을때, list_a도 같이 변함을 알 수가 있다.<br>
그리고 **"list_a와 list_b의 identity는 동일"**하다.<br>
하지만 같은 value를 갖는 list_c라는 object는 list_a와 다른 identity를 갖는 것을 알 수 있다.<br>

Immutable type 관련 실행코드는 아래와 같다.

In [13]:
## Immutable
# Tuple
tuple_a = (1,2)
tuple_b = tuple_a
tuple_c = (1,2)

print("Name \t identity \t type \t values")
print("tuple_a: ", id(tuple_a), type(tuple_a), tuple_a)
print("tuple_b: ", id(tuple_b), type(tuple_b), tuple_b)
print("tuple_c: ", id(tuple_c), type(tuple_c), tuple_c)
print("tuple_a == tuple_b?: ", tuple_a == tuple_b,"| tuple_a is tuple_b?: ", tuple_a is tuple_b)
print("tuple_a == tuple_c?: ", tuple_a == tuple_c,"| tuple_a is tuple_c?: ", tuple_a is tuple_c)

tuple_b += (3,)

print("\nName \t identity \t type \t values")
print("tuple_a: ", id(tuple_a), type(tuple_a), tuple_a)
print("tuple_b: ", id(tuple_b), type(tuple_b), tuple_b)
print("tuple_c: ", id(tuple_c), type(tuple_c), tuple_c)
print("tuple_a == tuple_b?: ", tuple_a == tuple_b,"| tuple_a is tuple_b?: ", tuple_a is tuple_b)
print("tuple_a == tuple_c?: ", tuple_a == tuple_c,"| tuple_a is tuple_c?: ", tuple_a is tuple_c)



# Number
num_a = 1
num_b = num_a
num_c = 1

print("\nName \t identity \t type \t values")
print("num_a: ", id(num_a), type(num_a), num_a)
print("num_b: ", id(num_b), type(num_b), num_b)
print("num_c: ", id(num_c), type(num_c), num_c)
print("num_a == num_b?: ", num_a == num_b, "| num_a is num_b?: ", num_a is num_b)
print("num_a == num_c?: ", num_a == num_c, "| num_a is num_c?: ", num_a is num_c)

num_b += 3

print("\nName \t identity \t type \t values")
print("num_a: ", id(num_a), type(num_a), num_a)
print("num_b: ", id(num_b), type(num_b), num_b)
print("num_c: ", id(num_c), type(num_c), num_c)
print("num_a == num_b?: ", num_a == num_b, "| num_a is num_b?: ", num_a is num_b)
print("num_a == num_c?: ", num_a == num_c, "| num_a is num_c?: ", num_a is num_c)

num_d = 256
num_e = 256

print("\nthe both of 256 ids are same?: ", id(num_d) == id(num_e))

num_f = 256
num_f += 1

print("\nthe 256 id and 257 id are same?: ", id(num_e) == id(num_f))


Name 	 identity 	 type 	 values
tuple_a:  140219804849928 <class 'tuple'> (1, 2)
tuple_b:  140219804849928 <class 'tuple'> (1, 2)
tuple_c:  140219804851080 <class 'tuple'> (1, 2)
tuple_a == tuple_b?:  True | tuple_a is tuple_b?:  True
tuple_a == tuple_c?:  True | tuple_a is tuple_c?:  False

Name 	 identity 	 type 	 values
tuple_a:  140219804849928 <class 'tuple'> (1, 2)
tuple_b:  140219805005144 <class 'tuple'> (1, 2, 3)
tuple_c:  140219804851080 <class 'tuple'> (1, 2)
tuple_a == tuple_b?:  False | tuple_a is tuple_b?:  False
tuple_a == tuple_c?:  True | tuple_a is tuple_c?:  False

Name 	 identity 	 type 	 values
num_a:  94409405902048 <class 'int'> 1
num_b:  94409405902048 <class 'int'> 1
num_c:  94409405902048 <class 'int'> 1
num_a == num_b?:  True | num_a is num_b?:  True
num_a == num_c?:  True | num_a is num_c?:  True

Name 	 identity 	 type 	 values
num_a:  94409405902048 <class 'int'> 1
num_b:  94409405902144 <class 'int'> 4
num_c:  94409405902048 <class 'int'> 1
num_a == num_b

tuple_a를 참조하고 있는 tuble_b와 num_a를 참조하고 있는 num_b를 변경하면, 변경된 value를 갖는 다른 object로 변화.<br> 
하지만 immutable type은 주의할 점이 존재.<br>
**"tuple은 같은 value를 갖는 object가 여러개 존재"** 가능. 하지만 **"number는 같은 value를 갖는 object는 단 1개"**.<br>
tuple과 number는 서로 다른 memory 정책을 갖음.<br>
**number는 256까지만 object가 singletone** 임.  

### d) Garbage Collector
Object는 절대 명시적으로 파괴될 수 없음. 즉, Python에는 object를 직접 제거하는 메커니즘이 없음.<br>
**"Garbage Collector가 object를 관리."**<br>

**"Reference count"**는 특정 메모리 주소를 참조하는 곳의 수.<br>
0이 될 경우, 다음 garbage collection때 메모리에서 해제.<br>

**"Garbage Collection"**은 필요없는 메모리를 자동으로 해제해 주는 것.<br> 
Generation으로 나눠서 메모리를 관리. **가장 낮은 generation부터 garbage collection**<br>
Reference count와 휴리스틱 등을 메모리 해제 기준으로 이용.<br>

`del` 연산자는 **"변수의 선언을 취소"**해 주는 연산자.<br>
`del` 연산자를 적용했다고 해서 메모리가 해제된 것은 아님.<br> 

<span style="color:green"><b>TODO</b>: gc의 기능</span>

Garbage Collector 관련 코드는 아래와 같다.

In [7]:
import sys 
import gc

# 1의 메모리 주소를 참조하는 수
a=1
print(sys.getrefcount(1), sys.getrefcount(a))

# 특정 set을 생성
f = {'machine', 'learning', 'python'}
print(sys.getrefcount(f))
print(sys.getrefcount({'machine', 'learning', 'python'}))
g = f
print(sys.getrefcount(f))
del g
print(sys.getrefcount(f))
print(sys.getrefcount(1), sys.getrefcount(a))

14335 14335
2
1
3
2
14343 14343


특정 set 생성시 처음부터 메모리를 참조하는 곳의 수는 2곳.<br>
숫자 1은 Python 내부에서 사용하는 곳이 많기 때문에 약 14,000여개의 참조
그리고 숫자 1은 참조하는 곳이 실시간으로 변하는 것으로 보아, garbage collection이 자주 일어나는 것으로 예상<br>

## 2. Special method

Special method는 사용자 정의 자료형(Class)을 Pythonic하게 사용하기 위한 필수요소.<br>
Class에서 정의가 가능하며, Python interpreter가 class에 구현된 special method를 호출하기 때문에 Pythonic하게 사용이 가능.<br>
일반적으로 사용자 코드에서 특별 메서드를 직접 호출하는 경우는 많지 않으며, 특별 메서드를 호출해야하는 경우에는 관련된 내장 함수를 호출하는 것이 좋음
사용자가 표준 연산을 수행하기 위해 클래스 자체에서 구현한 임의 메서드명을 암기할 필요가 없음.<br>
파이썬 표준 라이브러리에서 제공하는 풍부한 기능을 별도로 구현할 필요 없이 바로 사용할 수 있음.<br>
특별 메서드를 구현함으로써 사용자가 정의한 객체는 표준 파이썬 시퀀스처럼 작동하므로 반복 및 슬라이싱 등의 핵심 언어 기능을 사용할 수 있다.
일부 특별 메서드는 암묵적으로 호출(iter())

내장자료형은 이미 special method가 구현이 잘 되어 있기 때문에 Pythonic하게 코딩이 가능.<br>
`dir`함수로 내장자료형에 구현된 Special method를 확인가능.<br>

In [27]:
print('List: ', dir([1,2,3]), '\n')
print('Set: ', dir({1,2,3}), '\n')
print('Number: ', dir(1), '\n')

List:  ['__add__', '__class__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort'] 

Set:  ['__and__', '__class__', '__contains__', '__delattr__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__iand__', '__init__', '__init_subclass__', '__ior__', '__isub__', '__iter__', '__ixor__', '__le__', '__len__', '__lt__', '__ne__', '__new__', '__or__', '__rand__', '__reduce__', '__reduce_ex__', '__repr__', '__ror__', '__rsub__', '__rxor__', '__setattr__', '__sizeof

Special method는 dunder(double underbar의 줄임말)라 부르는 __를 앞뒤로 사용하여 표현.<br>



#### ETC

In [8]:
name = "Fred"
print("He said his name is {name}")
print(f"He said his name is {name}")

He said his name is {name}
He said his name is Fred


## References

1. [Python 3.6.3, Data model documentation](https://docs.python.org/3.6/reference/datamodel.html)
2. [Fluent Python](http://1.droppdf.com/files/X06AR/fluent-python-2015-.pdf)
3. [The Hitchhiker's Guide to the Python Memory](https://speakerdeck.com/devunt/the-hitchhikers-guide-to-the-python-memory)