dict:간단한 데이터 객체

In [1]:
car1 = {
    'color': 'red',
    'mileage': 3812.4,
    'automatic': True,
}
car2 = {
    'color': 'blue',
    'mileage': 3222.4,
    'automatic': False,
}

In [2]:
# 딕셔너리의 repr
car2

{'color': 'blue', 'mileage': 3222.4, 'automatic': False}

In [3]:
car2['mileage']

3222.4

In [4]:
# 딕셔너리 변경가능
car2['mileage'] = 12
car2['windshield'] = 'broken'
car2

{'color': 'blue', 'mileage': 12, 'automatic': False, 'windshield': 'broken'}

tuple: 불변 객체 그룹

In [6]:
import dis
dis.dis(compile("(23, 'a', 'b', 'c')", '', 'eval'))

  1           0 LOAD_CONST               4 ((23, 'a', 'b', 'c'))
              2 RETURN_VALUE


In [7]:
dis.dis(compile("[23, 'a', 'b', 'c']", '', 'eval'))

  1           0 LOAD_CONST               0 (23)
              2 LOAD_CONST               1 ('a')
              4 LOAD_CONST               2 ('b')
              6 LOAD_CONST               3 ('c')
              8 BUILD_LIST               4
             10 RETURN_VALUE


In [8]:
# 필드: 색상 주행거리, 자동여부
car1 = ('red', 3812.4, True)
car2 = ('blue', 40231.0, False)

In [10]:
#튜플의 repr
car1

('red', 3812.4, True)

In [11]:
car2

('blue', 40231.0, False)

In [12]:
car2[1]

40231.0

In [13]:
car2[1] = 232

TypeError: 'tuple' object does not support item assignment

사용자 정의 클래스 작성: 코드가 늘어날수록 제어할 것도 늘어난다.

In [14]:
class Car:
    def __init__(self, color, mileage, automatic):
        self.color = color
        self.mileage = mileage
        self.automatic = automatic

car1 = Car('red', 3812.4, True)
car2 = Car('blue', 40231.0, False)

In [15]:
car2.mileage

40231.0

In [19]:
#  클래스는 변경할 수 있다. 
car2.mileage = 12
car2.windshield = 'broken'

In [20]:
car2

<__main__.Car at 0x271357059b0>

In [21]:
# 문자열 표현은 그다지 유용하지 않다. __repr__메서드를 추가해야함.

collections.namedtuple: 편리한 데이터 객체
- 사용자 정의 클래스를 정의하는 것과 마찬가지로 namedtuple을 사용하면 정확한 필드명만 허용하는 레코드의 재사용 가능한 청사진을 정의할 수 있다.
- 네임드튜플 객체는 내부적으로 일반 파이썬 클래스로 구현된다.
- 메모리 사용량에 관해서도 일반 클래스보다 '더 좋으며' 일반 튜플만큼 효율적이다.

In [23]:
from collections import namedtuple
from sys import getsizeof

p1 = namedtuple('Point', 'x y z')(1, 2, 3)
p2 = (1, 2, 3)

In [24]:
getsizeof(p1)

72

In [25]:
getsizeof(p2)

72

In [27]:
from collections import namedtuple
Car = namedtuple('Car', 'color mileage automatic')
car1 = Car('red', 3812.4, True)
car1

Car(color='red', mileage=3812.4, automatic=True)

In [28]:
car1.mileage

3812.4

In [29]:
car1.mileage = 12

AttributeError: can't set attribute

In [30]:
car1.windshield = 'broken'

AttributeError: 'Car' object has no attribute 'windshield'

typing.NamedTuple: 개선된 네임드튜플
- collections 모듈의 네임드튜플의 개선된 버전. 
- 주요차이점은 새로운 레코드 타입을 정의하고 타입힌트를 지원하도록 갱신된 구문.

In [31]:
from typing import NamedTuple

class Car(NamedTuple):
    color: str
    mileage: float
    automatic: bool

car1 = Car('red', 3812.4, True)

In [32]:
# 인스턴스의 repr
car1

Car(color='red', mileage=3812.4, automatic=True)

In [34]:
#필드에 접근
car1.mileage

3812.4

In [35]:
# 필드 변경 불가
car1.mileage = 12

AttributeError: can't set attribute

In [36]:
car1.windshield = 'broken'

AttributeError: 'Car' object has no attribute 'windshield'

In [37]:
# mypy 같은 별도 타입확인 도구 없이는 타입주석은 허용되지 않음.
Car('red', 'NOT_A_FLOAT', 99)

Car(color='red', mileage='NOT_A_FLOAT', automatic=99)

struct.Struct: 직렬화된 C 구조체
- struct.Struct 클래스는 파이썬 bytes 객체로 직렬화된 C 구조체와 파이썬 값 사이의 변환을 수행.
- 직렬화된 구조체는 순수하게 파이썬 코드 내에서 처리되는 데이터 객체를 나타내는 데는 거의 사용되지 않음.
- 주로 데이터 교환 형식으로 사용

In [39]:
from struct import Struct
MyStruct = Struct('i?f')
data = MyStruct.pack(23, False, 42.0)

In [40]:
# 데이터 블롭(blob)만 얻는다.
data

b'\x17\x00\x00\x00\x00\x00\x00\x00\x00\x00(B'

In [42]:
# 데이터 블롭은 다시 풀(unpack)수 있다.
MyStruct.unpack(data)

(23, False, 42.0)

types.SimpleNamespace: 세련된 속성 접근

In [49]:
from  types import SimpleNamespace
car1 = SimpleNamespace(color='red',
                      mileage=3812.4,
                      automatic=True)

In [50]:
# 기본 repr:
car1

namespace(automatic=True, color='red', mileage=3812.4)

In [51]:
# 인스턴스는 속성 접근을 지원하고 변경할 수 있다.
car1.mileage = 12
car1.windshield = 'broken'
del car1.automatic
car1

namespace(color='red', mileage=12, windshield='broken')

요점
1. 몇개(2-3)의 필드만 있을때 : 필드 순서를 기억하기 쉽거나 필드명이 불필요할때 -> 일반 튜플객체(예를 들면 공간좌표(x, y, z))
2. 불변 필드가 필요시 : 일반 튜플, collections.namedtuple, typing.NamedTuple
3. 오타가 발생하지 않도록 필드이름 고정 필요시 : collections.namedtuple, typing.NamedTuple
4. 간단하게 유지 원할때 : 일반 딕셔너리(json과 비슷하므로)
5. 데이터 구조를 완전히 제어할 필요가 있을때 : @property의 setter와 getter를 사용하여 사용자 정의 클래스를 작성.
6. 객체에 동작(메서드)을 추가해야할때 : 사용자 정의 클래스를 처음부터 작성 혹은 collections.namedtuple, typing.NamedTuple을 확장하여 작성
7. 데이터를 디스크에 저장 혹은 네트워크로 전송해야하여 데이터를 일렬로 빽빽하게 담아야할 때.: struct.Struct
- 안전하고 기본적인 선택은? 파이썬2에선 collections.namedTuple, 파이썬 3에선 typing.NamedTuple