In [5]:
import platform
platform.python_version()

'3.11.3'

## 네임드 튜플(named tuple)과 데이터 클래스(dataclass)

- 모두 데이터를 저장하고 다루기 위한 방식으로 사용되지만, 몇 가지 차이점이 있습니다.

### 불변성: 
- 네임드 튜플은 불변(immutable) 객체로서, 한 번 생성된 후에 내부 데이터를 변경할 수 없습니다. 
- 반면 데이터 클래스는 필요에 따라 불변성 또는 가변성을 선택할 수 있습니다.

### 선언: 
- 네임드 튜플은 collections.namedtuple 함수를 사용하여 정의됩니다. 
- 데이터 클래스는 dataclasses.dataclass 데코레이터를 사용하여 정의됩니다.

### 타입 힌트: 
- 데이터 클래스는 타입 힌트를 더 넓게 지원합니다. 
- 네임드 튜플은 필드에 주석을 달기 어렵지만, 데이터 클래스는 타입 힌트를 사용할 수 있습니다.

### 메서드: 
- 데이터 클래스는 자동으로 __init__, __repr__, __eq__ 등의 메서드를 생성하여 사용하기 쉽게 만듭니다. 
- 네임드 튜플은 이러한 메서드를 직접 정의해야 합니다.

### 기능: 
- 데이터 클래스는 필드에 기본값, 기타 옵션 등을 설정할 수 있습니다. 
- 네임드 튜플은 필드에 기본값을 제공하기 어려우며, 튜플의 속성과 메서드가 제한적입니다.


## 1. 네임드 튜플

- 데이터 클래스 대신에 네임드 튜플(named tuple)을 사용하여 데이터를 저장하는 예제를 살펴보겠습니다. 
- 네임드 튜플은 튜플의 요소에 이름을 부여하여 간단한 데이터 구조를 정의할 때 유용합니다.

In [10]:
from collections import namedtuple

# 네임드 튜플 정의
Person = namedtuple('Person', ['name', 'age', 'email'])

In [11]:
# 네임드 튜플 인스턴스 생성
person = Person(name="Alice", age=30, email="alice@example.com")


In [13]:
person

Person(name='Alice', age=30, email='alice@example.com')

In [12]:
# 데이터에 접근
print(person.name)   # 출력: Alice
print(person.age)    # 출력: 30
print(person.email)  # 출력: alice@example.com

Alice
30
alice@example.com


### 불변 객체
- 네임드 튜플(named tuple)은 불변(immutable) 객체입니다. 
- 네임드 튜플이 생성된 후에는 내부의 데이터를 변경할 수 없습니다. 즉, 한 번 생성된 네임드 튜플의 필드 값은 수정할 수 없습니다.

In [14]:
try:
    person.age = 31
except Exception as e:
    print("Error:", e)

Error: can't set attribute


## 2. 데이터 클래스 

## 2-1. 파이썬 dataclasses 정의하기 
- 데이터를 저장하고 조작하는 데 사용하는 클래스를 생성하는 데 도움이 되는 데코레이터와 함수를 제공하는 모듈입니다. 
- dataclasses 모듈을 사용하면 일반적으로 필드를 가진 클래스를 더 쉽게 정의할 수 있습니다. 
- 이를 통해 간단하고 가독성이 높은 데이터 클래스를 만들 수 있습니다.

### 데이터 클래스 정의

- 데코레이트를 사용
- 클래스 내부에는 클래스 속성만 정의 


In [1]:
from dataclasses import dataclass

@dataclass
class Person:
    name: str
    age: int
    email: str


In [2]:
dir(dataclass)

['__annotations__',
 '__builtins__',
 '__call__',
 '__class__',
 '__closure__',
 '__code__',
 '__defaults__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__get__',
 '__getattribute__',
 '__getstate__',
 '__globals__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__kwdefaults__',
 '__le__',
 '__lt__',
 '__module__',
 '__name__',
 '__ne__',
 '__new__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

### 데이터 클래스 인스턴스 생성 

In [4]:
# 데이터 클래스 인스턴스 생성
person = Person(name="Alice", age=30, email="alice@example.com")

### 속성들 확인 

In [3]:
print(person.name)   # 출력: Alice
print(person.age)    # 출력: 30
print(person.email)  # 출력: alice@example.com

Alice
30
alice@example.com


## 2-2. 다양한 자료형으로 데이터 클래스 정의

- 데이터 클래스 정의할 때 클래스 속성에 초기값을 지정할 수 있다.

In [1]:
from dataclasses import dataclass
from datetime import date

###  다양한 자료형 및 초기값 설정 가능 

In [1]:
@dataclass
class User:
    id: int
    name: str
    birthdate: date
    admin: bool = False

In [2]:
user1 = User(id=1, name="Steve Jobs", birthdate=date(1955, 2, 24))

In [3]:
user1

User(id=1, name='Steve Jobs', birthdate=datetime.date(1955, 2, 24), admin=False)

## 2-3 불변 데이터 클래스 정의

- dataclasses를 사용하여 불변성을 가진 데이터 클래스를 정의할 수 있습니다. 
- 불변성을 갖는 클래스는 한 번 생성된 후에 그 상태가 변경되지 않는 특징을 가지며, 데이터의 안정성을 보장할 수 있습니다. 


In [6]:
from dataclasses import dataclass

@dataclass(frozen=True)
class ImmutablePerson:
    name: str
    age: int
    email: str


In [7]:
# 불변성 데이터 클래스 인스턴스 생성
person = ImmutablePerson(name="Alice", age=30, email="alice@example.com")

In [9]:
# 시도: 불변성 클래스의 필드 수정 시 예외 발생
try:
    person.age = 31
except Exception as e:
    print("Error:", e)

Error: cannot assign to field 'age'


## pydantic과 데이터 클래스(dataclass)
- 모두 데이터를 다루고 유효성을 검사하는 데 사용되는 도구입니다. 그러나 두 접근 방식 간에는 몇 가지 차이점이 있습니다.

### 데이터 유효성 검사:

- pydantic: 주된 목적은 데이터의 유효성을 검사하고 변환하는 것입니다. 입력 데이터의 유효성을 확인하고 데이터를 다루는 동안 데이터 유형 변환과 유효성 검증을 수행하는 데 중점을 둡니다.
- 데이터 클래스: 기본적으로 데이터 클래스는 필드를 가지며, 유효성 검사를 수동으로 수행해야 합니다. 불변성을 유지하거나 가변성을 선택할 수 있으며, 필요에 따라 데이터를 검사하는 로직을 구현해야 합니다.

### 선언:

- pydantic: 필드의 유형, 검증 규칙, 기본값 등을 선언하는 방식을 통해 데이터 모델을 정의합니다.
- 데이터 클래스: 간단한 데이터 저장 구조를 만들기 위한 데코레이터를 사용하여 데이터 클래스를 정의합니다.

### 타입 힌트와 주석:

- pydantic: 데이터 모델의 필드에 타입 힌트와 주석을 사용하여 데이터 유형을 지정하고 문서화할 수 있습니다.
- 데이터 클래스: PEP 484 타입 힌트를 사용할 수 있지만, 더 넓은 범위의 타입 힌트와 주석을 pydantic이 지원합니다.

### 메서드와 기능:

- pydantic: 데이터 유효성 검사, 디코딩, 인코딩, JSON 직렬화, 설정 관리 등 다양한 기능을 제공합니다.
- 데이터 클래스: 주로 데이터 저장 구조를 생성하는 데 초점을 맞추며, 간단한 메서드나 특수 기능은 제공하지 않습니다.

## 3. pydantic: 
- pydantic은 데이터 검증과 설정을 위한 모듈로, 데이터 클래스와 유사한 모델 클래스를 생성하면서 입력 데이터의 유효성을 검사하고 변환할 수 있습니다. 
- 주로 데이터 유효성 검증이 필요한 설정 파일이나 사용자 입력 처리에 유용합니다.

## 3-1 정의 

In [16]:
from pydantic import BaseModel

In [17]:
# Pydantic 모델 정의
class Person(BaseModel):
    name: str
    age: int
    email: str


## 인스턴스 생성 

In [18]:
# 유효성 검증 및 데이터 변환
data = {
    "name": "Alice",
    "age": 30,
    "email": "alice@example.com"
}


In [19]:
person = Person(**data)

### 조회하기 

In [20]:
print(person.name)   # 출력: Alice
print(person.age)    # 출력: 30
print(person.email)  # 출력: alice@example.com

Alice
30
alice@example.com


## 기본값 처리

In [29]:
class Person(BaseModel):
    name: str
    age: int = 30  # 기본값 설정

person = Person(name="Alice")
print(person.age)  # 출력: 30 (기본값 적용)

30


## 3-2 타입 유효성 체크 

In [21]:
# 유효하지 않은 데이터 처리
invalid_data = {
    "name": "Bob",
    "age": "twenty-five",  # 잘못된 타입
    "email": "bob@example.com"
}


In [22]:
try:
    invalid_person = Person(**invalid_data)
except ValueError as e:
    print("Error:", e)

Error: 1 validation error for Person
age
  value is not a valid integer (type=type_error.integer)


### 타입의 자동변환처리 

In [30]:
try:
    person = Person(name="Alice", age="30")  # 출력: 30 (문자열 "30"이 정수로 자동 변환됨)

except ValueError as e:
    print("Error:", e)

In [31]:
try:
    print(person.dict())     # 출력: 30 (문자열 "30"이 정수로 자동 변환됨)
except ValueError as e:
    print("Error:", e)

{'name': 'Alice', 'age': 30}


### 실제 타입이 오류면 예외 발생 

In [36]:
try:
    person1 = Person(name="겨울이", age="가을이")  # # 출력: 30 (문자열 "30"이 정수로 자동 변환됨)

except ValueError as e:
    print("Error:", e)

Error: 1 validation error for Person
age
  value is not a valid integer (type=type_error.integer)


### 커스텀 유효성 검증 

In [34]:
from pydantic import BaseModel, validator

class Person(BaseModel):
    name: str
    age: int

    @validator("age")
    def age_must_be_positive(cls, value):
        if value < 0:
            raise ValueError("Age must be positive")
        return value

person = Person(name="Alice", age=30)
print(person.dict())

try:
    invalid_person = Person(name="Bob", age=-25)
except ValueError as e:
    print("Error:", e)


{'name': 'Alice', 'age': 30}
Error: 1 validation error for Person
age
  Age must be positive (type=value_error)


## 3-3 불변 처리하기 

In [23]:
from pydantic import BaseModel

class ImmutablePerson(BaseModel):
    name: str
    age: int
    email: str

    class Config:
        frozen = True




In [25]:
# 불변성 데이터 클래스 인스턴스 생성
person = ImmutablePerson(name="Alice", age=30, email="alice@example.com")

# 시도: 불변성 클래스의 필드 수정 시 예외 발생
try:
    person.age = 31
except Exception as e:
    print("Error:", e)

Error: "ImmutablePerson" is immutable and does not support item assignment


## 3-4 Json 직렬화 

In [32]:
from pydantic import BaseModel

class Person(BaseModel):
    name: str
    age: int

person = Person(name="Alice", age=30)

# JSON 직렬화
json_data = person.json()
print(json_data)

# JSON 역직렬화
new_person = Person.parse_raw(json_data)
print(new_person.name, new_person.age)


{"name": "Alice", "age": 30}
Alice 30


## 3-5 데이터 처리 클래스의 확장 

In [33]:
from pydantic import BaseModel

class Person(BaseModel):
    name: str
    age: int

class Employee(Person):
    employee_id: int

employee = Employee(name="Alice", age=30, employee_id=123)
print(employee.dict())

{'name': 'Alice', 'age': 30, 'employee_id': 123}
