# Pydantic

Pydantic은 Python 타입 힌트를 사용하여 데이터 구조를 정의하고

런타임에서 이를 강제하는 강력한 라이브러리입니다.

단순히 데이터 타입만 체크하는 것이 아닌 데이터를 적절한 형식으로 변환하거나 누락된 필드를 찾아내는 등

프로그램의 안전성을 높이는 역할을 합니다.

## 핵심 용어

| **용어**                 | **설명**                                                  |
| ---------------------- | ------------------------------------------------------- |
| **BaseModel**          | Pydantic 모델을 만들기 위해 상속받는 기본 클래스입니다.                  |
| **Data Validation**    | 입력 데이터가 정의된 타입과 제약 조건에 맞는지 확인하는 과정입니다.                 |
| **Type Coercion**      | '123'이라는 문자열을 정수 123으로 자동 변환하는 것과 같은 "강제 형변환" 기능입니다.  |
| **Serialization**      | 모델 인덱스를 JSON이나 Dictionary 형태로 변환하여 외부로 내보내는 과정입니다.    |
| **Schema Enforcement** | 정의된 스키마(구조)를 엄격하게 준수하도록 강제하는 것입니다.                    |

In [3]:
# BasModel: 데이터의 설계도

from pydantic import BaseModel

class User(BaseModel):
    # 변수에 자료형을 설계하는 모델이며, 상속 시 해당 자료형이 사용된다.
    id: int
    name: str
    is_active: bool

In [16]:
user_data = {
    "id": "123",
    "name": "MaKa37",
    "is_active": "true"
}

user = User(**user_data)

# BaseModel의 설계도를 상속 받음으로써 자동으로 형변환된다.
print(f"user.id: {type(user.id)}\nuser.name: {type(user.name)}\nuser.is_active: {type(user.is_active)}")

user.id: <class 'int'>
user.name: <class 'str'>
user.is_active: <class 'bool'>


## Pydantic / ValidationError 발생되는 경우

pydantic이 User 클래스의 BaseModel을 상속받음에 따라 자동으로 형 변환되지만,

아래와 같은 경우에는 유효성 검사 오류가 발생한다.

| **필드**      | **입력값**   | **결과**              | **이유**                          |
| ----------- | --------- | ------------------- | ------------------------------- |
| `id`        | `"apple"` | **ValidationError** | "apple"은 숫자로 바꿀 수 없습니다.       |
| `is_active` | `"maybe"` | **ValidationError** | "maybe"는 참/거 거짓을 판단할 수 없습니다.  |

In [23]:
# ValidationError 발생 코드

faulty_data = {
    "id": 1,
    "name": "Maka38",
    "is_active": "not_sure"
}

# user = User(**faulty_data)
"""
ValidationError: 1 validation error for User
is_active
  Input should be a valid boolean, unable to interpret input [type=bool_parsing, input_value='not_sure', input_type=str]
    For further information visit https://errors.pydantic.dev/2.12/v/bool_parsing
"""

"\nValidationError: 1 validation error for User\nis_active\n  Input should be a valid boolean, unable to interpret input [type=bool_parsing, input_value='not_sure', input_type=str]\n    For further information visit https://errors.pydantic.dev/2.12/v/bool_parsing\n"

In [26]:
from pydantic import ValidationError

try:
    # id에 숫자가 아닌 "abc"를 넣고, is_active에 "maybe"를 넣어보겠습니다.
    user = User(id="abc", name="Maka38", is_active="maybe")
except ValidationError as e:
    print(e.json())

# loc: 에러가 발생한 위치 (예: id, is_active)
# msg: 에러 내용 (예: value is not a valid integer)
# type: 에러의 유형 (예: type_error.integer)

[{"type":"int_parsing","loc":["id"],"msg":"Input should be a valid integer, unable to parse string as an integer","input":"abc","url":"https://errors.pydantic.dev/2.12/v/int_parsing"},{"type":"bool_parsing","loc":["is_active"],"msg":"Input should be a valid boolean, unable to interpret input","input":"maybe","url":"https://errors.pydantic.dev/2.12/v/bool_parsing"}]


In [27]:
from typing import Optional
from pydantic import BaseModel

class User(BaseModel):
    id: int
    name: str
    is_active: bool = True # 기본 값 설정
    description: Optional[str] = None # 값이 없어도 됨.

new_user = User(id=1, name="maka37", is_active=False)
print(new_user)

id=1 name='maka37' is_active=False description=None


## Type Coercion(자동 형변환) 원리
- Datetime 데이터를 다루는 경우

In [34]:
from datetime import datetime
from pydantic import BaseModel

class Event(BaseModel):
    timestamp: datetime

event = Event(timestamp="2025-01-05T12:00:00") # ISO 형식 문자열

print(event)

timestamp=datetime.datetime(2025, 1, 5, 12, 0)


In [40]:
# Strict 모드로 int 형태만 받기
from pydantic import BaseModel, StrictInt

class StrictUser(BaseModel):
    id: StrictInt # 문자열 '123' 입력 시 Error 발생

"""
S_user = StrictUser('123')
TypeError: BaseModel.__init__() takes 1 positional argument but 2 were given
"""

S_user = StrictUser(id=123)
print(S_user)

id=123


## 실무: BaseSettings 활용 및 설정 관리

보통 데이터베이스 주소나 API 키 같은 정보는 보안상 코드에 직접 쓰지 않고

`.env`라는 환경 변수에 저장합니다.

Pydantic의 `BaseSettings`는 이 환경 변수를 읽어오고 검증하는데 특화되어 있습니다.

**이 기능을 사용하려면 `pydantic-settings` 라이브러리가 필요합니다.**

In [46]:
from pydantic_settings import BaseSettings

class Settings(BaseSettings):
    db_port: int = 5432
    api_key: str
    debug_mode: bool = False

    class config:
        env_file = ".env" # .env 파일에서 자동으로 읽어오기

```python
config = Settings()
값이 없는 경우 ValidationError 발생
```