# 7. 타입 힌트, dataclass, Pydantic

## 문법 설명

### 1. 타입 힌트 (Type Hints)

**정의**: 변수나 함수의 타입을 명시하여 코드 가독성을 높입니다.

**문법**:
```python
변수명: 타입 = 값
def 함수명(매개변수: 타입) -> 반환타입:
    코드
```

**기본 타입**:
- `int`, `float`, `str`, `bool`
- `list[타입]`, `dict[키타입, 값타입]`
- `Optional[타입]`: `None` 가능
- `Union[타입1, 타입2]`: 여러 타입 중 하나

**타입 임포트**:
```python
from typing import List, Dict, Optional, Union
```

---

### 2. dataclass

**정의**: 데이터 클래스를 간결하게 정의하는 데코레이터입니다.

**문법**:
```python
from dataclasses import dataclass

@dataclass
class 클래스명:
    속성1: 타입
    속성2: 타입 = 기본값
```

**특징**:
- `__init__()`, `__repr__()`, `__eq__()` 자동 생성
- 타입 힌트 필수
- 기본값 지정 가능
- `frozen=True`: 불변 객체 (수정 불가)

**주요 함수**:
- `asdict()`: 딕셔너리로 변환
- `astuple()`: 튜플로 변환
- `fields()`: 필드 정보 가져오기

---

### 3. Pydantic

**정의**: 데이터 검증과 직렬화를 자동으로 처리하는 라이브러리입니다.

**문법**:
```python
from pydantic import BaseModel, Field

class 모델명(BaseModel):
    필드1: 타입 = Field(..., description="설명")
    필드2: 타입 = 기본값
```

**특징**:
- 자동 타입 검증 및 변환
- 필수 필드 검증 (`...` 또는 `Field(...)`)
- JSON 직렬화/역직렬화 자동 지원
- `model_dump()`: 딕셔너리로 변환
- `model_dump_json()`: JSON 문자열로 변환
- `model_validate()`: 딕셔너리에서 객체 생성

**Field 옵션**:
- `default`: 기본값
- `description`: 필드 설명
- `gt`, `lt`: 크기 제한 (greater than, less than)
- `min_length`, `max_length`: 길이 제한

---
## 실습 시작

아래 실습을 통해 위 문법들을 직접 사용해봅니다.

---

## Part 1: 타입 힌트 (Type Hints)
---

### 7.1 기본 타입 힌트

Python 3.5+에서 도입된 타입 힌트는 코드의 가독성과 도구 지원을 향상시킵니다.

In [None]:
# 변수 타입 힌트

In [None]:
# 함수 매개변수와 반환값 타입 힌트
def greet(name: str) -> str:
def add(a: int, b: int) -> int:
def divide(a: float, b: float) -> float:

### 7.2 컬렉션 타입 힌트

In [None]:
# 리스트
# 딕셔너리
# 튜플
# 셋

### 7.3 Optional과 Union

In [None]:
# Optional: None일 수 있는 값
def find_user(user_id: int) -> Optional[str]:

In [None]:
# Union: 여러 타입 중 하나
def process_input(value: Union[int, str]) -> str:

### 7.4 함수 시그니처 
| 구성 요소      | 의미                                   |
| ------- | ------------------------------------ |
| 함수 이름   | `analyze_survey`                     |
| 매개변수 이름 | `responses`, `category`, `min_score` |
| 매개변수 개수 | 3개                                   |
| 매개변수 순서 | responses → category → min_score     |
| 기본값     | `category=None`, `min_score=0`       |
| 타입 힌트   | `list[dict]`, `Optional[str]`, `int` |
| 반환 타입   | `-> dict`                            |

In [None]:
def analyze_survey(
    # 초기에는 전체 응답 데이터를 분석 대상으로 설정
    # 카테고리가 지정된 경우 해당 카테고리만 필터링
    # 최소 점수 조건을 만족하는 응답만 필터링
    # 필터링 후 전체 응답 개수
    # 평균 점수 계산
    # - 응답이 없을 경우 0으로 처리 (ZeroDivisionError 방지)
    # 분석 결과를 딕셔너리 형태로 반환

---
## Part 2: dataclass
---

### 7.5 기본 dataclass

`dataclass`는 데이터를 담는 클래스를 간결하게 정의하는 데코레이터입니다.

| 구분         | 기존 `class`   | `@dataclass`    |
| ---------- | ------------ | --------------- |
| 도입 버전      | 초기부터 존재      | **Python 3.7+** |
| 목적         | **동작 + 데이터** | **데이터 중심 객체**   |
| `__init__` | 직접 작성        | **자동 생성**       |
| 타입 힌트      | 선택           | **필수**      |
| 코드 길이      | 김            | **매우 짧음**       |
| `__repr__` | 직접 작성        | 자동              |
| `__eq__`   | 직접 작성        | 자동              |

In [None]:
class Person:

In [None]:
# 인스턴스 생성

In [None]:
# 속성 접근

In [None]:
# 자동 생성되는 메서드들

--------------
**default_factory** - 객체가 만들어질 때마다 새 기본값을 만들어주는 함수

In [None]:
class Student:
    def average(self) -> float:

In [None]:
class Student:

### 7.7 설문 분석 데이터 모델

- Boolean, Dictionary 반환 example

In [None]:
class SurveyResponse:
    def is_positive(self) -> bool:
    def to_dict(self) -> dict:

- string 반환 example

In [None]:
class CategoryStats:
    def summary(self) -> str:

- json 반환 example

In [None]:
class SurveyStats:
    def to_json(self, indent: int = 2) -> str:

---
## Part 3: Pydantic (검증 기능이 추가된 dataclass)
---

### 7.8 Pydantic이란?

- Python 타입 힌트를 사용한 **데이터 검증** 라이브러리
- dataclass처럼 간결하지만 **자동 타입 검증** 추가
- Pydantic의 BaseModel은 필드 타입에 맞게 값을 `검증 + 자동 변환(coercion)`
- FastAPI, LangChain 등 주요 AI/웹 프레임워크에서 사용
- JSON 직렬화/역직렬화 자동 지원
- **AI 구조화 출력**: LLM 응답을 Pydantic 모델로 검증!

### 7.9 첫 번째 Pydantic 모델

In [None]:
class User(BaseModel):

In [None]:
# 인스턴스 생성

In [None]:
# 자동 타입 변환

In [None]:
# 잘못된 타입 → 에러

### 7.10 dataclass vs Pydantic 비교

| 구분       | `@dataclass` | Pydantic                 |
| -------- | ------------ | ------------------------ |
| 등장 시기    | Python 3.7   | Python 3.8 (v1), 2023 v2 |
| 주 목적     | 데이터 묶음       | **검증 + 파싱**              |
| 런타임 검증   | ❌ 없음         | ✅ 강력                     |
| JSON 직렬화 | 수동           | 자동                       |

In [None]:
# dataclass는 런타임 검증 안함
class UserDataclass:

In [None]:
# Pydantic은 런타임 검증함

### 7.11 Field로 상세 설정
```
    # Field 옵션:
    # ge: greater than or equal (이상)
    # le: less than or equal (이하)
    # gt: greater than (초과)
    # lt: less than (미만)
    # min_length, max_length: 문자열 길이
```

In [None]:
class SurveyResponseModel(BaseModel):

In [None]:
# 유효한 응답

In [None]:
# 범위 벗어난 점수

### 7.12 중첩 모델 (Nested Models)

In [None]:
class CategoryStatsModel(BaseModel):
class ReportModel(BaseModel):

In [None]:
# 중첩 모델 인스턴스 생성

### 7.13 모델 직렬화

In [None]:
# 딕셔너리로 변환

In [None]:
# JSON 문자열로 변환

### 7.14 Validator (검증기)

| 구분    | `field_validator` | `model_validator` |
| ----- | ----------------- | ----------------- |
| 검증 대상 | **단일 필드**         | **모델 전체**         |
| 접근 범위 | 값 1개              | 모든 필드             |
| 대표 용도 | 범위, 형식, 정규화       | 필드 간 조건           |
| 반환 값  | 검증된 값             | `self`            |
| 실행 시점 | 필드별               | 전체 필드             |


In [None]:
class StrictSurveyResponse(BaseModel):  # 설문 응답 + 날짜 범위를 함께 검증하는 모델
    def validate_category(cls, v):      # 카테고리 값 검증 메서드
    def validate_text(cls, v):           # 텍스트 정규화 메서드
    def validate_score(cls, v):          # 점수 범위 검증 메서드
    def validate_date_format(cls, v):
    def validate_dates(self):            # 시작일과 종료일의 관계를 검증하는 메서드

In [None]:
# 유효한 응답

In [None]:
# 잘못된 카테고리

In [None]:
# 정상 데이터 (model_validator 통과)

### 7.15 JSON 스키마 생성

Pydantic 모델에서 JSON 스키마를 자동 생성할 수 있습니다.
이것이 **AI 구조화 출력**의 핵심입니다!

In [None]:
# Pydantic 모델에서 JSON 스키마 자동 생성

### 7.16 Literal 타입 (특정 값만 허용)

In [None]:
class SentimentResult(BaseModel):

In [None]:
# 유효한 값

In [None]:
# 잘못된 값

---
## 연습문제

### 문제 1: Book dataclass
다음 속성을 가진 Book dataclass를 만드세요.
- title: str
- author: str
- price: int
- pages: int (기본값: 0)
- is_ebook: bool (기본값: False)

In [None]:
# 여기에 코드 작성

### 문제 2: UserProfile Pydantic 모델
다음 조건을 만족하는 UserProfile 모델을 만드세요.
- name: 2-50자 문자열
- email: 이메일 형식 (@포함 검증)
- age: 0-150 정수
- interests: 문자열 리스트 (선택)

In [None]:
class UserProfile(BaseModel):
    # 여기에 코드 작성

### 문제 3: 주문 모델
OrderItem과 Order 중첩 모델을 만드세요.
- OrderItem: product_id, quantity, unit_price
- Order: order_id, items(OrderItem 리스트), total_amount 자동 계산

In [None]:
class OrderItem(BaseModel):
    # 여기에 코드 작성
class Order(BaseModel):
    # 여기에 코드 작성

### 문제 4: 상품 리뷰 분석 모델
AI 구조화 출력용 상품 리뷰 분석 모델을 만드세요.
- rating: 1-5 별점 예측
- pros: 장점 리스트
- cons: 단점 리스트
- recommendation: 추천 여부 (bool)

In [None]:
class ReviewAnalysis(BaseModel):
    # 여기에 코드 작성