# 7. dataclass와 타입 힌트

**학습 목표**: dataclass로 데이터 모델을 정의하고, 타입 힌트의 기초를 익힙니다.

**소요 시간**: 30분

> Day2의 Pydantic(BaseModel)은 "검증 기능이 추가된 dataclass"로 이해할 수 있습니다!

---

## 7.1 타입 힌트 (Type Hints)

Python 3.5+에서 도입된 타입 힌트는 코드의 가독성과 도구 지원을 향상시킵니다.

### 7.1.1 기본 타입 힌트

In [None]:
# 변수 타입 힌트
name: str = "홍길동"
age: int = 25
height: float = 175.5
is_student: bool = True

print(f"{name}({age}세, {height}cm, 학생: {is_student})")

In [None]:
# 함수 매개변수와 반환값 타입 힌트
def greet(name: str) -> str:
    return f"안녕하세요, {name}님!"

def add(a: int, b: int) -> int:
    return a + b

def divide(a: float, b: float) -> float:
    return a / b

print(greet("파이썬"))
print(add(3, 5))
print(divide(10.0, 3.0))

### 7.1.2 컬렉션 타입 힌트

In [None]:
# 리스트
scores: list[int] = [85, 92, 78, 90]
names: list[str] = ["홍길동", "김철수", "이영희"]

# 딕셔너리
person: dict[str, str] = {"name": "홍길동", "city": "서울"}
scores_map: dict[str, int] = {"math": 90, "english": 85}

# 튜플
point: tuple[int, int] = (10, 20)
rgb: tuple[int, int, int] = (255, 128, 0)

# 셋
unique_ids: set[int] = {1, 2, 3, 4, 5}

print(f"점수: {scores}")
print(f"좌표: {point}")

### 7.1.3 Optional과 Union

In [None]:
from typing import Optional, Union

# Optional: None일 수 있는 값
def find_user(user_id: int) -> Optional[str]:
    """사용자를 찾아 이름 반환, 없으면 None"""
    users = {1: "홍길동", 2: "김철수"}
    return users.get(user_id)  # 없으면 None

print(find_user(1))  # 홍길동
print(find_user(99)) # None

In [None]:
# Union: 여러 타입 중 하나
def process_input(value: Union[int, str]) -> str:
    """정수 또는 문자열을 받아 처리"""
    if isinstance(value, int):
        return f"숫자: {value}"
    else:
        return f"문자열: {value}"

print(process_input(42))
print(process_input("hello"))

In [None]:
# Python 3.10+에서는 | 연산자 사용 가능
def process_v2(value: int | str) -> str:
    return str(value)

### 7.1.4 함수 시그니처 예시

In [None]:
from typing import Optional

def analyze_survey(
    responses: list[dict[str, any]],
    category: Optional[str] = None,
    min_score: int = 0
) -> dict[str, any]:
    """
    설문 응답 분석
    
    Args:
        responses: 응답 리스트
        category: 필터링할 카테고리 (선택)
        min_score: 최소 점수 필터 (기본값: 0)
    
    Returns:
        분석 결과 딕셔너리
    """
    # 필터링
    filtered = responses
    if category:
        filtered = [r for r in filtered if r.get("category") == category]
    filtered = [r for r in filtered if r.get("score", 0) >= min_score]
    
    # 집계
    total = len(filtered)
    avg_score = sum(r.get("score", 0) for r in filtered) / total if total > 0 else 0
    
    return {
        "total": total,
        "average_score": round(avg_score, 2),
        "filter": {"category": category, "min_score": min_score}
    }

In [None]:
# 테스트
data = [
    {"category": "제품", "score": 5},
    {"category": "서비스", "score": 3},
    {"category": "제품", "score": 4},
]

print(analyze_survey(data))
print(analyze_survey(data, category="제품"))
print(analyze_survey(data, min_score=4))

---
## 7.2 dataclass

`dataclass`는 데이터를 담는 클래스를 간결하게 정의하는 데코레이터입니다.

### 7.2.1 기본 dataclass

In [None]:
from dataclasses import dataclass

@dataclass
class Person:
    name: str
    age: int
    city: str = "서울"  # 기본값

In [None]:
# 인스턴스 생성
person1 = Person("홍길동", 25)
person2 = Person("김철수", 30, "부산")

print(person1)
print(person2)

In [None]:
# 속성 접근
print(person1.name)
print(person1.age)

In [None]:
# 자동 생성되는 메서드들
print(person1 == Person("홍길동", 25))  # __eq__ 자동 생성

### 7.2.2 dataclass vs 일반 클래스

In [None]:
# 일반 클래스로 작성하면...
class PersonOld:
    def __init__(self, name: str, age: int, city: str = "서울"):
        self.name = name
        self.age = age
        self.city = city
    
    def __repr__(self):
        return f"PersonOld(name='{self.name}', age={self.age}, city='{self.city}')"
    
    def __eq__(self, other):
        if not isinstance(other, PersonOld):
            return False
        return self.name == other.name and self.age == other.age and self.city == other.city

# dataclass는 위의 코드를 자동 생성!

### 7.2.3 dataclass 옵션

In [None]:
from dataclasses import dataclass, field

@dataclass(frozen=True)  # 불변(immutable) 객체
class Point:
    x: int
    y: int

point = Point(10, 20)
print(point)
# point.x = 30  # 에러! frozen이므로 수정 불가

In [None]:
@dataclass
class Student:
    name: str
    scores: list[int] = field(default_factory=list)  # 가변 기본값
    
    def average(self) -> float:
        return sum(self.scores) / len(self.scores) if self.scores else 0.0

student = Student("홍길동")
student.scores.append(90)
student.scores.append(85)
print(f"{student.name}: 평균 {student.average()}")

---
## 7.3 실습: 설문 분석 데이터 모델

dataclass로 설문 분석에 필요한 데이터 모델을 정의합니다.

In [None]:
from dataclasses import dataclass, field, asdict
from typing import Optional
from datetime import datetime
import json

### SurveyResponse 모델

In [None]:
@dataclass
class SurveyResponse:
    """개별 설문 응답"""
    id: int
    category: str
    text: str
    score: int
    timestamp: Optional[str] = None
    
    def is_positive(self) -> bool:
        """긍정 응답 여부"""
        return self.score >= 4
    
    def to_dict(self) -> dict:
        """딕셔너리로 변환"""
        return asdict(self)

In [None]:
# 사용 예시
response = SurveyResponse(
    id=1,
    category="제품",
    text="품질이 좋습니다",
    score=5,
    timestamp="2024-01-15 09:30:00"
)

print(response)
print(f"긍정 여부: {response.is_positive()}")
print(f"딕셔너리: {response.to_dict()}")

### CategoryStats 모델

In [None]:
@dataclass
class CategoryStats:
    """카테고리별 통계"""
    name: str
    count: int
    avg_score: float
    positive_ratio: float
    
    def to_dict(self) -> dict:
        return asdict(self)
    
    def summary(self) -> str:
        return f"{self.name}: {self.count}건, 평균 {self.avg_score:.2f}, 긍정 {self.positive_ratio:.1%}"

In [None]:
stats = CategoryStats("제품", 24, 3.83, 0.625)
print(stats.summary())

### SurveyStats 모델 (종합)

In [None]:
@dataclass
class SurveyStats:
    """설문 분석 종합 통계"""
    total_responses: int
    average_score: float
    category_stats: list[CategoryStats] = field(default_factory=list)
    top_keywords: list[dict[str, any]] = field(default_factory=list)
    notes: Optional[str] = None
    generated_at: str = field(default_factory=lambda: datetime.now().isoformat())
    
    def add_category(self, stats: CategoryStats):
        """카테고리 통계 추가"""
        self.category_stats.append(stats)
    
    def to_dict(self) -> dict:
        """중첩 구조 포함 딕셔너리 변환"""
        return {
            "total_responses": self.total_responses,
            "average_score": self.average_score,
            "category_stats": [cs.to_dict() for cs in self.category_stats],
            "top_keywords": self.top_keywords,
            "notes": self.notes,
            "generated_at": self.generated_at
        }
    
    def to_json(self, indent: int = 2) -> str:
        """JSON 문자열로 변환"""
        return json.dumps(self.to_dict(), ensure_ascii=False, indent=indent)
    
    def save(self, filepath: str):
        """JSON 파일로 저장"""
        with open(filepath, "w", encoding="utf-8") as f:
            f.write(self.to_json())
        print(f"저장 완료: {filepath}")

### 전체 사용 예시

In [None]:
# 통계 생성
survey_stats = SurveyStats(
    total_responses=50,
    average_score=3.74,
    notes="2024년 1월 고객 만족도 조사"
)

# 카테고리별 통계 추가
survey_stats.add_category(CategoryStats("제품", 24, 3.83, 0.625))
survey_stats.add_category(CategoryStats("배송", 14, 3.79, 0.571))
survey_stats.add_category(CategoryStats("서비스", 12, 3.58, 0.583))

# 키워드 추가
survey_stats.top_keywords = [
    {"keyword": "배송", "count": 15},
    {"keyword": "품질", "count": 8},
    {"keyword": "좋아요", "count": 7},
]

In [None]:
# 출력
print("=== 설문 통계 ===")
print(f"총 응답: {survey_stats.total_responses}")
print(f"평균 점수: {survey_stats.average_score}")
print(f"\n카테고리별:")
for cs in survey_stats.category_stats:
    print(f"  {cs.summary()}")

In [None]:
# JSON 변환
print("\n=== JSON ===")
print(survey_stats.to_json())

In [None]:
# 파일 저장
survey_stats.save("data/survey_stats.json")

---
## 7.4 Day1 마무리: 왜 dataclass/클래스가 필요한가?

### 딕셔너리 vs dataclass 비교

In [None]:
# 딕셔너리 방식 (문제점)
result_dict = {
    "total": 50,
    "avg_scroe": 3.74,  # 오타 발견 어려움
    "categories": {}
}

# typo 체크 안됨
print(result_dict["avg_scroe"])  # 오타여도 동작

In [None]:
# dataclass 방식 (장점)
@dataclass
class Result:
    total: int
    avg_score: float  # 자동완성, 오타 체크
    categories: dict = field(default_factory=dict)

result_obj = Result(total=50, avg_score=3.74)
# result_obj = Result(total=50, avg_scroe=3.74)  # IDE에서 오류 표시!

print(result_obj.avg_score)

### Pydantic 연결고리

Day2에서 배울 Pydantic의 `BaseModel`은:
- dataclass처럼 간결한 정의
- **자동 타입 검증** (잘못된 타입 → 에러)
- **JSON 스키마 자동 생성**
- **데이터 직렬화/역직렬화**

```python
from pydantic import BaseModel

class SurveyResponse(BaseModel):  # dataclass 대신 BaseModel
    id: int
    category: str
    score: int

# 자동 검증!
response = SurveyResponse(id="abc", ...)  # 에러: id는 int여야 함
```

---
## 연습문제

### 문제 1: Book dataclass
다음 속성을 가진 Book dataclass를 만드세요.
- title: str
- author: str
- price: int
- pages: int (기본값: 0)
- is_ebook: bool (기본값: False)

In [None]:
# 여기에 코드 작성

### 문제 2: Order dataclass
주문 정보를 담는 dataclass를 만드세요.
- order_id: str
- items: list[dict] (상품 목록)
- total_amount: int
- status: str (기본값: "pending")
- total_items() 메서드: 전체 상품 수 반환
- to_dict() 메서드

In [None]:
# 여기에 코드 작성

### 문제 3: 타입 힌트가 있는 함수
다음 함수에 적절한 타입 힌트를 추가하세요.

In [None]:
def calculate_statistics(numbers):
    """숫자 리스트의 통계 계산"""
    if not numbers:
        return None
    
    return {
        "count": len(numbers),
        "sum": sum(numbers),
        "average": sum(numbers) / len(numbers),
        "min": min(numbers),
        "max": max(numbers)
    }

# 타입 힌트 추가 버전 작성

### 문제 4: ReportData dataclass
AI 보고서 데이터를 위한 종합 dataclass를 설계하세요.
- title: str
- summary: str
- insights: list[str]
- action_items: list[str]
- generated_at: str (자동 생성)
- to_markdown() 메서드: 마크다운 형식 문자열 반환

In [None]:
# 여기에 코드 작성

---
## Day1 완료!

오늘 배운 내용:
1. 변수, 자료형, 문자열
2. 리스트, 딕셔너리, 셋
3. 조건문, 반복문
4. 함수, 모듈, 예외처리
5. 파일 I/O, JSON
6. 클래스와 OOP 기초
7. dataclass와 타입 힌트

**Day2 예고**: 
- pandas로 데이터 분석
- Google Sheets API
- Pydantic으로 데이터 검증
- Gemini API로 보고서 생성
- 미니 프로젝트!

