# 8. Gemini API + Pydantic 구조화 출력

**학습 목표**: Gemini API로 Pydantic 스키마 기반의 구조화된 JSON 응답을 받습니다.

**사전 준비**: 
- `pip install google-genai pydantic python-dotenv`
- GOOGLE_API_KEY 환경변수 설정

---

## 문법 설명

### 1. Gemini API 사용

**정의**: Google의 Gemini API를 사용하여 AI 응답을 받습니다.

**설치 및 임포트**:
```python
from google import genai
from dotenv import load_dotenv
import os
```

**클라이언트 생성**:
```python
load_dotenv()
client = genai.Client(api_key=os.getenv("GOOGLE_API_KEY"))
```

**API 호출 (Responses API)**:
```python
response = client.responses.create(
    model="gemini-2.0-flash-exp",
    input=[
        {"role": "system", "content": "시스템 프롬프트"},
        {"role": "user", "content": "사용자 입력"}
    ],
    max_output_tokens=2000,
)
content = response.output_text
```

**중요 사항**:
- `client.responses.create()` 사용 (최신 API)
- `client.chat.completions.create()` 사용 금지 (구버전)
- `temperature` 파라미터 없음 (Responses API에서 제거됨)
- 입력은 `input=[{role, content}]` 형식
- 출력은 `response.output_text` 사용

---

### 2. Pydantic 구조화 출력

**정의**: Pydantic 모델을 스키마로 사용하여 구조화된 JSON 응답을 받습니다.

**스키마 정의**:
```python
from pydantic import BaseModel, Field

class 응답모델(BaseModel):
    필드1: 타입 = Field(description="설명")
    필드2: 타입
```

**구조화 출력 요청**:
```python
response = client.responses.create(
    model="gemini-2.0-flash-exp",
    input=[{"role": "user", "content": "프롬프트"}],
    response_schema=응답모델,  # Pydantic 모델 전달
    max_output_tokens=2000,
)
```

**응답 파싱**:
```python
result = response.output_text  # JSON 문자열
parsed = 응답모델.model_validate_json(result)  # Pydantic 객체로 변환
```

**장점**:
- 타입 안정성 보장
- 자동 검증
- IDE 자동완성 지원
- 문서화 용이

---
## 실습 시작

아래 실습을 통해 위 문법들을 직접 사용해봅니다.

---

In [3]:
pip install google-genai pydantic python-dotenv

Collecting google-genai
  Downloading google_genai-1.60.0-py3-none-any.whl.metadata (53 kB)
Collecting google-auth<3.0.0,>=2.47.0 (from google-auth[requests]<3.0.0,>=2.47.0->google-genai)
  Downloading google_auth-2.47.0-py3-none-any.whl.metadata (6.4 kB)
Collecting websockets<15.1.0,>=13.0.0 (from google-genai)
  Downloading websockets-15.0.1-cp313-cp313-win_amd64.whl.metadata (7.0 kB)
Collecting rsa<5,>=3.1.4 (from google-auth<3.0.0,>=2.47.0->google-auth[requests]<3.0.0,>=2.47.0->google-genai)
  Downloading rsa-4.9.1-py3-none-any.whl.metadata (5.6 kB)
Downloading google_genai-1.60.0-py3-none-any.whl (719 kB)
   ---------------------------------------- 0.0/719.4 kB ? eta -:--:--
   ---------------------------------------- 719.4/719.4 kB 15.4 MB/s  0:00:00
Downloading google_auth-2.47.0-py3-none-any.whl (234 kB)
Downloading rsa-4.9.1-py3-none-any.whl (34 kB)
Downloading websockets-15.0.1-cp313-cp313-win_amd64.whl (176 kB)
Installing collected packages: websockets, rsa, google-auth, goo

## 8.1 API 키 설정

In [1]:
import os
from dotenv import load_dotenv

# .env 파일에서 환경변수 로드
load_dotenv()

# API 키 확인
api_key = os.environ.get("GOOGLE_API_KEY")
if api_key:
    print(f"API 키 로드됨: {api_key[:8]}...")
else:
    print("API 키가 설정되지 않았습니다.")
    print("1. https://aistudio.google.com/apikey 에서 API 키 발급")
    print("2. .env 파일에 GOOGLE_API_KEY=your-api-key 추가")

API 키 로드됨: AIzaSyDJ...


In [5]:
from google import genai

# 클라이언트 생성 (GOOGLE_API_KEY 환경변수 자동 사용)
client = genai.Client()

---
## 8.2 기본 텍스트 생성

In [6]:
# 간단한 텍스트 생성
response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents="파이썬의 장점 3가지를 간단히 알려주세요."
)

print(response.text)

파이썬의 장점 3가지는 다음과 같습니다.

1.  **쉬운 문법과 높은 가독성:**
    문법이 간결하고 영어와 비슷해서 배우기 쉽고, 코드를 빠르고 효율적으로 작성하고 이해할 수 있습니다. 이는 개발 생산성을 높여줍니다.

2.  **폭넓은 활용성:**
    웹 개발(Django, Flask), 데이터 분석(Pandas, NumPy), 인공지능/머신러닝(TensorFlow, PyTorch), 자동화 스크립트 등 매우 다양한 분야에서 활용될 수 있습니다.

3.  **풍부한 라이브러리 및 커뮤니티:**
    방대한 양의 라이브러리와 활발한 사용자 커뮤니티 덕분에 필요한 기능을 쉽게 구현하고 문제 발생 시 도움을 받을 수 있습니다.


---
## 8.3 Pydantic 스키마로 구조화 출력

핵심 포인트:
- `response_mime_type`: "application/json" 으로 설정
- `response_schema`: Pydantic 모델 클래스 전달
- `model_validate_json()`: 응답을 Pydantic으로 검증

In [7]:
from pydantic import BaseModel, Field
from typing import Literal, Optional

### 8.3.1 감성 분석

In [8]:
class SentimentResult(BaseModel):
    """감성 분석 결과"""
    sentiment: Literal["긍정", "부정", "중립"] = Field(description="감성 분류")
    confidence: float = Field(ge=0, le=1, description="신뢰도 0-1")
    keywords: list[str] = Field(default=[], description="핵심 키워드")
    summary: str = Field(description="한 줄 요약")

In [9]:
text = "이 제품은 정말 훌륭해요! 품질도 좋고 배송도 빨랐습니다. 다만 포장이 조금 아쉬웠어요."

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=f"다음 텍스트의 감성을 분석하세요:\n{text}",
    config={
        "response_mime_type": "application/json",
        "response_schema": SentimentResult,
    },
)

# Pydantic으로 검증
result = SentimentResult.model_validate_json(response.text)

print(f"감성: {result.sentiment}")
print(f"신뢰도: {result.confidence:.2f}")
print(f"키워드: {result.keywords}")
print(f"요약: {result.summary}")

감성: 긍정
신뢰도: 0.92
키워드: ['제품', '품질', '배송', '포장', '훌륭']
요약: 제품의 품질과 배송은 훌륭했으나, 포장은 다소 아쉬웠습니다.


In [10]:
# model_dump()로 딕셔너리 변환
import json
print(json.dumps(result.model_dump(), ensure_ascii=False, indent=2))

{
  "sentiment": "긍정",
  "confidence": 0.92,
  "keywords": [
    "제품",
    "품질",
    "배송",
    "포장",
    "훌륭"
  ],
  "summary": "제품의 품질과 배송은 훌륭했으나, 포장은 다소 아쉬웠습니다."
}


### 8.3.2 레시피 추출 (중첩 모델)

In [11]:
class Ingredient(BaseModel):
    """재료"""
    name: str = Field(description="재료 이름")
    quantity: str = Field(description="수량 (단위 포함)")

class Recipe(BaseModel):
    """레시피"""
    recipe_name: str = Field(description="요리 이름")
    prep_time_minutes: Optional[int] = Field(description="준비 시간 (분)")
    ingredients: list[Ingredient] = Field(description="재료 목록")
    instructions: list[str] = Field(description="조리 순서")

In [12]:
recipe_text = """
간단 계란볶음밥 만들기
재료: 밥 1공기, 계란 2개, 파 1줄기, 간장 1스푼, 참기름 약간
1. 팬에 기름을 두르고 파를 볶습니다.
2. 풀어둔 계란을 넣고 스크램블합니다.
3. 밥을 넣고 간장으로 간을 합니다.
4. 참기름을 뿌려 마무리합니다.
"""

response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=f"다음 텍스트에서 레시피를 추출하세요:\n{recipe_text}",
    config={
        "response_mime_type": "application/json",
        "response_schema": Recipe,
    },
)

recipe = Recipe.model_validate_json(response.text)

print(f"요리: {recipe.recipe_name}")
print(f"준비 시간: {recipe.prep_time_minutes}분")
print(f"\n재료:")
for ing in recipe.ingredients:
    print(f"  - {ing.name}: {ing.quantity}")
print(f"\n조리 순서:")
for i, step in enumerate(recipe.instructions, 1):
    print(f"  {i}. {step}")

요리: 간단 계란볶음밥
준비 시간: None분

재료:
  - 밥: 1공기
  - 계란: 2개
  - 파: 1줄기
  - 간장: 1스푼
  - 참기름: 약간

조리 순서:
  1. 팬에 기름을 두르고 파를 볶습니다.
  2. 풀어둔 계란을 넣고 스크램블합니다.
  3. 밥을 넣고 간장으로 간을 합니다.
  4. 참기름을 뿌려 마무리합니다.


---
## 연습문제

### 회의록 요약 모델
회의 내용을 요약하는 Pydantic 모델을 만들고 Gemini로 요약하세요.
- participants: 참가자 리스트
- main_topics: 주요 안건
- decisions: 결정 사항
- next_steps: 다음 단계

`data/08_회의록.txt`의 sample 회의록 사용

In [17]:
from pathlib import Path

In [18]:
class MeetingSummary(BaseModel):
    participants: str = Field(description="참가자 리스트")
    main_topics: str = Field(description="주요 안건")
    decisions: str = Field(description="결정 사항")
    next_steps: str = Field(description="다음 단계")

In [19]:
file_path = Path("data/08_회의록.txt")

recipe_text = ""
if file_path.exists():
    recipe_text = file_path.read_text(encoding="utf-8")

In [24]:
response = client.models.generate_content(
    model="gemini-2.5-flash",
    contents=f"회의 내용을 요약해줄래? :\n{recipe_text}",
    config={
        "response_mime_type": "application/json",
        "response_schema": Recipe,
    },
)

recipe = Recipe.model_validate_json(response.text)

print(f"recipe : ", recipe)

#print(f"참가자 리스트: {recipe.participants}")
#print(f"주요 안건: {recipe.main_topics}")
#print(f"결정 사항: {recipe.decisions}")
#print(f"다음 단계: {recipe.next_steps}")


recipe :  recipe_name='고객 설문 분석 리포트 자동화 MVP' prep_time_minutes=None ingredients=[Ingredient(name='설문 응답 데이터', quantity='JSON 파일, daily batch'), Ingredient(name='응답 항목', quantity='id, category, text, score, timestamp'), Ingredient(name='개인정보 처리', quantity='마스킹 처리'), Ingredient(name='분석 결과 구성', quantity='전체 평균 점수, 긍정 비율 (4점 이상), 카테고리별 통계'), Ingredient(name='키워드 추출 방식', quantity='빈도 기반 (1차 MVP)'), Ingredient(name='백엔드 프레임워크', quantity='FastAPI'), Ingredient(name='프론트엔드 화면', quantity='리포트 카드 (요약) 및 상세 화면 (카테고리 표)'), Ingredient(name='MVP 데이터 형식', quantity='JSON (파일명 YYYYMMDD_survey.json)'), Ingredient(name='긍정 점수 정의', quantity='4점 이상'), Ingredient(name='FastAPI 엔드포인트', quantity='/report, /health')] instructions=['고객 설문 데이터를 수집/분석하여 자동으로 요약 리포트를 생성하는 기능을 2주 내 MVP로 완성한다.', '설문 응답은 JSON 파일로 수집하며, daily batch로 저장한다.', '응답 항목(id, category, text, score, timestamp)을 포함한다.', '이메일/전화번호 등 개인정보는 저장 전 마스킹 처리한다.', '분석 결과는 전체 평균 점수, 긍정 비율(점수 4 이상), 카테고리별 통계(건수/평균/긍정비율)로 구성한다.', '키워드 추출은 1차 MVP에서 간단히 빈도 기