# 구조화된 출력 (Structured Output)

**텍스트를 라벨로 분류하기**

**태깅(Tagging)**이란 문서의 종류를 분류하여 **라벨링(Labeling)**하는 것을 의미합니다: 예) 긍정적, 부정적, 중립적

![이미지 설명](https://github.com/langchain-ai/langchain/blob/master/docs/static/img/tagging.png?raw=1)

---

## **개요 (Overview)**  

**태깅(Tagging)**은 몇 가지 주요 구성 요소로 이루어집니다:  

- **`function`**: 추출(Extraction)과 마찬가지로, 태깅은 함수(Functions)를 사용하여 모델이 문서를 어떻게 태깅해야 하는지 명시합니다.  
- **`schema`**: 문서를 어떻게 태깅할지 정의합니다 --> Pydantic 데이터 모델을 이용하여 정의

In [None]:
# !pip install -qU \
# python-dotenv \
# langchain \
# langchain-community \
# openai \
# anthropic \
# langchain-openai \
# langchain-anthropic \
# langchain-google-genai \
# python-dotenv

## Schema 정의와 도구 호출 **  

LangChain에서 OpenAI의 **도구 호출(Tool Calling)** 기능을 사용하여 태깅을 수행하는 간단한 예제를 살펴보겠습니다.  

- OpenAI 모델에서 지원하는 `with_structured_output` 메서드를 사용할 것입니다.  

스키마에 몇 가지 속성과 예상 유형을 추가하여 Pydantic 모델을 지정해 보겠습니다.

In [None]:
# 프롬프트 템플릿 정의
# 주어진 텍스트에서 필요한 정보를 추출하도록 지침 제공
# Pydantic 데이터 모델을 이용하여 텍스트에서 추출할 속성 정의
class Classification_1(BaseModel):
# OpenAI GPT-4o-mini 모델을 사용하여 Structured Output(구조화된 출력) 생성

사전 출력을 원하면 `.model_dump()`를 호출하면 됩니다.

예제에서 볼 수 있듯이, 모델은 우리가 원하는 바를 정확하게 해석합니다.  

다음 섹션에서는 이러한 결과를 어떻게 제어할 수 있는지 살펴보겠습니다.

## **더 세밀한 출력 제어**

**스키마(schema)**를 더 자세히 정의하면 모델의 출력을 더 세밀하게 제어할 수 있습니다.  

구체적으로 다음을 정의할 수 있습니다:  

- **각 속성의 가능한 값**  
- **속성을 모델이 정확하게 이해할 수 있도록 설명 추가**  
- **반드시 반환해야 할 필수 속성**  

이전에 언급한 각 요소를 제어하기 위해 **Enums**를 사용하여 우리의 **Pydantic 모델**을 다시 선언해봅시다.



In [None]:
class Classification_2(BaseModel):
# OpenAI GPT-4o-mini 모델을 사용하여 Structured Output(구조화된 출력) 생성

이제 답변은 우리가 예상하는 방식으로 제한될 것입니다!

### **구조화된 출력 (Structured Outputs)과 함수 호출**
 
챗봇과 같은 많은 애플리케이션에서는 모델이 사용자에게 **자연어로 직접 응답**해야 합니다. 그러나 경우에 따라 모델이 **구조화된 형식(structured format)**으로 출력을 제공해야 할 필요가 있습니다.  

예를 들어, 모델의 출력을 **데이터베이스에 저장**해야 하는 상황에서 출력이 데이터베이스 **스키마(schema)**에 맞도록 보장해야 할 수 있습니다.  

이러한 필요성은 **구조화된 출력(Structured Output)** 개념을 부각시키며, 이를 통해 모델이 **특정 출력 구조**를 따르도록 지시할 수 있습니다.  

**핵심 포인트:**  
- 자연어 응답이 아닌 **구조화된 데이터**로 응답.  
- 데이터베이스, API 등과의 호환성을 보장.  
- 스키마를 따르는 일관된 형식으로 데이터 제공.

구조화된 출력은 특히 **데이터베이스 저장, API 연동, 데이터 처리** 등 다양한 응용 분야에서 중요한 역할을 합니다. 

In [None]:
# 사용자 정의 함수 또는 외부 API
def get_weather(location: str, unit: str = "섭씨"):

In [None]:
# 스키마 정의
# 스키마를 모델에 바인딩
# 사용자 입력
# 사용자 입력을 받아 스키마에 맞는 구조화된 출력을 생성하도록 모델 호출

In [None]:
# structured_output을 함수 파라미터로 전달

### **스키마를 도구로서 모델에 바인딩**

In [None]:
# 사용자에게 응답을 구조화하기 위한 도구 정의
class ResponseFormatter(BaseModel):

In [None]:
# 스키마를 도구로 모델에 바인딩하여, 스키마를 따르는 출력을 생성하도록 설정  
# 모델 호출