# 분류와 구조화된 출력
## 텍스트를 라벨로 분류하기

- LangChain과 Pydantic을 활용하여 텍스트 분류(Classification) 태스크를 수행

**태깅(Tagging)** 이란 문서에 다음과 같은 클라스를 지정하는 것을 의미합니다.

- 감정 (sentiment)
- 언어
- 스타일(공식적, 비공식적 등)
- 다루는 주제
- 정치적 경향

![이미지 설명](https://github.com/langchain-ai/langchain/blob/master/docs/static/img/tagging.png?raw=1)

---

## **개요 (Overview)**  

**태깅(Tagging)** 은 몇 가지 주요 구성 요소로 이루어집니다:  

- **`function`**: 추출(Extraction)과 마찬가지로, 태깅은 함수(Functions)를 사용하여 모델이 문서를 어떻게 태깅해야 하는지 명시합니다.  
- **`schema`**: 문서를 어떻게 태깅할지 정의합니다 --> Pydantic 데이터 모델을 이용하여 정의

In [None]:
# LangSmith 추적 설정 활성화

## Pydantic 이란? 
- Pydantic은 Python 데이터 검증 및 설정 관리를 위한 라이브러리
- Pydantic의 핵심 기능
    - 타입 검증 (Type Validation)
    - 데이터가 지정된 형식(int, str 등)과 일치하는지 자동 확인
    - 기본값 설정 (Default Values)

In [None]:
class User(BaseModel):
# 올바른 데이터

In [None]:
# !pip install pydantic[email]

In [None]:
class User(BaseModel):

In [None]:
class Classification_3(BaseModel):
# 올바른 데이터 (1~10 범위 내)
# 잘못된 데이터 (10 초과)

In [None]:
class Classification_2(BaseModel):
# 올바른 데이터 입력
# ❌ 필수 필드 누락 (오류 발생)

## Schema 정의와 도구 호출 **  

LangChain에서 OpenAI의 **도구 호출(Tool Calling)** 기능을 사용하여 태깅을 수행하는 간단한 예제를 살펴보겠습니다.  

- OpenAI 모델에서 지원하는 `with_structured_output` 메서드를 사용할 것입니다.  

스키마에 몇 가지 속성과 예상 유형을 추가하여 Pydantic 모델을 지정해 보겠습니다.

In [None]:
# 프롬프트 템플릿 정의
# 주어진 텍스트에서 필요한 정보를 추출하도록 지침 제공
# Pydantic 데이터 모델을 이용하여 텍스트에서 추출할 속성 정의
# 감정의 종류와 값의 범위를 자율 지정
class Classification(BaseModel):
# OpenAI GPT-4o-mini 모델을 사용하여 Structured Output(구조화된 출력) 생성

dictionary 출력을 원하면 `.model_dump()`를 호출하면 됩니다.

예제에서 볼 수 있듯이, 모델은 우리가 원하는 바를 정확하게 해석합니다.  

다음 섹션에서는 이러한 결과를 어떻게 제어할 수 있는지 살펴보겠습니다.

## **더 세밀한 출력 제어**

**스키마(schema)** 를 더 자세히 정의하면 모델의 출력을 더 세밀하게 제어할 수 있습니다.  

구체적으로 다음을 정의할 수 있습니다:  

- **각 속성의 가능한 값**  
- **속성을 모델이 정확하게 이해할 수 있도록 설명 추가**  
- **반드시 반환해야 할 필수 속성**  

이전에 언급한 각 요소를 제어하기 위해 **Enums**를 사용하여 우리의 **Pydantic 모델**을 다시 선언해봅시다.



In [None]:
# 필수 요소로 지정하고 감정의 종류와 값의 범위 지정
class Classification_2(BaseModel):
# OpenAI GPT-4o-mini 모델을 사용하여 Structured Output(구조화된 출력) 생성

이제 답변은 우리가 예상하는 방식으로 제한될 것입니다!