### **StructuredOutputParser(구조화된 출력 파서)**

- 답변을 `dict` 형식으로 구성, Key/Value 쌍으로 갖는 여러 필드를 반환 할때 사용 
- Pydantic/JSON이 더 유용하지만 파라미터가 적은 모델에 적합함(로컬 모델은 Pydantic 파서가 동작하지 않는 경우가 많음)

- `ResponseSchema` 사용자의 질문에 대한 답변과 사용된 소스(웹사이트)에 대한 설명을 포함하는 응답 스키마를 정의

- `StructuredOutputParser`를 `response_schemas`를 사용하여 초기화하여, 정의된 응답 스키마에 따라 출력을 구조화

In [1]:
from langchain.output_parsers import ResponseSchema, StructuredOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_groq import ChatGroq

# 사용자의 질문에 대한 답변 
# 로컬 모델은 한글 사용시 부족할 수 있음 영어로 적는걸 권장
response_schemas = [
    ResponseSchema(name = 'answer', description = '사용자의 질문에 대한 답변'),
    ResponseSchema(name = 'source', description = '사용자의 질문에 답하기 위해 사용된 `출처`, `참고` 등의 정보'),
]

# 응답 스키마를 기반으로 구조화된 파서 초기화 
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

In [2]:
# 출력 형식 지시사항 
format_instructions = output_parser.get_format_instructions()

prompt = PromptTemplate(
    template = 'answer the users question as best as possible. \n {format_instructions} \n {question}',
    
    # 입력변수 
    input_variables=['question'],
    
    # 부분변수 
    partial_variables={'format_instructions' : format_instructions})

 

In [5]:
model = ChatGroq(model = 'gemma2-9b-it', temperature=0)  
chain = prompt | model | output_parser  

answer = chain.invoke('세종대왕의 즉위기간과 어떤 업적을 남겼나요?')  

In [12]:
model = ChatGroq(model = 'gemma2-9b-it', temperature=0) 

response = model.invoke('LLM의 역사에 대해서 설명해줘')

In [None]:
response.total_tokens

AIMessage(content='## LLM의 역사: 인공지능의 언어 능력 발전\n\nLLM(Large Language Model, 대규모 언어 모델)은 방대한 양의 텍스트 데이터를 학습하여 인간과 유사한 수준의 언어를 이해하고 생성할 수 있는 인공지능 모델입니다. \n\nLLM의 역사는 몇 가지 중요한 단계로 나눌 수 있습니다.\n\n**1. 초기 단계 (1950년대 - 1980년대):**\n\n* **1950년대:** 튜링 테스트 등 인공지능의 기초가 다지어지고, 컴퓨터가 언어를 이해하고 생성할 수 있는 가능성이 제기됩니다.\n* **1960년대 - 1970년대:** ELIZA와 같은 시스템이 개발되어 텍스트 기반 대화를 시도했지만, 제한적인 문맥 이해와 생성 능력을 보였습니다.\n* **1980년대:** 규칙 기반 시스템과 확률적 모델이 개발되어 자연어 처리 기술이 발전했습니다.\n\n**2. 딥러닝 시대 (1990년대 - 2010년대):**\n\n* **1990년대:** 신경망 기반 모델이 등장하며 자연어 처리 분야에 딥러닝이 적용되기 시작했습니다.\n* **2000년대:** RNN(Recurrent Neural Network)이 등장하여 순차적인 데이터 처리에 효과적이라는 사실이 밝혀지면서 자연어 처리 성능이 향상되었습니다.\n* **2010년대:** LSTM(Long Short-Term Memory)과 GRU(Gated Recurrent Unit)와 같은 RNN 변형 모델이 개발되어 더욱 복잡한 문맥을 이해하는 능력을 보여주었습니다.\n\n**3. 대규모 언어 모델의 등장 (2017년 - 현재):**\n\n* **2017년:** Google의 Transformer 모델이 등장하여 자연어 처리 분야에 혁명을 일으켰습니다. Transformer는 RNN보다 더 효율적으로 긴 문장을 처리할 수 있으며, Attention 메커니즘을 통해 문맥 정보를 더 잘 이해합니다.\n* **2018년:** OpenAI의 GPT(Generative Pre-trained

In [45]:
response.response_metadata['token_usage']['total_tokens']

771

In [None]:
response.response_metadata['token_usage']['total_time'] / response.response_metadata['token_usage']['total_tokens']


0.0017734852542153046