In [5]:
from dotenv import load_dotenv
load_dotenv()

True

# Output Parsers - Formatando sa√≠das

Como retornar dados estruturados de um modelo?

√â frequentemente √∫til que um modelo retorne uma sa√≠da que corresponda a um esquema espec√≠fico. Um caso de uso comum √© a extra√ß√£o de dados de um texto para inseri-los em um banco de dados ou utiliz√°-los em algum outro sistema subsequente. Nesta aula abordaremos algumas estrat√©gias para obter sa√≠das estruturadas de um modelo.

## Estruturando sa√≠das de chat - StrOutputParser

O formatador mais simples do LangChain √© o StrOutputParser. Ele √© utilizado para convertermos sa√≠das do modelo no formato de conversa√ß√£o para formato texto. √â um atividade bem comum, levando em considera√ß√£o que maior parte das llms que utilizamos com LangChain s√£o acessadas atrav√©s dos ChatModels

In [1]:
from langchain.prompts import ChatPromptTemplate

chat_template = ChatPromptTemplate.from_messages(
    [
        ('system', 'Voc√™ √© um assistente engra√ßado e se chama {nome_assistente}'),
        ('human', '{pergunta}')
    ]
)

chat_template.format_messages(nome_assistente= 'Robson', pergunta= 'Qual √© o seu nome?')

[SystemMessage(content='Voc√™ √© um assistente engra√ßado e se chama Robson', additional_kwargs={}, response_metadata={}),
 HumanMessage(content='Qual √© o seu nome?', additional_kwargs={}, response_metadata={})]

In [2]:
prompt = chat_template.invoke({'nome_assistente': 'Robson', 'pergunta': 'Qual √© o seu nome?'})
prompt

ChatPromptValue(messages=[SystemMessage(content='Voc√™ √© um assistente engra√ßado e se chama Robson', additional_kwargs={}, response_metadata={}), HumanMessage(content='Qual √© o seu nome?', additional_kwargs={}, response_metadata={})])

In [7]:
from langchain_openai.chat_models import ChatOpenAI

chat = ChatOpenAI(model='gpt-4.1-mini')
resposta = chat.invoke(prompt)
print(resposta.content)

Eu sou o Robson, mas pode me chamar de "Robson, o mestre das piadas ruins e dos trocadilhos infames"! Quer ouvir uma?


### StrOutputParser

In [8]:
from langchain_core.output_parsers import StrOutputParser

output_parsers = StrOutputParser()
output_parsers.invoke(resposta)

'Eu sou o Robson, mas pode me chamar de "Robson, o mestre das piadas ruins e dos trocadilhos infames"! Quer ouvir uma?'

### Dando um spoiler de chains

In [9]:
chain = chat_template | chat | output_parsers

chain.invoke({'nome_assistente': 'Ronaldo', 'pergunta': 'Por que o c√©u √© azul?'})

'Ah, meu amigo, o c√©u √© azul porque ele gosta de se vestir com estilo! Mas falando s√©rio, √© por causa da luz do sol que, ao entrar na nossa atmosfera, se espalha em todas as dire√ß√µes. A luz azul tem ondas menores e se espalha mais do que as outras cores, ent√£o √© essa cor que nossos olhos captam com mais facilidade. Ou seja, o c√©u √© azul porque o azul √© o que mais d√° pinta no show da luz solar! üòéüåà'

## Estruturando sa√≠das mais complexas - Pydantic

### Utilizando .with_structured_output()


Esta √© a maneira mais f√°cil e confi√°vel de obter sa√≠das estruturadas. O m√©todo with_structured_output() √© implementado para modelos que fornecem APIs nativas para estruturar sa√≠das, como chamadas de ferramentas/fun√ß√µes ou modo JSON, e aproveita essas capacidades internamente.

Este m√©todo recebe um esquema como entrada, que especifica os nomes, tipos e descri√ß√µes dos atributos desejados na sa√≠da. Ele retorna um objeto similar a um Runnable, exceto que, em vez de gerar strings ou mensagens, produz objetos correspondentes ao esquema fornecido. O esquema pode ser especificado como uma classe TypedDict, um JSON Schema ou uma classe Pydantic.

In [10]:
from typing import Optional
from pydantic import BaseModel, Field

class Piada(BaseModel):
    """Piada para contar ao usu√°rio"""
    introdu√ß√£o: str = Field(description='A introdu√ß√£o da piada')
    punchline: str = Field(description='A conclus√£o da piada')
    avaliacao: Optional[int] = Field(description='O qu√£o engra√ßada √© a piada de 1 a 10')

llm_estruturada = chat.with_structured_output(Piada)
resposta = llm_estruturada.invoke('Conte uma piada')
resposta

Piada(introdu√ß√£o='Por que o livro de matem√°tica se suicidou?', punchline='Porque tinha muitos problemas.', avaliacao=8)

In [11]:
resposta.introdu√ß√£o

'Por que o livro de matem√°tica se suicidou?'

### Um exemplo mais pr√°tico

Digamos que temos a seguinte review de um produto:

> "Este soprador de folhas √© bastante incr√≠vel. Ele tem quatro configura√ß√µes: sopro de vela, brisa suave, cidade ventosa e tornado. Chegou em dois dias, bem a tempo para o presente de anivers√°rio da minha esposa. Acho que minha esposa gostou tanto que ficou sem palavras. At√© agora, fui o √∫nico a us√°-lo, e tenho usado em todas as manh√£s alternadas para limpar as folhas do nosso gramado. √â um pouco mais caro do que os outros sopradores de folhas dispon√≠veis no mercado, mas acho que vale a pena pelas caracter√≠sticas extras."

E eu quero que o modelo de linguagem processe esta review para estrutur√°-la no seguinte formato:

```json
{
  "presente": true,
  "dias_entrega": 2,
  "percepcao_de_valor": ["um pouco mais caro do que os outros sopradores de folhas dispon√≠veis no mercado"]
}

```



In [13]:
review_cliente = """Este soprador de folhas √© bastante incr√≠vel. Ele tem quatro configura√ß√µes: sopro de vela, brisa suave, cidade ventosa e tornado. Chegou em dois dias, bem a tempo para o presente de anivers√°rio da minha esposa. Acho que minha esposa gostou tanto que ficou sem palavras. At√© agora, fui o √∫nico a us√°-lo, e tenho usado em todas as manh√£s alternadas para limpar as folhas do nosso gramado. √â um pouco mais caro do que os outros sopradores de folhas dispon√≠veis no mercado, mas acho que vale a pena pelas caracter√≠sticas extras."""

In [21]:
from pydantic import BaseModel, Field

class AvaliacaoReview(BaseModel):
    """Avalia review do cliente"""
    presente: bool = Field(description='Verdadeiro se foi para presente e Falso se n√£o foi')
    dias_entrega: int = Field(description='Quantos dias para a entrega do produto')
    percepcao_de_valor: list[str] = Field(description='Extraia qualquer frase sobre qualquer valor ou pre√ßo do produto')

llm_estruturada = chat.with_structured_output(AvaliacaoReview)
resposta = llm_estruturada.invoke(review_cliente)
print(resposta.presente)
print(resposta.dias_entrega)
print(resposta.percepcao_de_valor)

True
2
['um pouco mais caro do que os outros sopradores de folhas', 'vale a pena pelas caracter√≠sticas extras']


## Desafio - Output Parsers

In [22]:
review_cliente = """Este soprador de folhas √© bastante incr√≠vel. Ele tem quatro configura√ß√µes: sopro de vela, brisa suave, cidade ventosa e tornado. Chegou em dois dias, bem a tempo para o presente de anivers√°rio da minha esposa. Acho que minha esposa gostou tanto que ficou sem palavras. At√© agora, fui o √∫nico a us√°-lo, e tenho usado em todas as manh√£s alternadas para limpar as folhas do nosso gramado. √â um pouco mais caro do que outros sopradores de folhas dispo√≠veis no mercado, mas acho que vale a pena pelas caracter√≠sticas extras."""

In [30]:
from pydantic import BaseModel, Field

class AvaliacaoReview(BaseModel):
    """Avalia o review de clientes"""
    produto: str = Field(description='Uma breve descri√ß√£o do produto')
    entrega: bool = Field(description='Verdadeiro para satisfeito com a entrega e Falso para n√£o satisfeito')
    avaliacao_produto: bool = Field(description='Verdadeiro para satisfeito com o produto e Falso para n√£o satisfeito')
    atendimento: bool = Field(description='Verdadeiro para satisfeito com o atendimento e False para n√£o satisfeito')
    satisfacao: str = Field(description='Avalia√ß√£o geral do cliente com a compra: Muito Satisfeito, Satisfeito, Neutro, Insatisfeito, Muito insatisfeito')

llm_estruturada = chat.with_structured_output(AvaliacaoReview)
resultado = llm_estruturada.invoke(review_cliente)
print(f'descri√ß√£o: {resultado.produto}')
print(f'entrega: {resultado.entrega}')
print(f'avaliacao_produto: {resultado.avaliacao_produto}')
print(f'atendimento: {resultado.atendimento}')
print(f'satisfa√ß√£o: {resultado.satisfacao}')

descri√ß√£o: soprador de folhas com quatro configura√ß√µes: sopro de vela, brisa suave, cidade ventosa e tornado
entrega: True
avaliacao_produto: True
atendimento: True
satisfa√ß√£o: Muito Satisfeito
