# üéØ OutputParsers: Transformando Respostas Bagun√ßadas em Dados Estruturados!

**M√≥dulo 5 de 17 - Curso LangChain v0.3**



Fala pessoal! Pedro Guth aqui! üöÄ

T√°, mas o que acontece quando voc√™ faz uma pergunta pro ChatGPT e ele te responde com um text√£o desorganizado? Voc√™ quer dados estruturados, mas recebe uma resposta que parece conversa de WhatsApp da fam√≠lia!

√â a√≠ que entram os **OutputParsers** do LangChain! Pensa neles como aquele amigo organizado que pega sua gaveta bagun√ßada e deixa tudo certinho, cada coisa no seu lugar.

**O que vamos ver hoje:**
- Por que precisamos de OutputParsers
- Tipos principais de parsers
- Como integrar com nossos ChatModels e PromptTemplates
- Exemplos pr√°ticos que v√£o te fazer falar "Liiindo!"

Bora come√ßar!

## ü§î O Problema: LLMs Falam Demais!

Imagina que voc√™ vai no a√ßougue e pede "1kg de picanha". O a√ßougueiro, em vez de te dar s√≥ a carne, come√ßa:

*"Olha, essa picanha aqui √© muito boa, vem do boi que pastava l√° no sul, a textura dela √© macia, eu recomendo fazer na churrasqueira com sal grosso..."*

Voc√™ s√≥ queria a picanha! ü•©

Com LLMs √© igual. Voc√™ pede dados estruturados e eles v√™m com:
- Explica√ß√µes extras
- Formata√ß√£o inconsistente
- Texto em linguagem natural

**OutputParsers resolvem isso!** Eles s√£o como um filtro que:
1. Pega a resposta "tagarela" do LLM
2. Extrai s√≥ o que importa
3. Estrutura no formato que voc√™ precisa

### Fluxo com OutputParsers:

```mermaid
graph LR
    A[Prompt] --> B[LLM]
    B --> C[Resposta Textual]
    C --> D[OutputParser]
    D --> E[Dados Estruturados]
```

**Dica!** OutputParsers funcionam como "tradutor" entre a linguagem natural do LLM e estruturas de dados que seu c√≥digo entende!

In [None]:
# Instalando as depend√™ncias necess√°rias
!pip install langchain langchain-google-genai python-dotenv -q

print("Depend√™ncias instaladas! Bora pro c√≥digo! üöÄ")

In [None]:
# Setup inicial - conectando com o Gemini
import os
from dotenv import load_dotenv
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import PromptTemplate

# Carregando vari√°veis de ambiente
load_dotenv()

# Configurando o modelo (lembra dos m√≥dulos anteriores?)
llm = ChatGoogleGenerativeAI(
    model="gemini-2.0-flash-exp",
    google_api_key=os.getenv("GOOGLE_API_KEY"),
    temperature=0.1  # Pouca criatividade para respostas mais consistentes
)

print("Gemini configurado! Agora vamos ver o problema sem OutputParser...")

In [None]:
# Exemplo do PROBLEMA: sem OutputParser
prompt_sem_parser = PromptTemplate(
    input_variables=["produto"],
    template="Liste 3 caracter√≠sticas do produto {produto}"
)

# Criando a chain simples (lembra do LCEL?)
chain_sem_parser = prompt_sem_parser | llm

# Testando
resposta_bagun√ßada = chain_sem_parser.invoke({"produto": "smartphone"})
print("RESPOSTA SEM PARSER:")
print(resposta_bagun√ßada.content)
print("\n" + "="*50)
print("Tipo da resposta:", type(resposta_bagun√ßada.content))
print("\nViu? √â s√≥ texto! Como extrair as 3 caracter√≠sticas? ü§î")

## üìã Tipos de OutputParsers no LangChain

O LangChain tem v√°rios tipos de parsers, cada um para uma situa√ß√£o espec√≠fica. √â como ter diferentes tipos de peneira na cozinha!



### Principais Tipos:

1. **PydanticOutputParser** üéØ
   - Para estruturas complexas definidas com Pydantic
   - Valida√ß√£o autom√°tica dos dados
   - Ideal para APIs e dados cr√≠ticos

2. **CommaSeparatedListOutputParser** üìù
   - Transforma texto em lista separada por v√≠rgulas
   - Simples e direto ao ponto
   - Perfeito para listas b√°sicas

3. **StructuredOutputParser** üèóÔ∏è
   - Para estruturas simples sem Pydantic
   - Define campos manualmente
   - Meio termo entre simplicidade e estrutura

4. **JsonOutputParser** üóÇÔ∏è
   - Extrai JSON v√°lido das respostas
   - Flex√≠vel para diferentes estruturas
   - √ìtimo para integra√ß√µes

**Dica!** Comece sempre pelo mais simples que resolve seu problema. N√£o use bazuca para matar mosquito!

In [None]:
# Importando os OutputParsers que vamos usar
from langchain.output_parsers import (
    CommaSeparatedListOutputParser,
    StructuredOutputParser,
    PydanticOutputParser
)
from langchain.schema import OutputParserException
from pydantic import BaseModel, Field
from typing import List
import json

print("OutputParsers importados! Vamos come√ßar pelo mais simples...")

## üìù CommaSeparatedListOutputParser: O B√°sico que Funciona!

Este √© o mais simples de todos. √â como pedir pro seu amigo listar as coisas e separar por v√≠rgula.

**Quando usar:**
- Listas simples
- N√£o precisa de valida√ß√£o complexa
- Quer rapidez e simplicidade

**Como funciona:**
1. Parser gera instru√ß√µes autom√°ticas para o LLM
2. LLM responde seguindo o formato
3. Parser converte a resposta em lista Python

**Dica!** O parser tem um m√©todo `get_format_instructions()` que gera automaticamente as instru√ß√µes para o LLM. √â m√°gico! ‚ú®

In [None]:
# CommaSeparatedListOutputParser em a√ß√£o!
list_parser = CommaSeparatedListOutputParser()

# Vamos ver que instru√ß√µes ele gera automaticamente
print("INSTRU√á√ïES AUTOM√ÅTICAS DO PARSER:")
print(list_parser.get_format_instructions())
print("\n" + "="*50 + "\n")

# Criando um prompt que usa essas instru√ß√µes
prompt_com_parser = PromptTemplate(
    input_variables=["produto"],
    template="Liste 5 caracter√≠sticas do produto {produto}.\n\n{format_instructions}",
    partial_variables={"format_instructions": list_parser.get_format_instructions()}
)

print("Prompt criado! Vamos ver como fica...")
print(prompt_com_parser.format(produto="smartphone"))

In [None]:
# Criando a chain completa com OutputParser
chain_com_parser = prompt_com_parser | llm | list_parser

# Testando com smartphone
resultado_lista = chain_com_parser.invoke({"produto": "smartphone"})

print("RESULTADO COM PARSER:")
print(resultado_lista)
print("\n" + "="*40)
print(f"Tipo: {type(resultado_lista)}")
print(f"Quantidade de itens: {len(resultado_lista)}")
print("\nAgora posso acessar cada item individualmente:")
for i, caracteristica in enumerate(resultado_lista, 1):
    print(f"{i}. {caracteristica.strip()}")

print("\nLiiindo! Agora temos uma lista Python de verdade! üéâ")

## üèóÔ∏è StructuredOutputParser: Mais Organiza√ß√£o!

Agora vamos subir um n√≠vel! O StructuredOutputParser √© como ter um formul√°rio organizado. Em vez de uma lista simples, voc√™ define campos espec√≠ficos.

√â tipo a diferen√ßa entre:
- **Lista simples:** "ma√ß√£, banana, laranja"
- **Estruturada:** "nome: ma√ß√£, cor: vermelha, pre√ßo: R$ 5,00"

### Como definir a estrutura:
Voc√™ cria um dicion√°rio com:
- **Chave:** nome do campo
- **Valor:** descri√ß√£o do que esperamos

**Dica!** Use este parser quando precisar de dados organizados mas n√£o quiser a complexidade do Pydantic!

In [None]:
# Definindo a estrutura que queremos
from langchain.output_parsers import ResponseSchema, StructuredOutputParser

# Definindo os campos que queremos na resposta
response_schemas = [
    ResponseSchema(name="nome", description="nome do produto analisado"),
    ResponseSchema(name="preco_estimado", description="pre√ßo estimado em reais (apenas o n√∫mero)"),
    ResponseSchema(name="categoria", description="categoria principal do produto"),
    ResponseSchema(name="pros", description="3 principais vantagens separadas por v√≠rgula"),
    ResponseSchema(name="contras", description="3 principais desvantagens separadas por v√≠rgula")
]

# Criando o parser estruturado
structured_parser = StructuredOutputParser.from_response_schemas(response_schemas)

print("INSTRU√á√ïES GERADAS PELO STRUCTURED PARSER:")
print(structured_parser.get_format_instructions())
print("\nViu como ele j√° orienta o LLM sobre o formato JSON? Inteligente! üß†")

In [None]:
# Criando o prompt para an√°lise estruturada de produto
prompt_estruturado = PromptTemplate(
    input_variables=["produto"],
    template="""Analise o produto {produto} e forne√ßa as informa√ß√µes solicitadas.
    
Seja preciso e objetivo nas respostas.

{format_instructions}""",
    partial_variables={"format_instructions": structured_parser.get_format_instructions()}
)

# Criando a chain completa
chain_estruturada = prompt_estruturado | llm | structured_parser

# Testando com diferentes produtos
produtos_teste = ["iPhone 15", "Tesla Model 3", "PlayStation 5"]

for produto in produtos_teste:
    print(f"\n{'='*20} AN√ÅLISE: {produto} {'='*20}")
    try:
        resultado = chain_estruturada.invoke({"produto": produto})
        print(f"Nome: {resultado['nome']}")
        print(f"Pre√ßo Estimado: R$ {resultado['preco_estimado']}")
        print(f"Categoria: {resultado['categoria']}")
        print(f"Pr√≥s: {resultado['pros']}")
        print(f"Contras: {resultado['contras']}")
    except Exception as e:
        print(f"Erro ao processar {produto}: {e}")

print("\nAgora temos dados estruturados que podemos usar em qualquer aplica√ß√£o! üöÄ")

## üéØ PydanticOutputParser: O Mais Profissional!

Agora vamos para o **top tier** dos OutputParsers! O PydanticOutputParser √© como ter um fiscal da receita verificando seus dados - nada passa batido!



**Por que Pydantic √© incr√≠vel:**
- ‚úÖ **Valida√ß√£o autom√°tica** de tipos
- ‚úÖ **Documenta√ß√£o autom√°tica** dos campos
- ‚úÖ **Tratamento de erros** elegante
- ‚úÖ **Compatibilidade** com FastAPI, SQLAlchemy, etc.

√â como a diferen√ßa entre:
- **Sem valida√ß√£o:** Algu√©m te d√° um papel com n√∫meros
- **Com Pydantic:** Um contador certificado te entrega um relat√≥rio validado

**Dica!** Use Pydantic quando os dados forem cr√≠ticos para sua aplica√ß√£o. Vale o esfor√ßo extra!

In [None]:
# Definindo um modelo Pydantic para an√°lise de produto
from pydantic import BaseModel, Field, validator
from typing import List, Optional
from datetime import datetime

class AnaliseProduto(BaseModel):
    """Modelo para an√°lise completa de um produto"""
    
    nome: str = Field(description="Nome completo do produto")
    categoria: str = Field(description="Categoria principal (ex: eletr√¥nicos, ve√≠culos, games)")
    preco_min: float = Field(description="Pre√ßo m√≠nimo estimado em reais")
    preco_max: float = Field(description="Pre√ßo m√°ximo estimado em reais")
    nota_avaliacao: float = Field(description="Nota de 0 a 10 baseada na qualidade geral")
    caracter√≠sticas_positivas: List[str] = Field(description="Lista com 3 principais vantagens")
    caracter√≠sticas_negativas: List[str] = Field(description="Lista com 3 principais desvantagens")
    recomendado_para: str = Field(description="Perfil de usu√°rio ideal para este produto")
    disponibilidade: str = Field(description="Facilidade para encontrar: f√°cil, m√©dia, dif√≠cil")
    
    # Valida√ß√µes customizadas
    @validator('nota_avaliacao')
    def validar_nota(cls, v):
        if not 0 <= v <= 10:
            raise ValueError('Nota deve estar entre 0 e 10')
        return v
    
    @validator('preco_min', 'preco_max')
    def validar_precos(cls, v):
        if v < 0:
            raise ValueError('Pre√ßos devem ser positivos')
        return v

# Criando o parser Pydantic
pydantic_parser = PydanticOutputParser(pydantic_object=AnaliseProduto)

print("INSTRU√á√ïES GERADAS PELO PYDANTIC PARSER:")
print(pydantic_parser.get_format_instructions()[:500] + "...")
print("\nViu como ele gera instru√ß√µes super detalhadas? Isso garante qualidade! üíé")

In [None]:
# Criando prompt para an√°lise profissional
prompt_pydantic = PromptTemplate(
    input_variables=["produto"],
    template="""Voc√™ √© um especialista em an√°lise de produtos. Analise detalhadamente o produto: {produto}

Considere:
- Pre√ßos atuais do mercado brasileiro
- Qualidade e durabilidade
- Custo-benef√≠cio
- Disponibilidade no Brasil

Seja preciso e realista nas avalia√ß√µes.

{format_instructions}""",
    partial_variables={"format_instructions": pydantic_parser.get_format_instructions()}
)

# Chain completa com valida√ß√£o Pydantic
chain_pydantic = prompt_pydantic | llm | pydantic_parser

# Testando com um produto
produto_teste = "MacBook Air M2"
print(f"Analisando: {produto_teste}...\n")

try:
    analise = chain_pydantic.invoke({"produto": produto_teste})
    
    print(f"üì± PRODUTO: {analise.nome}")
    print(f"üè∑Ô∏è  CATEGORIA: {analise.categoria}")
    print(f"üí∞ PRE√áO: R$ {analise.preco_min:,.2f} - R$ {analise.preco_max:,.2f}")
    print(f"‚≠ê NOTA: {analise.nota_avaliacao}/10")
    print(f"üéØ RECOMENDADO PARA: {analise.recomendado_para}")
    print(f"üì¶ DISPONIBILIDADE: {analise.disponibilidade}")
    
    print("\n‚úÖ PONTOS POSITIVOS:")
    for i, ponto in enumerate(analise.caracter√≠sticas_positivas, 1):
        print(f"   {i}. {ponto}")
    
    print("\n‚ùå PONTOS NEGATIVOS:")
    for i, ponto in enumerate(analise.caracter√≠sticas_negativas, 1):
        print(f"   {i}. {ponto}")
    
    print(f"\nüîç TIPO DO OBJETO: {type(analise)}")
    print("\nLiiindo! Agora temos um objeto Python completo com valida√ß√£o! üéâ")
    
except Exception as e:
    print(f"Erro na an√°lise: {e}")
    print("Vamos tentar novamente com mais contexto...")

## üìä Visualizando os Resultados

Vamos criar algumas visualiza√ß√µes para mostrar como os OutputParsers nos ajudam a trabalhar com dados estruturados!

**Dica!** Uma das grandes vantagens dos OutputParsers √© poder usar os dados em gr√°ficos, an√°lises e outras aplica√ß√µes!

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# Vamos analisar v√°rios produtos para criar visualiza√ß√µes
produtos_para_comparar = [
    "iPhone 15 Pro",
    "Samsung Galaxy S24", 
    "Google Pixel 8",
    "Xiaomi 14"
]

analises = []
nomes_produtos = []
notas = []
precos_medios = []

print("Analisando produtos para compara√ß√£o...\n")

for produto in produtos_para_comparar:
    try:
        print(f"Processando {produto}...")
        analise = chain_pydantic.invoke({"produto": produto})
        
        analises.append(analise)
        nomes_produtos.append(analise.nome)
        notas.append(analise.nota_avaliacao)
        preco_medio = (analise.preco_min + analise.preco_max) / 2
        precos_medios.append(preco_medio)
        
    except Exception as e:
        print(f"Erro ao processar {produto}: {e}")

print(f"\nAn√°lises conclu√≠das! {len(analises)} produtos processados.")

In [None]:
# Criando visualiza√ß√µes dos dados estruturados
if len(analises) > 0:
    fig, ((ax1, ax2), (ax3, ax4)) = plt.subplots(2, 2, figsize=(15, 12))
    
    # Gr√°fico 1: Notas de Avalia√ß√£o
    colors = ['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4']
    bars1 = ax1.bar(range(len(nomes_produtos)), notas, color=colors)
    ax1.set_title('üìä Notas de Avalia√ß√£o por Produto', fontsize=14, fontweight='bold')
    ax1.set_ylabel('Nota (0-10)')
    ax1.set_xticks(range(len(nomes_produtos)))
    ax1.set_xticklabels([nome.split()[-1] for nome in nomes_produtos], rotation=45)
    ax1.grid(axis='y', alpha=0.3)
    
    # Adicionando valores nas barras
    for bar, nota in zip(bars1, notas):
        ax1.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 0.1, 
                f'{nota}', ha='center', va='bottom', fontweight='bold')
    
    # Gr√°fico 2: Pre√ßos M√©dios
    bars2 = ax2.bar(range(len(nomes_produtos)), precos_medios, color=colors)
    ax2.set_title('üí∞ Pre√ßos M√©dios por Produto', fontsize=14, fontweight='bold')
    ax2.set_ylabel('Pre√ßo (R$)')
    ax2.set_xticks(range(len(nomes_produtos)))
    ax2.set_xticklabels([nome.split()[-1] for nome in nomes_produtos], rotation=45)
    ax2.grid(axis='y', alpha=0.3)
    
    # Formatando valores monet√°rios
    for bar, preco in zip(bars2, precos_medios):
        ax2.text(bar.get_x() + bar.get_width()/2, bar.get_height() + 100, 
                f'R$ {preco:,.0f}', ha='center', va='bottom', fontweight='bold')
    
    # Gr√°fico 3: Rela√ß√£o Pre√ßo x Nota
    scatter = ax3.scatter(precos_medios, notas, s=200, c=colors, alpha=0.7)
    ax3.set_title('üíé Custo-Benef√≠cio: Pre√ßo x Nota', fontsize=14, fontweight='bold')
    ax3.set_xlabel('Pre√ßo M√©dio (R$)')
    ax3.set_ylabel('Nota (0-10)')
    ax3.grid(True, alpha=0.3)
    
    # Adicionando labels nos pontos
    for i, nome in enumerate(nomes_produtos):
        ax3.annotate(nome.split()[-1], (precos_medios[i], notas[i]), 
                    xytext=(5, 5), textcoords='offset points', fontsize=10)
    
    # Gr√°fico 4: Categorias
    categorias = [analise.categoria for analise in analises]
    categoria_counts = {}
    for cat in categorias:
        categoria_counts[cat] = categoria_counts.get(cat, 0) + 1
    
    if categoria_counts:
        ax4.pie(categoria_counts.values(), labels=categoria_counts.keys(), 
               autopct='%1.0f%%', colors=colors[:len(categoria_counts)])
        ax4.set_title('üì± Distribui√ß√£o por Categoria', fontsize=14, fontweight='bold')
    
    plt.tight_layout()
    plt.show()
    
    print("Liiindo! Viu como os OutputParsers nos permitiram criar visualiza√ß√µes incr√≠veis? üìä‚ú®")
else:
    print("N√£o foi poss√≠vel gerar gr√°ficos - dados insuficientes.")

## üõ†Ô∏è Tratamento de Erros e Debugging

Nem sempre tudo funciona perfeitamente! LLMs podem ser imprevis√≠veis, igual aquele amigo que √†s vezes entende errado o que voc√™ falou.

![](/imagens/langchain-modulo-05_img_04.png)

**Problemas comuns:**
- LLM n√£o segue exatamente o formato pedido
- Dados faltando ou em formato incorreto
- Caracteres especiais que quebram o JSON
- Respostas muito longas ou muito curtas

**Estrat√©gias de recovery:**
1. **Try/catch** sempre presente
2. **Prompt engineering** mais espec√≠fico
3. **Temperature baixa** para consist√™ncia
4. **Retry logic** quando necess√°rio

**Dica!** Sempre teste seus OutputParsers com v√°rios exemplos diferentes. Murphy's Law √© real na programa√ß√£o!

In [None]:
# Fun√ß√£o helper para tentar parsing com fallback
def analisar_produto_com_retry(produto, max_tentativas=3):
    """Analisa produto com retry autom√°tico em caso de erro"""
    
    for tentativa in range(max_tentativas):
        try:
            print(f"Tentativa {tentativa + 1} para {produto}...")
            
            # Adjustando temperature baseado na tentativa
            temp = 0.1 + (tentativa * 0.1)  # Aumenta um pouco a cada tentativa
            
            llm_temp = ChatGoogleGenerativeAI(
                model="gemini-2.0-flash-exp",
                google_api_key=os.getenv("GOOGLE_API_KEY"),
                temperature=temp
            )
            
            chain_temp = prompt_pydantic | llm_temp | pydantic_parser
            resultado = chain_temp.invoke({"produto": produto})
            
            print(f"‚úÖ Sucesso na tentativa {tentativa + 1}!")
            return resultado
            
        except OutputParserException as e:
            print(f"‚ùå Erro de parsing na tentativa {tentativa + 1}: {str(e)[:100]}...")
            if tentativa == max_tentativas - 1:
                print("‚ùå Falha ap√≥s todas as tentativas. Usando fallback...")
                return None
                
        except Exception as e:
            print(f"‚ùå Erro geral na tentativa {tentativa + 1}: {e}")
            if tentativa == max_tentativas - 1:
                return None
    
    return None

# Testando com produtos que podem dar problema
produtos_desafiadores = [
    "Produto inexistente XYZ-2000",  # Produto que n√£o existe
    "Tesla Cybertruck",  # Produto com info limitada
    "RTX 4090"  # Nome abreviado
]

print("Testando robustez do sistema...\n")

for produto in produtos_desafiadores:
    print(f"\n{'='*30} {produto} {'='*30}")
    resultado = analisar_produto_com_retry(produto)
    
    if resultado:
        print(f"üéâ Produto analisado: {resultado.nome}")
        print(f"üìä Nota: {resultado.nota_avaliacao}/10")
    else:
        print("üíî N√£o foi poss√≠vel analisar este produto.")
        print("Em produ√ß√£o, implementar√≠amos um fallback aqui.")

## üîÑ Integrando com M√≥dulos Anteriores

Lembra dos m√≥dulos que j√° estudamos? Vamos conectar tudo!

**Revis√£o r√°pida:**
- **M√≥dulo 2:** ChatModel (Gemini) ‚úÖ
- **M√≥dulo 3:** LCEL (chains com |) ‚úÖ  
- **M√≥dulo 4:** PromptTemplate ‚úÖ
- **M√≥dulo 5:** OutputParsers ‚úÖ (agora!)

**Pr√≥ximos m√≥dulos que se beneficiam:**
- **M√≥dulo 6:** Chains - OutputParsers deixam chains mais poderosas
- **M√≥dulo 10:** RAG - Parsing de documentos estruturados
- **M√≥dulo 11:** Agents - Ferramentas que retornam dados estruturados

### Fluxo Completo:

```mermaid
graph TD
    A[Input do Usu√°rio] --> B[PromptTemplate]
    B --> C[ChatModel - Gemini]
    C --> D[Resposta em Texto]
    D --> E[OutputParser]
    E --> F[Dados Estruturados]
    F --> G[Aplica√ß√£o]
```

**Dica!** Este fluxo √© a base de 90% das aplica√ß√µes LangChain. Domina isso e voc√™ domina o LangChain!

In [None]:
# Exemplo COMPLETO integrando todos os m√≥dulos anteriores
from langchain.prompts import ChatPromptTemplate
from langchain.schema.runnable import RunnablePassthrough

# Modelo mais complexo para demonstra√ß√£o
class ComparacaoProdutos(BaseModel):
    """Compara√ß√£o detalhada entre produtos"""
    
    produto_melhor: str = Field(description="Nome do produto com melhor avalia√ß√£o geral")
    produto_custo_beneficio: str = Field(description="Produto com melhor custo-benef√≠cio")
    produto_mais_caro: str = Field(description="Produto mais caro")
    resumo_comparacao: str = Field(description="Resumo em 2 frases da compara√ß√£o")
    recomendacao_final: str = Field(description="Para quem voc√™ recomendaria cada produto")

# Parser para compara√ß√£o
parser_comparacao = PydanticOutputParser(pydantic_object=ComparacaoProdutos)

# Prompt template mais sofisticado usando ChatPromptTemplate
prompt_comparacao = ChatPromptTemplate.from_messages([
    ("system", "Voc√™ √© um especialista em an√°lise comparativa de produtos de tecnologia."),
    ("human", """
Compare os seguintes produtos considerando:
- Pre√ßo atual no mercado brasileiro  
- Qualidade e recursos
- Custo-benef√≠cio
- P√∫blico-alvo

Produtos: {produtos}

Seja objetivo e baseado em dados reais do mercado.

{format_instructions}
    """)
])

# Chain completa usando LCEL
chain_comparacao = (
    {
        "produtos": RunnablePassthrough(),
        "format_instructions": lambda _: parser_comparacao.get_format_instructions()
    }
    | prompt_comparacao 
    | llm 
    | parser_comparacao
)

# Testando compara√ß√£o
produtos_para_comparar = "iPhone 15 Pro, Samsung Galaxy S24 Ultra, Google Pixel 8 Pro"

print("üîÑ Executando chain completa com todos os m√≥dulos...\n")

try:
    comparacao = chain_comparacao.invoke(produtos_para_comparar)
    
    print("üèÜ RESULTADO DA COMPARA√á√ÉO:")
    print(f"\nü•á Melhor Produto: {comparacao.produto_melhor}")
    print(f"üí∞ Melhor Custo-Benef√≠cio: {comparacao.produto_custo_beneficio}")
    print(f"üí∏ Mais Caro: {comparacao.produto_mais_caro}")
    print(f"\nüìù Resumo: {comparacao.resumo_comparacao}")
    print(f"\nüéØ Recomenda√ß√µes: {comparacao.recomendacao_final}")
    
    print("\n‚ú® Perfeito! Todos os m√≥dulos trabalhando juntos! ‚ú®")
    
except Exception as e:
    print(f"Erro na compara√ß√£o: {e}")
    print("Tentando novamente...")

## üéØ Exerc√≠cio Pr√°tico: Seu Primeiro Sistema Completo!

Agora √© sua vez! Vamos criar um sistema de an√°lise de filmes usando tudo que aprendemos.

**Desafio:** Criar um analisador de filmes que:
1. Receba o nome de um filme
2. Retorne an√°lise estruturada
3. Permita comparar m√∫ltiplos filmes
4. Trate erros elegantemente

**Campos para analisar:**
- Nome do filme
- Ano de lan√ßamento  
- G√™nero principal
- Nota IMDb estimada
- Resumo em 1 frase
- 3 pontos fortes
- 2 pontos fracos
- P√∫blico recomendado

**Dica!** Use o que aprendemos: Pydantic para valida√ß√£o, try/catch para erros, e LCEL para chains elegantes!

In [None]:
# EXERC√çCIO: Complete o c√≥digo abaixo
# Defina o modelo Pydantic para an√°lise de filmes

class AnaliseFilme(BaseModel):
    """Seu modelo aqui! Defina os campos necess√°rios"""
    
    # TODO: Adicione os campos solicitados
    # Lembre-se de usar Field() com descriptions
    # E validators onde necess√°rio (ex: ano entre 1900-2024)
    
    pass  # Remova este pass e implemente

# TODO: Crie o parser
# parser_filme = ?

# TODO: Crie o prompt template
# prompt_filme = ?

# TODO: Crie a chain completa
# chain_filme = ?

# TODO: Teste com alguns filmes
filmes_teste = ["Cidade de Deus", "Vingadores Ultimato", "Parasita"]

print("Implemente o c√≥digo acima e teste! üé¨")
print("\nQuando terminar, descomente as linhas abaixo para testar:")

# for filme in filmes_teste:
#     try:
#         analise = chain_filme.invoke({"filme": filme})
#         print(f"\nüé¨ {analise.nome} ({analise.ano})")
#         print(f"‚≠ê Nota: {analise.nota_imdb}")
#         print(f"üìù {analise.resumo}")
#     except Exception as e:
#         print(f"Erro ao analisar {filme}: {e}")

In [None]:
# SOLU√á√ÉO DO EXERC√çCIO (n√£o olhe antes de tentar!)
# Descomente para ver a solu√ß√£o

# class AnaliseFilme(BaseModel):
#     """An√°lise completa de filme"""
#     
#     nome: str = Field(description="Nome completo do filme")
#     ano: int = Field(description="Ano de lan√ßamento")
#     genero: str = Field(description="G√™nero principal (drama, a√ß√£o, com√©dia, etc)")
#     nota_imdb: float = Field(description="Nota estimada no IMDb (0-10)")
#     resumo: str = Field(description="Resumo do filme em uma frase")
#     pontos_fortes: List[str] = Field(description="3 principais pontos fortes")
#     pontos_fracos: List[str] = Field(description="2 principais pontos fracos")
#     publico_recomendado: str = Field(description="Perfil do p√∫blico ideal")
#     
#     @validator('ano')
#     def validar_ano(cls, v):
#         if not 1900 <= v <= 2024:
#             raise ValueError('Ano deve estar entre 1900 e 2024')
#         return v
#     
#     @validator('nota_imdb')
#     def validar_nota(cls, v):
#         if not 0 <= v <= 10:
#             raise ValueError('Nota deve estar entre 0 e 10')
#         return v

print("Solu√ß√£o comentada acima! Tente fazer primeiro! üí™")

## üöÄ Preparando para os Pr√≥ximos M√≥dulos

Parab√©ns! Voc√™ dominou os OutputParsers! üéâ

![](/imagens/langchain-modulo-05_img_05.png)

**O que dominamos hoje:**
- ‚úÖ Por que OutputParsers s√£o essenciais
- ‚úÖ CommaSeparatedListOutputParser para listas simples
- ‚úÖ StructuredOutputParser para dados organizados
- ‚úÖ PydanticOutputParser para valida√ß√£o profissional
- ‚úÖ Tratamento de erros e retry logic
- ‚úÖ Integra√ß√£o com m√≥dulos anteriores

**Como isso se conecta com os pr√≥ximos m√≥dulos:**

üîó **M√≥dulo 6 - Chains:** OutputParsers tornam chains muito mais poderosas
üîó **M√≥dulo 8 - Document Loading:** Parsing de documentos estruturados
üîó **M√≥dulo 10 - RAG:** Estrutura√ß√£o de respostas baseadas em documentos
üîó **M√≥dulo 11 - Agents:** Tools que retornam dados estruturados
üîó **M√≥dulo 14 - Deploy:** APIs que retornam JSON estruturado

**Dica Final!** OutputParsers s√£o o "tempero" que transforma aplica√ß√µes b√°sicas em sistemas profissionais. Use sempre que precisar de dados estruturados!

## üìö Resumo e Boas Pr√°ticas

### üéØ Quando Usar Cada Parser:

| Parser | Quando Usar | Exemplo |
|--------|-------------|----------|
| **CommaSeparatedList** | Listas simples | "ma√ß√£, banana, laranja" |
| **Structured** | Dados organizados sem valida√ß√£o complexa | {"nome": "Jo√£o", "idade": "30"} |
| **Pydantic** | Aplica√ß√µes profissionais com valida√ß√£o | APIs, sistemas cr√≠ticos |
| **JSON** | Estruturas flex√≠veis | Configura√ß√µes, dados vari√°veis |

### üõ°Ô∏è Boas Pr√°ticas:

1. **Sempre use try/catch** - LLMs s√£o imprevis√≠veis
2. **Temperature baixa** - Para respostas consistentes (0.1-0.3)
3. **Prompts espec√≠ficos** - Seja claro sobre o formato desejado
4. **Valida√ß√£o Pydantic** - Para dados cr√≠ticos
5. **Teste com dados reais** - N√£o apenas casos ideais
6. **Implemente retry logic** - Para aumentar robustez
7. **Use format_instructions** - Deixe o parser orientar o LLM

### üö® Armadilhas Comuns:

- ‚ùå Confiar 100% que o LLM seguir√° o formato
- ‚ùå N√£o validar dados antes de usar
- ‚ùå Prompts muito vagos sobre formato
- ‚ùå N√£o ter fallback para erros
- ‚ùå Usar parser complexo para tarefa simples

### üí° Dica de Ouro:

"OutputParsers s√£o como contratos: definem exatamente o que voc√™ espera receber. Seja espec√≠fico no que pede e generoso no que aceita como entrada!"

In [None]:
# üéâ C√ìDIGO FINAL: Template Reutiliz√°vel
# Este √© um template que voc√™ pode usar em qualquer projeto!

def criar_analisador_com_parser(modelo_pydantic, template_prompt, modelo_llm=None):
    """Factory function para criar analisadores com OutputParser
    
    Args:
        modelo_pydantic: Classe Pydantic para estruturar dados
        template_prompt: String do template do prompt
        modelo_llm: Modelo LLM (opcional, usa padr√£o se None)
    
    Returns:
        Chain completa pronta para uso
    """
    
    # Configura√ß√£o padr√£o do LLM
    if modelo_llm is None:
        modelo_llm = ChatGoogleGenerativeAI(
            model="gemini-2.0-flash-exp",
            google_api_key=os.getenv("GOOGLE_API_KEY"),
            temperature=0.1
        )
    
    # Criando parser
    parser = PydanticOutputParser(pydantic_object=modelo_pydantic)
    
    # Criando prompt
    prompt = PromptTemplate(
        input_variables=["input"],
        template=template_prompt + "\n\n{format_instructions}",
        partial_variables={"format_instructions": parser.get_format_instructions()}
    )
    
    # Retornando chain completa
    return prompt | modelo_llm | parser

# Exemplo de uso do template
print("Template reutiliz√°vel criado! üîß")
print("Use este padr√£o em seus projetos para ter OutputParsers consistentes!")
print("\nPr√≥ximo m√≥dulo: Chains - onde vamos combinar m√∫ltiplas opera√ß√µes! üöÄ")
print("\nParab√©ns por completar o M√≥dulo 5! Voc√™ est√° dominando o LangChain! üéâ")