# Lab 7: Structured Output - Respostas em Formato Definido

<img src="./assets/LC_StructuredOutput.png" width="500">

## üéØ O que voc√™ vai aprender neste Lab

**Structured Output** permite que agentes produzam dados em formatos definidos (JSON, objetos Python). Isso √© essencial para integrar agentes com sistemas existentes.

### Por que Structured Output √© importante?

1. **Integra√ß√£o com sistemas**: APIs esperam dados em formatos espec√≠ficos
2. **Valida√ß√£o autom√°tica**: Dados s√£o validados contra o schema
3. **Processamento program√°tico**: F√°cil de processar em c√≥digo
4. **Consist√™ncia**: Sempre o mesmo formato de resposta

### O Problema com Texto Livre:

```python
# Texto livre - dif√≠cil de processar
resposta = "O nome √© Jo√£o, email joao@email.com, telefone 11999999999"

# Como extrair os dados? Regex? Parse manual? üò∞
```

### Com Structured Output:

```python
# Formato estruturado - f√°cil de usar
resposta = {
    "name": "Jo√£o",
    "email": "joao@email.com",
    "phone": "11999999999"
}

# Acesso direto!
print(resposta["email"])  # joao@email.com
```

### Tipos suportados pelo LangChain:

| Tipo | Descri√ß√£o | Valida√ß√£o |
|------|-----------|-----------|
| **TypedDict** | Dicion√°rio tipado | Tipos b√°sicos |
| **Pydantic BaseModel** | Modelo com valida√ß√£o | Completa |
| **dataclass** | Classe de dados Python | Tipos b√°sicos |
| **JSON Schema (dict)** | Schema JSON puro | Estrutura |

## ‚öôÔ∏è Setup - Configura√ß√£o do Ambiente

Instala√ß√£o das bibliotecas necess√°rias.

In [None]:
%pip install -U mlflow>=3 langchain>=1 langchain-community databricks-langchain --quiet
dbutils.library.restartPython()

In [None]:
import mlflow
mlflow.langchain.autolog()

## üìã Exemplo: Extra√ß√£o de Contatos com TypedDict

Vamos criar um agente que extrai informa√ß√µes de contato de uma conversa gravada.

### Definindo o schema com TypedDict

`TypedDict` permite definir a estrutura esperada da resposta:

In [None]:
from typing_extensions import TypedDict
from langchain.agents import create_agent
from databricks_langchain import ChatDatabricks


class ContactInfo(TypedDict):
    name: str
    email: str
    phone: str


# Inicializar o modelo Databricks
llm = ChatDatabricks(
    endpoint="databricks-meta-llama-3-3-70b-instruct",
    temperature=0.1,
)

agent = create_agent(model=llm, response_format=ContactInfo)

recorded_conversation = """We talked with John Doe. He works over at Example. His number is, let's see, 
five, five, five, one two three, four, five, six seven. Did you get that?
And, his email was john at example.com. He wanted to order 50 boxes of Captain Crunch."""

result = agent.invoke(
    {"messages": [{"role": "user", "content": recorded_conversation}]}
)

result["structured_response"]

### O que acontece:

1. Definimos `ContactInfo` com os campos esperados
2. Passamos `response_format=ContactInfo` ao criar o agente
3. O agente extrai os dados da conversa e retorna em `result["structured_response"]`

Observe como o agente interpreta "five, five, five..." como um n√∫mero de telefone!

## üî∑ Alternativa: Pydantic BaseModel

**Pydantic** oferece valida√ß√£o mais robusta que `TypedDict`. Voc√™ pode adicionar:
- Validadores customizados
- Valores padr√£o
- Descri√ß√µes de campos
- Restri√ß√µes (min/max, regex, etc.)

### Vantagens do Pydantic:
- Valida√ß√£o autom√°tica de tipos
- Serializa√ß√£o/deserializa√ß√£o JSON
- Documenta√ß√£o autom√°tica (OpenAPI)
- Mensagens de erro claras

* pydantic `BaseModel`
* `TypedDict`
* `dataclasses`
* json schema (dict)

### Resultado com Pydantic

O resultado agora √© uma inst√¢ncia de `ContactInfoPydantic` com valida√ß√£o de tipos!

In [None]:
from langchain.agents import create_agent
from pydantic import BaseModel


class ContactInfoPydantic(BaseModel):
    name: str
    email: str
    phone: str


agent = create_agent(model=llm, response_format=ContactInfoPydantic)

recorded_conversation = """ We talked with John Doe. He works over at Example. His number is, let's see, 
five, five, five, one two three, four, five, six seven. Did you get that?
And, his email was john at example.com. He wanted to order 50 boxes of Captain Crunch."""

result = agent.invoke(
    {"messages": [{"role": "user", "content": recorded_conversation}]}
)

result["structured_response"]

## üìö Resumo e Pr√≥ximos Passos

### O que aprendemos:

| Formato | Quando usar |
|---------|-------------|
| **TypedDict** | Estruturas simples, sem valida√ß√£o complexa |
| **Pydantic BaseModel** | Valida√ß√£o robusta, APIs de produ√ß√£o |
| **dataclass** | Estruturas simples com m√©todos |
| **JSON Schema** | Integra√ß√£o com sistemas externos |

### Como acessar a resposta estruturada:

```python
result = agent.invoke(...)

# A resposta estruturada est√° em:
dados = result["structured_response"]

# Acesso aos campos:
nome = dados["name"]      # TypedDict
nome = dados.name         # Pydantic
```

### Dicas:
- Use Pydantic para valida√ß√£o em produ√ß√£o
- Adicione descri√ß√µes aos campos para ajudar o LLM
- Considere campos opcionais (`Optional[str]`) quando apropriado

### Pr√≥ximo Lab:
No **Lab 8 - Dynamic Prompts**, voc√™ aprender√° a adaptar o prompt do agente dinamicamente com base em contexto!