In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## Iniciando e invocando um modelo

Inicializa o chat com os provedores de AI, define configurações da integração

In [2]:
from langchain.chat_models import init_chat_model

model = init_chat_model(
    model="gpt-5-nano"
)

O invoke é é utilizado para interagir com o modelo, permite passar suas definições de payload de entrada. 

In [3]:
response = model.invoke("Oi, qual é a capital do Nortão do Mato Grosso?")

response

AIMessage(content='Não existe uma capital oficial do “Nortão” — é uma região do estado de Mato Grosso, não uma entidade com governo próprio. A capital de Mato Grosso é Cuiabá. \n\nNo uso popular, algumas pessoas chamam Sinop de “capital do Nortão” por ser o maior polo da região, mas isso é apenas uma expressão informal, não oficial. Quer saber mais sobre as cidades principais do Nortão? Posso indicar.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 995, 'prompt_tokens': 19, 'total_tokens': 1014, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 896, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-DA2G37bbYbKOvmKw1fifTXhffPDOA', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c68c5-fb48-7ef3

In [4]:
print(response.content)

Não existe uma capital oficial do “Nortão” — é uma região do estado de Mato Grosso, não uma entidade com governo próprio. A capital de Mato Grosso é Cuiabá. 

No uso popular, algumas pessoas chamam Sinop de “capital do Nortão” por ser o maior polo da região, mas isso é apenas uma expressão informal, não oficial. Quer saber mais sobre as cidades principais do Nortão? Posso indicar.


Resultado da sua chaama como dados de tokens, modelo, etc...

In [5]:
from pprint import pprint

pprint(response.response_metadata)

{'finish_reason': 'stop',
 'id': 'chatcmpl-DA2G37bbYbKOvmKw1fifTXhffPDOA',
 'logprobs': None,
 'model_name': 'gpt-5-nano-2025-08-07',
 'model_provider': 'openai',
 'service_tier': 'default',
 'system_fingerprint': None,
 'token_usage': {'completion_tokens': 995,
                 'completion_tokens_details': {'accepted_prediction_tokens': 0,
                                               'audio_tokens': 0,
                                               'reasoning_tokens': 896,
                                               'rejected_prediction_tokens': 0},
                 'prompt_tokens': 19,
                 'prompt_tokens_details': {'audio_tokens': 0,
                                           'cached_tokens': 0},
                 'total_tokens': 1014}}


## Customização do modelo

- temperature: calibra o modelo para ser mais criativo/determínistico - temperaturas altas torna as respostas do modelo mais criativo, ao passo que temperaturas baixas mais determinístico
- max_tokens: limita o total de numero de gerados na respota, controlando o tamanho do output do modelo
- timeout: o maximo de tempo que devemos aguardar a resposta do modelo até que a request seja cancelada
- max_retries: maximo de retentativa se a request falhar

In [6]:
model = init_chat_model(
    model="gpt-5-nano",
    max_tokens=5000,
    temperature=0.7,
    timeout=60,
    max_retries=3,
)

response = model.invoke("Qual a capital do Brasil?")
print(response.content)

A capital do Brasil é Brasília.


## Model Providers

Vefirique as integrações disponiveis e capacidades de cada provider para o langchain 

https://docs.langchain.com/oss/python/integrations/chat

In [7]:
from langchain_google_genai import ChatGoogleGenerativeAI

model = ChatGoogleGenerativeAI(model="gemini-3-flash-preview")

response = model.invoke("Qual é a capital do Brasil?")
print(response.content)

[{'type': 'text', 'text': 'A capital do Brasil é **Brasília**.', 'extras': {'signature': 'EqoDCqcDAb4+9vuYE/8Y9Vu+FPcpqeqG3NfOu+kcLaQ2pjaCqSh1mIRfrTKwrfAI9hDaBgYWnYrKeYG9LbYhcY/wPf/O3BFt8U2lFanDRlfopH10Dbeay0bLtjOC9CoVh0SKnfAc1oQuIiW46qGc7vYYmkFbtVreSTVBfkpw2uV6/tL8hffepHJ4/SH+CGyNndFX6LMMAVXKPjiSWq6EvninL1xVbppxCRf8AgTVUHWa5ZjVx1LSCBon1FrTBmqG4Ut/Qe7DhOBvdBrP4mlrPbYdSY2I6jCRLugaY4BHAkO+Eg7EO7YasuE7d9X9f09D91aX+esvGbpUdz05A3js8V87fE+jnmo7nZhl6IbK6/llUSFaIQHpWjhUkW3DnDh75GbJ+zOkb15/LHMogdo+726kPFrUj9eUUAB+yZXI7aId486gASyzj6NB4/LTlN61j0HjJRv3w7aUYA9R4pg7PXPpfxBANxhk8rO0wlPR/S620wGPnWiqoDg/OYvC8h+q7UEnuVV6ybjAtNWb7mp57BycLHEb2s2BwO5Ad46vPxbeU+u7JQwUlSJn3gOF'}}]


## Inicando e invocando um agente

O create_agent do langchain segue o padrão ReAct (pensar->agir->observar->responder)

A diferença para a chamada do model direto é que o agent executa um orquestrador por baixo dos panos, capaz de gerenciar estado das msgs, chamadas de ferramentas e criterios de parada. 

In [8]:
from langchain.agents import create_agent

agent = create_agent(model=model)

HumanMessage representa as interações (user input) do usuario

In [9]:
from langchain.messages import HumanMessage

response = agent.invoke(
    {"messages": [HumanMessage(content="Qual é a capital do Brasil?")]}
)

In [10]:
from pprint import pprint

pprint(response)

{'messages': [HumanMessage(content='Qual é a capital do Brasil?', additional_kwargs={}, response_metadata={}, id='b622fcb7-c11c-44e1-9521-b133f8b268b8'),
              AIMessage(content=[{'type': 'text', 'text': 'A capital do Brasil é **Brasília**.', 'extras': {'signature': 'Ev0BCvoBAb4+9vuEaILzq26pTCnITLCy7peDOYEhaOGcJrjlvcNsHdUN/d5jWYZUCpX4/zNN6sDYo20gLrzh9SDPgtbVzVC8nsS+ExMe7tzdm1H8a5PJuj4ocKCc8T8UlANiffWIrVo1XSRm65Ya8MniB5dn51fLxd+c4clSapj3Ht715wFQgxybyqsZyPWww/1jwU5sJDgGPRTscEx95Qs9z2W7kXeHZPXZ6CHAStwcuTgclr0c9E78Pzr5YhiCGhYJd3snCGNlR2yhHoVx8Ci/UzOCn5XXegpMQBQ2grjTuoB7h6BS+BxNsCTUmCKP76sv5Q5mVb8xxuex335jiw=='}}], additional_kwargs={}, response_metadata={'finish_reason': 'STOP', 'model_name': 'gemini-3-flash-preview', 'safety_ratings': [], 'model_provider': 'google_genai'}, id='lc_run--019c68c6-2a18-7202-afac-d99ea63567cb-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 8, 'output_tokens': 62, 'total_tokens': 70, 'input_token_details': {'cache_read': 0}, 'o

In [11]:
print(response["messages"][-1].content)

[{'type': 'text', 'text': 'A capital do Brasil é **Brasília**.', 'extras': {'signature': 'Ev0BCvoBAb4+9vuEaILzq26pTCnITLCy7peDOYEhaOGcJrjlvcNsHdUN/d5jWYZUCpX4/zNN6sDYo20gLrzh9SDPgtbVzVC8nsS+ExMe7tzdm1H8a5PJuj4ocKCc8T8UlANiffWIrVo1XSRm65Ya8MniB5dn51fLxd+c4clSapj3Ht715wFQgxybyqsZyPWww/1jwU5sJDgGPRTscEx95Qs9z2W7kXeHZPXZ6CHAStwcuTgclr0c9E78Pzr5YhiCGhYJd3snCGNlR2yhHoVx8Ci/UzOCn5XXegpMQBQ2grjTuoB7h6BS+BxNsCTUmCKP76sv5Q5mVb8xxuex335jiw=='}}]


A lista de mensagens passada ao agent representa a memória de curto prazo, nesse caso estamos fazendo o controle manual do histórico. 
Isso singifica que o agente é capaz de entender o contexto das mensagens trocadas entre user e ai, e responder adequadamente com base no contexto fornecido.

In [12]:
from langchain.messages import AIMessage

response = agent.invoke(
    {
        "messages": [
            HumanMessage(content="Qual é a capital do Brasil?"),
            AIMessage(content="Brasília."),
            HumanMessage(content="Me fale mais sobre Brasília")
        ]
    }
)



In [13]:
print(response["messages"][-1])

content=[{'type': 'text', 'text': 'Brasília é uma cidade única, conhecida mundialmente por seu planejamento urbano e arquitetura modernista. Aqui estão os pontos principais para entender a capital do Brasil:\n\n### 1. História e Fundação\n*   **Inauguração:** Foi inaugurada em **21 de abril de 1960** pelo então presidente **Juscelino Kubitschek (JK)**.\n*   **Objetivo:** A ideia era transferir a capital do litoral (Rio de Janeiro) para o interior do país para integrar as diversas regiões do Brasil e garantir a segurança nacional, afastando o centro das decisões de possíveis ataques marítimos.\n*   **Construção recorde:** A cidade foi construída em menos de quatro anos (cerca de 41 meses), um feito impressionante para a época.\n\n### 2. Planejamento Urbano (Plano Piloto)\n*   **Lúcio Costa:** Foi o urbanista responsável pelo projeto da cidade, chamado de **Plano Piloto**.\n*   **Formato:** O desenho da cidade é frequentemente comparado ao formato de um **avião** ou de uma borboleta.\n* 

## Prompt do Sistema

Um sistem prompt é a camada de instrução de maior contexto em uma chamada ao modelo. 
Ele basicamene define o comportamento de base do assistente: papel, tom, limites, formatos de resposta, políticas, objetivos, etc...

In [14]:
products = [
    {
        "id": 1,
        "name": "Casa terrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²",
        "price": 700000,
        "location": "Rua das Flores, 123",
    },
    {
        "id": 2,
        "name": "Apartamento 3 dormitórios, 2 banheiros, 2 vagas de garagem, 120m²",
        "price": 800000,
        "location": "Rua das Avencas, 123",
    },
]

products_formatted = "\n".join([f"ID: {p['id']}\nNome: {p['name']}\nPreço: {p['price']}\nLocalização: {p['location']}" for p in products])

system_prompt = f"""
Você é um assistente de vendas focado no mercado imobiliário.

Seus produtos são imóveis de alto padrão, com preços a partir de R$ 700.000,00

Aqui estão os imóveis disponíveis para venda:
{products_formatted}
"""

seller_agent = create_agent(
    model="gpt-5-nano",
    system_prompt=system_prompt
)



In [15]:
user_question = "Qual é o imóvel mais barato da região?"

response = seller_agent.invoke(
    {"messages": [HumanMessage(content=user_question)]}
)

print(response['messages'][1].content)

O imóvel mais barato disponível é a Casa térrea (ID 1) por R$ 700.000,00. Detalhes: 3 dormitórios, 2 banheiros, 2 vagas, 200 m². Localização: Rua das Flores, 123.

Deseja agendar uma visita ou precisa de mais informações sobre este imóvel?


## Saídas estruturadas

Uma resposta estruturada é o meio que temos para fazer com que o modelo retorne dados num formato previsível ao invés de um texto livre. 

In [16]:
from langchain.agents import create_agent
from langchain.messages import HumanMessage
from pydantic import BaseModel

class Product(BaseModel):
    id: int
    name: str
    price: float
    location: str

seller_agent = create_agent(
    model="gpt-5-nano",
    system_prompt=system_prompt,
    response_format=Product
)

response = seller_agent.invoke(
    {"messages": [HumanMessage(content=user_question)]}
)

product = response["structured_response"]

print(product.id)
print(product.name)
print(product.price)
print(product.location)

1
Casa terrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²
700000.0
Rua das Flores, 123


## Definições de ferramentas

ferramentas (tools) são funções que você expõe para o agente agir no mundo externo (fazer cálculo, consultar API, buscar dados, etc.), 

In [17]:
from langchain.tools import tool

@tool
def calculate_installments(price: float, installments: int):
    """
    Calcula o valor das parcelas de um produto
    """

    if installments <= 0:
        return "O número de parcelas deve ser maior que 0"
    
    return price / installments


podemos invocar as ferramentas diretamente

In [18]:
calculate_installments.invoke({"price": 1000, "installments": 5})

200.0

## Adicionando as ferramentas ao agent

In [19]:
seller_agent = create_agent(
    model="gpt-5-nano",
    system_prompt=system_prompt,
    tools=[calculate_installments]
)

user_question = "Qual o valor parcelado em 10x do imóvel mais barato?"

response = seller_agent.invoke(
    {"messages": [HumanMessage(content=user_question)]}
)

print(response["messages"][-1].content)

Imóvel mais barato:
- Casa térrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²
- Localização: Rua das Flores, 123
- Preço: R$ 700.000,00

Parcela em 10x: R$ 70.000,00 por mês (total de R$ 700.000,00).

Deseja que eu simule com entrada ou com outras condições de pagamento?


In [20]:
from pprint import pprint

pprint(response['messages'])

[HumanMessage(content='Qual o valor parcelado em 10x do imóvel mais barato?', additional_kwargs={}, response_metadata={}, id='38ef5319-388b-42aa-9839-be92b64eb184'),
 AIMessage(content='', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 414, 'prompt_tokens': 289, 'total_tokens': 703, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 384, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-5-nano-2025-08-07', 'system_fingerprint': None, 'id': 'chatcmpl-DA2GjxABoPIiEi6jNeCZ5j3VhTDce', 'service_tier': 'default', 'finish_reason': 'tool_calls', 'logprobs': None}, id='lc_run--019c68c6-a043-71e1-8f43-cd99792c72ac-0', tool_calls=[{'name': 'calculate_installments', 'args': {'price': 700000, 'installments': 10}, 'id': 'call_ZgrTFiP865OxHvvoTYFCczb4', 'type': 'tool_call'}], invalid_tool_calls=[], usage_meta

In [21]:
print(response["messages"][1].tool_calls)

[{'name': 'calculate_installments', 'args': {'price': 700000, 'installments': 10}, 'id': 'call_ZgrTFiP865OxHvvoTYFCczb4', 'type': 'tool_call'}]


## Pesquisa na internet

In [29]:
from tavily import TavilyClient
from typing import Dict, Any

tavily_client = TavilyClient()

@tool
def search_internet(query: str)  -> Dict[str, Any]:
    """
    Pesquisa na internet
    """
    return tavily_client.search(query)
    

In [30]:
seller_agent = create_agent(
    model="gpt-5-nano",
    system_prompt=system_prompt,
    tools=[calculate_installments, search_internet]
)

user_question = "Procure por imóveis de alto padrão em Sinop, na região do bairro Aquarela das Artes"

response = seller_agent.invoke(
    {"messages": [HumanMessage(content=user_question)]}
)

print(response["messages"][-1].content)

Encontrei algumas opções de alto padrão no bairro Aquarela das Artes, em Sinop. Abaixo, um resumo com os pontos principais e preços quando disponíveis:

- Casa de alto padrão no Aquarela das Artes
  - Preço: R$ 1.600.000
  - Características: 3 suítes (1 master com closet), sala com pé-direito alto, cozinha gourmet com ilha e churrasqueira, lavabo, lavanderia, garagem para 2 vagas, sacada com vista para a orla. Observação: anúncio afirma also piscina com cascata, aquecida e hidro.

- Casa de frente para a orla - Aquarela das Artes
  - Preço: não informado publicamente
  - Características: 3 suítes, piscina, vista para a orla. Área total citada: cerca de 323m² de terreno, 260m² de área coberta incluindo piscina.

- Imóvel com 2 quartos/1 suíte no Aquarela das Artes
  - Preço: não informado
  - Dimensões: terreno 170m², área construída 102m²

- Residencial Aquarela das Artes (outros anúncios)
  - Preço: não informado
  - Características: 3 suítes (inclui master com closet), piscina entre 

In [31]:
print(response["messages"][1].tool_calls)

[{'name': 'search_internet', 'args': {'query': 'Sinop Aquarela das Artes imobiliário alto padrão'}, 'id': 'call_fNuyC55CN6YA2OTUEcPL8O6y', 'type': 'tool_call'}]


In [32]:
## Memória 

Vamos adicionar memória multi-turn automatico para nosso agent.

In [41]:
from langgraph.checkpoint.memory import InMemorySaver  

seller_agent = create_agent(
    model="gpt-5-nano",
    system_prompt=system_prompt,
    tools=[calculate_installments, search_internet],
    checkpointer=InMemorySaver()
)

config = {"configurable": {"thread_id": "123"}}

user_question = "Oi, minhas preferências são: 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²"

response = seller_agent.invoke(
    {"messages": [HumanMessage(content=user_question)]},
    config=config
)

print(response["messages"][-1].content)

Ótimo! com base nas suas preferências, o imóvel que atende exatamente é:

- ID 1: Casa térrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²
  - Preço: R$ 700.000
  - Localização: Rua das Flores, 123

Observação: o ID 2 também é 3 dormitórios, 2 banheiros e 2 vagas, mas tem 120m² (não atende aos 200m² desejados).

Como gostaria de seguir?
- Agendar uma visita ao ID 1
- Pedir mais fotos/plantas do ID 1
- Calcular parcelas de pagamento (diga em quantas parcelas quer; posso usar simulações como 12x, 24x, 60x, etc.)


**Lista de messages manual vs checkpointer**

Na lista de mensagens (HumanMessage, AIMessage, HumanMessage), estamos fazendo memória manual: passa todo o contexto explicitamente a cada invoke. (Stateless por padrão.)
Com checkpointer=InMemorySaver() + thread_id, ativamos memória automática por thread: o agente salva/recupera estado entre chamadas, sem precisar reenviar todo o histórico. (Stateful por sessão/conversa.)

In [43]:
pprint(response)

{'messages': [HumanMessage(content='Oi, minhas preferências são: 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²', additional_kwargs={}, response_metadata={}, id='325c8c2c-66d7-4038-aca3-68e9bcca3ae7'),
              AIMessage(content='Ótimo! com base nas suas preferências, o imóvel que atende exatamente é:\n\n- ID 1: Casa térrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²\n  - Preço: R$ 700.000\n  - Localização: Rua das Flores, 123\n\nObservação: o ID 2 também é 3 dormitórios, 2 banheiros e 2 vagas, mas tem 120m² (não atende aos 200m² desejados).\n\nComo gostaria de seguir?\n- Agendar uma visita ao ID 1\n- Pedir mais fotos/plantas do ID 1\n- Calcular parcelas de pagamento (diga em quantas parcelas quer; posso usar simulações como 12x, 24x, 60x, etc.)', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 1590, 'prompt_tokens': 320, 'total_tokens': 1910, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens

In [44]:
question = HumanMessage(content="Pesquise por casas que se encaixam nas minhas preferências com localização no bairro Aquarela das Artes")

response = seller_agent.invoke(
    {"messages": [question]},
    config,  
)

pprint(response)

{'messages': [HumanMessage(content='Oi, minhas preferências são: 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²', additional_kwargs={}, response_metadata={}, id='325c8c2c-66d7-4038-aca3-68e9bcca3ae7'),
              AIMessage(content='Ótimo! com base nas suas preferências, o imóvel que atende exatamente é:\n\n- ID 1: Casa térrea, 3 dormitórios, 2 banheiros, 2 vagas de garagem, 200m²\n  - Preço: R$ 700.000\n  - Localização: Rua das Flores, 123\n\nObservação: o ID 2 também é 3 dormitórios, 2 banheiros e 2 vagas, mas tem 120m² (não atende aos 200m² desejados).\n\nComo gostaria de seguir?\n- Agendar uma visita ao ID 1\n- Pedir mais fotos/plantas do ID 1\n- Calcular parcelas de pagamento (diga em quantas parcelas quer; posso usar simulações como 12x, 24x, 60x, etc.)', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 1590, 'prompt_tokens': 320, 'total_tokens': 1910, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens

In [45]:
print(response["messages"][-1].content)

Obrigado! Fiz uma busca por imóveis em Aquarela das Artes que se aproximam das suas preferências (3 dormitórios, 2 banheiros, 2 vagas, ~200 m²). Note que é difícil encontrar exatamente 200 m² com 2 banheiros nessa região, então listei opções próximas e com dados disponíveis.

Opções encontradas em Aquarela das Artes (aproximações)
- Viva Real — Avenida das Artes, Aquarela das Artes, Sinop
  - Área: 215 m²
  - Banheiros: 3
  - Vagas: 2
  - Observação: atende 2 vagas, mas possui 3 banheiros (acima do desejado). Link: [resumo da página]

- Zap Imóveis — Aquarela das Artes, Sinop
  - Área: 188 m²
  - Quartos: 3
  - Banheiros: 3
  - Vagas: 2
  - Observação: próximo de 200 m² e 3 dorms, mas tem 3 banheiros (acima do desejado). Link: [resumo da página]

- Baza Imobiliária — Aquarela das Artes, Sinop
  - Quartos: 3
  - Banheiros: 2
  - Vagas: não especificado (geralmente 2)
  - Observação: informa 3 quartos e 2 banheiros; área não informada no snippet. Link: [resumo da página]

- Kenlo (Aquare