# Modelos Fundacionais

Modelos de linguagem (LLMs) são redes neurais treinadas em grandes volumes de texto que aprenderam a gerar e compreender linguagem natural. Na prática, interagimos com eles por meio de **chat models**, que recebem mensagens e retornam respostas.

O LangChain oferece uma interface unificada para trabalhar com modelos de diferentes provedores (OpenAI, Anthropic, Google, etc.) sem precisar mudar a estrutura do código. Isso é feito por meio da funcao `init_chat_model`, que inicializa qualquer modelo de chat a partir do nome.

In [1]:
from dotenv import load_dotenv

load_dotenv()

True

## Inicializando um modelo

In [2]:
from langchain.chat_models import init_chat_model

model = init_chat_model(model="gpt-4.1-nano")

A funcao `init_chat_model` identifica automaticamente o provedor com base no nome do modelo. No caso de `gpt-4.1-nano`, ele sabe que pertence a OpenAI.

Para enviar uma mensagem ao modelo, usamos o metodo `.invoke()`, que recebe um texto (ou uma lista de mensagens) e retorna um objeto de resposta.

In [3]:
resposta = model.invoke("Qual o maior estado do Brasil em extensao territorial?")

In [4]:
resposta

AIMessage(content='O maior estado do Brasil em extensão territorial é o Amazonas.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 12, 'prompt_tokens': 18, 'total_tokens': 30, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14', 'system_fingerprint': 'fp_336de151a4', 'id': 'chatcmpl-DCtAXLfZqh9YSRze6PlQSVVDeWsy6', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='lc_run--019c914e-a864-7dd0-9482-a59230870a5e-0', tool_calls=[], invalid_tool_calls=[], usage_metadata={'input_tokens': 18, 'output_tokens': 12, 'total_tokens': 30, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

O objeto retornado e do tipo `AIMessage`. Ele contem o texto da resposta em `.content`, alem de metadados sobre a chamada.

In [5]:
print(resposta.content)

O maior estado do Brasil em extensão territorial é o Amazonas.


## Metadados da resposta

Cada chamada ao modelo retorna metadados uteis, como o modelo usado, a quantidade de tokens consumidos e o motivo pelo qual a geracao parou. Essas informacoes sao importantes para monitorar custos e entender o comportamento do modelo.

In [6]:
from pprint import pprint

pprint(resposta.response_metadata)

{'finish_reason': 'stop',
 'id': 'chatcmpl-DCtAXLfZqh9YSRze6PlQSVVDeWsy6',
 'logprobs': None,
 'model_name': 'gpt-4.1-nano-2025-04-14',
 'model_provider': 'openai',
 'service_tier': 'default',
 'system_fingerprint': 'fp_336de151a4',
 'token_usage': {'completion_tokens': 12,
                 'completion_tokens_details': {'accepted_prediction_tokens': 0,
                                               'audio_tokens': 0,
                                               'reasoning_tokens': 0,
                                               'rejected_prediction_tokens': 0},
                 'prompt_tokens': 18,
                 'prompt_tokens_details': {'audio_tokens': 0,
                                           'cached_tokens': 0},
                 'total_tokens': 30}}


## Parametros do modelo

Ao inicializar o modelo, podemos passar parametros adicionais que alteram seu comportamento. O mais comum e a **temperature**, que controla a aleatoriedade das respostas:

- `temperature=0` gera respostas mais deterministicas e previsveis
- `temperature=1` ou acima gera respostas mais criativas e variadas

Para tarefas objetivas (extracao de dados, classificacao), prefira temperatura baixa. Para tarefas criativas (geracao de texto, brainstorming), use temperatura mais alta.

In [7]:
model = init_chat_model(
    model="gpt-4.1-nano",
    temperature=0
)

resposta = model.invoke("Me conta uma curiosidade sobre Brasilia.")
print(resposta.content)

Claro! Uma curiosidade interessante sobre Brasília é que ela foi planejada e construída em apenas cerca de três anos, de 1956 a 1960, para ser a nova capital do Brasil. O projeto foi elaborado pelo arquiteto Oscar Niemeyer e pelo urbanista Lúcio Costa, e a cidade foi inaugurada oficialmente em 21 de abril de 1960. Brasília é considerada uma das maiores obras de arquitetura moderna do mundo e foi reconhecida como Patrimônio Mundial pela UNESCO em 1987 devido ao seu planejamento urbano inovador e arquitetura única.


In [8]:
model = init_chat_model(
    model="gpt-4.1-nano",
    temperature=1.5
)

resposta = model.invoke("Me conta uma curiosidade sobre Brasilia.")
print(resposta.content)

Claro! Uma curiosidade interessante sobre Brasília é que ela foi diferente de muitas capitais, pois foi planejada e construída do zero — sua construção começou em 1956, e altura de 1960 já servia como nova capital do Brasil. Francisco Netto Stein criou o projeto urbanístico, que inclui formidáveis abertas e discard útil para refletir progresso, modernidade e unziunidade composta.tar foto!


## Trocando de provedor

Uma das grandes vantagens do LangChain e a **intercambiabilidade de provedores**. O mesmo codigo funciona com OpenAI, Anthropic, Google e dezenas de outros provedores. Basta mudar o nome do modelo.

In [9]:
model = init_chat_model(model="claude-sonnet-4-20250514")

resposta = model.invoke("Qual o maior estado do Brasil em extensao territorial?")
print(resposta.content)

O maior estado do Brasil em extensão territorial é o **Amazonas**, com aproximadamente 1.570.745,68 km².

O Amazonas ocupa cerca de 18,4% de todo o território brasileiro e é maior que muitos países. Para ter uma ideia da dimensão, ele é maior que países como Peru, Colômbia e até mesmo maior que a soma de vários países europeus.

Em segundo lugar vem o Pará, com cerca de 1.247.689 km², seguido pelo Mato Grosso em terceiro.


Observe que nao mudamos nada na estrutura do codigo. Apenas trocamos o nome do modelo de `gpt-4.1-nano` para `claude-sonnet-4-20250514`, e o LangChain cuidou de usar o provedor correto (Anthropic) automaticamente.

A lista completa de provedores e modelos suportados esta na documentacao: https://docs.langchain.com/oss/python/integrations/chat

## Modelos vs. Agentes

Ate agora usamos o modelo diretamente com `init_chat_model`. Isso e util para chamadas simples, mas no mundo real queremos mais: ferramentas, memoria, system prompts, output estruturado.

Para isso, o LangChain oferece a funcao `create_agent`, que cria um **agente** a partir de um modelo. Um agente e um sistema que pode:

- Receber instrucoes via system prompt
- Usar ferramentas (tools) para executar acoes
- Manter memoria entre interacoes
- Decidir autonomamente quando e quais ferramentas usar

Na pratica, o agente usa o modelo como seu "cerebro", mas adiciona capacidades extras em torno dele.

In [10]:
from langchain.agents import create_agent

agente = create_agent(model="gpt-4.1-nano")

A interface do agente e diferente do modelo. Em vez de receber uma string diretamente, o agente espera um dicionario com a chave `messages`, contendo uma lista de objetos de mensagem.

In [11]:
from langchain.messages import HumanMessage

pergunta = HumanMessage(content="Quem projetou Brasilia?")

resposta = agente.invoke(
    {"messages": [pergunta]}
)

In [12]:
pprint(resposta)

{'messages': [HumanMessage(content='Quem projetou Brasilia?', additional_kwargs={}, response_metadata={}, id='4928b2be-1647-4e5a-833c-cf5c18395e3d'),
              AIMessage(content='Brasília foi projetada pelo arquiteto brasileiro Lúcio Costa, que elaborou o plano piloto da cidade, e pelo arquiteto e urbanista Oscar Niemeyer, responsável pelos principais edifícios e monumentos. A concepção e o planejamento da cidade também envolveram o esforço de uma equipe de especialistas e engenheiros, mas Lúcio Costa e Oscar Niemeyer são os principais nomes associados ao projeto de Brasília.', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 86, 'prompt_tokens': 13, 'total_tokens': 99, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_provider': 'openai', 'model_name': 'gpt-4.1-nano-2025-04-14'

A resposta do agente e um dicionario contendo a chave `messages`, que e uma lista com todas as mensagens da conversa, tanto as enviadas quanto as recebidas. A ultima mensagem e sempre a resposta do agente.

In [13]:
print(resposta["messages"][-1].content)

Brasília foi projetada pelo arquiteto brasileiro Lúcio Costa, que elaborou o plano piloto da cidade, e pelo arquiteto e urbanista Oscar Niemeyer, responsável pelos principais edifícios e monumentos. A concepção e o planejamento da cidade também envolveram o esforço de uma equipe de especialistas e engenheiros, mas Lúcio Costa e Oscar Niemeyer são os principais nomes associados ao projeto de Brasília.


## Historico manual de mensagens

Podemos simular uma conversa passando manualmente uma lista de mensagens alternando entre `HumanMessage` (usuario) e `AIMessage` (modelo). Isso permite dar contexto ao agente sobre o que ja foi conversado.

In [14]:
from langchain.messages import AIMessage

resposta = agente.invoke(
    {"messages": [
        HumanMessage(content="Quem projetou Brasilia?"),
        AIMessage(content="Brasilia foi projetada pelo urbanista Lucio Costa, com edificios desenhados por Oscar Niemeyer."),
        HumanMessage(content="Em que ano ela foi inaugurada?"),
    ]}
)

print(resposta["messages"][-1].content)

Brasília foi inaugurada em 21 de abril de 1960.


## Streaming

Em aplicacoes reais, esperamos que a resposta apareca token a token, como acontece no ChatGPT. Isso e chamado de **streaming** e melhora a experiencia do usuario, pois ele comeca a ler a resposta enquanto ela ainda esta sendo gerada.

No LangChain, usamos o metodo `.stream()` do agente com `stream_mode="messages"`. Cada iteracao retorna um token e seus metadados.

In [15]:
for token, metadata in agente.stream(
    {"messages": [HumanMessage(content="Me fale sobre a historia de Santos Dumont em 3 paragrafos.")]},
    stream_mode="messages"
):
    if token.content:
        print(token.content, end="", flush=True)

Alberto Santos Dumont, conhecido como o "Pai da Aviação", nasceu em 20 de julho de 1873, em Palmira, atualmente município de Santos Dumont, em Minas Gerais. Desde cedo, demonstrou grande interesse por invenções e pelo avanço tecnológico, dedicando-se ao estudo do funcionamento de máquinas e ao desenvolvimento de projetos aeronáuticos. Sua paixão o levou a experimentar diversos protótipos de balões e dirigíveis, culminando na criação de veículos capazes de voar de forma controlada, um marco importante na história da aviação.

Nos anos 1906 e 1907, Santos Dumont realizou feitos que conquistaram reconhecimento mundial, incluindo o voo do 14-bis, na então França. Em 23 de outubro de 1906, na manhã de domingo, ele realizou o primeiro voo registrado oficialmente com um aparelho mais pesado que o ar, percorrendo aproximadamente 60 metros no Campo de Bagatelle, em Paris. Esse voo é considerado por muitos como o primeiro a ocorrer de forma realmente controlada e sustentável, marcando um avanço 