# Modelos

## LLMs

Modelos de Linguagem Grande (LLMs, na sigla em inglês) são um componente central do LangChain. O LangChain não fornece seus próprios LLMs, mas sim oferece uma interface padrão para interagir com diversos LLMs diferentes. Para ser específico, essa interface é uma que recebe como entrada uma string e retorna uma string.

Existem muitos provedores de LLMs (OpenAI, Cohere, Hugging Face, etc) - a classe LLM é projetada para fornecer uma interface padrão para todos eles.

In [4]:
from langchain_openai import OpenAI

llm = OpenAI(model='gpt-3.5-turbo-instruct')

### Chamando a llm

In [6]:
pergunta = 'Conte uma história breve sobre a jornada de aprender a programar'
resposta = llm.invoke(pergunta)
print(resposta)



Era uma vez um jovem curioso e sempre em busca de novos desafios. Ele sempre se interessou por tecnologia e desde cedo sonhava em criar seus próprios jogos e aplicativos. Porém, não sabia por onde começar.

Um dia, esse jovem ouviu falar sobre programação e como ela era a base de tudo que ele admirava no mundo da tecnologia. Decidiu então embarcar em uma jornada de aprendizado.

No começo, tudo parecia muito complicado e confuso. Ele não entendia nada de códigos e ficava frustrado por não conseguir realizar suas ideias. Mas com determinação e muita paciência, ele começou a estudar e praticar diariamente.

Ao longo dos meses, o jovem foi se aperfeiçoando e entendendo melhor os conceitos da programação. Ele descobriu que não se tratava apenas de escrever linhas de códigos, mas sim de resolver problemas e criar soluções.

Com o tempo, ele foi se envolvendo em projetos e desafios cada vez mais complexos e seu conhecimento foi crescendo exponencial


### Chamando com stream de resposta

In [3]:
pergunta = 'Conte uma história breve sobre a jornada de aprender a programar'
for trecho in llm.stream(pergunta):
    print(trecho, end='')



Era uma vez uma jovem chamada Sofia que sempre foi fascinada por tecnologia e computadores. Desde criança, ela passava horas navegando na internet e jogando jogos online. Mas um dia, ela percebeu que queria fazer mais do que apenas usar as tecnologias criadas por outras pessoas, ela queria ser capaz de criar suas próprias aplicações e programas.

Decidida a aprender a programar, Sofia se matriculou em um curso básico de programação. No começo, ela ficou um pouco intimidada com todas aquelas linhas de código e com a complexidade dos comandos. Mas com determinação e muita prática, ela foi superando os desafios e aprendendo aos poucos.

Ao longo da jornada, Sofia descobriu que a programação exigia muito mais do que apenas habilidades técnicas. Era preciso ter paciência, criatividade e uma boa dose de resiliência para enfrentar os erros e bugs que surgiam pelo caminho.

Com o passar do tempo, Sofia foi se aperfeiçoando e se apaixonando cada vez mais pela programação. El

### Chamadas simultâneas

In [9]:
perguntas = [
    'O que é o céu?',
    'O que é a terra?',
    'O que são as estrelas?'
]

for resposta in llm.batch(perguntas):
    print(resposta)



O céu é uma região do espaço que pode ser vista a partir da superfície da Terra e que abrange todas as estrelas, planetas e outros corpos celestes visíveis a olho nu. É também conhecido como a abóbada celeste ou firmamento. O céu é considerado um lugar divino em muitas religiões e crenças, onde se acredita que as almas dos mortos vão após a morte. Também é frequentemente associado à ideia de paz, beleza e eternidade. No entanto, cientificamente, o céu é apenas a atmosfera da Terra, composta por gases, nuvens e outros elementos que formam o clima e a meteorologia. 


A terra é o terceiro planeta do sistema solar, localizado a uma distância média de 149,6 milhões de quilômetros do sol. É o único planeta conhecido até o momento que possui condições favoráveis para a existência de vida, devido à sua atmosfera, água líquida em sua superfície e uma diversidade de organismos vivos. A terra é composta por camadas geológicas, como a crosta, o manto e o núcleo, e possui um diâmetro de cerca de

## ChatModels

ChatModels são um componente central do LangChain.

Um modelo de chat é um modelo de linguagem que utiliza mensagens de chat como entradas e retorna mensagens de chat como saídas (ao invés de usar texto puro).

O LangChain possui integrações com vários provedores de modelos (OpenAI, Cohere, Hugging Face, etc.) e expõe uma interface padrão para interagir com todos esses modelos.

In [10]:
from langchain_openai import ChatOpenAI

chat = ChatOpenAI(model='gpt-4.1')

In [17]:
from langchain_core.messages import HumanMessage, SystemMessage

mensagens = [
    SystemMessage(content='Você é uma professora de LLM muito simpática, que explica para quem não é da área.'),
    HumanMessage(content='O que é transformer?')
]
resposta = chat.invoke(mensagens)

In [18]:
print(resposta.content)

Ótima pergunta! Vou te explicar de uma forma simples:

**Transformer** é uma arquitetura de inteligência artificial criada em 2017, muito usada para entender e gerar textos – como eu estou fazendo agora 😊.

Antes dos Transformers, os modelos antigos liam um texto palavra por palavra, na ordem certinha, o que dificultava entender relações de palavras que estavam longe uma da outra na frase.

O Transformer tem uma ideia brilhante: ele olha para todas as palavras do texto ao mesmo tempo e tenta entender como elas se relacionam, mesmo as que estão distantes! Isso é feito com uma técnica chamada **atenção** ("attention", em inglês).

**Por exemplo:**  
Se você lê a frase “O João foi ao parque porque ele queria brincar”, o modelo precisa entender que “ele” se refere ao “João”. Os Transformers são muito bons nisso!

**Por que ele ficou famoso?**
- Ele permite treinar modelos enormes, como o ChatGPT e o Google Translate.
- Consegue lidar com textos longos e complexos.
- Funciona não só com tex

In [19]:
resposta.response_metadata

{'token_usage': {'completion_tokens': 303,
  'prompt_tokens': 36,
  'total_tokens': 339,
  'completion_tokens_details': {'accepted_prediction_tokens': 0,
   'audio_tokens': 0,
   'reasoning_tokens': 0,
   'rejected_prediction_tokens': 0},
  'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}},
 'model_name': 'gpt-4.1-2025-04-14',
 'system_fingerprint': 'fp_b38e740b47',
 'id': 'chatcmpl-BYfAcQ6q8xHDep3xXqq6HzEonqmpU',
 'service_tier': 'default',
 'finish_reason': 'stop',
 'logprobs': None}

In [20]:
from langchain_core.messages import HumanMessage, SystemMessage

mensagens = [
    SystemMessage(content='Você é um assistente que conta piadas.'),
    HumanMessage(content='Quanto é 1 + 1?')
]
for trecho in chat.stream(mensagens):
    print(trecho.content, end='')

1 + 1 é 2… Exceto quando estão apaixonados, aí viram 1 só! 😄

Existem 5 tipos diferentes de mensagens:

- `HumanMessage`: Isso representa uma mensagem do usuário. Geralmente consiste apenas de conteúdo.

- `AIMessage`: Isso representa uma mensagem do modelo. Pode ter additional_kwargs incluídos - por exemplo, tool_calls se estiver usando chamadas de ferramentas da OpenAI.

- `SystemMessage`: Isso representa uma mensagem do sistema, que indica ao modelo como se comportar. Geralmente consiste apenas de conteúdo. Nem todo modelo suporta isso.

- `FunctionMessage`: Isso representa o resultado de uma chamada de função. Além do papel e conteúdo, esta mensagem tem um parâmetro de nome que transmite o nome da função que foi chamada para produzir este resultado.

- `ToolMessage`: Isso representa o resultado de uma chamada de ferramenta. Isso é distinto de uma Mensagem de Função a fim de corresponder aos tipos de mensagens de função e ferramenta da OpenAI. Além do papel e conteúdo, esta mensagem tem um parâmetro tool_call_id que transmite o id da chamada à ferramenta que foi feita para produzir este resultado.