# Aula 1

```
Nota: 
$ uv init google-colab
$ cd google-colab/
$ uv venv
$ source .venv/bin/activate
$ code .
$ uv pip install langchain-google-genai google-generativeai
$ uv pip install ipykernel
$ uv pip install jupyter
$ uv pip install python-dotenv
```

In [5]:
import os
from dotenv import load_dotenv
from langchain_google_genai import ChatGoogleGenerativeAI

load_dotenv()

# Acessa a chave da variável de ambiente
gemini_key = os.getenv('GEMINI_API_KEY')

In [6]:
llm = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash",
    temperature = 0,          # Criatividade das respostas (0 a 1) 0 é mais preciso
    api_key=gemini_key
)

In [10]:
resposta  = llm.invoke("Como usar RAG (de IA)? O que eu precisso saber?")
print(resposta.content)

RAG (Retrieval Augmented Generation) é uma técnica poderosa que combina a capacidade de geração de texto de um Large Language Model (LLM) com a capacidade de recuperar informações de uma base de conhecimento externa. Em termos simples, ele permite que um LLM "consulte" documentos específicos antes de responder a uma pergunta, em vez de depender apenas do conhecimento em que foi treinado.

Vamos detalhar o que você precisa saber e como usá-lo.

---

### O que é RAG (Retrieval Augmented Generation)?

**R**etrieval (Recuperação): O sistema busca informações relevantes em uma base de dados externa (seus documentos, artigos, FAQs, etc.).
**A**ugmented (Aumentada): As informações recuperadas são adicionadas à sua pergunta original, "aumentando" o prompt.
**G**eneration (Geração): O LLM usa este prompt aumentado (sua pergunta + contexto recuperado) para gerar uma resposta mais precisa e fundamentada.

**Por que RAG é importante?**

1.  **Reduz Alucinações:** LLMs podem "inventar" fatos. RAG o

In [9]:
resposta  = llm.invoke("Me explique como se eu tivesse 8 anos, como se pode dar exemplos usando Few-shot")
print(resposta.content)

Oi! Imagina que você tem um amigo muito, muito esperto, tipo um robô super inteligente, mas ele não sabe *tudo* ainda.

**Normalmente, para aprender algo novo,** ele precisa ver um montão de exemplos. Tipo, se você quer que ele saiba o que é um cachorro, você mostra 100 fotos de cachorros diferentes: um grande, um pequeno, um peludo, um sem pelo... e aí ele aprende.

**Mas o Few-shot é diferente!** É como se fosse uma mágica para aprender super rápido!

Imagina que eu te mostro um bichinho de pelúcia que você nunca viu na vida. Eu digo: "Olha, esse aqui é um **Fuzzy-Wuzzy**!"

*   Eu te mostro **UM** Fuzzy-Wuzzy. (Só um!)
*   Aí eu te mostro **OUTRO** Fuzzy-Wuzzy, um pouquinho diferente, e digo: "Esse também é um Fuzzy-Wuzzy!" (Agora você viu **DOIS**!)

E pronto! Só com esses dois exemplos, se eu te mostrar uma foto de um monte de bichinhos e perguntar: "Qual desses é um Fuzzy-Wuzzy?", você provavelmente vai saber!

**Você aprendeu o que é um Fuzzy-Wuzzy com *pouquinhos* exemplos!** N

In [11]:
resposta  = llm.invoke("Exemplifique pra mim, um exemplo usando Few-shot, para que meu agente de IA aprenda a descobrir " \
                       "câmeras online que tenham visão para o Rio Jaguarão, somente online, na qual se possa ter uma " \
                       "noção do nivel das águas do Rio Jaguarão, na fronteira com Uruguai")
print(resposta.content)

Com certeza! O Few-shot learning é uma técnica poderosa para guiar um agente de IA com poucos exemplos, sem a necessidade de um treinamento massivo.

Vamos criar um exemplo para o seu agente de IA aprender a encontrar câmeras online do Rio Jaguarão.

---

**Contexto:** Você tem um agente de IA baseado em um Large Language Model (LLM) que pode processar texto, realizar buscas na internet e extrair informações.

**Objetivo:** Ensinar o agente a encontrar câmeras online do Rio Jaguarão, na fronteira com o Uruguai, com o propósito de verificar o nível das águas.

---

### Exemplo de Few-Shot Prompt para seu Agente de IA

```
// INSTRUÇÃO DO SISTEMA (System Prompt)
// Esta parte define o papel e as capacidades do seu agente.
Você é um agente de IA especializado em encontrar câmeras online (webcams, streams, etc.) que mostrem rios específicos, com foco em monitoramento de nível de água ou condições gerais. Sua tarefa é pesquisar na internet e fornecer links diretos ou descrições de como aces

In [13]:
resposta  = llm.invoke("Então RAG e 'Retrieval-Argumented Generation' são a mesma coisa (um é abreviação da outra) ?")
print(resposta.content)

Sim, **exatamente!**

**RAG** é a abreviação (o acrônimo) de **Retrieval-Augmented Generation**.

São a mesma coisa. "RAG" é a forma curta e comumente usada para se referir à técnica completa de "Retrieval-Augmented Generation".

É como dizer "IA" para "Inteligência Artificial" ou "LLM" para "Large Language Model". A abreviação é a forma mais prática e difundida de se referir ao conceito.


In [14]:
resposta  = llm.invoke("Me explique de forma simples, a diferença de Prompt (ou Prompt do usuário), e Prompt do Sistema")
print(resposta.content)

Vamos simplificar isso com uma analogia!

Imagine que você está conversando com uma pessoa.

---

### 1. Prompt do Usuário (ou Prompt)

*   **O que é:** É **o que você digita** para a inteligência artificial. É a sua pergunta, o seu pedido, a sua instrução direta.
*   **Função:** Dizer à IA *o que* você quer que ela faça ou responda.
*   **Analogia:** É como **você falando diretamente com a pessoa**.
    *   *Exemplo:* "Olá, você pode me dar 5 ideias de nomes para um cachorro?"
    *   *Exemplo:* "Me explique a teoria da relatividade de forma simples."
    *   *Exemplo:* "Escreva um e-mail de agradecimento para um cliente."

---

### 2. Prompt do Sistema

*   **O que é:** É uma **instrução "invisível"** que é dada à inteligência artificial *antes* que ela veja o seu prompt. É como um "manual de instruções" ou um "briefing" para a IA sobre como ela deve se comportar.
*   **Função:** Definir o "papel", a "personalidade", o "tom", as "regras" ou as "restrições" que a IA deve seguir ao res

In [7]:
TRIAGEM_PROMPT = (
    "Você é um triador de Service Desk para políticas internas da empresa Carraro Desenvolvimento. "
    "Dada a mensagem do usuário, retorne SOMENTE um JSON com:\n"
    "{\n"
    '  "decisao": "AUTO_RESOLVER" | "PEDIR_INFO" | "ABRIR_CHAMADO",\n'
    '  "urgencia": "BAIXA" | "MEDIA" | "ALTA",\n'
    '  "campos_faltantes": ["..."]\n'
    "}\n"
    "Regras:\n"
    '- **AUTO_RESOLVER**: Perguntas claras sobre regras ou procedimentos descritos nas políticas (Ex: "Posso reembolsar a internet do meu home office?", "Como funciona a política de alimentação em viagens?").\n'
    '- **PEDIR_INFO**: Mensagens vagas ou que faltam informações para identificar o tema ou contexto (Ex: "Preciso de ajuda com uma política", "Tenho uma dúvida geral").\n'
    '- **ABRIR_CHAMADO**: Pedidos de exceção, liberação, aprovação ou acesso especial, ou quando o usuário explicitamente pede para abrir um chamado (Ex: "Quero exceção para trabalhar 5 dias remoto.", "Solicito liberação para anexos externos.", "Por favor, abra um chamado para o RH.").'
    "Analise a mensagem e decida a ação mais apropriada."
)

In [8]:
from pydantic import BaseModel, Field
from typing import Literal, List, Dict

class TriagemOutput(BaseModel):
    decisao: Literal["AUTO_RESOLVER", "PEDIR_INFO", "ABRIR_CHAMADO"]
    urgencia: Literal["BAIXA", "MEDIA", "ALTA"]
    campos_faltantes: List[str] = Field(default_factory=list)  

In [9]:
llm_triagem = ChatGoogleGenerativeAI(
    model="gemini-2.5-flash",
    temperature = 0,          # Criatividade das respostas (0 a 1) 0 é mais preciso
    api_key=gemini_key
)

In [10]:
from langchain_core.messages import HumanMessage, SystemMessage

triagem_chain = llm_triagem.with_structured_output(TriagemOutput)

def triagem(mensagem: str) -> Dict:
    saida: TriagemOutput = triagem_chain.invoke([
        SystemMessage(content=TRIAGEM_PROMPT),
        HumanMessage(content=mensagem)
    ])
    return saida.model_dump()

In [11]:
testes = ["Posso reembolsar a internet?",
          "Quero mais 5 dias de trabalho remoto. Como Faço?",
          "Quantas capivaras tem no rio pinheiros?"
    ] 

In [12]:
for msg in testes:
    resultado = triagem(msg)
    print(f"Mensagem: {msg}\nResultado: {resultado}\n") 

Mensagem: Posso reembolsar a internet?
Resultado: {'decisao': 'AUTO_RESOLVER', 'urgencia': 'BAIXA', 'campos_faltantes': []}

Mensagem: Quero mais 5 dias de trabalho remoto. Como Faço?
Resultado: {'decisao': 'ABRIR_CHAMADO', 'urgencia': 'MEDIA', 'campos_faltantes': []}

Mensagem: Quantas capivaras tem no rio pinheiros?
Resultado: {'decisao': 'PEDIR_INFO', 'urgencia': 'BAIXA', 'campos_faltantes': ['contexto_da_politica']}

