# Aula 1: Arquitetura RAG na Pr√°tica com Gemini

## O que vamos aprender:
- Como o RAG resolve problemas reais dos LLMs
- Diferen√ßas pr√°ticas entre RAG e prompting tradicional
- Primeiros passos com LangChain e Google Gemini
- Como carregar e processar documentos PDF

### Por que RAG √© essencial no mercado?
1. **Dados sempre atualizados** - Sem retreinar modelos
2. **Respostas verific√°veis** - Com fontes de informa√ß√£o
3. **Custo otimizado** - Evita fine-tuning caro
4. **Aplica√ß√µes reais**: Chatbots de suporte, an√°lise de documentos, assistentes internos

## 0. Configura√ß√£o do Ambiente

Primeiro, vamos instalar as bibliotecas necess√°rias. Usaremos:
- `langchain` e `langchain-google-genai` para interagir com o Gemini.
- `pypdf` para ler o conte√∫do do nosso arquivo PDF.


In [1]:
!pip install langchain langchain-google-genai==2.0.5 google-generativeai pypdf
!pip install langchain-community

Collecting langchain-google-genai==2.0.5
  Downloading langchain_google_genai-2.0.5-py3-none-any.whl.metadata (3.6 kB)
Collecting langchain-core<0.4,>=0.3.15 (from langchain-google-genai==2.0.5)
  Downloading langchain_core-0.3.81-py3-none-any.whl.metadata (3.2 kB)
INFO: pip is looking at multiple versions of langchain to determine which version is compatible with other requirements. This could take a while.
Collecting langchain
  Downloading langchain-1.1.3-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.1.2-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.1.1-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.1.0-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.0.8-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.0.7-py3-none-any.whl.metadata (4.9 kB)
  Downloading langchain-1.0.6-py3-none-any.whl.metadata (4.9 kB)
INFO: pip is still looking at multiple versions of langchain to determine which version is compatible with other

- Onde obter chave google: https://aistudio.google.com/apikey

In [2]:
import os

os.environ['GOOGLE_API_KEY'] = '...'

## 1. Prompting Tradicional vs RAG - Compara√ß√£o Pr√°tica

Vamos ver na pr√°tica a diferen√ßa entre usar apenas um LLM (prompting tradicional) e usar RAG.

In [16]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain_core.prompts import ChatPromptTemplate

llm = ChatGoogleGenerativeAI(model="gemini-2.5-flash", temperature = 0)

In [17]:
# EXEMPLO 1: Prompting Tradicional (sem RAG)

pergunta = "Qual √© a pol√≠tica de home office da nossa empresa?"

prompt_tradicional = ChatPromptTemplate.from_template(
    "Responda a seguinte pergunta: {pergunta}"
)

In [18]:
chain_tradicional = prompt_tradicional | llm

resposta_tradicional = chain_tradicional.invoke({"pergunta": pergunta})

In [19]:
print(resposta_tradicional.content)

Como sou uma intelig√™ncia artificial e n√£o tenho acesso √†s pol√≠ticas internas espec√≠ficas da sua empresa, n√£o consigo te dar a resposta exata.

No entanto, posso te explicar os tipos comuns de pol√≠ticas de home office que as empresas adotam hoje em dia, para que voc√™ tenha uma ideia do que procurar:

1.  **Totalmente Remoto (Full Remote):** Todos os colaboradores trabalham de casa permanentemente, independentemente da fun√ß√£o. A empresa pode ter um escrit√≥rio f√≠sico, mas ele n√£o √© o local principal de trabalho.
2.  **H√≠brido (Hybrid):** Esta √© a modalidade mais comum atualmente e pode ter v√°rias varia√ß√µes:
    *   **Dias Fixos:** Os colaboradores t√™m dias espec√≠ficos da semana para ir ao escrit√≥rio (ex: ter√ßas e quintas) e os demais dias trabalham de casa.
    *   **Dias Flex√≠veis:** Os colaboradores precisam cumprir um n√∫mero m√≠nimo de dias no escrit√≥rio por m√™s ou semana, mas podem escolher quais dias.
    *   **Baseado em Equipe:** Cada equipe ou departame

-----
## OBS: O que √© esse | ?

O operador `|` em Python, nesse contexto com **LangChain**, √© uma **forma elegante de compor etapas de uma cadeia (chain)** de execu√ß√£o, como se fosse um **"pipeline"**.

### ‚úÖ Significado pr√°tico no LangChain:

```python
chain = prompt | llm
```

Esse c√≥digo cria uma **cadeia (chain)** onde:

* O `prompt` √© executado primeiro,
* E o resultado (texto formatado com as vari√°veis) √© enviado diretamente para o `llm` (modelo de linguagem, como o Gemini),
* Retornando a **resposta gerada**.

-------

## Carregando nosso Documento
Agora, em vez de simular o documento, vamos carregar o `politica_home_office.pdf` que est√° na mesma pasta.

In [None]:
from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader("politica_home_office.pdf")

documento = loader.load()

In [None]:
documento

[Document(metadata={'producer': 'ReportLab PDF Library - www.reportlab.com', 'creator': '(unspecified)', 'creationdate': '2025-07-07T09:42:25-03:00', 'author': '(anonymous)', 'keywords': '', 'moddate': '2025-07-07T09:42:25-03:00', 'subject': '(unspecified)', 'title': '(anonymous)', 'trapped': '/False', 'source': 'politica_home_office.pdf', 'total_pages': 1, 'page': 0, 'page_label': '1'}, page_content="Pol√≠tica de Trabalho Remoto e H√≠brido\nVers√£o 2.1 - Atualizada em Janeiro 2024\n1. Objetivo\nEsta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando\npromover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e\ncolabora√ß√£o.\n2. Elegibilidade\nTodos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e\ncujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho\nh√≠brido. A aprova√ß√£o final est√° sujeita ao acordo com o gestor

In [None]:
contexto_empresa = documento[0].page_content

In [None]:
contexto_empresa

"Pol√≠tica de Trabalho Remoto e H√≠brido\nVers√£o 2.1 - Atualizada em Janeiro 2024\n1. Objetivo\nEsta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando\npromover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e\ncolabora√ß√£o.\n2. Elegibilidade\nTodos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e\ncujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho\nh√≠brido. A aprova√ß√£o final est√° sujeita ao acordo com o gestor direto.\n3. Modalidade e Hor√°rio\n3.1. Modelo H√≠brido: A modalidade padr√£o √© h√≠brida, compreendendo 3 (tr√™s) dias de trabalho\nremoto (home office) e 2 (dois) dias de trabalho presencial no escrit√≥rio, por semana.\n3.2. Dias Presenciais: Os dias de trabalho presencial ser√£o definidos em comum acordo entre a\nequipe e o gestor, priorizando as ter√ßas-feiras para reuni√µes de alinhamento geral 

In [None]:
print(contexto_empresa[:500] + "...")

Pol√≠tica de Trabalho Remoto e H√≠brido
Vers√£o 2.1 - Atualizada em Janeiro 2024
1. Objetivo
Esta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando
promover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e
colabora√ß√£o.
2. Elegibilidade
Todos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e
cujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho...


In [None]:
# Exemplo 2: Com RAG - Usando o contexto do PDF

prompt_rag = ChatPromptTemplate.from_template("""
Use o contexto abaixo para responder a pergunta.
Se n√£o souber a resposta baseado no contexto, diga que n√£o tem a informa√ß√£o.

Contexto: {contexto}
Pergunta: {pergunta}

RespostaResposta:""")

In [None]:
chain_rag = prompt_rag | llm

resposta_rag = chain_rag.invoke({"contexto": contexto_empresa, "pergunta": pergunta})

In [None]:
print(resposta_rag.content)

A pol√≠tica da empresa XYZ n√£o √© especificamente de "home office", mas sim de trabalho h√≠brido.  Funcion√°rios eleg√≠veis trabalham 3 dias remotamente (home office) e 2 dias presencialmente no escrit√≥rio por semana.  A modalidade padr√£o exige a presen√ßa no escrit√≥rio √†s ter√ßas-feiras para reuni√µes de equipe.  Funcion√°rios em tempo integral que completaram o per√≠odo de experi√™ncia de 90 dias e cujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto s√£o eleg√≠veis, mediante aprova√ß√£o do gestor.


## üìö Resumo Pr√°tico da Aula 1

### O que aprendemos:
1. **RAG vs. Prompting Tradicional**: Vimos na pr√°tica como o RAG fornece respostas mais precisas usando dados externos.
2. **LangChain + Gemini**: Configuramos o ambiente para usar os modelos de LLM e Embedding do Google.
3. **Leitura de PDFs**: Aprendemos a carregar o conte√∫do de um documento PDF para usar como contexto.
