# Aula 1: Arquitetura RAG na Pr√°tica com Gemini

## O que vamos aprender:
- Como o RAG resolve problemas reais dos LLMs
- Diferen√ßas pr√°ticas entre RAG e prompting tradicional
- Primeiros passos com LangChain e Google Gemini
- Como carregar e processar documentos PDF

### Por que RAG √© essencial no mercado?
1. **Dados sempre atualizados** - Sem retreinar modelos
2. **Respostas verific√°veis** - Com fontes de informa√ß√£o
3. **Custo otimizado** - Evita fine-tuning caro
4. **Aplica√ß√µes reais**: Chatbots de suporte, an√°lise de documentos, assistentes internos

## 0. Configura√ß√£o do Ambiente

Primeiro, vamos instalar as bibliotecas necess√°rias. Usaremos:
- `langchain` e `langchain-google-genai` para interagir com o Gemini.
- `pypdf` para ler o conte√∫do do nosso arquivo PDF.


In [1]:
!pip install langchain langchain-google-genai pypdf
!pip install langchain-community

Defaulting to user installation because normal site-packages is not writeable
Collecting langchain-google-genai
  Downloading langchain_google_genai-2.1.9-py3-none-any.whl.metadata (7.2 kB)
Collecting filetype<2.0.0,>=1.2.0 (from langchain-google-genai)
  Downloading filetype-1.2.0-py2.py3-none-any.whl.metadata (6.5 kB)
Collecting google-ai-generativelanguage<0.7.0,>=0.6.18 (from langchain-google-genai)
  Downloading google_ai_generativelanguage-0.6.18-py3-none-any.whl.metadata (9.8 kB)
Collecting google-api-core!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,!=2.9.*,<3.0.0,>=1.34.1 (from google-api-core[grpc]!=2.0.*,!=2.1.*,!=2.10.*,!=2.2.*,!=2.3.*,!=2.4.*,!=2.5.*,!=2.6.*,!=2.7.*,!=2.8.*,!=2.9.*,<3.0.0,>=1.34.1->google-ai-generativelanguage<0.7.0,>=0.6.18->langchain-google-genai)
  Downloading google_api_core-2.25.1-py3-none-any.whl.metadata (3.0 kB)
Collecting google-auth!=2.24.0,!=2.25.0,<3.0.0,>=2.14.1 (from google-ai-generativelanguage<0.7.0,>=0.6.

- Onde obter chave google: https://aistudio.google.com/apikey

In [2]:
import os

os.environ['GOOGLE_API_KEY'] = 'AIzaSyAWKKi1WVE7zqtFiVij-sjHsDEvEL_wN6k'

## 1. Prompting Tradicional vs RAG - Compara√ß√£o Pr√°tica

Vamos ver na pr√°tica a diferen√ßa entre usar apenas um LLM (prompting tradicional) e usar RAG.

In [8]:
from langchain_google_genai import ChatGoogleGenerativeAI
from langchain.prompts import ChatPromptTemplate
from langchain_community.chat_models import ChatOllama
from langchain.prompts import ChatPromptTemplate

# llm = ChatGoogleGenerativeAI(model="gemini-1.5-pro-latest", temperature = 0)
llm = ChatOllama(model="mistral", temperature=0)

  llm = ChatOllama(model="mistral", temperature=0)


In [10]:
# EXEMPLO 1: Prompting Tradicional (sem RAG)

pergunta = "Qual √© a pol√≠tica de home office da nossa empresa?"

prompt_tradicional = ChatPromptTemplate.from_template(
    "Responda a seguinte pergunta: {pergunta}"
)

In [14]:
chain_tradicional = prompt_tradicional | llm

resposta_tradicional = chain_tradicional.invoke({"pergunta": pergunta})

In [15]:
print(resposta_tradicional.content)

 A minha resposta √© baseada em informa√ß√µes gerais e n√£o espec√≠ficas para uma empresa em particular. A pol√≠tica de trabalho remoto ou home office varia de empresa para empresa. Algumas empresas permitem que os funcion√°rios trabalhem remotamente por completo, enquanto outras t√™m pol√≠ticas mais restritivas e exigem que os funcion√°rios estejam presentes fisicamente no local de trabalho. √â importante consultar a pol√≠tica oficial da sua empresa para obter informa√ß√µes precisas sobre suas op√ß√µes de trabalho remoto.


-----
## OBS: O que √© esse | ?

O operador `|` em Python, nesse contexto com **LangChain**, √© uma **forma elegante de compor etapas de uma cadeia (chain)** de execu√ß√£o, como se fosse um **"pipeline"**.

### ‚úÖ Significado pr√°tico no LangChain:

```python
chain = prompt | llm
```

Esse c√≥digo cria uma **cadeia (chain)** onde:

* O `prompt` √© executado primeiro,
* E o resultado (texto formatado com as vari√°veis) √© enviado diretamente para o `llm` (modelo de linguagem, como o Gemini),
* Retornando a **resposta gerada**.

-------

## Carregando nosso Documento
Agora, em vez de simular o documento, vamos carregar o `politica_home_office.pdf` que est√° na mesma pasta.

In [16]:
from langchain_community.document_loaders import PyPDFLoader

loader = PyPDFLoader("politica_home_office.pdf")

documento = loader.load()

In [17]:
documento

[Document(metadata={'producer': 'ReportLab PDF Library - www.reportlab.com', 'creator': '(unspecified)', 'creationdate': '2025-07-07T09:42:25-03:00', 'author': '(anonymous)', 'keywords': '', 'moddate': '2025-07-07T09:42:25-03:00', 'subject': '(unspecified)', 'title': '(anonymous)', 'trapped': '/False', 'source': 'politica_home_office.pdf', 'total_pages': 1, 'page': 0, 'page_label': '1'}, page_content="Pol√≠tica de Trabalho Remoto e H√≠brido\nVers√£o 2.1 - Atualizada em Janeiro 2024\n1. Objetivo\nEsta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando\npromover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e\ncolabora√ß√£o.\n2. Elegibilidade\nTodos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e\ncujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho\nh√≠brido. A aprova√ß√£o final est√° sujeita ao acordo com o gestor

In [18]:
contexto_empresa = documento[0].page_content

In [19]:
contexto_empresa

"Pol√≠tica de Trabalho Remoto e H√≠brido\nVers√£o 2.1 - Atualizada em Janeiro 2024\n1. Objetivo\nEsta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando\npromover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e\ncolabora√ß√£o.\n2. Elegibilidade\nTodos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e\ncujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho\nh√≠brido. A aprova√ß√£o final est√° sujeita ao acordo com o gestor direto.\n3. Modalidade e Hor√°rio\n3.1. Modelo H√≠brido: A modalidade padr√£o √© h√≠brida, compreendendo 3 (tr√™s) dias de trabalho\nremoto (home office) e 2 (dois) dias de trabalho presencial no escrit√≥rio, por semana.\n3.2. Dias Presenciais: Os dias de trabalho presencial ser√£o definidos em comum acordo entre a\nequipe e o gestor, priorizando as ter√ßas-feiras para reuni√µes de alinhamento geral 

In [20]:
print(contexto_empresa[:500] + "...")

Pol√≠tica de Trabalho Remoto e H√≠brido
Vers√£o 2.1 - Atualizada em Janeiro 2024
1. Objetivo
Esta pol√≠tica estabelece as diretrizes para o trabalho remoto e h√≠brido na Empresa XYZ, visando
promover a flexibilidade, o bem-estar dos funcion√°rios e a manuten√ß√£o da produtividade e
colabora√ß√£o.
2. Elegibilidade
Todos os funcion√°rios em tempo integral, que completaram o per√≠odo de experi√™ncia de 90 dias e
cujas fun√ß√µes s√£o compat√≠veis com o trabalho remoto, s√£o eleg√≠veis para aderir ao modelo de trabalho...


In [21]:
# Exemplo 2: Com RAG - Usando o contexto do PDF

prompt_rag = ChatPromptTemplate.from_template("""
Use o contexto abaixo para responder a pergunta.
Se n√£o souber a resposta baseado no contexto, diga que n√£o tem a informa√ß√£o.

Contexto: {contexto}
Pergunta: {pergunta}

RespostaResposta:""")

In [22]:
chain_rag = prompt_rag | llm

resposta_rag = chain_rag.invoke({"contexto": contexto_empresa, "pergunta": pergunta})

In [23]:
print(resposta_rag.content)

 A pol√≠tica de trabalho remoto (home office) da Empresa XYZ, conforme estabelecida na vers√£o 2.1 atualizada em Janeiro de 2024, √© que os funcion√°rios eleg√≠veis podem trabalhar em casa por tr√™s dias por semana, enquanto o restante dos dois dias ser√° no escrit√≥rio presencial. A jornada de trabalho de 8 horas di√°rias pode ser cumprida com flexibilidade, iniciando entre 07:00 e 10:00, e o hor√°rio de 'core time', no qual todos devem estar dispon√≠veis online ou no escrit√≥rio, √© das 10:00 √†s 16:00. A Empresa XYZ fornecer√° os equipamentos necess√°rios para a execu√ß√£o do trabalho, incluindo notebook e um aux√≠lio de custo mensal no valor de R$ 150,00 ser√° concedido para cobrir despesas com internet de alta velocidade.


## üìö Resumo Pr√°tico da Aula 1

### O que aprendemos:
1. **RAG vs. Prompting Tradicional**: Vimos na pr√°tica como o RAG fornece respostas mais precisas usando dados externos.
2. **LangChain + Gemini**: Configuramos o ambiente para usar os modelos de LLM e Embedding do Google.
3. **Leitura de PDFs**: Aprendemos a carregar o conte√∫do de um documento PDF para usar como contexto.
