# 💡 Prática: Sistema RAG — Busca Semântica Manual

**Objetivo**: Implementar um sistema Retrieval-Augmented Generation (RAG), realizando busca semântica com cálculo direto de similaridade em NumPy.

### 📦 Parte 1 – Instalação e Importação de Bibliotecas

Execute para instalar as bibliotecas necessárias.

In [None]:
import sys
!{sys.executable} -m pip install sentence-transformers
!{sys.executable} -m pip install transformers

import numpy as np
from sentence_transformers import SentenceTransformer
from transformers import pipeline

### 📚 Parte 2 – Corpus

Base de conhecimento sobre Redes de Computadores para consulta.

In [None]:
corpus = [
    "O modelo OSI possui sete camadas, cada uma com responsabilidades distintas.",
    "A camada de transporte é responsável pela entrega fim a fim e controle de fluxo.",
    "O protocolo IP é usado para roteamento de pacotes entre redes.",
    "Firewalls monitoram e controlam o tráfego de entrada e saída de uma rede.",
    "DNS é um sistema de nomes que traduz nomes de domínio em endereços IP.",
    "O protocolo TCP garante a entrega confiável e ordenada dos dados.",
    "A camada de enlace detecta e corrige erros de transmissão no nível de quadros.",
    "Switches operam na camada de enlace e roteadores na camada de rede.",
    "A camada de aplicação lida com protocolos como HTTP, FTP e SMTP.",
    "O endereço MAC é atribuído a interfaces de rede e é único para cada dispositivo."
]

### 🧠 Parte 3 – Geração dos Embeddings

Usaremos o modelo `all-MiniLM-L6-v2` para transformar os textos do corpus em vetores.

🟨 **Preencha o espaço para gerar os embeddings dos documentos**.

In [None]:
model = SentenceTransformer("all-MiniLM-L6-v2")

corpus_embeddings = model.encode(____, convert_to_numpy=True)  # Preencha o ___

### 🔍 Parte 4 – Busca Semântica Manual

Função para calcular similaridade coseno entre a pergunta e os documentos para encontrar os mais relevantes.

In [None]:
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))


def buscar_documentos(pergunta, k=3):
    pergunta_emb = model.encode([pergunta], convert_to_numpy=True)[0]
    similaridades = [cosine_similarity(pergunta_emb, doc_emb) for doc_emb in corpus_embeddings]
    indices_ordenados = np.argsort(similaridades)[::-1]
    return [corpus[i] for i in indices_ordenados[:k]]

In [None]:
buscar_documentos("Como funciona o protocolo TCP?")

### ✍️ Parte 5 – Geração de Resposta com GPT-2

Usaremos o modelo GPT-2 para gerar uma resposta baseada na pergunta e nos documentos mais relevantes.

🟨 Código pronto, apenas entenda como funciona.

In [None]:
gerador = pipeline("text-generation", model="gpt2")

def responder(pergunta):
    trechos = buscar_documentos(pergunta)
    contexto = " ".join(trechos)
    prompt = f"Contexto: {contexto}\n\nPergunta: {pergunta}\nResposta:"
    resposta = gerador(prompt, max_new_tokens=100)[0]["generated_text"]
    return resposta

In [None]:
responder("Qual a função do protocolo IP?")

### ✅ Parte 6 – Tarefa dos Alunos

- Preencha os campos em branco.
- Teste a função `responder` com perguntas:
  - "O que faz a camada de aplicação?"
  - "Qual a função da camada de transporte?"
  - "O que é um firewall?"

In [None]:
responder("O que faz a camada de aplicação?")
responder("Qual a função da camada de transporte?")
responder("O que é um firewall?")

### 🧠 Questões para refletir

1. Como o contexto influencia a qualidade da geração da resposta?
4. O que aconteceria se usássemos outro modelo de geração no lugar do GPT-2?

### 🎯 Conclusão

Você implementou um sistema RAG simples que faz busca semântica usando NumPy para calcular similaridades. Esse método funciona para bases pequenas e ajuda a entender o funcionamento do RAG.