# üí° Pr√°tica: Sistema RAG ‚Äî Busca Sem√¢ntica Manual

**Objetivo**: Implementar um sistema Retrieval-Augmented Generation (RAG), realizando busca sem√¢ntica com c√°lculo direto de similaridade em NumPy.

### üì¶ Parte 1 ‚Äì Instala√ß√£o e Importa√ß√£o de Bibliotecas

Execute para instalar as bibliotecas necess√°rias.

In [None]:
import sys
!{sys.executable} -m pip install sentence-transformers
!{sys.executable} -m pip install transformers

import numpy as np
from sentence_transformers import SentenceTransformer
from transformers import pipeline

### üìö Parte 2 ‚Äì Corpus

Base de conhecimento sobre Redes de Computadores para consulta.

In [None]:
corpus = [
    "O modelo OSI possui sete camadas, cada uma com responsabilidades distintas.",
    "A camada de transporte √© respons√°vel pela entrega fim a fim e controle de fluxo.",
    "O protocolo IP √© usado para roteamento de pacotes entre redes.",
    "Firewalls monitoram e controlam o tr√°fego de entrada e sa√≠da de uma rede.",
    "DNS √© um sistema de nomes que traduz nomes de dom√≠nio em endere√ßos IP.",
    "O protocolo TCP garante a entrega confi√°vel e ordenada dos dados.",
    "A camada de enlace detecta e corrige erros de transmiss√£o no n√≠vel de quadros.",
    "Switches operam na camada de enlace e roteadores na camada de rede.",
    "A camada de aplica√ß√£o lida com protocolos como HTTP, FTP e SMTP.",
    "O endere√ßo MAC √© atribu√≠do a interfaces de rede e √© √∫nico para cada dispositivo."
]

### üß† Parte 3 ‚Äì Gera√ß√£o dos Embeddings

Usaremos o modelo `all-MiniLM-L6-v2` para transformar os textos do corpus em vetores.

üü® **Preencha o espa√ßo para gerar os embeddings dos documentos**.

In [None]:
model = SentenceTransformer("all-MiniLM-L6-v2")

corpus_embeddings = model.encode(____, convert_to_numpy=True)  # Preencha o ___

### üîç Parte 4 ‚Äì Busca Sem√¢ntica Manual

Fun√ß√£o para calcular similaridade coseno entre a pergunta e os documentos para encontrar os mais relevantes.

In [None]:
def cosine_similarity(a, b):
    return np.dot(a, b) / (np.linalg.norm(a) * np.linalg.norm(b))


def buscar_documentos(pergunta, k=3):
    pergunta_emb = model.encode([pergunta], convert_to_numpy=True)[0]
    similaridades = [cosine_similarity(pergunta_emb, doc_emb) for doc_emb in corpus_embeddings]
    indices_ordenados = np.argsort(similaridades)[::-1]
    return [corpus[i] for i in indices_ordenados[:k]]

In [None]:
buscar_documentos("Como funciona o protocolo TCP?")

### ‚úçÔ∏è Parte 5 ‚Äì Gera√ß√£o de Resposta com GPT-2

Usaremos o modelo GPT-2 para gerar uma resposta baseada na pergunta e nos documentos mais relevantes.

üü® C√≥digo pronto, apenas entenda como funciona.

In [None]:
gerador = pipeline("text-generation", model="gpt2")

def responder(pergunta):
    trechos = buscar_documentos(pergunta)
    contexto = " ".join(trechos)
    prompt = f"Contexto: {contexto}\n\nPergunta: {pergunta}\nResposta:"
    resposta = gerador(prompt, max_new_tokens=100)[0]["generated_text"]
    return resposta

In [None]:
responder("Qual a fun√ß√£o do protocolo IP?")

### ‚úÖ Parte 6 ‚Äì Tarefa dos Alunos

- Preencha os campos em branco.
- Teste a fun√ß√£o `responder` com perguntas:
  - "O que faz a camada de aplica√ß√£o?"
  - "Qual a fun√ß√£o da camada de transporte?"
  - "O que √© um firewall?"

In [None]:
responder("O que faz a camada de aplica√ß√£o?")
responder("Qual a fun√ß√£o da camada de transporte?")
responder("O que √© um firewall?")

### üß† Quest√µes para refletir

1. Como o contexto influencia a qualidade da gera√ß√£o da resposta?
4. O que aconteceria se us√°ssemos outro modelo de gera√ß√£o no lugar do GPT-2?

### üéØ Conclus√£o

Voc√™ implementou um sistema RAG simples que faz busca sem√¢ntica usando NumPy para calcular similaridades. Esse m√©todo funciona para bases pequenas e ajuda a entender o funcionamento do RAG.