# An치lise de Erros e Matriz de Confus칚o 游댌

Neste notebook, aprofundamos a avalia칞칚o do modelo treinado, identificando Falsos Positivos e Falsos Negativos.

In [None]:
import torch
import pandas as pd
from sklearn.metrics import confusion_matrix, classification_report, ConfusionMatrixDisplay
import matplotlib.pyplot as plt
import sys
import os

sys.path.append(os.path.abspath(".."))
from models.models import CharCNN
from utils.utils import url_to_tensor, VOCAB_SIZE, decode_tensor

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [None]:
# 1. Carregar Modelo Treinado (CNN Exemplo)
MODEL_PATH = "../checkpoints/urlifeguard_cnn.pth"
model = CharCNN(vocab_size=VOCAB_SIZE, num_classes=2).to(device)

if os.path.exists(MODEL_PATH):
    model.load_state_dict(torch.load(MODEL_PATH, map_location=device))
    print("Modelo carregado com sucesso!")
else:
    print("Modelo n칚o encontrado. Treine primeiro!")

In [None]:
# 2. Carregar Dados de Teste
df = pd.read_csv("../data/malicious_phish.csv")
df['label'] = df['type'].apply(lambda x: 0 if x == 'benign' else 1)

# Usar uma amostra para an치lise r치pida
test_sample = df.sample(1000, random_state=99)
urls = test_sample['url'].values
y_true = test_sample['label'].values

In [None]:
# 3. Gerar Predi칞칫es
model.eval()
y_pred = []

with torch.no_grad():
    for url in urls:
        tensor = url_to_tensor(url, max_len=150).unsqueeze(0).to(device)
        output = model(tensor)
        _, predicted = torch.max(output, 1)
        y_pred.append(predicted.item())

In [None]:
# 4. Matriz de Confus칚o e Relat칩rio
print(classification_report(y_true, y_pred, target_names=['Benigno', 'Malicioso']))

cm = confusion_matrix(y_true, y_pred)
disp = ConfusionMatrixDisplay(confusion_matrix=cm, display_labels=['Benigno', 'Malicioso'])
disp.plot(cmap='Blues')
plt.title("Matriz de Confus칚o")
plt.show()

In [None]:
# 5. An치lise de Falhas (Onde o modelo errou?)
test_sample['pred'] = y_pred
errors = test_sample[test_sample['label'] != test_sample['pred']]

print(f"Total de erros na amostra: {len(errors)}")
print("\nExemplos de Falsos Negativos (Era Malicioso, disse Benigno):")
fn = errors[(errors['label'] == 1) & (errors['pred'] == 0)]
display(fn[['url', 'type']].head(10))

print("\nExemplos de Falsos Positivos (Era Benigno, disse Malicioso):")
fp = errors[(errors['label'] == 0) & (errors['pred'] == 1)]
display(fp[['url', 'type']].head(10))