# 📊 Cálculo de Métricas de Avaliação + Preparação do Dataset

Este notebook demonstra:
1. Como **dividir o dataset em treino/validação** com `scripts/split_dataset.py`
2. Como utilizar o módulo `metrics.py` (em `src/`) para calcular e visualizar métricas.

Funções disponíveis em `src/metrics.py`:
- `calcular_metricas()` → Acurácia, Precisão, Recall e F1
- `exibir_metricas()` → Exibe métricas formatadas
- `plotar_matriz_confusao()` → Gera matriz de confusão visual
- `gerar_relatorio()` → Relatório detalhado por classe

In [1]:
# Instalação de dependências
!pip install -r ../requirements.txt

## 🔹 Preparação do Dataset
Supondo que suas imagens e labels estejam em `dataset/raw/images` e `dataset/raw/labels`,
vamos usar o script `scripts/split_dataset.py` para organizar automaticamente em treino e validação.

In [2]:
# Executa a divisão do dataset em treino e validação
!python ../scripts/split_dataset.py \
    --images_dir ../dataset/raw/images \
    --labels_dir ../dataset/raw/labels \
    --output_dir ../dataset \
    --split_ratio 0.8 \
    --seed 42

## 🔹 Importando módulo de métricas
Agora vamos trabalhar com `src/metrics.py` para calcular e exibir métricas.

In [3]:
import numpy as np
from src.metrics import calcular_metricas, exibir_metricas, plotar_matriz_confusao, gerar_relatorio

## 🔹 Simulação de previsões de um modelo
Para demonstração, vamos criar valores reais (`y_true`) e previstos (`y_pred`) fictícios.
Em um caso real, eles viriam do seu modelo de Machine Learning.

In [4]:
y_true = np.array([0, 1, 1, 0, 1, 0, 1, 1, 0, 0])
y_pred = np.array([0, 0, 1, 0, 1, 1, 1, 1, 0, 0])
labels = ["Classe 0", "Classe 1"]

## 📈 Cálculo das métricas principais

In [5]:
metrics = calcular_metricas(y_true, y_pred)
exibir_metricas(metrics)

## 📊 Matriz de Confusão

In [6]:
plotar_matriz_confusao(y_true, y_pred, labels=labels)

## 📑 Relatório Detalhado

In [7]:
gerar_relatorio(y_true, y_pred, target_names=labels)