# Experimentos: Baseline com SVM Clássico

Este notebook estabelece baselines de performance com um modelo de Support Vector Machine (SVM) clássico em datasets

In [5]:
from sklearn.datasets import load_breast_cancer # O Scikit-learn já tem o dataset 'Wisconsin Breast Cancer' pronto para usar.
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC  # Importando o SVM Clássico
from sklearn.metrics import classification_report
import numpy as np


## Loading data and initial analysis

In [11]:
X, y = load_breast_cancer(return_X_y=True)  # Carregando o dataset

# Verificando as dimensões dos nossos dados
print(f"Dimensões dos dados: {X.shape}")


# Vendo a distribuição das classes (0 e 1)
print("\nDistribuição das classes:")
# Usando numpy para contar as ocorrências de cada classe
unique, counts = np.unique(y, return_counts=True)
for class_label, count in zip(unique, counts):
    print(f"Classe {class_label}: {count} ocorrências")


Dimensões dos dados: (569, 30)

Distribuição das classes:
Classe 0: 212 ocorrências
Classe 1: 357 ocorrências


## Split data into training and testing sets

In [16]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42, stratify=y) # Stratify -> mantém a proporção das classes no split

print(f"Dimensões do conjunto de treino: {X_train.shape}")
print(f"Dimensões do conjunto de teste: {X_test.shape}")


Dimensões do conjunto de treino: (426, 30)
Dimensões do conjunto de teste: (143, 30)


## Normalize data

In [None]:
# normalizing the data
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)  # Ajusta o scaler e transforma os dados de treino
X_test = scaler.transform(X_test)  # Transforma os dados de teste com o mesmo scaler

print("\nDados normalizados:")






Dados normalizados:
Primeiras 5 amostras do conjunto de treino:
[[ 1.65909581e+00  2.17205449e-01  1.61061990e+00  1.63333853e+00
   5.76311605e-01  5.23544521e-01  6.45326310e-01  1.19874480e+00
  -9.35149071e-05 -1.24425088e-01  4.14312264e-01 -5.97142095e-01
   4.25167885e-01  4.97329621e-01 -6.44904409e-01 -1.38083245e-01
  -6.02764307e-02  1.97953779e-02 -1.15354241e+00 -1.48976771e-01
   1.56731877e+00 -7.58786987e-02  1.60722303e+00  1.38496870e+00
   4.12628434e-01  4.61628950e-01  6.42584428e-01  7.01834827e-01
  -5.56084149e-01  3.88780742e-01]
 [-3.38165388e-01 -1.38996798e+00 -4.01667191e-01 -3.87016967e-01
  -1.98560357e+00 -1.25788628e+00 -8.20499587e-01 -9.49158284e-01
  -1.68412696e+00 -9.64260327e-01 -9.34200568e-01 -1.30786873e+00
  -8.77182308e-01 -6.41787667e-01 -7.60950999e-01 -6.56341150e-01
  -4.87168505e-01 -9.07609237e-01 -5.19211037e-01 -6.10338974e-01
  -5.37720315e-01 -1.61324355e+00 -5.80787585e-01 -5.29159641e-01
  -1.60039981e+00 -8.71595894e-01 -7.26165