In [1]:
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import f1_score

# 1. Simulando um conjunto de dados (como se fossem features radiômicos extraídos de MRI)
X, y = make_classification(n_samples=500, n_features=20, n_informative=10, 
                           n_redundant=5, random_state=42)

# Introduzindo variabilidade artificial (como diferentes intensidades de scanners)
rng = np.random.RandomState(42)
scaling_factors = rng.normal(loc=1.0, scale=0.5, size=X.shape[1])
X_noisy = X * scaling_factors

# Dividindo em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_noisy, y, test_size=0.3, random_state=42)

# 2. Modelo SEM normalização
clf_raw = SVC()
clf_raw.fit(X_train, y_train)
y_pred_raw = clf_raw.predict(X_test)
f1_raw = f1_score(y_test, y_pred_raw)

# 3. Modelo COM normalização (Z-score)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

clf_scaled = SVC()
clf_scaled.fit(X_train_scaled, y_train)
y_pred_scaled = clf_scaled.predict(X_test)
f1_scaled = f1_score(y_test, y_pred_scaled)

# 4. Resultados
print(f"F1-score sem normalização: {f1_raw:.3f}")
print(f"F1-score com Z-score normalization: {f1_scaled:.3f}")


F1-score sem normalização: 0.931
F1-score com Z-score normalization: 0.812
