In [1]:
# 1. Importar bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# 2. Carregar o dataset
df = pd.read_csv('defeitos_dataset.csv')

# 3. Separar features (X) e target (y)
X = df.drop('defeituoso', axis=1)
y = df['defeituoso']

# 4. Dividir em treino e teste (70/30)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 5. Treinar o modelo KNN com k=5 usando todas as features
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

# 6. Calcular a acurácia baseline
y_pred = knn.predict(X_test)
baseline_accuracy = accuracy_score(y_test, y_pred)
print(f"Acurácia com todas as features (baseline): {baseline_accuracy:.4f}")

# 7. Fazer ablation study (remoção de uma feature por vez)
ablation_results = {}

for feature in X.columns:
    print(f"\nRemovendo feature: {feature}")
    
    # Remove a feature
    X_temp = X.drop(columns=[feature])

    # Divide novamente
    X_train_temp, X_test_temp, y_train_temp, y_test_temp = train_test_split(X_temp, y, test_size=0.3, random_state=42)

    # Treina o modelo
    knn_temp = KNeighborsClassifier(n_neighbors=5)
    knn_temp.fit(X_train_temp, y_train_temp)

    # Avalia acurácia
    y_pred_temp = knn_temp.predict(X_test_temp)
    acc = accuracy_score(y_test_temp, y_pred_temp)
    ablation_results[feature] = acc
    print(f"Acurácia sem '{feature}': {acc:.4f}")

# 8. Comparar resultados
print("\n--- Comparação das Acurácias ---")
print(f"Baseline (todas as features): {baseline_accuracy:.4f}")
for feat, acc in ablation_results.items():
    diff = baseline_accuracy - acc
    print(f"Sem '{feat}': {acc:.4f} | Diferença: {diff:.4f}")

Acurácia com todas as features (baseline): 0.8333

Removendo feature: temperatura
Acurácia sem 'temperatura': 0.8333

Removendo feature: pressao
Acurácia sem 'pressao': 0.8333

Removendo feature: velocidade
Acurácia sem 'velocidade': 0.8333

Removendo feature: vibracao
Acurácia sem 'vibracao': 0.8333

Removendo feature: umidade
Acurácia sem 'umidade': 0.8222

--- Comparação das Acurácias ---
Baseline (todas as features): 0.8333
Sem 'temperatura': 0.8333 | Diferença: 0.0000
Sem 'pressao': 0.8333 | Diferença: 0.0000
Sem 'velocidade': 0.8333 | Diferença: 0.0000
Sem 'vibracao': 0.8333 | Diferença: 0.0000
Sem 'umidade': 0.8222 | Diferença: 0.0111
