In [6]:
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.feature_selection import SelectKBest, f_classif
import numpy as np

# Carregar o conjunto de dados Iris
iris = load_iris()
X, y = iris.data, iris.target

# Função para calcular a pontuação média da validação cruzada
def evaluate_model(X, y, cv=5):
    model = DecisionTreeClassifier(random_state=42)
    scores = cross_val_score(model, X, y, cv=cv, scoring='accuracy')
    return np.mean(scores), np.std(scores)

# Avaliação do modelo com todas as características
full_feature_score, full_feature_std = evaluate_model(X, y)

# Seleção de características usando k melhores com ANOVA F-test
selector = SelectKBest(f_classif, k=2)  # Vamos escolher as 2 melhores características
X_selected = selector.fit_transform(X, y)

# Avaliação do modelo após a seleção de características
selected_feature_score, selected_feature_std = evaluate_model(X_selected, y)

# Exibir resultados
print(f"Score com todas as características: {full_feature_score} (±{full_feature_std})")
print(f"Score com características selecionadas: {selected_feature_score} (±{selected_feature_std})")


Score com todas as características: 0.9533333333333334 (±0.03399346342395189)
Score com características selecionadas: 0.9600000000000002 (±0.03265986323710903)
