In [1]:
# Importa as bibliotecas necessárias
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, mean_squared_error
from sklearn.model_selection import cross_val_score
import numpy as np

# Função para avaliar o modelo com diferentes protocolos experimentais
def avaliar_modelo(modelo, X, y, protocolo):
    if protocolo == 'resubstituicao':
        # Avaliação por resubstituição
        y_pred = modelo.predict(X)
        acuracia = accuracy_score(y, y_pred)
        return acuracia
    elif protocolo == 'holdout':
        # Avaliação por holdout
        X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42, stratify=y)
        modelo.fit(X_train, y_train)
        y_pred = modelo.predict(X_test)
        acuracia = accuracy_score(y_test, y_pred)
        return acuracia
    elif protocolo == 'validacao_cruzada':
        # Avaliação por validação cruzada
        acuracias_cv = cross_val_score(modelo, X, y, cv=5, scoring='accuracy')
        return np.mean(acuracias_cv)

# Carrega o conjunto de dados Iris
iris = load_iris()
X = iris.data
y = iris.target

# Divide os dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42, stratify=y)

# Cria um modelo de Árvore de Decisão
modelo_dt = DecisionTreeClassifier()

# Cria um modelo KNN
modelo_knn = KNeighborsClassifier(n_neighbors=3)

# Treina o modelo Árvore de Decisão no conjunto de treinamento
modelo_dt.fit(X_train, y_train)

# Treina o modelo KNN no conjunto de treinamento
modelo_knn.fit(X_train, y_train)

# Avaliar modelos usando diferentes protocolos experimentais
acuracia_resubstituicao_dt = avaliar_modelo(modelo_dt, X, y, 'resubstituicao')
acuracia_holdout_dt = avaliar_modelo(modelo_dt, X, y, 'holdout')
acuracia_cv_dt = avaliar_modelo(modelo_dt, X, y, 'validacao_cruzada')

acuracia_resubstituicao_knn = avaliar_modelo(modelo_knn, X, y, 'resubstituicao')
acuracia_holdout_knn = avaliar_modelo(modelo_knn, X, y, 'holdout')
acuracia_cv_knn = avaliar_modelo(modelo_knn, X, y, 'validacao_cruzada')

# Imprimir resultados
print("Árvore de Decisão:")
print(f"Acurácia (Resubstituição): {acuracia_resubstituicao_dt * 100:.2f}%")
print(f"Acurácia (Holdout): {acuracia_holdout_dt * 100:.2f}%")
print(f"Acurácia (Validação Cruzada): {acuracia_cv_dt * 100:.2f}%")
print("\n")
print("KNN:")
print(f"Acurácia (Resubstituição): {acuracia_resubstituicao_knn * 100:.2f}%")
print(f"Acurácia (Holdout): {acuracia_holdout_knn * 100:.2f}%")
print(f"Acurácia (Validação Cruzada): {acuracia_cv_knn * 100:.2f}%")

Árvore de Decisão:
Acurácia (Resubstituição): 99.33%
Acurácia (Holdout): 93.33%
Acurácia (Validação Cruzada): 96.67%


KNN:
Acurácia (Resubstituição): 96.00%
Acurácia (Holdout): 100.00%
Acurácia (Validação Cruzada): 96.67%
