In [1]:
# Importação das bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# URL do dataset Wine
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

# Carregando o dataset
vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

# Função para realizar treinamento e avaliação do KNN com diferentes random_state e valores de k
def avalia_knn(random_state):
    # Separação dos dados em treino e teste
    X = vinhos.drop(columns=['classe'])
    y = vinhos['classe']
    X_train, X_test, y_train, y_test = train_test_split(
        X, y, test_size=0.3, random_state=random_state
    )

    # Lista de valores de k
    valores_k = [3, 5]
    resultados = {}

    for k in valores_k:
        # Treinamento do modelo
        knn = KNeighborsClassifier(n_neighbors=k)
        knn.fit(X_train, y_train)

        # Previsões e avaliação
        y_pred = knn.predict(X_test)
        accuracy = accuracy_score(y_test, y_pred)
        resultados[k] = accuracy

    return resultados

# Valores de random_state a serem avaliados
random_states = [42, 17, 24]
resultados_finais = {}

# Avaliação para cada random_state
for rs in random_states:
    print(f"Avaliando com random_state={rs}...")
    resultados = avalia_knn(random_state=rs)
    resultados_finais[rs] = resultados
    for k, acc in resultados.items():
        print(f"k={k}, Acurácia={acc:.4f}")

# Análise final dos resultados
print("\nResumo dos resultados:")
for rs, res in resultados_finais.items():
    print(f"Random State {rs}: {res}")

melhor_configuracao = max(
    ((rs, k, acc) for rs, res in resultados_finais.items() for k, acc in res.items()),
    key=lambda x: x[2]
)
print(
    f"\nA melhor configuração foi: random_state={melhor_configuracao[0]}, "
    f"k={melhor_configuracao[1]}, com acurácia={melhor_configuracao[2]:.4f}"
)


Avaliando com random_state=42...
k=3, Acurácia=0.7407
k=5, Acurácia=0.7407
Avaliando com random_state=17...
k=3, Acurácia=0.6481
k=5, Acurácia=0.6667
Avaliando com random_state=24...
k=3, Acurácia=0.7407
k=5, Acurácia=0.6667

Resumo dos resultados:
Random State 42: {3: 0.7407407407407407, 5: 0.7407407407407407}
Random State 17: {3: 0.6481481481481481, 5: 0.6666666666666666}
Random State 24: {3: 0.7407407407407407, 5: 0.6666666666666666}

A melhor configuração foi: random_state=42, k=3, com acurácia=0.7407
