In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

def treinar_avaliar_knn(random_state):
    X = vinhos.drop('classe', axis=1)
    y = vinhos['classe']
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=random_state)

    resultados = {}

    knn3 = KNeighborsClassifier(n_neighbors=3)
    knn3.fit(X_train, y_train)
    y_pred_3 = knn3.predict(X_test)
    accuracy_3 = accuracy_score(y_test, y_pred_3)
    resultados['k=3'] = accuracy_3

    knn5 = KNeighborsClassifier(n_neighbors=5)
    knn5.fit(X_train, y_train)
    y_pred_5 = knn5.predict(X_test)
    accuracy_5 = accuracy_score(y_test, y_pred_5)
    resultados['k=5'] = accuracy_5

    return resultados

random_states = [42, 17, 24]
resultados_finais = {}

for state in random_states:
    resultados_finais[state] = treinar_avaliar_knn(state)

resultados_df = pd.DataFrame(resultados_finais).T
print("Resultados de Acurácia com Diferentes Valores de Random States e K:")
print(resultados_df)

melhor_config = resultados_df.idxmax().to_dict()
print("\nMelhor Configuração:")
for k, state in melhor_config.items():
    print(f"Para {k}, random_state = {state} com acurácia = {resultados_df.loc[state, k]:.4f}")


Resultados de Acurácia com Diferentes Valores de Random States e K:
         k=3       k=5
42  0.740741  0.740741
17  0.648148  0.666667
24  0.740741  0.666667

Melhor Configuração:
Para k=3, random_state = 42 com acurácia = 0.7407
Para k=5, random_state = 42 com acurácia = 0.7407
