In [3]:
# Importação das bibliotecas necessárias
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# 1. Carregamento dos Dados
# URL do dataset Wine
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

# Ler o arquivo CSV com as colunas especificadas, definindo a coluna 'classe' como object
vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

# Separar as features e o target
X = vinhos.drop('classe', axis=1)
y = vinhos['classe']

# Função para treinar e avaliar o modelo
def treinar_avaliar_knn(X, y, k, random_state):
    # Divisão dos dados em treino e teste (70% treino, 30% teste)
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=random_state)

    # Treinamento do modelo KNN com k vizinhos
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)

    # Previsão e cálculo da acurácia
    y_pred = knn.predict(X_test)
    accuracy = accuracy_score(y_test, y_pred)

    return accuracy

# Definindo os valores de k e random_state para os experimentos
ks = [3, 5]
random_states = [42, 17, 24]

# Dicionário para armazenar os resultados
resultados = {}

# Realizando os experimentos
for random_state in random_states:
    print(f'\nRandom State: {random_state}')
    for k in ks:
        accuracy = treinar_avaliar_knn(X, y, k, random_state)
        resultados[(k, random_state)] = accuracy
        print(f'  k = {k} -> Acurácia: {accuracy:.4f}')

# Comparação Final
melhor_configuracao = max(resultados, key=resultados.get)
print(f'\nMelhor configuração: k = {melhor_configuracao[0]}, random_state = {melhor_configuracao[1]}')
print(f'Acurácia da melhor configuração: {resultados[melhor_configuracao]:.4f}')



Random State: 42
  k = 3 -> Acurácia: 0.7407
  k = 5 -> Acurácia: 0.7407

Random State: 17
  k = 3 -> Acurácia: 0.6481
  k = 5 -> Acurácia: 0.6667

Random State: 24
  k = 3 -> Acurácia: 0.7407
  k = 5 -> Acurácia: 0.6667

Melhor configuração: k = 3, random_state = 42
Acurácia da melhor configuração: 0.7407
