In [None]:
import pandas as pd

# URL do dataset Wine
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

# Exibindo as primeiras linhas dos dados
vinhos.head()

from sklearn.model_selection import train_test_split

# Separar as variáveis independentes (X) e dependente (y)
X = vinhos.drop(columns=['classe'])  # Características dos vinhos
y = vinhos['classe']  # Classe dos vinhos

# Dividir os dados em treino e teste (30% para teste)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

print(X_train.shape, X_test.shape)

from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Função para treinar e avaliar o modelo KNN
def treinar_e_avaliar_knn(k, X_train, X_test, y_train, y_test):
    knn = KNeighborsClassifier(n_neighbors=k)
    knn.fit(X_train, y_train)

    # Previsões
    y_pred = knn.predict(X_test)

    # Acurácia
    accuracy = accuracy_score(y_test, y_pred)

    return accuracy

# Avaliar o modelo KNN para k=3
accuracy_k3 = treinar_e_avaliar_knn(3, X_train, X_test, y_train, y_test)
print(f'Acurácia com k=3: {accuracy_k3:.4f}')

# Avaliar o modelo KNN para k=5
accuracy_k5 = treinar_e_avaliar_knn(5, X_train, X_test, y_train, y_test)
print(f'Acurácia com k=5: {accuracy_k5:.4f}')

# Função para dividir os dados com diferentes random_states e avaliar o modelo
def avaliar_com_random_state(random_state, k_values):
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=random_state)

    resultados = {}
    for k in k_values:
        accuracy = treinar_e_avaliar_knn(k, X_train, X_test, y_train, y_test)
        resultados[k] = accuracy

    return resultados

k_values = [3, 5]

# Avaliar para random_state = 17
resultados_17 = avaliar_com_random_state(17, k_values)
print("Resultados com random_state = 17:", resultados_17)

# Avaliar para random_state = 24
resultados_24 = avaliar_com_random_state(24, k_values)
print("Resultados com random_state = 24:", resultados_24)


