In [3]:
import pandas as pd

In [4]:
url = 'https://archive.ics.uci.edu/ml/machine-learning-databases/wine/wine.data'

# Nome das colunas em português BR
column_names_pt_br = [
    'classe',
    'alcool',
    'acido_malico',
    'cinzas',
    'alcalinidade_de_cinzas',
    'magnesio',
    'fenois_totais',
    'flavanoides',
    'fenois_nao_flavanoides',
    'proantocianinas',
    'intensidade_de_cor',
    'matiz',
    'od280_od315_de_vinhos_diluidos',
    'prolina'
]

# Ler o arquivo CSV com as colunas especificadas, definindo a coluna 'classe' como object
vinhos = pd.read_csv(url, names=column_names_pt_br, dtype={'classe': object})

In [5]:
from sklearn.model_selection import train_test_split

# Separar as features e a target
X = vinhos.iloc[:, 1:]
y = vinhos['classe']

# Treino (70%) e teste (30%)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Verificar os tamanhos das divisões
print(f"Tamanho de X_train: {X_train.shape}")
print(f"Tamanho de X_test: {X_test.shape}")
print(f"Tamanho de y_train: {y_train.shape}")
print(f"Tamanho de y_test: {y_test.shape}")

Tamanho de X_train: (124, 13)
Tamanho de X_test: (54, 13)
Tamanho de y_train: (124,)
Tamanho de y_test: (54,)


In [6]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score

# Classificador KNN com k=3
knn_k3 = KNeighborsClassifier(n_neighbors=3)
knn_k3.fit(X_train, y_train)
y_pred_k3 = knn_k3.predict(X_test)

# Avaliar o modelo
accuracy_k3 = accuracy_score(y_test, y_pred_k3)
print(f"Acurácia do KNN com k=3: {accuracy_k3:.2f}")

# Classificador KNN com k=5
knn_k5 = KNeighborsClassifier(n_neighbors=5)
knn_k5.fit(X_train, y_train)
y_pred_k5 = knn_k5.predict(X_test)

# Avaliar o modelo
accuracy_k5 = accuracy_score(y_test, y_pred_k5)
print(f"Acurácia do KNN com k=5: {accuracy_k5:.2f}")

# Comparar os resultados
if accuracy_k3 > accuracy_k5:
    print("O modelo com k=3 apresenta melhor desempenho.")
elif accuracy_k5 > accuracy_k3:
    print("O modelo com k=5 apresenta melhor desempenho.")
else:
    print("Ambos os modelos apresentam o mesmo desempenho.")

Acurácia do KNN com k=3: 0.74
Acurácia do KNN com k=5: 0.74
Ambos os modelos apresentam o mesmo desempenho.


In [7]:
# Valores de random_state
random_states = [17, 24]

# Dicionário para armazenar os resultados
results = {}

for state in random_states:
    print(f"\nRandom State: {state}")

    # Divisão dos dados em treino e teste
    X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=state)

    # KNN com k=3
    knn_k3 = KNeighborsClassifier(n_neighbors=3)
    knn_k3.fit(X_train, y_train)
    y_pred_k3 = knn_k3.predict(X_test)
    accuracy_k3 = accuracy_score(y_test, y_pred_k3)
    print(f"Acurácia do KNN com k=3: {accuracy_k3:.2f}")

    # KNN com k=5
    knn_k5 = KNeighborsClassifier(n_neighbors=5)
    knn_k5.fit(X_train, y_train)
    y_pred_k5 = knn_k5.predict(X_test)
    accuracy_k5 = accuracy_score(y_test, y_pred_k5)
    print(f"Acurácia do KNN com k=5: {accuracy_k5:.2f}")

    # Armazenar os resultados no dicionário
    results[state] = {
        "k=3": accuracy_k3,
        "k=5": accuracy_k5
    }

    # Comparação dos desempenhos
    if accuracy_k3 > accuracy_k5:
        print("O modelo com k=3 apresenta melhor desempenho.\n")
    elif accuracy_k5 > accuracy_k3:
        print("O modelo com k=5 apresenta melhor desempenho.\n")
    else:
        print("Ambos os modelos apresentam o mesmo desempenho.\n")

# Exibindo o resumo final dos resultados
print("\nResumo Final:")
for state, accuracies in results.items():
    print(f"Random State: {state}, Acurácia k=3: {accuracies['k=3']:.2f}, Acurácia k=5: {accuracies['k=5']:.2f}")



Random State: 17
Acurácia do KNN com k=3: 0.65
Acurácia do KNN com k=5: 0.67
O modelo com k=5 apresenta melhor desempenho.


Random State: 24
Acurácia do KNN com k=3: 0.74
Acurácia do KNN com k=5: 0.67
O modelo com k=3 apresenta melhor desempenho.


Resumo Final:
Random State: 17, Acurácia k=3: 0.65, Acurácia k=5: 0.67
Random State: 24, Acurácia k=3: 0.74, Acurácia k=5: 0.67


In [8]:
# Comparação final
best_state = None
best_k = None
best_accuracy = 0

print("\n### Comparação Final ###")
for state, accuracies in results.items():
    for k, acc in accuracies.items():
        print(f"Random State: {state}, k={k}, Acurácia: {acc:.2f}")
        if acc > best_accuracy:
            best_accuracy = acc
            best_state = state
            best_k = k

# Melhor configuração
print("\n### Melhor Configuração ###")
print(f"Random State: {best_state}, k={best_k}, Acurácia: {best_accuracy:.2f}")



### Comparação Final ###
Random State: 17, k=k=3, Acurácia: 0.65
Random State: 17, k=k=5, Acurácia: 0.67
Random State: 24, k=k=3, Acurácia: 0.74
Random State: 24, k=k=5, Acurácia: 0.67

### Melhor Configuração ###
Random State: 24, k=k=3, Acurácia: 0.74
