In [1]:
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler
from tensorflow.keras.datasets import fashion_mnist

# Carregando o conjunto de dados
(X_train, y_train), (X_test, y_test) = fashion_mnist.load_data()

# Redimensionando os dados de entrada
X_train = X_train.reshape(X_train.shape[0], -1)
X_test = X_test.reshape(X_test.shape[0], -1)

# Normalizando os dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Dividindo o conjunto de treinamento em treinamento, validação e teste (70%, 10%, 20%)
X_train, X_val, y_train, y_val = train_test_split(X_train, y_train, test_size=0.3, random_state=42)

best_accuracy = 0.0
best_k = None
best_distance = None

for k in range(1, 31):
    for distance in ['euclidean', 'manhattan', 'chebyshev']:
        # Criação do classificador KNN
        knn = KNeighborsClassifier(n_neighbors=k, metric=distance)
        
        # Treinamento do classificador
        knn.fit(X_train, y_train)
        
        # Previsões no conjunto de validação
        y_pred = knn.predict(X_val)
        
        # Avaliação da acurácia
        accuracy = accuracy_score(y_val, y_pred)
        
        # Verificação se essa configuração é a melhor até agora
        if accuracy > best_accuracy:
            best_accuracy = accuracy
            best_k = k
            best_distance = distance

# Treinamento final com a melhor configuração
knn = KNeighborsClassifier(n_neighbors=best_k, metric=best_distance)
knn.fit(X_train, y_train)

# Previsões no conjunto de teste
y_pred_test = knn.predict(X_test)

# Avaliação da acurácia no conjunto de teste
accuracy_test = accuracy_score(y_test, y_pred_test)

print("Melhor valor de k:", best_k)
print("Melhor função de distância:", best_distance)
print("Acurácia no conjunto de teste:", accuracy_test)


Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/train-images-idx3-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-labels-idx1-ubyte.gz
Downloading data from https://storage.googleapis.com/tensorflow/tf-keras-datasets/t10k-images-idx3-ubyte.gz
Melhor valor de k: 9
Melhor função de distância: manhattan
Acurácia no conjunto de teste: 0.8515
