In [None]:
from google.colab import drive
drive.mount("/content/gdrive")

In [None]:
def load_mnist(path, kind='train'):
    import os
    import gzip
    import numpy as np

    """Load MNIST data from `path`"""
    labels_path = os.path.join(path,
                               '%s-labels-idx1-ubyte.gz'
                               % kind)
    images_path = os.path.join(path,
                               '%s-images-idx3-ubyte.gz'
                               % kind)

    with gzip.open(labels_path, 'rb') as lbpath:
        labels = np.frombuffer(lbpath.read(), dtype=np.uint8,
                               offset=8)

    with gzip.open(images_path, 'rb') as imgpath:
        images = np.frombuffer(imgpath.read(), dtype=np.uint8,
                               offset=16).reshape(len(labels), 784)

    return images, labels

In [None]:
import matplotlib.pyplot as plt
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import train_test_split

X_train, y_train = load_mnist('/content/gdrive/MyDrive/ML/fashionmnist', kind='train')
X_test, y_test = load_mnist('/content/gdrive/MyDrive/ML/fashionmnist', kind='t10k')

# Pegando 10% dos dados de treino para validação
X_train, X_validation, y_train, y_validation = train_test_split(X_train, y_train, test_size=0.1, random_state=42)

# Métricas e valores para k

In [None]:
k_values = range(1, 30)

accuraciesEuc = []
accuraciesMan = []
accuraciesChe = []

### Treinando o modelo utilizando a metrica = "euclidean"

In [None]:
for k in k_values:
    knn = KNeighborsClassifier(n_neighbors = k, metric = "euclidean")
    knn.fit(X_train, y_train)
    # Avaliando precisão do modelo e atualizando lista de precisão
    score = knn.score(X_validation, y_validation)
    accuraciesEuc.append(score)

# Mostrando a precisão com os dados de validação utilizando um gráfico
plt.plot(k_values, accuraciesEuc, marker = 'o')
plt.xlabel("Valores de K")
plt.ylabel("Precisão")
plt.show()

### Treinando o modelo utilizando a metrica = "manhattan"

In [None]:
for k in k_values:
    knn = KNeighborsClassifier(n_neighbors = k, metric = "manhattan")
    knn.fit(X_train, y_train)
    # Avaliando precisão do modelo e atualizando lista de precisão
    score = knn.score(X_validation, y_validation)
    accuraciesMan.append(score)

# Mostrando a precisão com os dados de validação utilizando um gráfico
plt.plot(k_values, accuraciesMan, marker = 'o')
plt.xlabel("Valores de K")
plt.ylabel("Precisão")
plt.show()

### Treinando o modelo utilizando a metrica = "chebyshev"

In [None]:
for k in k_values:
    knn = KNeighborsClassifier(n_neighbors = k, metric = "chebyshev")
    knn.fit(X_train, y_train)
    # Avaliando precisão do modelo e atualizando lista de precisão
    score = knn.score(X_validation, y_validation)
    accuraciesChe.append(score)

# Mostrando a precisão com os dados de validação utilizando um gráfico
plt.plot(k_values, accuraciesChe, marker = 'o')
plt.xlabel("Valores de K")
plt.ylabel("Precisão")
plt.show()

Encontrando o melhor valor de K e a melhor métrica

In [None]:
import numpy as np

# euclidean melhor K
arr = np.array(accuraciesEuc)
index = arr.argmax() + 1
best = arr[arr.argmax()]
euclidean = ["euclidean", index, best]

# manhattan melhor K
arr = np.array(accuraciesMan)
index = arr.argmax() + 1
best = arr[arr.argmax()]
manhattan = ["manhattan", index, best]

# chebyshev melhor K
arr = np.array(accuraciesChe)
index = arr.argmax() + 1
best = arr[arr.argmax()]
chebyshev = ["chebyshev", index, best]

# Melhor K
maxValue = [euclidean, manhattan, chebyshev]
maxValue.sort(key = lambda x: x[2])
bestKM = maxValue[-1]

Treinando utilizando o melhor k e a melhor métrica

In [None]:
knn = KNeighborsClassifier(n_neighbors = bestKM[1], metric = bestKM[0])
knn.fit(X_train, y_train)
# Avaliando precisão do modelo e atualizando lista de precisão
score = knn.score(X_test, y_test)
print(score)