In [61]:
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from keras import metrics
import numpy as np


In [62]:
(train_data, train_labels), (test_data, test_labels) = fashion_mnist.load_data()

train_data = train_data.reshape(60000, 784)
test_data = test_data.reshape(10000, 784)

In [63]:
train_data = train_data / 255.0 
test_data = test_data / 255.0 

train_data[23]

array([0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.        ,
       0.        , 0.        , 0.        , 0.        , 0.     

In [64]:
def vectorize_sequences(sequences, dimension=10):
    results = np.zeros((len(sequences), dimension))
    for i, sequence in enumerate(sequences):
        results[i, sequence] = 1.0
    return results

In [65]:
train_labels = vectorize_sequences(train_labels)
test_labels = vectorize_sequences(test_labels)

In [50]:
train_labels[25:28]

array([[0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.]])

In [71]:
model = Sequential(
    [
        Dense(750, input_dim=train_data.shape[1], activation="relu"),
        Dense(64, activation="relu"),
        Dropout(0.2),
        Dense(10, activation="softmax"),
    ]
)

In [72]:
model.summary()

Model: "sequential_8"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_24 (Dense)            (None, 750)               588750    
                                                                 
 dense_25 (Dense)            (None, 64)                48064     
                                                                 
 dropout_8 (Dropout)         (None, 64)                0         
                                                                 
 dense_26 (Dense)            (None, 10)                650       
                                                                 
Total params: 637464 (2.43 MB)
Trainable params: 637464 (2.43 MB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [73]:
model.compile(
    optimizer="Adam",
    loss="categorical_crossentropy",
    metrics=["accuracy", metrics.Recall(), metrics.Precision(), metrics.F1Score(),
    ],
)

In [74]:
history = model.fit(train_data, train_labels, 
                    batch_size=128, 
                    epochs=30,
                    validation_split=0.2,
                    verbose=1)

Epoch 1/30
Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


In [79]:
scores = model.evaluate(test_data[-2000:], test_labels[-2000:], verbose=1)



Була створена нейронна мережа (модель багатошарового персептрону) на основі датасету fashion_mnist для класифікаціїї зображень одягу. Мережа складається з двох прихованих і одного вихідного шару. Вихідний шар складається з 10 нейронів, що дорівнює кількості класів одягу. В якості функції активації на схованих шарах була використана функція активації relu. Для вихідного шару в якості функції активації була використана функція розподілу ймовірност softmax. В якості функції втрат, як для задачі многокласової класифікації, була використана categorical_crossentropy. В якості оптимізатора був викорастан ADAM оптимізатор.
Для зменьшення перенавчання системи був використан dropout, більш високі результати були досягнуті за рахунок збільшення кількості нейронів і епох.
При розрахунку помітно, що точність на тестових даних меньша, ніж на тренувальних даних. Це відбувається за рахунок того, що модель була навчена на навчальному датасеті train_data. Коли модель працює з зображенями, які вона ніколи не зустрічала (в даному випадку test_data), то її ефективність класифікації трохи знизилася.