In [3]:
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Dropout
from keras import metrics
import numpy as np





In [4]:
(train_data, train_labels), (test_data, test_labels) = fashion_mnist.load_data()

train_data = train_data.reshape(60000, 784)
test_data = test_data.reshape(10000, 784)

In [5]:
train_data = train_data / 255.0
test_data = test_data / 255.0

train_data.shape

(60000, 784)

In [6]:
def vectorize_sequences(sequences, dimension=10):
    results = np.zeros((len(sequences), dimension))
    for i, sequence in enumerate(sequences):
        results[i, sequence] = 1.0
    return results

In [7]:
train_labels = vectorize_sequences(train_labels)
test_labels = vectorize_sequences(test_labels)

In [8]:
train_labels[25:28]

array([[0., 0., 0., 1., 0., 0., 0., 0., 0., 0.],
       [1., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
       [0., 0., 1., 0., 0., 0., 0., 0., 0., 0.]])

In [9]:
model = Sequential(
    [
        Dense(750, input_dim=train_data.shape[1], activation="relu"),
        Dense(64, activation="relu"),
        Dropout(0.2),
        Dense(10, activation="softmax"),
    ]
)




In [10]:
model.summary()

Model: "sequential"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense (Dense)               (None, 750)               588750    
                                                                 
 dense_1 (Dense)             (None, 64)                48064     
                                                                 
 dropout (Dropout)           (None, 64)                0         
                                                                 
 dense_2 (Dense)             (None, 10)                650       
                                                                 
Total params: 637464 (2.43 MB)
Trainable params: 637464 (2.43 MB)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________


In [11]:
model.compile(
    optimizer="Adam",
    loss="categorical_crossentropy",
    metrics=["accuracy", metrics.Recall(), metrics.Precision(), metrics.F1Score(),
    ],
)




In [12]:
epochs = 30

In [13]:
history = model.fit(train_data, train_labels, 
                    batch_size=128, 
                    epochs=epochs,
                    validation_split=0.2,
                    verbose=1)

Epoch 1/30


Epoch 2/30
Epoch 3/30
Epoch 4/30
Epoch 5/30
Epoch 6/30
Epoch 7/30
Epoch 8/30
Epoch 9/30
Epoch 10/30
Epoch 11/30
Epoch 12/30
Epoch 13/30
Epoch 14/30
Epoch 15/30
Epoch 16/30
Epoch 17/30
Epoch 18/30
Epoch 19/30
Epoch 20/30
Epoch 21/30
Epoch 22/30
Epoch 23/30
Epoch 24/30
Epoch 25/30
Epoch 26/30
Epoch 27/30
Epoch 28/30
Epoch 29/30
Epoch 30/30


In [20]:
loss = history.history["loss"][epochs-1]
accuracy = history.history["accuracy"][epochs-1]
recall = history.history["recall"][epochs-1]               
presicion = history.history["precision"][epochs-1]                  
f1_score = history.history["f1_score"][epochs-1]
print(f"Функція втрат: {loss:.2f} \nAccuracy: {accuracy*100:.2f}% \nПовнота (recall): {recall:.2f} \nТочність (presicion): {presicion:.2f}") 
print("\nF-міра (міра точності) по класам:")
for i in range(0, 10):
    print(f"class {i+1}: {f1_score[i]:.2f}")

Функція втрат: 0.14 
Accuracy: 94.69% 
Повнота (recall): 0.94 
Точність (presicion): 0.95

F-мера (мера точності) по класам:
class 1: 0.92
class 2: 1.00
class 3: 0.89
class 4: 0.96
class 5: 0.89
class 6: 0.99
class 7: 0.86
class 8: 0.98
class 9: 1.00
class 10: 0.98


In [21]:
loss, accuracy, recall, presicion, f1_score = model.evaluate(
    test_data[-2000:], test_labels[-2000:], verbose=1
)
print(
    f"Метріки, розраховані на тестових даних: \nФункція втрат: {loss:.2f} \nAccuracy: {accuracy*100:.2f}% \nПовнота (recall): {recall:.2f} \nТочність (presicion): {presicion:.2f}"
)

print("\nF-мiра (мiра точності) по класам:")
for i in range(0, 10):
    print(f"class {i+1}: {f1_score[i]:.2f}")

Метріки, розраховані на тестових даних: 
Функція втрат: 0.38 
Accuracy: 90.20% 
Повнота (recall): 0.90 
Точність (presicion): 0.91

F-мера (мера точності) по класам:
class 1: 0.84
class 2: 0.98
class 3: 0.79
class 4: 0.90
class 5: 0.86
class 6: 0.97
class 7: 0.75
class 8: 0.97
class 9: 0.97
class 10: 0.97


Була створена нейронна мережа (модель багатошарового персептрону) на основі датасету fashion_mnist для класифікаціїї зображень одягу. Мережа складається з двох прихованих і одного вихідного шару. Вихідний шар складається з 10 нейронів, що дорівнює кількості класів одягу. В якості функції активації на схованих шарах була використана функція активації relu. Для вихідного шару в якості функції активації була використана функція розподілу ймовірност softmax. В якості функції втрат, як для задачі многокласової класифікації, була використана categorical_crossentropy. В якості оптимізатора був викорастан ADAM оптимізатор.
Для зменьшення перенавчання системи був використан dropout, більш високі результати були досягнуті за рахунок збільшення кількості нейронів і епох.
При розрахунку помітно, що точність на тестових даних меньша, ніж на тренувальних даних. Це відбувається за рахунок того, що модель була навчена на навчальному датасеті train_data. Коли модель працює з зображенями, які вона ніколи не зустрічала (в даному випадку test_data), то її ефективність класифікації трохи знизилася.