<a href="https://colab.research.google.com/github/Valeram12/neural-networks/blob/main/lab5/lab5.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, Flatten
from tensorflow.keras.datasets import fashion_mnist
from tensorflow.keras.optimizers import Adam

# Завантаження даних
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0  # нормалізація

# Функція для створення моделі з параметрами
def create_model(input_neurons, hidden_layers, hidden_neurons, epochs, batch_size):
    model = Sequential()
    model.add(Flatten(input_shape=(28, 28)))  # перетворює 28x28 пікселів в 784-елементний вектор

    # Вхідний шар
    model.add(Dense(input_neurons, activation='relu'))

    # Приховані шари
    for _ in range(hidden_layers):
        model.add(Dense(hidden_neurons, activation='relu'))

    # Вихідний шар
    model.add(Dense(10, activation='softmax'))  # 10 класів

    # Компіляція моделі
    model.compile(optimizer=Adam(), loss='sparse_categorical_crossentropy', metrics=['accuracy'])

    # Навчання моделі
    model.fit(x_train, y_train, epochs=epochs, batch_size=batch_size, validation_data=(x_test, y_test))

    # Оцінка моделі
    test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
    print(f'Test accuracy: {test_acc}')

# Використання різної кількості нейронів на вхідному шарі
for input_neurons in [400, 600, 800, 1200]:
    print(f"Testing with {input_neurons} input neurons")
    create_model(input_neurons, hidden_layers=1, hidden_neurons=300, epochs=5, batch_size=100)

# Додавання прихованого шару з різною кількістю нейронів
for hidden_neurons in [200, 300, 400, 600, 800]:
    print(f"Testing with hidden layer of {hidden_neurons} neurons")
    create_model(input_neurons=784, hidden_layers=1, hidden_neurons=hidden_neurons, epochs=5, batch_size=100)

# Додавання кількох прихованих шарів
for layers in [1, 2, 3]:
    print(f"Testing with {layers} hidden layers")
    create_model(input_neurons=784, hidden_layers=layers, hidden_neurons=300, epochs=5, batch_size=100)

# Використання різної кількості епох
for epoch_count in [10, 15, 20, 25, 30]:
    print(f"Testing with {epoch_count} epochs")
    create_model(input_neurons=784, hidden_layers=1, hidden_neurons=300, epochs=epoch_count, batch_size=100)

# Використання різних розмірів міні-вибірки
for batch_size in [10, 50, 100, 200, 500]:
    print(f"Testing with batch size of {batch_size}")
    create_model(input_neurons=784, hidden_layers=1, hidden_neurons=300, epochs=5, batch_size=batch_size)


Testing with 400 input neurons
Epoch 1/5
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 10ms/step - accuracy: 0.7836 - loss: 0.6171 - val_accuracy: 0.8544 - val_loss: 0.4028
Epoch 2/5
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 12ms/step - accuracy: 0.8649 - loss: 0.3657 - val_accuracy: 0.8658 - val_loss: 0.3745
Epoch 3/5
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 10ms/step - accuracy: 0.8846 - loss: 0.3157 - val_accuracy: 0.8758 - val_loss: 0.3516
Epoch 4/5
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 10ms/step - accuracy: 0.8902 - loss: 0.2971 - val_accuracy: 0.8762 - val_loss: 0.3376
Epoch 5/5
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m7s[0m 12ms/step - accuracy: 0.8996 - loss: 0.2702 - val_accuracy: 0.8692 - val_loss: 0.3678
313/313 - 1s - 3ms/step - accuracy: 0.8692 - loss: 0.3678
Test accuracy: 0.8691999912261963
Testing with 600 input neurons
Epoch 1/5
[1m600/600[0m [32m━━━━

KeyboardInterrupt: 

При 600 нейронах модель має достатню кількість параметрів для ефективного навчання, але не настільки багато, щоб виникло перенавчання. Якщо нейронів більше (800 або 1200), мережа може почати захоплювати більше шуму або незначні особливості даних, що може погіршити здатність до генералізації.

 Кількість нейронів у прихованому шарі впливає на здатність моделі вивчати складні взаємозв'язки у даних. При 600 нейронах модель має достатньо параметрів для представлення складних залежностей, що покращує її здатність узагальнювати на нові дані. Менша кількість нейронів може не вистачати для повного захоплення складних особливостей, а надмірна кількість (800) може призвести до перенавчання.

Збільшення кількості прихованих шарів також може привести до перенавчання моделі і зменшення її якості.

Збільшення епох позитивно впливає на точність моделі.

In [3]:
for batch_size in [10, 50, 100, 200, 500]:
    print(f"Testing with batch size of {batch_size}")
    create_model(input_neurons=784, hidden_layers=1, hidden_neurons=300, epochs=5, batch_size=batch_size)

Testing with batch size of 10
Epoch 1/5
[1m6000/6000[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m66s[0m 11ms/step - accuracy: 0.7899 - loss: 0.5811 - val_accuracy: 0.8469 - val_loss: 0.4164
Epoch 2/5
[1m6000/6000[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m66s[0m 11ms/step - accuracy: 0.8648 - loss: 0.3664 - val_accuracy: 0.8458 - val_loss: 0.4135
Epoch 3/5
[1m6000/6000[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m81s[0m 11ms/step - accuracy: 0.8764 - loss: 0.3356 - val_accuracy: 0.8646 - val_loss: 0.3705
Epoch 4/5
[1m6000/6000[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m68s[0m 11ms/step - accuracy: 0.8838 - loss: 0.3131 - val_accuracy: 0.8667 - val_loss: 0.3709
Epoch 5/5
[1m6000/6000[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m78s[0m 11ms/step - accuracy: 0.8911 - loss: 0.2939 - val_accuracy: 0.8811 - val_loss: 0.3495
313/313 - 1s - 3ms/step - accuracy: 0.8811 - loss: 0.3495
Test accuracy: 0.8810999989509583
Testing with batch size of 50
Epoch 1/5
[1m1200/1200


Результати з різними розмірами batch size показують, що невеликий розмір вибірки, наприклад, 10, дає хорошу точність, але збільшує час навчання, тоді як великі вибірки, такі як 500 у них час на кожну ітерацію значно зменшується, а модель навчається менш деталізовано. Самою оптимальноє вибіркою є 100 -
оптимальний баланс між точністю і часом. Модель навчається швидше, ніж з міні-вибіркою 10, але зберігає хорошу точність.

# Найкращий результат
Найкращий результат можна отримати при таких параметрах :

input_neurons=600,

 hidden_layers=2,

  hidden_neurons=300,
  
   epochs=13,
   
   batch_size=100

In [11]:
    create_model(input_neurons=600, hidden_layers=2, hidden_neurons=300, epochs=13, batch_size=100)

Epoch 1/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m13s[0m 19ms/step - accuracy: 0.7806 - loss: 0.6196 - val_accuracy: 0.8491 - val_loss: 0.4177
Epoch 2/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 17ms/step - accuracy: 0.8676 - loss: 0.3616 - val_accuracy: 0.8605 - val_loss: 0.3817
Epoch 3/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m10s[0m 17ms/step - accuracy: 0.8803 - loss: 0.3233 - val_accuracy: 0.8645 - val_loss: 0.3719
Epoch 4/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m21s[0m 18ms/step - accuracy: 0.8872 - loss: 0.2990 - val_accuracy: 0.8779 - val_loss: 0.3346
Epoch 5/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m11s[0m 18ms/step - accuracy: 0.8954 - loss: 0.2794 - val_accuracy: 0.8773 - val_loss: 0.3498
Epoch 6/13
[1m600/600[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m20s[0m 17ms/step - accuracy: 0.9030 - loss: 0.2586 - val_accuracy: 0.8815 - val_loss: 0.3330
Epoch 7/13
[1m6