In [11]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Dense, Dropout, Activation, Flatten, Conv2D, MaxPooling2D, BatchNormalization
import os

In [12]:
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
y_train = tf.keras.utils.to_categorical(y_train, 10)
y_test = tf.keras.utils.to_categorical(y_test, 10)
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

In [9]:
model = Sequential([
    Conv2D(32, (3, 3), activation='selu', input_shape=(32, 32, 3)),
    BatchNormalization(),
    MaxPooling2D((2, 2)),
    Dropout(0.25),
    Conv2D(64, (3, 3), activation='selu'),
    BatchNormalization(),
    MaxPooling2D((2, 2)),
    Dropout(0.25),
    Conv2D(128, (3, 3), activation='selu'),
    BatchNormalization(),
    Dropout(0.25),
    Flatten(),
    Dense(64, activation='selu'),
    BatchNormalization(),
    Dropout(0.25),
    Dense(10, activation='softmax')
])

model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [10]:
datagen = ImageDataGenerator(
    rotation_range=10,
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True,
    preprocessing_function=tf.keras.applications.vgg16.preprocess_input
    )
train_generator = datagen.flow(x_train, y_train, batch_size=32)
model.fit(train_generator, epochs=10, validation_data=(x_test, y_test))

scores = model.evaluate(x_test, y_test, verbose=1)
print('Test loss:', scores[0])
print('Test accuracy:', scores[1])

Epoch 1/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m32s[0m 19ms/step - accuracy: 0.3201 - loss: 1.9726 - val_accuracy: 0.1000 - val_loss: 633.1362
Epoch 2/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 20ms/step - accuracy: 0.4486 - loss: 1.5256 - val_accuracy: 0.1000 - val_loss: 627.0211
Epoch 3/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 20ms/step - accuracy: 0.4903 - loss: 1.4171 - val_accuracy: 0.1000 - val_loss: 1200.8188
Epoch 4/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m31s[0m 19ms/step - accuracy: 0.4890 - loss: 1.4303 - val_accuracy: 0.1000 - val_loss: 1078.3014
Epoch 5/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m30s[0m 19ms/step - accuracy: 0.4771 - loss: 1.4647 - val_accuracy: 0.1000 - val_loss: 1227.0438
Epoch 6/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m30s[0m 19ms/step - accuracy: 0.5006 - loss: 1.4069 - val_accuracy: 0.1000 - val_loss

In [None]:
Улучшения:
    Добавление дополнительных слоев может помочь улучшить общую производительность модели.
    Увеличение числа эпох.
    Применение регуляризации, таких как dropout может помочь бороться с переобучением и повысить обобщающую способность модели.
    Аугментация данных для увеличения разнообразия обучающих данных.
Ухудшения:
    Увеличение сложности модели без необходимости может привести к переобучению.
    Размер обучающего набора данных недостаточно большой.
    Если модель не обучается в течение достаточного числа эпох, она может не смочь достаточно выучить закономерности в данных.

Изменения необходимые для работы с другими дата сетами:
    Изменение размера входных данных, так как рамеры в каждом дата сете отличаются(MNIST(28, 28, 1), CIFAR-100(32, 32, 3), ImageNet(в зависимости от изображения))
    Изменение числа классов в зависимости от модели.(MNIST(0 - 9), CIFAR-100(100), ImageNet(>20000))
    Изменить количество нейронов в последнем полносвязном слое.(MNIST(0 - 9), CIFAR-100(100), ImageNet(>20000))
    Изменение архитектуры модели.