In [3]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Dense, Dropout, Activation, Flatten, Conv2D, MaxPooling2D
import os

# Установка параметров нейросети
batch_size = 32
num_classes = 10
epochs = 10  # Увеличиваем количество эпох для лучшего обучения
data_augmentation = True
save_dir = os.path.join(os.getcwd(), 'saved_models')
model_name = 'keras_cifar10_trained_model.h5'

# Загрузка и разделение данных
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'тренировочные примеры')
print(x_test.shape[0], 'тестовые примеры')

# Преобразование матрицы чисел 0-9 в бинарную матрицу чисел 0-1
y_train = tf.keras.utils.to_categorical(y_train, num_classes)
y_test = tf.keras.utils.to_categorical(y_test, num_classes)

# Нормализация данных
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

# Определение формы входных данных
input_shape = (32, 32, 3)  # Форма для CIFAR-10

# Конфигурирование модели с использованием Input слоя
model = Sequential()
model.add(Input(shape=input_shape))
model.add(Conv2D(32, (3, 3), padding='same'))
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Conv2D(64, (3, 3), padding='same'))
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(512))
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes))
model.add(Activation('softmax'))

# Компиляция модели
model.compile(loss='categorical_crossentropy',
              optimizer='rmsprop',
              metrics=['accuracy'])

# Создание генератора данных с аугментацией
if data_augmentation:
    datagen = ImageDataGenerator(
        rotation_range=10,
        width_shift_range=0.1,
        height_shift_range=0.1,
        horizontal_flip=True,
        preprocessing_function=tf.keras.applications.vgg16.preprocess_input
    )
    train_generator = datagen.flow(x_train, y_train, batch_size=batch_size)
    model.fit(train_generator, epochs=epochs, validation_data=(x_test, y_test))
else:
    model.fit(x_train, y_train, batch_size=batch_size,
              epochs=epochs, validation_data=(x_test, y_test))

# Сохранение модели
if not os.path.isdir(save_dir):
    os.makedirs(save_dir)
model_path = os.path.join(save_dir, model_name)
model.save(model_path)
print('Обученная модель сохранена как %s ' % model_path)

# Оценка модели
scores = model.evaluate(x_test, y_test, verbose=1)
print('Test loss:', scores[0])
print('Test accuracy:', scores[1])

x_train shape: (50000, 32, 32, 3)
50000 тренировочные примеры
10000 тестовые примеры
Epoch 1/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m41s[0m 25ms/step - accuracy: 0.0985 - loss: 2.8978 - val_accuracy: 0.1000 - val_loss: 2.3026
Epoch 2/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m38s[0m 24ms/step - accuracy: 0.0980 - loss: 2.3029 - val_accuracy: 0.1000 - val_loss: 2.3025
Epoch 3/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m38s[0m 24ms/step - accuracy: 0.0962 - loss: 2.3028 - val_accuracy: 0.1185 - val_loss: 2.3025
Epoch 4/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m38s[0m 24ms/step - accuracy: 0.0978 - loss: 2.3028 - val_accuracy: 0.1004 - val_loss: 2.3025
Epoch 5/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m37s[0m 24ms/step - accuracy: 0.1024 - loss: 2.3026 - val_accuracy: 0.1000 - val_loss: 2.3026
Epoch 6/10
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m38s[0m 24ms/



Обученная модель сохранена как h:\Git\Introduction_to_Neural_Networks\seminar-4\saved_models\keras_cifar10_trained_model.h5 
[1m313/313[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 6ms/step - accuracy: 0.1080 - loss: 2.3025
Test loss: 2.30247163772583
Test accuracy: 0.10849999636411667


## Анализ  
- Улучшает работу нейронной сети: Увеличение количества эпох, добавление фильтров, использование аугментации данных, Dropout, Batch Normalization, различные оптимизаторы и регуляризация.
- Ухудшает работу нейронной сети: Слишком большое количество эпох может привести к переобучению, что ухудшит способность модели к обобщению на новых данных.  
Применение этих стратегий может помочь улучшить точность распознавания образов CIFAR-10 сверточной нейронной сетью, но важно тщательно настраивать параметры и экспериментировать, чтобы найти оптимальную конфигурацию для вашей конкретной задачи.

In [4]:
import tensorflow as tf
from tensorflow.keras.datasets import cifar10
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Input, Dense, Dropout, Activation, Flatten, Conv2D, MaxPooling2D, BatchNormalization
import os

# Установка параметров нейросети
batch_size = 32
num_classes = 10
epochs = 50  # Увеличиваем количество эпох для лучшего обучения
data_augmentation = True
save_dir = os.path.join(os.getcwd(), 'saved_models')
# Изменено на рекомендуемый формат
model_name = 'keras_cifar10_trained_model.keras'

# Загрузка и разделение данных
(x_train, y_train), (x_test, y_test) = cifar10.load_data()
print('x_train shape:', x_train.shape)
print(x_train.shape[0], 'тренировочные примеры')
print(x_test.shape[0], 'тестовые примеры')

# Преобразование матрицы чисел 0-9 в бинарную матрицу чисел 0-1
y_train = tf.keras.utils.to_categorical(y_train, num_classes)
y_test = tf.keras.utils.to_categorical(y_test, num_classes)

# Нормализация данных
x_train = x_train.astype('float32') / 255
x_test = x_test.astype('float32') / 255

# Определение формы входных данных
input_shape = (32, 32, 3)  # Форма для CIFAR-10

# Конфигурирование модели с использованием Input слоя и добавлением BatchNormalization
model = Sequential()
model.add(Input(shape=input_shape))
model.add(Conv2D(32, (3, 3), padding='same'))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(Conv2D(32, (3, 3)))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Conv2D(64, (3, 3), padding='same'))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(Conv2D(64, (3, 3)))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(MaxPooling2D(pool_size=(2, 2)))
model.add(Dropout(0.25))

model.add(Flatten())
model.add(Dense(512))
model.add(BatchNormalization())
model.add(Activation('relu'))
model.add(Dropout(0.5))
model.add(Dense(num_classes))
model.add(Activation('softmax'))

# Компиляция модели с использованием оптимизатора Adam
model.compile(loss='categorical_crossentropy',
              optimizer='adam',
              metrics=['accuracy'])

# Создание генератора данных с аугментацией
if data_augmentation:
    datagen = ImageDataGenerator(
        rotation_range=10,
        width_shift_range=0.1,
        height_shift_range=0.1,
        horizontal_flip=True,
        preprocessing_function=tf.keras.applications.vgg16.preprocess_input
    )
    train_generator = datagen.flow(x_train, y_train, batch_size=batch_size)
    model.fit(train_generator, epochs=epochs, validation_data=(x_test, y_test))
else:
    model.fit(x_train, y_train, batch_size=batch_size,
              epochs=epochs, validation_data=(x_test, y_test))

# Сохранение модели в новом формате
if not os.path.isdir(save_dir):
    os.makedirs(save_dir)
model_path = os.path.join(save_dir, model_name)
model.save(model_path)
print('Обученная модель сохранена как %s ' % model_path)

# Оценка модели
scores = model.evaluate(x_test, y_test, verbose=1)
print('Test loss:', scores[0])
print('Test accuracy:', scores[1])

x_train shape: (50000, 32, 32, 3)
50000 тренировочные примеры
10000 тестовые примеры
Epoch 1/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m62s[0m 38ms/step - accuracy: 0.2559 - loss: 2.2255 - val_accuracy: 0.1000 - val_loss: 65.7148
Epoch 2/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m59s[0m 38ms/step - accuracy: 0.4642 - loss: 1.4826 - val_accuracy: 0.1000 - val_loss: 15.4732
Epoch 3/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m60s[0m 38ms/step - accuracy: 0.5457 - loss: 1.2739 - val_accuracy: 0.1000 - val_loss: 4.1524
Epoch 4/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m62s[0m 39ms/step - accuracy: 0.5851 - loss: 1.1636 - val_accuracy: 0.1000 - val_loss: 21.5107
Epoch 5/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m61s[0m 39ms/step - accuracy: 0.6215 - loss: 1.0697 - val_accuracy: 0.1000 - val_loss: 14.5576
Epoch 6/50
[1m1563/1563[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m65s[0m 4

В этом коде были внесены следующие изменения:  

- Увеличено количество эпох обучения до 50 для лучшего обучения модели.
- Добавлены слои BatchNormalization после каждого сверточного слоя для улучшения обучения и стабильности модели.
- Использован оптимизатор adam для более эффективного обучения.
- Включена аугментация данных для увеличения разнообразия обучающих данных.
- Изменено имя файла сохранения модели на .keras, что является рекомендуемым форматом для сохранения моделей Keras.  

Эти изменения направлены на улучшение обучения модели и ее способности к обобщению на новых данных, что в свою очередь может улучшить точность распознавания образов CIFAR-10.

**Для работы с другими наборами данных, такими как MNIST, CIFAR-100 и ImageNet, потребуется внести изменения в архитектуру нейронной сети и параметры обучения. Вот некоторые рекомендации:**  


**MNIST**  
Изменение размера входных данных: MNIST состоит из изображений размером 28x28 пикселей, в отличие от CIFAR-10, где изображения имеют размер 32x32 пикселей. Нужно будет изменить размер входных данных в модели.
Изменение количества классов: MNIST содержит 1 класс (цифры от 0 до 9), в то время как CIFAR-10 содержит 10 классов. Это означает, что вам нужно будет изменить количество нейронов в последнем полносвязном слое на 10.

**CIFAR-100**  
Увеличение количества фильтров: CIFAR-100 содержит 100 классов, что значительно больше, чем в CIFAR-10. Может потребоваться увеличить количество фильтров в сверточных слоях, чтобы модель могла лучше различать различные классы.
Использование более глубокой архитектуры: Для CIFAR-100 может потребоваться более глубокая архитектура, чтобы улучшить производительность модели.

**ImageNet**  
Использование предварительно обученных моделей: ImageNet содержит огромное количество изображений и классов, что делает его сложным для обучения с нуля. Вместо этого рекомендуется использовать предварительно обученные модели, такие как VGG16, ResNet или Inception, и дообучать их на наборе данных.
Изменение размера входных данных: ImageNet содержит изображения размером 224x224 пикселей, поэтому нужно будет изменить размер входных данных в модели.  

**Общие рекомендации**  
Использование активационной функции ELU: Вместо ReLU можно использовать ELU (Exponential Linear Unit), которая может ускорить процесс обучения и улучшить точность модели, особенно на сложных наборах данных, таких как CIFAR-100 3.  
Оптимизация параметров обучения: Может потребоваться оптимизация параметров обучения, таких как скорость обучения, размер пакета и количество эпох, чтобы достичь лучшей производительности на новых наборах данных.  
При переносе модели на другие наборы данных важно тщательно тестировать и настраивать модель, чтобы обеспечить её эффективную работу на каждом из них.

