In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Flatten, Dense, Dropout
from sklearn.model_selection import train_test_split

from tensorflow.keras.preprocessing.image import load_img, img_to_array
import os
from PIL import Image

In [2]:
# Загрузка данных
train_data = pd.read_csv("train_data.csv")
test_data = pd.read_csv("test_data.csv")

In [3]:
# Создаем экземпляры ImageDataGenerator для аугментации тренировочных и тестовых изображений
train_datagen = ImageDataGenerator(
    rescale=1./255,            # Перенормировка значений пикселей
    rotation_range=20,         # Угол поворота (в градусах)
    width_shift_range=0.2,     # Сдвиг по ширине
    height_shift_range=0.2,    # Сдвиг по высоте
    shear_range=0.2,           # Направление сдвига
    zoom_range=0.2,            # Масштабирование
    horizontal_flip=True,      # Отражение по горизонтали
    fill_mode='nearest'        # Заполнение пикселей за пределами границ изображения
)

test_datagen = ImageDataGenerator(
    rescale=1./255,            # Перенормировка значений пикселей
    rotation_range=20,         # Угол поворота (в градусах)
    width_shift_range=0.2,     # Сдвиг по ширине
    height_shift_range=0.2,    # Сдвиг по высоте
    shear_range=0.2,           # Направление сдвига
    zoom_range=0.2,            # Масштабирование
    horizontal_flip=True,      # Отражение по горизонтали
    fill_mode='nearest'        # Заполнение пикселей за пределами границ изображения
    )  

# Создаем генераторы данных для тренировочного и тестового наборов
train_generator = train_datagen.flow_from_dataframe(
    dataframe=train_data,
    x_col='image_path',            # Имя столбца с путями к изображениям
    y_col='label',                 # Имя столбца с метками классов
    target_size=(300, 300),        # Размер изображений (высота, ширина)
    batch_size=32,                 # Размер пакета данных
    class_mode='categorical'       # Режим классификации (категориальная классификация)
)

test_generator = test_datagen.flow_from_dataframe(
    dataframe=test_data,
    x_col='image_path',
    y_col='label',
    target_size=(300, 300),
    batch_size=32,
    class_mode='categorical'
)

Found 6194 validated image filenames belonging to 10 classes.
Found 1554 validated image filenames belonging to 10 classes.


In [4]:
# Получаем словарь классов и их индексов
class_indices = train_generator.class_indices

# Получаем количество уникальных классов
num_classes = len(class_indices)

# Выводим количество уникальных классов
print("Количество уникальных классов:", num_classes)

Количество уникальных классов: 10


Последовательная модель нейронной сети с использованием библиотеки Keras/TensorFlow.  
Давайте разберем каждый слой:  
 
Свёрточный слой (Conv2D):  
Количество фильтров: 32  
Размер ядра: (3, 3)  
Функция активации: ReLU  
Размер входных данных: (150, 150, 3) (высота, ширина, каналы)  
Слой пулинга (MaxPooling2D):  
Размер пулинга: (2, 2)  
По умолчанию используется максимальное значение в каждом окне пулинга.  
Свёрточный слой (Conv2D):  
Количество фильтров: 64  
Размер ядра: (3, 3)  
Функция активации: ReLU  
Слой пулинга (MaxPooling2D):  
Размер пулинга: (2, 2)  
Свёрточный слой (Conv2D):  
Количество фильтров: 128  
Размер ядра: (3, 3)  
Функция активации: ReLU  
Слой пулинга (MaxPooling2D):   
Размер пулинга: (2, 2)  
Слой сглаживания (Flatten):  
Преобразует многомерные данные в одномерный массив для подачи на полносвязные слои.  
Полносвязный слой (Dense):  
Количество нейронов: 512  
Функция активации: ReLU  
Слой Dropout:  
Слой Dropout с вероятностью 0.5 помогает предотвратить переобучение, случайным образом "выключая" половину нейронов на каждой итерации обучения.  
Выходной полносвязный слой (Dense):  
Количество нейронов: num_classes (количество классов в задаче классификации)  
Функция активации: softmax (используется для многоклассовой классификации)  

In [5]:
# Создаем последовательную модель
model = Sequential()

# Добавляем сверточные слои с пулингом
model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(300, 300, 3)))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(64, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))
model.add(Conv2D(128, (3, 3), activation='relu'))
model.add(MaxPooling2D((2, 2)))

# Добавляем слой для сглаживания данных перед подачей на полносвязные слои
model.add(Flatten())

# Добавляем полносвязные слои
model.add(Dense(512, activation='relu'))
model.add(Dropout(0.5))  # Добавляем слой Dropout для уменьшения переобучения
model.add(Dense(num_classes, activation='softmax'))  # Выходной слой с softmax для классификации


  super().__init__(


In [6]:
model.compile(optimizer='adam',
              loss='categorical_crossentropy',
              metrics=['accuracy'])


In [7]:
# Обучение модели
history = model.fit(
    train_generator,
    steps_per_epoch=len(train_generator),
    epochs=10,
    validation_data=test_generator,
    validation_steps=len(test_generator)
)

Epoch 1/10


  self._warn_if_super_not_called()


[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m435s[0m 2s/step - accuracy: 0.1698 - loss: 2.9720 - val_accuracy: 0.2336 - val_loss: 2.1376
Epoch 2/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 365us/step - accuracy: 0.0000e+00 - loss: 0.0000e+00 - val_accuracy: 0.0000e+00 - val_loss: 0.0000e+00
Epoch 3/10


  self.gen.throw(value)


[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m354s[0m 2s/step - accuracy: 0.2523 - loss: 2.1343 - val_accuracy: 0.2671 - val_loss: 2.0762
Epoch 4/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 0s/step - accuracy: 0.0000e+00 - loss: 0.0000e+00 - val_accuracy: 0.0000e+00 - val_loss: 0.0000e+00
Epoch 5/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m343s[0m 2s/step - accuracy: 0.2738 - loss: 2.0701 - val_accuracy: 0.3172 - val_loss: 2.0161
Epoch 6/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 54us/step - accuracy: 0.0000e+00 - loss: 0.0000e+00 - val_accuracy: 0.0000e+00 - val_loss: 0.0000e+00
Epoch 7/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m347s[0m 2s/step - accuracy: 0.2961 - loss: 2.0408 - val_accuracy: 0.3320 - val_loss: 1.9968
Epoch 8/10
[1m194/194[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 53us/step - accuracy: 0.0000e+00 - loss: 0.0000e+00 - val_accuracy: 0.0000e+00 - val_loss

In [8]:
# Оценка производительности модели на тестовых данных:

test_loss, test_accuracy = model.evaluate(test_generator, verbose=2)
print(f'Потери на тестовых данных: {test_loss}')
print(f'Точность на тестовых данных: {test_accuracy}')

49/49 - 30s - 619ms/step - accuracy: 0.3218 - loss: 1.9754
Потери на тестовых данных: 1.9753581285476685
Точность на тестовых данных: 0.32175031304359436
