In [1]:
# Блок 1: Импорт базовых библиотек для работы с данными и визуализацией
import numpy as np              # Библиотека для работы с массивами и математическими операциями
import matplotlib.pyplot as plt # Библиотека для создания графиков и визуализации данных
import os                       # Библиотека для работы с файловой системой

### Блок 1: Импорт базовых библиотек
- `numpy` (np): используется для эффективной работы с массивами и выполнения численных вычислений
- `matplotlib.pyplot` (plt): позволяет создавать визуализации данных, такие как графики и изображения
- `os`: предоставляет функции для взаимодействия с операционной системой, например, работы с файлами и путями

In [None]:
# Блок 2: Импорт библиотек TensorFlow и Keras
import tensorflow as tf                                 # Основная библиотека машинного обучения
from tensorflow import keras                            # Высокоуровневый API для построения нейронных сетей
from tensorflow.keras.datasets import fashion_mnist     # Набор данных Fashion MNIST
from tensorflow.keras.models import Sequential          # Модель последовательного типа
from tensorflow.keras.layers import Dense, Flatten, Dropout, Conv2D, MaxPooling2D  # Слои нейронной сети

### Блок 2: Импорт TensorFlow и компонентов Keras
- `tensorflow` (tf): основная библиотека для машинного обучения и работы с тензорами
- `keras`: высокоуровневый API TensorFlow для удобного создания и обучения нейронных сетей
- `fashion_mnist`: встроенный набор данных с изображениями одежды (60,000 обучающих и 10,000 тестовых примеров)
- `Sequential`: класс для создания моделей, где слои добавляются последовательно
- Импорт слоев:
  - `Dense`: полносвязный слой
  - `Flatten`: преобразование многомерных данных в одномерный вектор
  - `Dropout`: слой для предотвращения переобучения
  - `Conv2D`: сверточный слой для обработки изображений
  - `MaxPooling2D`: слой субдискретизации для уменьшения размерности

In [None]:
# Блок 3: Константы размеров данных и параметров модели
IMG_SHAPE = (28, 28, 1)      # Размер входного изображения: высота, ширина, каналы
NUM_CLASSES = 10             # Количество классов в задаче классификации

### Блок 3: Константы размеров данных и параметров модели
- `IMG_SHAPE`: кортеж, определяющий форму входных изображений
  - 28 - высота в пикселях
  - 28 - ширина в пикселях
  - 1 - количество каналов (1 для градаций серого, 3 было бы для RGB)
- `NUM_CLASSES`: количество категорий одежды в наборе Fashion MNIST (10 классов)

In [None]:
# Блок 4: Константы обучения модели
BATCH_SIZE = 64             # Размер пакета для обучения
EPOCHS = 15                 # Количество эпох обучения
VALIDATION_SPLIT = 0.2      # Доля данных для валидации

### Блок 4: Константы обучения модели
- `BATCH_SIZE`: количество примеров в одном пакете для обучения (64 изображения за итерацию)
- `EPOCHS`: общее количество проходов через весь набор данных (15 полных итераций)
- `VALIDATION_SPLIT`: доля обучающих данных, используемых для валидации (20% от общего объема)

In [None]:
# Блок 5: Константы путей файловой системы
BASE_DIR = os.path.dirname(os.path.abspath(__file__))              # Базовая директория скрипта
MODEL_PATH = os.path.join(BASE_DIR, 'files', 'model', 'perfect_model.keras')  # Путь для сохранения модели

### Блок 5: Константы путей файловой системы
- `BASE_DIR`: вычисляет абсолютный путь к директории текущего скрипта
  - `os.path.abspath(__file__)`: полный путь к файлу скрипта
  - `os.path.dirname()`: извлекает директорию из полного пути
- `MODEL_PATH`: полный путь для сохранения обученной модели
  - Использует `os.path.join()` для кроссплатформенного объединения пути
  - Модель будет сохранена в подкаталоге `files/model` с именем `perfect_model.keras`

In [None]:
# Блок 6: Загрузка набора данных Fashion MNIST
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()  # Загрузка тренировочных и тестовых данных

### Блок 6: Загрузка набора данных Fashion MNIST
- `fashion_mnist.load_data()`: загружает встроенный набор данных Fashion MNIST
- Возвращает кортеж из двух пар:
  - `(x_train, y_train)`: обучающие данные (60,000 изображений и меток)
  - `(x_test, y_test)`: тестовые данные (10,000 изображений и меток)
- `x_train`, `x_test`: массивы изображений (28x28 пикселей, градации серого)
- `y_train`, `y_test`: массивы меток классов (целые числа от 0 до 9)

In [None]:
# Блок 7: Изменение формы данных для сверточной сети
x_train = x_train.reshape((60000, 28, 28, 1))  # Добавление канала для обучающих данных
x_test = x_test.reshape((10000, 28, 28, 1))    # Добавление канала для тестовых данных

### Блок 7: Изменение формы данных для сверточной сети
- Исходная форма данных: (количество_примеров, 28, 28)
- Новая форма: (количество_примеров, 28, 28, 1)
  - Добавлен канал (1), так как сверточные сети (Conv2D) ожидают 4D-вход
  - 60,000 - количество обучающих примеров
  - 10,000 - количество тестовых примеров
  - 28x28 - размер изображения
  - 1 - количество каналов (градации серого)

In [None]:
# Блок 8: Нормализация данных
x_train = x_train / 255.0  # Нормализация обучающих данных
x_test = x_test / 255.0    # Нормализация тестовых данных

### Блок 8: Нормализация данных
- Деление значений пикселей на 255.0 (максимальное значение пикселя)
- Преобразует значения из диапазона [0, 255] в [0, 1]
- Улучшает сходимость модели и стабильность обучения

In [None]:
# Блок 9: Переопределение классов
mapping = {5: 6, 6: 4, 7: 6, 8: 5, 9: 6}  # Словарь для замены значений классов
y_train = np.array([mapping.get(y, y) for y in y_train])  # Применение к обучающим меткам
y_test = np.array([mapping.get(y, y) for y in y_test])    # Применение к тестовым меткам

### Блок 9: Переопределение классов
- `mapping`: словарь, определяющий замену классов:
  - 5 → 6
  - 6 → 4
  - 7 → 6
  - 8 → 5
  - 9 → 6
  - Остальные классы остаются без изменений
- Преобразование меток:
  - Используется `mapping.get(y, y)`: если ключа нет в словаре, возвращается исходное значение `y`
  - Создается новый массив с помощью `np.array` и спискового включения
- Применяется к `y_train` и `y_test` для согласованности данных

In [None]:
# Блок 10: Создание базовой структуры модели
model = Sequential([  # Инициализация последовательной модели
    Conv2D(64, (3, 3), activation='relu', input_shape=IMG_SHAPE, kernel_regularizer=l2(0.001)),  # Первый сверточный слой
    BatchNormalization(),  # Нормализация батчей
    Conv2D(128, (3, 3), activation='relu', padding='same', kernel_regularizer=l2(0.001)),  # Второй сверточный слой
    BatchNormalization(),  # Нормализация батчей
    MaxPooling2D((2, 2)),  # Первый слой субдискретизации
    Dropout(0.5),          # Первый слой выброса
])

### Блок 10: Создание базовой структуры модели
- `Sequential`: создает модель, где слои добавляются последовательно
- Первый блок свертки:
  - `Conv2D(64, (3, 3))`: 64 фильтра размером 3x3
  - `activation='relu'`: функция активации ReLU
  - `input_shape=IMG_SHAPE`: форма входных данных (28, 28, 1)
  - `kernel_regularizer=l2(0.001)`: L2-регуляризация с коэффициентом 0.001
  - `BatchNormalization()`: нормализует выходы слоя для ускорения обучения
- Второй блок свертки:
  - `Conv2D(128, (3, 3))`: 128 фильтров размером 3x3
  - `padding='same'`: сохраняет размер выхода равным входу
- `MaxPooling2D((2, 2))`: уменьшает размерность в 2 раза (с 28x28 до 14x14)
- `Dropout(0.5)`: случайным образом отключает 50% нейронов для предотвращения переобучения

In [None]:
# Блок 11: Добавление глубоких сверточных слоев
model.add(Conv2D(256, (3, 3), activation='relu', kernel_regularizer=l2(0.001)))  # Третий сверточный слой
model.add(BatchNormalization())  # Нормализация батчей
model.add(MaxPooling2D((2, 2)))  # Второй слой субдискретизации
model.add(Dropout(0.5))          # Второй слой выброса

### Блок 11: Добавление глубоких сверточных слоев
- `Conv2D(256, (3, 3))`: 256 фильтров размером 3x3
  - Увеличивает количество признаков для извлечения сложных паттернов
  - `kernel_regularizer=l2(0.001)`: L2-регуляризация для контроля весов
- `BatchNormalization()`: стабилизирует обучение
- `MaxPooling2D((2, 2))`: уменьшает размерность с 14x14 до 7x7
- `Dropout(0.5)`: 50% выброс для регуляризации

In [None]:
# Блок 12: Полносвязные слои и выходной слой
model.add(Flatten())  # Преобразование в одномерный вектор
model.add(Dense(128, activation='relu', kernel_regularizer=l2(0.001)))  # Полносвязный Cлой с 128 нейронами
model.add(BatchNormalization())  # Нормализация батчей
model.add(Dropout(0.3))  # Слой выброса с 30%
model.add(Dense(NUM_CLASSES, activation='softmax'))  # Выходной слой

### Блок 12: Полносвязные слои и выходной слой
- `Flatten()`: преобразует 7x7x256 в вектор длиной 12,544
- `Dense(128)`: полносвязный слой с 128 нейронами
  - `activation='relu'`: функция активации ReLU
  - `kernel_regularizer=l2(0.001)`: L2-регуляризация
- `BatchNormalization()`: нормализация перед финальным слоем
- `Dropout(0.3)`: 30% выброс для финальной регуляризации
- `Dense(NUM_CLASSES)`: выходной слой с количеством нейронов, равным числу классов (10)
  - `activation='softmax'`: вероятностное распределение по классам

In [None]:
# Блок 13: Компиляция модели
model.compile(
    optimizer=tf.keras.optimizers.Adam(learning_rate=0.0001),  # Оптимизатор Adam
    loss='sparse_categorical_crossentropy',                    # Функция потерь
    metrics=['accuracy']                                       # Метрика оценки
)

### Блок 13: Компиляция модели
- `optimizer='Adam'`: адаптивный оптимизатор с шагом обучения `learning_rate=0.0001`
- `loss='sparse_categorical_crossentropy'`: функция потерь для многоклассовой классификации с целочисленными метками
- `metrics=['accuracy']`: отслеживание точности во время обучения и оценки

In [None]:
def plot_training_history(history):
    """Визуализация истории обучения"""
    plt.figure(figsize=(12, 5))

    # График потерь
    plt.subplot(1, 2, 1)
    plt.plot(history.history['loss'], label='Обучающая выборка')
    plt.plot(history.history['val_loss'], label='Валидационная выборка')
    plt.title('Функция потерь по эпохам')
    plt.xlabel('Эпоха')
    plt.ylabel('Потери')
    plt.legend()
    plt.grid(True)

    # График точности
    plt.subplot(1, 2, 2)
    plt.plot(history.history['accuracy'], label='Обучающая выборка')
    plt.plot(history.history['val_accuracy'], label='Валидационная выборка')
    plt.title('Точность по эпохам')
    plt.xlabel('Эпоха')
    plt.ylabel('Точность')
    plt.legend()
    plt.grid(True)

    plt.tight_layout()
    plt.show()

In [None]:
# Блок 14: Загрузка и предобработка данных
(x_train, y_train), (x_test, y_test) = load_and_preprocess_data()  # Вызов функции подготовки данных

### Блок 14: Загрузка и предобработка данных
- `load_and_preprocess_data()`: предполагаемая пользовательская функция
  - Загружает данные Fashion MNIST
  - Выполняет предобработку (изменение формы, нормализацию, переопределение классов)
- Возвращает кортеж:
  - `(x_train, y_train)`: обучающие данные и метки
  - `(x_test, y_test)`: тестовые данные и метки

In [None]:
# Блок 15: Проверка и обучение модели
if not os.path.exists(MODEL_PATH):  # Проверка существования сохраненной модели
    early_stopping = EarlyStopping(
        monitor='val_loss',            # Отслеживание потерь на валидации
        patience=10,                   # Терпение для остановки
        restore_best_weights=True      # Восстановление лучших весов
    )
    model = create_model()             # Создание новой модели
    history = model.fit(               # Обучение модели
        x_train, y_train,
        batch_size=BATCH_SIZE,         # Размер пакета
        epochs=EPOCHS,                 # Количество эпох
        shuffle=True,                  # Перемешивание данных
        validation_split=VALIDATION_SPLIT,  # Доля валидационных данных
        callbacks=[early_stopping]     # Callback для ранней остановки
    )
    model.save(MODEL_PATH)             # Сохранение модели
else:
    model = keras.models.load_model(MODEL_PATH)  # Загрузка существующей модели
    history = None                     # История отсутствует при загрузке

### Блок 15: Проверка и обучение модели
- `os.path.exists(MODEL_PATH)`: проверяет наличие сохраненной модели по пути `MODEL_PATH`
- Если модели нет:
  - `EarlyStopping`: callback для остановки обучения при отсутствии прогресса
    - `monitor='val_loss'`: отслеживает потери на валидационной выборке
    - `patience=10`: ждет 10 эпох без улучшения
    - `restore_best_weights=True`: восстанавливает веса лучшей модели
  - `create_model()`: предполагаемая функция создания архитектуры модели
  - `model.fit()`: обучение модели
    - `batch_size=BATCH_SIZE`: использует заданный размер пакета (64)
    - `epochs=EPOCHS`: максимальное количество эпох (15)
    - `shuffle=True`: перемешивает данные перед каждой эпохой
    - `validation_split=VALIDATION_SPLIT`: использует 20% данных для валидации
    - `callbacks=[early_stopping]`: применяет раннюю остановку
  - `model.save(MODEL_PATH)`: сохраняет модель в файл
- Если модель существует:
  - `keras.models.load_model(MODEL_PATH)`: загружает модель из файла
  - `history = None`: история обучения недоступна

In [None]:
# Блок 16: Оценка модели
test_loss, test_acc = model.evaluate(x_test, y_test)  # Оценка на тестовых данных
print(f'Точность на тестовых данных: {test_acc:.4f}')  # Вывод точности

### Блок 16: Оценка модели
- `model.evaluate()`: вычисляет потери и метрики на тестовых данных
  - `x_test`, `y_test`: тестовые изображения и метки
  - Возвращает `test_loss` (потери) и `test_acc` (точность)
- Выводит точность с 4 знаками после запятой для читаемости

In [None]:
# Блок 17: Визуализация результатов обучения
if history:  # Проверка наличия истории обучения
    plot_training_history(history)  # Вызов функции визуализации
else:
    print('Модель загружена из файла')  # Сообщение при загрузке модели

### Блок 17: Визуализация результатов обучения
- `if history`: проверяет, была ли модель обучена в этой сессии
  - `plot_training_history(history)`: предполагаемая функция
    - Визуализирует метрики обучения (например, точность и потери)
    - Использует объект `history` с данными по эпохам
- Если `history is None`:
  - Выводит сообщение, что модель была загружена, а не обучена