In [None]:
# Блок 1: Импорт библиотек для работы с файловой системой и изображениями
import os                       # Работа с файловой системой
import cv2                      # Библиотека OpenCV для обработки изображений
import matplotlib.pyplot as plt # Визуализация данных и графиков

### Блок 1: Импорт библиотек для работы с файловой системой и изображениями
- `os`: предоставляет функции для взаимодействия с операционной системой (пути, файлы)
- `cv2`: OpenCV, используется для обработки изображений (чтение, изменение размера и т.д.)
- `matplotlib.pyplot` (plt): инструмент для построения графиков и отображения изображений

In [None]:
# Блок 2: Импорт библиотек для машинного обучения и массивов
import numpy as np              # Работа с массивами и математическими операциями
import tensorflow as tf         # Основная библиотека машинного обучения
from tensorflow import keras    # Высокоуровневый API для нейронных сетей

### Блок 2: Импорт библиотек для машинного обучения и массивов
- `numpy` (np): эффективная работа с многомерными массивами и числовыми вычислениями
- `tensorflow` (tf): фреймворк для построения и обучения моделей машинного обучения
- `keras`: модуль TensorFlow для упрощенного создания и управления нейронными сетями

In [None]:
# Блок 3: Импорт специфичных компонентов Keras
from tensorflow.keras.datasets import fashion_mnist     # Набор данных Fashion MNIST
from tensorflow.keras.models import Sequential, load_model  # Модель и загрузка моделей
from tensorflow.keras.layers import Dense, Flatten, Dropout, Conv2D, MaxPooling2D  # Слои нейронной сети

### Блок 3: Импорт специфичных компонентов Keras
- `fashion_mnist`: встроенный набор данных с изображениями одежды (60,000 + 10,000 примеров)
- Импорт из `tensorflow.keras.models`:
  - `Sequential`: класс для последовательного добавления слоев в модель
  - `load_model`: функция для загрузки сохраненных моделей
- Импорт из `tensorflow.keras.layers`:
  - `Dense`: полносвязный слой
  - `Flatten`: преобразование многомерных данных в вектор
  - `Dropout`: слой выброса для регуляризации
  - `Conv2D`: сверточный слой для обработки изображений
  - `MaxPooling2D`: слой субдискретизации для уменьшения размерности

In [None]:
# Блок 4: Определение пути к модели
BASE_DIR = os.path.dirname(os.path.abspath(__file__))              # Базовая директория скрипта
MODEL_PATH = os.path.join(BASE_DIR, 'files', 'model', 'fashion_mnist_model.h5')  # Путь к файлу модели

### Блок 4: Определение пути к модели
- `BASE_DIR`: вычисляет директорию, в которой находится текущий скрипт
  - `os.path.abspath(__file__)`: полный путь к файлу скрипта
  - `os.path.dirname()`: извлекает директорию из пути
- `MODEL_PATH`: полный путь для сохранения/загрузки модели
  - Использует `os.path.join()` для кроссплатформенной совместимости
  - Модель будет храниться в подкаталоге `files/model` с именем `fashion_mnist_model.h5`

In [None]:
# Блок 5: Загрузка данных Fashion MNIST
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()  # Загрузка данных
x_train = x_train.reshape((60000, 28, 28, 1))                     # Изменение формы обучающих данных
x_test = x_test.reshape((10000, 28, 28, 1))                       # Изменение формы тестовых данных

### Блок 5: Загрузка данных Fashion MNIST
- `fashion_mnist.load_data()`: загружает набор данных Fashion MNIST
  - Возвращает кортеж из двух пар:
    - `(x_train, y_train)`: 60,000 обучающих изображений и меток
    - `(x_test, y_test)`: 10,000 тестовых изображений и меток
- `reshape()`: добавляет канал для совместимости со сверточными сетями
  - Исходная форма: (количество_примеров, 28, 28)
  - Новая форма: (количество_примеров, 28, 28, 1)
    - 28x28 - размер изображения
    - 1 - канал (градации серого)

In [None]:
# Блок 6: Нормализация данных
x_train = x_train / 255.0  # Нормализация обучающих данных
x_test = x_test / 255.0    # Нормализация тестовых данных

### Блок 6: Нормализация данных
- Деление значений пикселей на 255.0 (максимальное значение в градациях серого)
- Преобразует диапазон значений из [0, 255] в [0, 1]
- Улучшает сходимость модели и стабильность обучения нейронной сети

In [None]:
# Блок 7: Проверка и загрузка/создание модели
if os.path.exists(MODEL_PATH):  # Проверка наличия модели
    print("Загрузка существующей модели...")
    model = load_model(MODEL_PATH)  # Загрузка сохраненной модели
else:
    print("Создание новой модели...")
    model = Sequential([  # Создание последовательной модели
        Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),  # Первый сверточный слой
        Conv2D(64, (3, 3), activation='relu'),  # Второй сверточный слой
        MaxPooling2D((2, 2)),  # Первый слой субдискретизации
        Dropout(0.5),  # Первый слой выброса
        Conv2D(128, (3, 3), activation='relu'),  # Третий сверточный слой
        MaxPooling2D((2, 2)),  # Второй слой субдискретизации
        Dropout(0.5),  # Второй слой выброса
        Flatten(),  # Преобразование в вектор
        Dense(128, activation='relu'),  # Полносвязный слой
        Dense(10, activation='softmax')  # Выходной слой
    ])

### Блок 7: Проверка и загрузка/создание модели
- `os.path.exists(MODEL_PATH)`: проверяет, существует ли файл модели
- Если модель существует:
  - `load_model(MODEL_PATH)`: загружает сохраненную модель
- Если модели нет:
  - `Sequential`: создание новой модели с последовательными слоями:
    - `Conv2D(32, (3, 3))`: 32 фильтра 3x3, входной слой с формой (28, 28, 1)
    - `Conv2D(64, (3, 3))`: 64 фильтра 3x3
    - `MaxPooling2D((2, 2))`: уменьшение размерности (с 28x28 до 14x14)
    - `Dropout(0.5)`: выброс 50% нейронов
    - `Conv2D(128, (3, 3))`: 128 фильтров 3x3
    - `MaxPooling2D((2, 2))`: уменьшение до 7x7
    - `Dropout(0.5)`: еще один выброс 50%
    - `Flatten()`: преобразование в вектор
    - `Dense(128)`: полносвязный слой с 128 нейронами
    - `Dense(10, 'softmax')`: выходной слой для 10 классов

In [None]:
# Блок 8: Компиляция и обучение модели (при создании)
if not os.path.exists(MODEL_PATH):  # Выполняется только если модель создается
    model.compile(  # Компиляция модели
        optimizer='adam',  # Оптимизатор Adam
        loss='sparse_categorical_crossentropy',  # Функция потерь
        metrics=['accuracy']  # Метрика оценки
    )
    history = model.fit(  # Обучение модели
        x_train, y_train,
        epochs=15,  # Количество эпох
        batch_size=512,  # Размер пакета
        shuffle=True,  # Перемешивание данных
        validation_split=0.1  # Доля валидационных данных
    )
    model.save(MODEL_PATH)  # Сохранение модели
    print("Модель сохранена в файл:", MODEL_PATH)

### Блок 8: Компиляция и обучение модели
- Условно выполняется, если модель создается заново
- `model.compile()`:
  - `optimizer='adam'`: адаптивный оптимизатор Adam
  - `loss='sparse_categorical_crossentropy'`: для многоклассовой классификации
  - `metrics=['accuracy']`: отслеживание точности
- `model.fit()`:
  - Обучает модель на `x_train`, `y_train`
  - `epochs=15`: 15 проходов по данным
  - `batch_size=512`: 512 примеров в пакете
  - `shuffle=True`: перемешивание данных
  - `validation_split=0.1`: 10% данных для валидации
- `model.save()`: сохраняет модель в `MODEL_PATH`

In [None]:
# Блок 9: Оценка и визуализация результатов (при создании)
if not os.path.exists(MODEL_PATH):  # Выполняется только если модель обучалась
    test_loss, test_acc = model.evaluate(x_test, y_test)  # Оценка на тестовых данных
    print('Test accuracy:', test_acc)

    plt.figure(figsize=(12, 5))  # Создание фигуры для графиков

    plt.subplot(1, 2, 1)  # График потерь
    plt.plot(history.history['loss'], label='Training Loss')
    plt.plot(history.history['val_loss'], label='Validation Loss')
    plt.title('Loss Over Epochs')
    plt.xlabel('Epoch')
    plt.ylabel('Loss')
    plt.legend()
    plt.grid(True)

    plt.subplot(1, 2, 2)  # График точности
    plt.plot(history.history['accuracy'], label='Training Accuracy')
    plt.plot(history.history['val_accuracy'], label='Validation Accuracy')
    plt.title('Accuracy Over Epochs')
    plt.xlabel('Epoch')
    plt.ylabel('Accuracy')
    plt.legend()
    plt.grid(True)

    plt.tight_layout()  # Оптимизация расположения
    plt.show()  # Отображение графиков

### Блок 9: Оценка и визуализация результатов
- Условно выполняется, если модель обучалась
- `model.evaluate()`: вычисляет потери и точность на тестовых данных
- Визуализация:
  - `plt.figure(figsize=(12, 5))`: размер фигуры 12x5 дюймов
  - Первый график (`subplot(1, 2, 1)`): потери
    - `history.history['loss']`: потери на обучении
    - `history.history['val_loss']`: потери на валидации
  - Второй график (`subplot(1, 2, 2)`): точность
    - `history.history['accuracy']`: точность на обучении
    - `history.history['val_accuracy']`: точность на валидации
  - `tight_layout()`: улучшает расположение графиков
  - `show()`: отображает графики

In [None]:
# Блок 10: Функция предобработки изображений
def load_and_preprocess_images(folder_path):  # Функция загрузки изображений
    images = []
    filenames = []
    for filename in os.listdir(folder_path):  # Перебор файлов в папке
        img_path = os.path.join(folder_path, filename)
        img = cv2.imread(img_path, cv2.IMREAD_GRAYSCALE)  # Чтение в градациях серого
        img = cv2.resize(img, (28, 28))  # Изменение размера
        img = img.reshape((28, 28, 1))  # Добавление канала
        img = img / 255.0  # Нормализация
        images.append(img)
        filenames.append(filename)
    return np.array(images), filenames  # Возврат массивов

### Блок 10: Функция предобработки изображений
- `load_and_preprocess_images(folder_path)`: загружает и обрабатывает изображения
- Процесс:
  - Перебирает файлы в `folder_path` с помощью `os.listdir`
  - `cv2.imread(..., cv2.IMREAD_GRAYSCALE)`: читает изображения в градациях серого
  - `cv2.resize()`: приводит к размеру 28x28
  - `reshape()`: добавляет канал (28, 28, 1)
  - Нормализация: деление на 255.0
- Возвращает:
  - `np.array(images)`: массив обработанных изображений
  - `filenames`: список имен файлов

In [None]:
# Блок 11: Загрузка и классификация изображений
images, filenames = load_and_preprocess_images(BASE_DIR + '/files/ten_clothing_images_resized/inv')  # Загрузка изображений
predictions = model.predict(images)  # Предсказание классов

### Блок 11: Загрузка и классификация изображений
- `load_and_preprocess_images()`: загружает изображения из указанной папки
  - Путь: `BASE_DIR + '/files/ten_clothing_images_resized/inv'`
- `model.predict(images)`: классифицирует загруженные изображения
  - Возвращает массив вероятностей для каждого класса

In [None]:
# Блок 12: Вывод результатов классификации
class_names = ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
               'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']  # Названия классов
for i, (pred, filename) in enumerate(zip(predictions, filenames)):  # Перебор предсказаний
    print(pred)  # Вывод вероятностей
    print(pred.max())  # Максимальная вероятность
    predicted_class = np.argmax(pred)  # Индекс предсказанного класса
    confidence = pred[predicted_class]  # Уверенность
    print(f"File: {filename}, Predicted class: {class_names[predicted_class]}, Confidence: {confidence:.2f}")
    print("="*100)  # Разделитель

### Блок 12: Вывод результатов классификации
- `class_names`: список названий классов Fashion MNIST
- Цикл по предсказаниям:
  - `zip(predictions, filenames)`: парное объединение предсказаний и имен файлов
  - `pred`: массив вероятностей для одного изображения
  - `np.argmax(pred)`: индекс класса с максимальной вероятностью
  - `confidence`: значение вероятности для предсказанного класса
- Выводит:
  - Все вероятности (`pred`)
  - Максимальную вероятность (`pred.max()`)
  - Имя файла, предсказанный класс и уверенность (с 2 знаками после запятой)
  - Разделитель из 100 символов "="