<a href="https://colab.research.google.com/github/F1ameX/TUSUR_ML/blob/main/TUSUR_HW_7.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## Структуры нейронных сетей для решения базовых задач классификации и регрессии

In [None]:
# Импортируем модуль для работы с архитектурами нейронных сетей
from tensorflow import keras as k

### Задача №1. Структура распознавания 10 цифр (CNN, размер изображения 28 х 28 x 1)

Для создания свёрточной нейронной сети (CNN), распознающей 10 цифр необходимо во время процесса свёртки изображения суметь выделить ключевые признаки для каждой цифры, чтобы модель смогла ориентироваться на них и верно обучаться.

Для этого в модели используется несколько сверточных слоев, которые выполняют операции свертки на входном изображении. Сначала происходит извлечение базовых признаков, таких как края, текстуры и углы, которые затем комбинируются в более сложные абстракции с помощью последующих слоев. Для поиска этих признаков используются фильтры разных размеров и глубины. Каждый фильтр находит уникальные шаблоны в изображении, которые важны для распознавания цифры.

После свёртки применяется операция пулинга, которая уменьшает размерность данных, сохраняя при этом наиболее важные признаки. Это помогает уменьшить вычислительные ресурсы и предотвращает переобучение, а также делает модель более устойчивой к небольшим искажениям изображений.

Затем извлеченные признаки преобразуются в одномерный вектор с помощью слоя Flatten, который подготавливает данные для полносвязных слоев. В этих слоях происходит дальнейшая обработка и классификация, где каждый нейрон отвечает за вероятность принадлежности изображения к одной из 10 цифр.

Для финальной классификации используется слой с 10 выходными нейронами, каждый из которых соответствует одной цифре от 0 до 9. Для этого применяется активация softmax, которая преобразует выходные данные в вероятности, обеспечивая интерпретацию модели как вероятности принадлежности изображения к каждой из 10 цифр.

Таким образом, модель учится выделять и комбинировать ключевые признаки на каждом уровне, начиная от простых шаблонов и заканчивая более сложными абстракциями, что позволяет ей эффективно распознавать и классифицировать рукописные цифры.

In [None]:
# Создание модели секвенциальным (последовательным) путём задания слоёв
digits_recognition = k.Sequential()

# Свёрточные слои и поиск ключевых признаков
digits_recognition.add(k.layers.Conv2D(filters = 32, kernel_size = (3, 3), activation = 'relu', input_shape = (28, 28, 1)))
digits_recognition.add(k.layers.MaxPooling2D(pool_size = (2, 2)))
digits_recognition.add(k.layers.Conv2D(filters = 64, kernel_size = (3, 3), activation = 'relu'))
digits_recognition.add(k.layers.MaxPooling2D(pool_size = (2, 2)))

# Выпрямление матриц изображений в вектор
digits_recognition.add(k.layers.Flatten())

# Создание полносвязного слоя для обучения и 10 выходных нейронов (по цифре на каждый)
digits_recognition.add(k.layers.Dense(units = 128, activation = 'relu'))
digits_recognition.add(k.layers.Dropout(0.5))
digits_recognition.add(k.layers.Dense(units = 10, activation = 'softmax'))

# Итоговый вывод модели
digits_recognition.summary()

### Задача №2. Структура бинарного классификатора кошек и собак (CNN, размер изображения 150х150x3)


Для создания модели бинарного классификатора для задачи распознавания кошек и собак используется сверточная нейронная сеть (CNN), работающая с изображениями размером 150 x 150 пикселей и 3 каналами (RGB).

Модель начинается с первого сверточного слоя, использующего 128 фильтров размером 5x5 и функцию активации ReLU. Этот слой извлекает базовые признаки изображения, такие как края и текстуры. Следующий слой представляет собой операцию подвыборки с размером окна 10x10, которая уменьшает размерность и помогает извлечь более абстрактные признаки, сохраняя важную информацию. После этого идет второй сверточный слой с 64 фильтрами размером 3x3 и активацией ReLU, который извлекает более сложные признаки, а еще один слой MaxPooling с размером окна 5x5 уменьшает размерность изображения.

После свёрток используется слой Flatten, который преобразует двумерную матрицу в одномерный вектор, чтобы его можно было подать на полносвязный слой. Полносвязный слой с 256 нейронами и функцией активации ReLU обрабатывает извлеченные признаки и объединяет информацию. Для предотвращения переобучения используется слой Dropout с вероятностью 0.5, который случайным образом отключает половину нейронов во время обучения.

Финальный выходной слой содержит один нейрон с активацией sigmoid, что позволяет модели выдавать вероятность принадлежности изображения к одному из двух классов — кошке или собаке. Модель компилируется с использованием оптимизатора Adam и функции потерь binary_crossentropy, а для оценки эффективности используется метрика точности (accuracy).

In [None]:
# Создание модели секвенциальным (последовательным) путём задания слоёв
animal_classificator = k.Sequential()

# Свёрточные слои и поиск ключевых признаков
animal_classificator.add(k.layers.Conv2D(filters = 128, kernel_size = (5, 5), activation = 'relu', input_shape = (150, 150, 3)))
animal_classificator.add(k.layers.MaxPooling2D(10, 10))
animal_classificator.add(k.layers.Conv2D(filters = 64, kernel_size = (3, 3), activation = 'relu'))
animal_classificator.add(k.layers.MaxPooling2D(5, 5))

# Выпрямление матриц изображений в вектор
animal_classificator.add(k.layers.Flatten())

# Создание полносвязного слоя для обучения и выходного нейрона классификации
animal_classificator.add(k.layers.Dense(units = 256, activation = 'relu'))
animal_classificator.add(k.layers.Dropout(0.5))
animal_classificator.add(k.layers.Dense(units = 1, activation = 'sigmoid'))

# Компиляция модели адамом, функцией потерь бинарная кросс-энтропии по метрике точности
animal_classificator.compile(optimizer = 'adam', loss = 'binary_crossentropy', metrics = ['accuracy'])

# Итоговый вывод модели
animal_classificator.summary()

### Задача №3. Структура регрессора. Входные данные - это вектор (60 x 1), MLP.



Для создания модели регрессора, работающей с входными данными в виде вектора размером (60, 1), используется многослойный перцептрон (MLP).

Модель состоит из нескольких полносвязных слоев, которые обрабатывают данные с использованием функции активации ReLU. В каждом полносвязном слое после активации добавляется слой BatchNormalization, что позволяет улучшить обучение, нормализуя данные после каждого слоя и ускоряя сходимость. Сначала входные данные обрабатываются через слой с 128 нейронами, затем через слой с 64 нейронами, и наконец через слой с 32 нейронами. Для предотвращения переобучения модель использует стандартную нормализацию данных на каждом шаге, что помогает предотвратить эффект затухающего градиента и улучшает стабильность.

После обработки данных скрытыми слоями, результат подается на выходной слой с одним нейроном, который предсказывает целевое значение для задачи регрессии. Для компиляции модели используется оптимизатор Adam, который помогает эффективно минимизировать ошибку во время обучения, и функция потерь mean_squared_error (среднеквадратичная ошибка), которая является стандартной для задач регрессии.

Таким образом, эта модель помогает предсказывать непрерывное значение, обучаясь на входных данных и извлекая важные закономерности через несколько скрытых слоев с нормализацией.

In [None]:
# Создание модели секвенциальным (последовательным) путём задания слоёв
regressor = k.Sequential([

    # Три полносвязных слоя для обработки данных с батч-нормализацией после каждого
    k.layers.Dense(units = 128, input_dim = 60, activation = 'relu'),
    k.layers.BatchNormalization(),
    k.layers.Dense(units = 64, activation = 'relu'),
    k.layers.BatchNormalization(),
    k.layers.Dense(units = 32, activation = 'relu'),
    k.layers.BatchNormalization(),

    # Выходной слой - значение регрессора
    k.layers.Dense(units = 1)
])

# Компиляция полученной модели адамом со стандартной функцией потерь для регрессии MSE
regressor.compile(optimizer = 'adam', loss = 'mean_squared_error')

# Итоговый вывод модели
regressor.summary()

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
