### **Лабораторная работа 1**

***
__Алгоритм обучения методом градиентного спуска__
***

In [3]:
# Импортирование необходимых модулей
import numpy as np
import tensorflow as tf

In [4]:
# Загрузка и подготовка данных MNIST
"""Шаг 1: Подготовка обучающей выборки."""
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()

In [5]:
# Нормализация данных
x_train = x_train / 255.0
x_test = x_test / 255.0

In [6]:
# Преобразование меток в категориальный формат
num_classes = 10
y_train = np.eye(num_classes)[y_train]
y_test = np.eye(num_classes)[y_test]

In [7]:
# Преобразование изображений в векторы
x_train = x_train.reshape(x_train.shape[0], -1)
x_test = x_test.reshape(x_test.shape[0], -1)

##### Используем БД MNIST.
- Изображения представляют собой одну цифру в диапазоне от 0 до 9, значения пикселей нормализованы к диапазону от 0 до 1.
- Метки классов преобразованы в формат one-hot encoding (для задач многоцелевого распознавания)

In [8]:
class Perceptron:
    def __init__(self, input_dim, output_dim, learning_rate=0.1):
        """Шаг 2: Инициализация персептрона с заданными размерами входа и выхода.
        
        Args:
            input_dim (int): Размерность входных данных.
            output_dim (int): Количество выходных нейронов.
            learning_rate (float): Скорость обучения.
        """
        self.weights = np.random.randn(input_dim, output_dim) * 0.01
        self.biases = np.random.randn(output_dim) * 0.01
        self.learning_rate = learning_rate

    def sigmoid(self, x):
        """Сигмоидальная функция активации.
        
        Args:
            x (numpy.ndarray): Входные данные.
        
        Returns:
            numpy.ndarray: Выходные данные после применения сигмоидальной функции.
        """
        return 1 / (1 + np.exp(-x))

    def sigmoid_derivative(self, y):
        """Производная сигмоидальной функции.
        
        Args:
            y (numpy.ndarray): Выходные данные после применения сигмоидальной функции.
        
        Returns:
            numpy.ndarray: Производная сигмоидальной функции.
        """
        return y * (1 - y)

    def forward(self, X):
        """Шаг 5: Вычисление выхода нейронов.
        
        Args:
            X (numpy.ndarray): Входные данные.
        
        Returns:
            numpy.ndarray: Выход нейронов.
        """
        return self.sigmoid(np.dot(X, self.weights) + self.biases)

    def train(self, x_train, y_train, epochs, threshold=1e-3):
        """Шаг 3: Обучение персептрона с использованием градиентного спуска.
        
        Args:
            x_train (numpy.ndarray): Обучающие данные.
            y_train (numpy.ndarray): Метки классов для обучающих данных.
            epochs (int): Количество эпох для обучения.
            threshold (float): Порог для остановки обучения.
        """
        for epoch in range(epochs):
            total_error = 0
            weight_updates = np.zeros_like(self.weights)
            bias_updates = np.zeros_like(self.biases)

            for i in range(x_train.shape[0]):
                """Шаг 4: Обработка обучающей выборки"""
                X, D = x_train[i:i + 1], y_train[i:i + 1]

                """Шаг 5: Вычисление взвешенной суммы входных сигналов и выходного сигнала на основании функции активации"""
                Y = self.forward(X)

                """Шаг 6: Вычисление ошибки для текущего обучающего вектора"""
                error = D - Y
                total_error += np.sum(error**2) / 2
                delta = error * self.sigmoid_derivative(Y)

                """Шаг 7: Посчет величины коррекции синаптических весов нейрона и нейронных смещений"""
                weight_updates += np.outer(X.T, delta)
                bias_updates += delta.flatten()

            """Шаг 9: Коррекция синаптических весов"""
            self.weights += self.learning_rate * weight_updates / x_train.shape[0]
            self.biases += self.learning_rate * bias_updates / x_train.shape[0]
            total_error /= x_train.shape[0]

            """Шаг 8: Проверка критерия останова обучения"""
            if total_error < threshold:
                print(f'Прерывание обучения в эпоху {epoch + 1} из-за низкой погрешности: {total_error:.4f}')
                break
            print(f'Эпоха {epoch + 1}/{epochs}, Ошибка: {total_error:.4f}')

    def evaluate(self, x_test, y_test):
        """Оценка точности персептрона на тестовых данных."
        
        Args:
            x_test (numpy.ndarray): Входные данные для тестирования.
            y_test (numpy.ndarray): Желаемые выходные данные для тестирования.
        
        Returns:
            float: Точность модели на тестовых данных.
        """
        predictions = np.argmax(self.forward(x_test), axis=1)
        return np.mean(predictions == np.argmax(y_test, axis=1))

In [9]:
# Параметры персептрона
perceptron = Perceptron(input_dim=x_train.shape[1], output_dim=10)

In [12]:
# Обучение персептрона
perceptron.train(x_train, y_train, epochs=100)

Эпоха 1/100, Ошибка: 0.3971
Эпоха 2/100, Ошибка: 0.3953
Эпоха 3/100, Ошибка: 0.3936
Эпоха 4/100, Ошибка: 0.3919
Эпоха 5/100, Ошибка: 0.3902
Эпоха 6/100, Ошибка: 0.3886
Эпоха 7/100, Ошибка: 0.3869
Эпоха 8/100, Ошибка: 0.3853
Эпоха 9/100, Ошибка: 0.3837
Эпоха 10/100, Ошибка: 0.3821
Эпоха 11/100, Ошибка: 0.3805
Эпоха 12/100, Ошибка: 0.3789
Эпоха 13/100, Ошибка: 0.3773
Эпоха 14/100, Ошибка: 0.3758
Эпоха 15/100, Ошибка: 0.3743
Эпоха 16/100, Ошибка: 0.3728
Эпоха 17/100, Ошибка: 0.3713
Эпоха 18/100, Ошибка: 0.3698
Эпоха 19/100, Ошибка: 0.3683
Эпоха 20/100, Ошибка: 0.3668
Эпоха 21/100, Ошибка: 0.3654
Эпоха 22/100, Ошибка: 0.3639
Эпоха 23/100, Ошибка: 0.3625
Эпоха 24/100, Ошибка: 0.3611
Эпоха 25/100, Ошибка: 0.3597
Эпоха 26/100, Ошибка: 0.3583
Эпоха 27/100, Ошибка: 0.3570
Эпоха 28/100, Ошибка: 0.3556
Эпоха 29/100, Ошибка: 0.3543
Эпоха 30/100, Ошибка: 0.3529
Эпоха 31/100, Ошибка: 0.3516
Эпоха 32/100, Ошибка: 0.3503
Эпоха 33/100, Ошибка: 0.3490
Эпоха 34/100, Ошибка: 0.3477
Эпоха 35/100, Ошибка: 0

In [11]:
# Финальная оценка модели на тестовых данных
final_accuracy = perceptron.evaluate(x_test, y_test)
print(f'Финальная точность: {final_accuracy:.4f}')

Финальная точность: 0.6083
