### **Лабораторная работа 1**

***
__Алгоритм обучения методом градиентного спуска__
***

In [None]:
# Импортование необходимых модулей
import numpy as np
import tensorflow as tf

In [None]:
# Загрузка и подготовка данных MNIST
"""Шаг 1: Подготовка обучающей выборки."""
mnist = tf.keras.datasets.mnist
(x_train, y_train), (x_test, y_test) = mnist.load_data()


In [None]:
# Нормализация данных
x_train = x_train / 255.0
x_test = x_test / 255.0

In [None]:
# Преобразование меток в категориальный формат
num_classes = 10
y_train = np.eye(num_classes)[y_train]
y_test = np.eye(num_classes)[y_test]

In [None]:
# Преобразование изображений в векторы
x_train = x_train.reshape(x_train.shape[0], -1)
x_test = x_test.reshape(x_test.shape[0], -1)

##### Используем БД MNIST.
- Изображения представляют собой одну цифру в диапазоне от 0 до 9, значения пикселей нормализованы к диапазону от 0 до 1.
- Метки классов преобразованы в формат one-hot encoding (для задач многоцелевого распознавания)

In [None]:
class Perceptron:
    def __init__(self, input_dim, output_dim, learning_rate=0.1):
        """Шаг 2: Инициализация персептрона с заданными размерами входа и выхода.
        
        Args:
            input_dim (int): Размерность входных данных.
            output_dim (int): Количество выходных нейронов.
            learning_rate (float): Скорость обучения.
        """
        self.weights = np.random.randn(input_dim, output_dim) * 0.01
        self.biases = np.random.randn(output_dim) * 0.01
        self.learning_rate = learning_rate

    def sigmoid(self, x):
        """Сигмоидальная функция активации.
        
        Args:
            x (numpy.ndarray): Входные данные.
        
        Returns:
            numpy.ndarray: Выходные данные после применения сигмоидальной функции.
        """
        return 1 / (1 + np.exp(-x))

    def sigmoid_derivative(self, y):
        """Производная сигмоидальной функции.
        
        Args:
            y (numpy.ndarray): Выходные данные после применения сигмоидальной функции.
        
        Returns:
            numpy.ndarray: Производная сигмоидальной функции.
        """
        return y * (1 - y)

    def forward(self, X):
        """Шаг 5: Вычисление выхода нейронов.
        
        Args:
            X (numpy.ndarray): Входные данные.
        
        Returns:
            numpy.ndarray: Выход нейронов.
        """
        return self.sigmoid(np.dot(X, self.weights) + self.biases)

    def train(self, x_train, y_train, epochs, threshold=1e-3):
        """Шаг 3: Обучение персептрона с использованием градиентного спуска.
        
        Args:
            x_train (numpy.ndarray): Обучающие данные.
            y_train (numpy.ndarray): Метки классов для обучающих данных.
            epochs (int): Количество эпох для обучения.
            threshold (float): Порог для остановки обучения.
        """
        for epoch in range(epochs):
            total_error = 0
            weight_updates = np.zeros_like(self.weights)
            bias_updates = np.zeros_like(self.biases)

            for i in range(x_train.shape[0]):
                """Шаг 4: Обработка обучающей выборки"""
                X, D = x_train[i:i + 1], y_train[i:i + 1]

                """Шаг 5: Вычисление взвешенной суммы входных сигналов и выходного сигнала на основании функции активации"""
                Y = self.forward(X)

                """Шаг 6: Вычисление ошибки для текущего обучающего вектора"""
                error = D - Y
                total_error += np.sum(error**2) / 2
                delta = error * self.sigmoid_derivative(Y)

                """Шаг 7: Посчет величины коррекции синаптических весов нейрона и нейронных смещений"""
                weight_updates += np.outer(X.T, delta)
                bias_updates += delta.flatten()

            """Шаг 9: Коррекция синаптических весов"""
            self.weights += self.learning_rate * weight_updates / x_train.shape[0]
            self.biases += self.learning_rate * bias_updates / x_train.shape[0]
            total_error /= x_train.shape[0]

            """Шаг 8: Проверка критерия останова обучения"""
            if total_error < threshold:
                print(f'Прерывание обучения в эпоху {epoch + 1} из-за низкой погрешности: {total_error:.4f}')
                break
            print(f'Эпоха {epoch + 1}/{epochs}, Ошибка: {total_error:.4f}')

    def evaluate(self, x_test, y_test):
        """Оценка точности персептрона на тестовых данных."
        
        Args:
            x_test (numpy.ndarray): Входные данные для тестирования.
            y_test (numpy.ndarray): Желаемые выходные данные для тестирования.
        
        Returns:
            float: Точность модели на тестовых данных.
        """
        predictions = np.argmax(self.forward(x_test), axis=1)
        return np.mean(predictions == np.argmax(y_test, axis=1))

In [183]:
# Параметры персептрона
perceptron = Perceptron(input_dim=x_train.shape[1], output_dim=10)

In [184]:
# Обучение персептрона
perceptron.train(x_train, y_train, epochs=25)

Эпоха 1/25, Ошибка: 1.2505
Эпоха 2/25, Ошибка: 0.9321
Эпоха 3/25, Ошибка: 0.7604
Эпоха 4/25, Ошибка: 0.6655
Эпоха 5/25, Ошибка: 0.6081
Эпоха 6/25, Ошибка: 0.5704
Эпоха 7/25, Ошибка: 0.5440
Эпоха 8/25, Ошибка: 0.5245
Эпоха 9/25, Ошибка: 0.5096
Эпоха 10/25, Ошибка: 0.4977
Эпоха 11/25, Ошибка: 0.4881
Эпоха 12/25, Ошибка: 0.4801
Эпоха 13/25, Ошибка: 0.4732
Эпоха 14/25, Ошибка: 0.4673
Эпоха 15/25, Ошибка: 0.4621
Эпоха 16/25, Ошибка: 0.4575
Эпоха 17/25, Ошибка: 0.4533
Эпоха 18/25, Ошибка: 0.4495
Эпоха 19/25, Ошибка: 0.4461
Эпоха 20/25, Ошибка: 0.4428
Эпоха 21/25, Ошибка: 0.4398
Эпоха 22/25, Ошибка: 0.4370
Эпоха 23/25, Ошибка: 0.4343
Эпоха 24/25, Ошибка: 0.4317
Эпоха 25/25, Ошибка: 0.4292


In [185]:
# Финальная оценка модели на тестовых данных
final_accuracy = perceptron.evaluate(x_test, y_test)
print(f'Финальная точность: {final_accuracy:.4f}')

Финальная точность: 0.6478
