#1. Импорт библиотек и определение класса нейронной сети

In [1]:
import numpy as np

In [2]:
# Определяем класс для настраиваемой нейронной сети
class ConfigurableNeuralNetwork:
    def __init__(self, input_size, hidden_size, output_size):

        # Инициализация нейронной сети.

        self.input_size = input_size
        self.hidden_size = hidden_size
        self.output_size = output_size

        # Инициализация весов и смещений для слоев

        self.W1 = np.random.randn(self.input_size, self.hidden_size)
        self.b1 = np.zeros((1, self.hidden_size))
        self.W2 = np.random.randn(self.hidden_size, self.output_size)
        self.b2 = np.zeros((1, self.output_size))


    def sigmoid(self, x):
        """
        Сигмоидная функция активации.
        """
        return 1 / (1 + np.exp(-x))


    def sigmoid_derivative(self, x):
        """
        Производная сигмоидной функции.
        """
        return x * (1 - x)


    # Функция прямого распространения данных через сеть
    def forward(self, X):
        """
        Прямое распространение (forward propagation).
        """
        self.z1 = np.dot(X, self.W1) + self.b1  # Линейная комбинация входных данных и весов
        self.a1 = self.sigmoid(self.z1)  # Применяем активацию к скрытому слою
        self.z2 = np.dot(self.a1, self.W2) + self.b2  # Линейная комбинация скрытого слоя и весов
        self.a2 = self.sigmoid(self.z2)  # Применяем активацию к выходному слою
        return self.a2, self.a1  # Возвращаем выходные данные и значения скрытого слоя



    def backward(self, X, y, output, hidden_layer):
        """
        Обратное распространение (backpropagation).
        """
        error = y - output  # Ошибка на выходном слое

        # Рассчитываем дельты и градиенты для каждого слоя
        delta2 = error * self.sigmoid_derivative(output)
        dW2 = np.dot(hidden_layer.T, delta2)
        db2 = np.sum(delta2, axis=0, keepdims=True)

        delta1 = delta2.dot(self.W2.T) * self.sigmoid_derivative(hidden_layer)
        dW1 = np.dot(X.T, delta1)
        db1 = np.sum(delta1, axis=0)

        return dW1, db1, dW2, db2  # Возвращаем градиенты для обновления весов и смещений


    def train(self, X, y, learning_rate, epochs):
        """
        Обучение нейронной сети.
        """
        for i in range(epochs):
            # Выполняем прямое распространение и получаем предсказания
            output, hidden_layer = self.forward(X)
            # Выполняем обратное распространение для получения градиентов
            dW1, db1, dW2, db2 = self.backward(X, y, output, hidden_layer)

            # Обновляем веса и смещения
            self.W1 += learning_rate * dW1
            self.b1 += learning_rate * db1
            self.W2 += learning_rate * dW2
            self.b2 += learning_rate * db2

            # Печатаем ошибку каждые 1000 эпох
            if (i % 1000 == 0):
                loss = np.mean(np.square(y - output))
                print(f"Epoch {i}, Loss: {loss}")

  # Функция для предсказания на основе обученной модели
    def predict(self, X):
        """
        Предсказание на основе обученной модели.
        """
        output, _ = self.forward(X)  # Прогоняем данные через сеть
        return np.round(output)  # Округляем результат до 0 или 1


#3. Основной код для тестирования

In [3]:
# Основной код для тестирования нейронной сети
if __name__ == "__main__":
    # Создаем искусственный датасет для задачи XOR
    X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
    y = np.array([[0], [1], [1], [0]])  # XOR

    # Параметры нейронной сети
    input_size = 2
    hidden_size = 10  # Количество нейронов в скрытом слое
    output_size = 1
    learning_rate = 0.1
    epochs = 10000

    # Создаем и обучаем нейронную сеть
    nn = ConfigurableNeuralNetwork(input_size, hidden_size, output_size)
    nn.train(X, y, learning_rate, epochs)

    # Тестовые данные
    X_test = np.array([[0, 0], [1, 1], [0, 1], [1, 0], [0.5, 0.5], [0.2, 0.8], [0.8, 0.2]])

    # Предсказания
    predictions = nn.predict(X_test)

    # Выводим результаты предсказаний
    print("\n--- Результаты предсказаний ---")
    for i, (inp, pred) in enumerate(zip(X_test, predictions)):
        print(f"Тест {i+1}: Входные данные: {inp} → Предсказание: {pred[0]}")
    print("--- Конец предсказаний ---\n")


Epoch 0, Loss: 0.3053851925851801
Epoch 1000, Loss: 0.08737521212855612
Epoch 2000, Loss: 0.017511453699769274
Epoch 3000, Loss: 0.007486980194585744
Epoch 4000, Loss: 0.0044449592658621475
Epoch 5000, Loss: 0.003073825397179421
Epoch 6000, Loss: 0.0023156816331120584
Epoch 7000, Loss: 0.001841779647755833
Epoch 8000, Loss: 0.001520449738248718
Epoch 9000, Loss: 0.0012896211599770025

--- Результаты предсказаний ---
Тест 1: Входные данные: [0. 0.] → Предсказание: 0.0
Тест 2: Входные данные: [1. 1.] → Предсказание: 0.0
Тест 3: Входные данные: [0. 1.] → Предсказание: 1.0
Тест 4: Входные данные: [1. 0.] → Предсказание: 1.0
Тест 5: Входные данные: [0.5 0.5] → Предсказание: 0.0
Тест 6: Входные данные: [0.2 0.8] → Предсказание: 1.0
Тест 7: Входные данные: [0.8 0.2] → Предсказание: 1.0
--- Конец предсказаний ---

