In [382]:
import numpy as np

def loss(y, label):
    diff = y - label
    abs_diff = np.absolute(diff)
    mean_diff = abs_diff.mean()
    
    return mean_diff

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def sigmoid_derivative(x):
    return x * (1 - x)

class Neuron:
    def __init__(self, inputs):
        # Веса и смещения инициализируются случайно
        self._weights = np.random.rand(inputs)
        self._bias = np.random.rand()
        self._output = None
        self._inputs = None
        self._delta = None
    
    def forward(self, inputs):
        self._inputs = inputs
        # Вычисление выхода через функцию активации (сигмоида)
        self._output = sigmoid(np.dot(self._inputs, self._weights) + self._bias)
        return self._output
    
    def backward(self, error):
        # Ошибка на данном нейроне
        self._delta = error * sigmoid_derivative(self._output)
        
        # Обновление весов и смещения
        # Умножаем ошибку на вход для каждого нейрона и обновляем веса
        self._weights -= self._delta * self._inputs
        self._bias -= self._delta

class Model:
    def __init__(self):
        # Создаем скрытые нейроны (2 нейрона с 2 входами)
        self.hidden = [Neuron(2) for _ in range(2)]
        # Выходной нейрон (с 2 входами, т.к. два скрытых нейрона)
        self.output = Neuron(2)
    
    def forward(self, inputs):
        # Прогон скрытого слоя
        out_h = np.array([self.hidden[i].forward(inputs) for i in range(len(self.hidden))])
        # Прогон выходного слоя
        out_o = self.output.forward(out_h)
        return out_o
    
    def backward(self, inputs, label):
        # Рассчитываем ошибку на выходе
        error = loss(self.output._output, label)
        
        # Обратное распространение для выходного слоя
        self.output.backward(error)
        
        # Теперь вычисляем ошибку для скрытого слоя
        hidden_errors = self.output._delta * self.output._weights
        
        # Обратное распространение для скрытых нейронов
        for i in range(len(self.hidden)):
            # Умножаем ошибку на вход для каждого скрытого нейрона
            self.hidden[i].backward(hidden_errors * inputs[i])

# Тренировочные данные (логический XOR)
test = [[[0, 0], 0], [[0, 1], 1], [[1, 0], 1], [[1, 1], 0]]
train = test
model = Model()

epoch = 1000
for _ in range(epoch):
    for X, label in train:
        y = model.forward(X)  # Прогон модели
        print("--- ", X, label)
        model.backward(X, label)  # Обратное распространение


---  [0, 0] 0
---  [0, 1] 1


ValueError: non-broadcastable output operand with shape (2,) doesn't match the broadcast shape (2,2)

In [370]:
import numpy as np

In [371]:
def loss(y, label):
    diff = y - label
    abs_diff = np.absolute(diff)
    mean_diff = abs_diff.mean()
    
    return mean_diff

def sigmoid(z):
    return 1 / (1 + np.exp(-z))

def sigmoid_derivative(x):
    return x * (1 - x)


In [372]:
class Neuron:
    def __init__(self, inputs):
        self._weights = np.random.rand(inputs)
        self._bias = np.random.rand()
        self._output = None
        self._inputs = None
        self._delta = None
    
    def forward(self, inputs):
        self._inputs = np.array(inputs)
        self._output = sigmoid(
            np.dot(self._inputs, self._weights) + self._bias
        )
        return self._output
    
    def backward(self, error):
        self._delta = error * sigmoid_derivative(self._output)
        
        self._weights -= self._delta * self._inputs
        self._bias -= self._delta

In [373]:
class Model:
    def __init__(self):
        self.hidden = [Neuron(2) for _ in range(2)]
        self.output = Neuron(2)
    
    def forward(self, inputs):
        out_h = np.array([self.hidden[i].forward(inputs) for i in range(len(self.hidden))])
        out_o = self.output.forward(out_h)
        
        return out_o
    
    def backward(self, inputs, label):
        error = loss(self.output._output, label)
        
        self.output.backward(error)
        hidden_errors = self.output._delta * np.array([neuron._weights for neuron in self.hidden])
        for i in range(len(self.hidden)):
            self.hidden[i].backward(hidden_errors[i] * inputs[i])


In [374]:
test = [[[0,0],0], [[0,1],1], [[1,0],1], [[1,1],0]]
train = test

In [375]:
model = Model()
epoch = 1000

In [376]:
for _ in range(epoch):
    for X, label in train:
        y = model.forward(X)
        print("--- ", X, label)
        model.backward(X, label)

---  [0, 0] 0
---  [0, 1] 1


ValueError: non-broadcastable output operand with shape (2,) doesn't match the broadcast shape (2,2)

In [252]:
for X, label in test:
    print(f"Input: {X}; Predict: {model.forward(X)}.")

Input: (0, 0); Predict: 1.0678820995742516e-11.
Input: (0, 1); Predict: 0.5292391889465566.
Input: (1, 0); Predict: 0.5292391889465566.
Input: (1, 1); Predict: 0.5292391889465566.
