In [132]:
import numpy as np
import matplotlib.pyplot as plt

class Perceptron:
    def __init__(self, input_size, learning_rate=0.1):
        self.weights = np.random.randn(input_size) * 0.01
        self.bias = 0
        self.lr = learning_rate

    def predict(self, X):
        z = X @ self.weights + self.bias
        return (z >= 0).astype(int)

    def train(self, X, y, epochs=100):
        for epoch in range(epochs):
            for xi, yi in zip(X, y):
                pred = self.predict(xi.reshape(1, -1))[0]
                error = yi - pred

                # Perceptron learning rule
                self.weights += self.lr * error * xi
                self.bias += self.lr * error

# Дані XOR
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 1, 1, 0])  # XOR

# Навчання
perceptron = Perceptron(2)
perceptron.train(X, y, epochs=100)

# Результати
print("XOR з одним персептроном:")
for xi, yi in zip(X, y):
    pred = perceptron.predict(xi.reshape(1, -1))[0]
    print(f"Input: {xi}, True: {yi}, Predicted: {pred}")
print("Персептрон не може вирішити XOR!")

XOR з одним персептроном:
Input: [0 0], True: 0, Predicted: 1
Input: [0 1], True: 1, Predicted: 0
Input: [1 0], True: 1, Predicted: 0
Input: [1 1], True: 0, Predicted: 0
Персептрон не може вирішити XOR!


In [178]:
class SimpleMLP:
    def __init__(self):
        # 2 входи -> 2 приховані -> 1 вихід
        self.W1 = np.random.randn(2, 2)
        self.b1 = np.zeros((1, 2))
        self.W2 = np.random.randn(2, 1)
        self.b2 = np.zeros((1, 1))

    def forward(self, X):
        # Прихований шар
        self.z1 = X @ self.W1 + self.b1
        self.a1 = np.maximum(0, self.z1)  # ReLU

        # Вихідний шар
        self.z2 = self.a1 @ self.W2 + self.b2
        self.a2 = 1 / (1 + np.exp(-self.z2))  # Sigmoid

        return self.a2

    def train(self, X, y, epochs=1000, lr=0.1):
        for epoch in range(epochs):
            # Forward pass
            output = self.forward(X)

            # Backward pass (спрощений)
            m = X.shape[0]

            # Градієнт вихідного шару
            dz2 = output - y.reshape(-1, 1)
            dW2 = (1/m) * self.a1.T @ dz2
            db2 = (1/m) * np.sum(dz2, axis=0, keepdims=True)

            # Градієнт прихованого шару
            da1 = dz2 @ self.W2.T
            dz1 = da1 * (self.z1 > 0)  # ReLU derivative
            dW1 = (1/m) * X.T @ dz1
            db1 = (1/m) * np.sum(dz1, axis=0, keepdims=True)

            # Оновлення ваг
            self.W2 -= lr * dW2
            self.b2 -= lr * db2
            self.W1 -= lr * dW1
            self.b1 -= lr * db1

            if epoch % 100 == 0:
                loss = np.mean((output - y.reshape(-1, 1))**2)
                print(f"Epoch {epoch}, Loss: {loss:.4f}")

# Навчання MLP на XOR
mlp = SimpleMLP()
mlp.train(X, y, epochs=1000, lr=0.5)

# Результати
print("\nXOR з MLP:")
predictions = mlp.forward(X)
for xi, yi, pred in zip(X, y, predictions):
    print(f"Input: {xi}, True: {yi}, Predicted: {pred[0]:.3f}")

Epoch 0, Loss: 0.3776
Epoch 100, Loss: 0.1671
Epoch 200, Loss: 0.1667
Epoch 300, Loss: 0.1667
Epoch 400, Loss: 0.1667
Epoch 500, Loss: 0.1667
Epoch 600, Loss: 0.1667
Epoch 700, Loss: 0.1667
Epoch 800, Loss: 0.1667
Epoch 900, Loss: 0.1667

XOR з MLP:
Input: [0 0], True: 0, Predicted: 0.666
Input: [0 1], True: 1, Predicted: 0.666
Input: [1 0], True: 1, Predicted: 0.666
Input: [1 1], True: 0, Predicted: 0.001
