# Архитектура MLP: как соединяются слои

## Реализация MLP на NumPy

#### Пример из курса

In [1]:
import numpy as np

class SampleMLP:
    def __init__(self, layer_sizes, activation='relu'):
        self.layer_sizes = layer_sizes
        self.activation = activation
        self.W = []
        self.b = []
        for i in range(len(layer_sizes) - 1):
            in_dim = layer_sizes[i]
            out_dim = layer_sizes[i + 1]
            # Инициализация весов небольшой случайной матрицей
            weight_matrix = np.random.randn(in_dim, out_dim) * 0.1
            # Инициализация смещения нулями
            bias_vector = np.zeros((1, out_dim))
            self.W.append(weight_matrix)
            self.b.append(bias_vector)

### Задание 1
Создайте аналогичный класс MLP с активацией `sigmoid` в параметрах `__init__`. 

In [2]:
import numpy as np

class MLP:
    # Допишите код MLP
    def __init__(self, layer_sizes, activation='sigmoid'):
        self.layer_sizes = layer_sizes
        self.activation = activation
        self.W = []
        self.b = []
        for i in range(len(layer_sizes) - 1):
            in_dim = layer_sizes[i]
            out_dim = layer_sizes[i + 1]
            # Инициализация весов небольшой случайной матрицей
            weight_matrix = np.random.randn(in_dim, out_dim) * 0.1
            # Инициализация смещения нулями
            bias_vector = np.zeros((1, out_dim))
            self.W.append(weight_matrix)
            self.b.append(bias_vector)

После вычисления взвешенной суммы нейрон применяет функцию активации. Sigmoid даёт выход, плавно сжимая значения в диапазоне (0,1).

Sigmoid задаётся формулой:

In [None]:
1 / (1 + np.exp(-Z))  # плавно сжимает значения к диапазону (0,1)

### Задание 2
Допишите функцию активации в MLP. 

In [3]:
import numpy as np

class MLP:

    def __init__(self, layer_sizes, activation='sigmoid'):
        self.layer_sizes = layer_sizes
        self.activation = activation
        self.W = []      # список матриц весов
        self.b = []      # список векторов смещений
        # Ваша задача заполнить self.W и self.b случайными параметрами
        for i in range(len(layer_sizes) - 1):
            in_dim = layer_sizes[i]
            out_dim = layer_sizes[i + 1]
            weight_matrix = np.random.randn(in_dim, out_dim) * 0.1
            bias_vector = np.zeros((1, out_dim))
            self.W.append(weight_matrix)
            self.b.append(bias_vector)

    def _sigmoid(self, Z):
        # Нужно вернуть 1 / (1 + np.exp(-Z))
        # Ваш код здесь
        return 1 / (1 + np.exp(-Z))

Осталось реализовать прямой проход. Он объединяет инициализацию и активации. 

На первом шаге A = X, затем итерируемся по слоям, используя веса W и смещения b. 

Для скрытых слоёв применяем активацию. 

`A = self._relu(Z)`

Для последнего слоя не применяем активацию, так как она зависит от задачи (регрессия, классификация и т.п.).


In [None]:
# Демонстрация кода внутри метода forward:
# A = X
# for i, (W, b) in enumerate(zip(self.W, self.b)):
#     Z = A.dot(W) + b
#     if i < len(self.W) - 1:
#         A = self._relu(Z)
#     else:
#         A = Z  # линейный выход для последнего слоя
# return A