In [1]:
import numpy as np

In [2]:
# Define activation function

class BaseActivation:
    def forward(self, layer: np.array) -> np.ndarray:
        raise NotImplementedError

    def backwards(self, layer: np.array) -> np.ndarray:
        raise NotImplementedError

In [None]:
# Не преобразует код - беред слой и возвращает
# На последнем слое сводит ранг матрицы к единице

class LinearActivation(BaseActivation):
    def forward(self, layer: np.array) -> np.ndarray:
        return layer
    
    # В качестве производной возвращает массив единиц той же самой размерности
    def backwards(self, layer: np.array) -> np.ndarray:
        return np.ones(layer.shape)

In [3]:
# Кусочно линейная функция активации. Отбрасывает все что ниже нуля
# Может не сойтись на маленькой сети, как XOR например
class ReluActivation(BaseActivation):
    def forward(self, layer: np.array) -> np.ndarray:
        return np.maximum(layer, 0)
    
    def backwards(self, layer: np.array) -> np.ndarray:
        return np.where(layer > 0, 1, 0)

In [4]:
# Домножает всё что ниже нуля на некоторый коэффициент
# Сходится всегда, т.к. не зануляет градиенты
class LeakyReluActivation(BaseActivation):
    pass

In [5]:


class SigmoidActivvation(BaseActivation):
    def forward(self, layer: np.array) -> np.ndarray:
        return 1.0

In [6]:
class BaseLossFunction:
    def compute_loss(self, y_true: np.array, y_pred: np.array) -> np.ndarray:
        raise NotImplementedError
        
    def compute_gradient(self, y_pred: np.array, y_true: np.array) -> np.ndarray:
        raise NotImplementedError

In [7]:
class MeanSquareError(BaseLossFunction):
    def compute_loss(self, y_pred: np.array, y_true: np.array) -> np.ndarray:
        return ((y_pred - y_true)**2)/2
    
    def compute_gradient(self, y_pred: np.array, y_true: np.array) -> np.ndarray:
        return (y_pred - y_true)

In [None]:
# Полносвязная сеть выглядит:
'''
Входной слой с некоторым кол-вом слоёв
Скрытые слои
Выходной слой

Каждая нода связана с каждой нодой из предыдущего слова

К каждой ноде на первом скрытом слое добавляется байас=1
При преобразовании, значение перемещается в многомерном пространстве. Но т.к. точку ноль сдвинуть невозможно, мы добавляем байас, чтобы научить нейронку сдвигу.


Инициализируем нейронную сеть задавая размерность слоёв (кол-во нод в каждом слое)

-------------------------------------------------------

Команда zip позвращает tuple из первых элементов заданных объектов, потом из вторых элементов заданных объектов и т.д.
    Под дефолту продолжается до конца самого короткого из элементов.

np.expand_dims(a, axis = 0) - изменяет размерность матрицы. В некотором роде поворачивает её, но на самом деле нет



'''