In [None]:
# DoubleLinkedList
from multipledispatch import dispatch
from abc import ABCMeta, abstractproperty

from enum import Enum
import numpy as np

class Node:
    __metaclass__ = ABCMeta

    @abstractproperty
    def pref():
        """Ссылка на предыдущий объект"""

    @abstractproperty
    def nref():
        """Ссылка на следующий объект"""
        
class DoubleLinkedList:
    def __init__(self) -> None:
        self.head = None
        self.tail = None
    
    def _insert_start(self, obj: Node) -> bool:
        if not self.head:
            self.head = obj
            self.tail = self.head
            return True
        return False

    @dispatch(object)
    def insert(self, obj: Node):
        if self._insert_start(obj):
            return self

        obj.pref = self.tail
        self.tail.nref = obj
        
        self.tail = obj
        return self

    @dispatch(list)
    def insert(self, obj: list):
        while obj:
            self.insert(obj[0])
            obj.pop(0)
        return self

class Func(Enum):
    linear  = (lambda x: x, 
               lambda x: 1)
    
    sigmoid = (lambda x: 1 / (1 + np.exp(-x)), 
               lambda x: np.exp(x) / (1 + np.exp(x))**2)
    
    relu    = (lambda x: np.maximum(0, x),
               lambda x: (x > 0) * 1)
    
    tanh    = (lambda x: (np.exp(2 * x) - 1) / (np.exp(2 * x) + 1),
               lambda x: 4 * np.exp(2 * x) / (np.exp(2 * x) + 1)**2)
    
    mse     = (lambda y_true, y_pred: np.sum((y_true - y_pred)**2) / y_true.shape[0],
               lambda y_true, y_pred: 2 * (y_true - y_pred))

mul = np.dot
def null(x) -> bool: return x.shape[0] == 0 if type(x) is np.ndarray else not bool(x)

class Layer(Node):
    def __init__(self, n_neurons: int, actFunc: Func, lmbd: float = 0.1) -> None:
        self.n_neurons = n_neurons
        self.actFunc, self.actFuncDer = actFunc.value
        self.lmbd = lmbd
        self.W, self.B = None, None
        self.T, self.H = None, None
        self._pref = None
        self._nref = None

    def update_weights(self) -> None:
        if null(self.W) and null(self.B):
            self.W = np.random.uniform(-.5, .5, (self.n_neurons,self.nref.n_neurons))
            self.B = np.random.uniform(-.5, .5, (1, self.nref.n_neurons))
            
            self.dE_dW = np.zeros(self.W.shape)
            self.dE_dB = np.zeros(self.B.shape)
        else:
            self.W = self.W + self.lmbd * self.dE_dW
            self.B = self.B + self.lmbd * self.dE_dB

    def transform(self, X: np.ndarray) -> np.ndarray:
        # если мы в последнем слое, то применяем функцию активации
        if not self.nref:
            return self.actFunc(X)

        # обновление весов
        self.update_weights()

        # если это первый слой, инициализируем h
        self.H = X if not self.pref else self.H

        # считаем сумму T и применяем функцию активации для
        # нахождения H для следующего слоя
        self.nref.T = mul(self.H, self.W) + self.B
        self.nref.H = self.actFunc(self.nref.T)
        # возвращаем вектор для следующего слоя
        return self.nref.H

    def backprop(self, dE_dH):
        # если это последний слой, принимаем производную ошибки
        # иначе считаем как dE_dT_(i + 1) * W_T
        self.dE_dH = dE_dH if not self.nref else mul(self.nref.dE_dT, self.W.T)
        self.dE_dT = self.dE_dH * self.actFuncDer(self.T)
        
        # градиент весов предыдущего слоя
        self.pref.dE_dW = mul(self.pref.H.T, self.dE_dT)
        
        # градиент смещения предыдущего слоя
        self.pref.dE_dB = self.dE_dT

    @property
    def pref(self): return self._pref

    @pref.setter
    def pref(self, obj): self._pref = obj
    
    @property
    def nref(self): return self._nref

    @nref.setter
    def nref(self, obj): self._nref = obj
	
class NeuralNetwork:
    def __init__(self, layers: list[Layer], lossFunc: Func) -> None:
        # двусвязный список s1 <--> s2 <--> s3 <--> s4
        self.layers = DoubleLinkedList().insert(layers)
        # функция потерь и её производная
        self.lossFunc, self.lossFuncDer = lossFunc.value

    def fit(self, X: np.ndarray, Y: np.ndarray, n_epohs: int = 400, eps: float = 0.0001):
        self.answer = np.zeros((X.shape[0],))
        for _ in range(n_epohs):
            last_answer = []
            for i in range(X.shape[0]):
                # прямое распространение
                layer = self.layers.head
                vector = X[i].reshape(1, X[i].shape[0])
                while layer != None:
                    vector = layer.transform(vector)
                    layer = layer.nref

                #градиент ошибки
                dE_dH = self.lossFuncDer(Y[i], vector)

                # обратное распространение
                layer = self.layers.tail
                while layer.pref != None:
                    layer.backprop(dE_dH)
                    layer = layer.pref
                last_answer.append(vector)
            if _ % 20 == 0:
                print(f'Эпоха {_}: Ошибка: {self.lossFunc(Y,last_answer).round(3)}')
            # точка остановки градиентного спуска
            if (np.fabs(self.answer - np.array(last_answer)) < eps).all():
                break   
            self.answer = last_answer
        return self
	
    def predict(self, X: np.ndarray):
        answer = np.empty((0,self.layers.tail.n_neurons))
        for i in range(X.shape[0]):
            # прямое распространение
            layer = self.layers.head
            vector = X[i].reshape(1, X[i].shape[0])
            while layer != None:
                vector = layer.transform(vector)
                layer = layer.nref
            answer = np.vstack((answer,vector))
        return answer
    
# test 1
model = NeuralNetwork(
    [Layer(2, actFunc=Func.sigmoid,lmbd=0.9), 
     Layer(4, actFunc=Func.sigmoid,lmbd=0.9),
     Layer(1, actFunc=Func.linear)], 
    lossFunc=Func.mse)

model.fit(
    X=np.array([[0,0], [0,1], [1,0], [1,1]]),
    Y=np.array([0, 1, 1, 0]),
    n_epohs=1000,
    eps=0.0001
)

model.predict(
    X=np.array([[0,0], [0,1], [1,0], [1,1]])
)

In [71]:
# test 2
model = NeuralNetwork(
    [Layer(3, actFunc=Func.sigmoid,lmbd=1.2), 
     Layer(4, actFunc=Func.sigmoid,lmbd=1.2),
     Layer(4, actFunc=Func.sigmoid,lmbd=1.2),
     Layer(1, actFunc=Func.linear)], 
    lossFunc=Func.mse)

x = np.random.randint(0,80,(100,3))
y = x.sum(axis=1) % 2

model.fit(
    X=x,
    Y=y,
    n_epohs=1000,
    eps=0.0001
)

x_test = np.random.randint(0,80,(10,3))
y_test = x_test.sum(axis=1) % 2

print(model.predict(x_test))
print(y_test)

Эпоха 0: Ошибка: 33.135
[[3.19466475e-01]
 [7.49762533e-02]
 [1.38017220e-02]
 [2.41058327e-03]
 [4.17055149e-04]
 [7.20362012e-05]
 [1.24390475e-05]
 [2.14785575e-06]
 [3.70870622e-07]
 [6.40386463e-08]]
[0 1 1 0 1 0 0 1 1 0]


4. Реализуйте сверточный слой (прямое и обратное распространение). Используйте реализацию многослойного персептрона из ЛР №7. Соберите CNN, используя разработанные Вами слои.
5. Попробуйте обучить классификатор кошек и собак с использованием собственной реализации CNN.

In [3]:
# import matplotlib.pyplot as plt
# from matplotlib.image import imread
# image = imread('../../Datasets/Lab8_Data/cats/4.jpg')

In [4]:
# # image = np.random.randint(0,10,(6,6,3))
# kernel = np.random.randint(0,100,(5,5))

In [5]:
# # TODO: добавить смещение и исправить проблему с шагом
# def convolution(image: np.ndarray, kernel: np.ndarray, step: int = 1):
#     """Свёртка"""
#     # размеры ядра
#     n = kernel.shape[0]

#     # добавляем рамку из нулей
#     ext = int((n - 1) / 2)

#     matrix = np.zeros(image.shape[:2])
#     for dimension in range(image.shape[2]):
#         # берём одно из измерений картинки (красное, зелёное или синее)
#         image_slice = image[:,:,dimension]
#         # размеры среза
#         image_length, image_width = image_slice.shape
#         # добавление рамок
#         image_slice = np.pad(image_slice, ((ext,ext),(ext,ext)))
#         # умножение ядра на  матрицу 
#         matrix += np.array([
#             [(kernel * image_slice[i:i+n, j:j+n]).sum() for j in range(0,image_width,step)] for i in range(0,image_length,step) 
#         ])
#     return matrix

# def max_pooling(a: np.ndarray, step: int):
#     return np.array([
#         [a[i:i+step,j:j+step].max() for j in range(0,a.shape[1],step)] for i in range(0,a.shape[0],step)
#     ])

# def average_pooling(a: np.ndarray, step: int):
#     return np.array([
#         [a[i:i+step,j:j+step].mean() for j in range(0,a.shape[1],step)] for i in range(0,a.shape[0],step)
#     ])

# def min_pooling(a: np.ndarray, step: int):
#     return np.array([
#         [a[i:i+step,j:j+step].min() for j in range(0,a.shape[1],step)] for i in range(0,a.shape[0],step)
#     ])

In [6]:
# max_pooling(convolution(image, kernel),5).shape