# Нейронные сети. Основы

## Реализация перцептрона

Перцептрон - это модель, предложенная Френком Розенблаттом в 1957 году и являющаяся прообразом современных нейронных сетей. По своей сути она представляет из себя значительно упрощенную схему восприятия информации мозгом. Целью этого практического задания будет реализация собственной модели перцептрона. Давайте разберем схему работы этого алгоритма в деталях.

* Мы работаем с тренировочной выборкой $S = \{(x_i, y_i)| i \in \{1,...,m\} \}$
* Инициализируем веса $\omega^{(0)} \leftarrow 0$ нулевым вектором.
* Инициализирует bias параметр $b = 0$.
* В начальный момент времени номер шага $t=0$.
* Задаем learning rate $\eta > 0$.
* Пока значение $t < t_{\max}$
    * случайно выбираем объект из тренировочной выборки $(x_i, y_i) \in S$.
    * если выполняется условие $y_i (\langle \omega^{(t)}, x_i\rangle + b) \leq 0$ тогда
        * $b^{(t+1)} \leftarrow b^{(t)} + \eta \times y_i$.
        * $\omega^{(t+1)} \leftarrow \omega^{(t)} + \eta \times y_i \times x_i$.
    * далее, обновляем $t \leftarrow t+1$.

Таким образом, финальное значение ветора весов $\omega$ и bias параметра $b$ позволяют классифицировать новый объект $x$. Если $(\langle \omega, x \rangle + b) \geq 0$, то мы относим объект к классу $+1$, в противном случае мы относим объект к классу $-1$.

Для начала загрузим датасет для задачи классификации цветков Ириса с помощь функции `load_iris` из `sklearn.datasets`. Давайте подготовим данные для задачи бинарной классификации. Для этого выберем первые 100 элементов из данного набора данных. Так же преобразуем класс $0$ в класс $-1$.

In [1]:
import numpy as np
from sklearn.datasets import load_iris

X, y = load_iris(return_X_y=True)
X, y = X[:100], y[:100]
num_features = X.shape[1]
y = np.array([1 if y_i == 1 else -1 for y_i in y])

In [7]:
X[1]

array([4.9, 3. , 1.4, 0.2])

In [6]:
X[1] - 2

array([ 2.9,  1. , -0.6, -1.8])

Реализуйте алгоритм перцептрона приведенный выше. Для выборки случайного объекта из тренировочного датасета по индексу используйте функцию `randint` из модуля `random` с параметрами 0 и n, где n - это размер тренировочно выборки. Перед запуском итераций алгоритма установите `random.seed(42)`. Вы можете реализовать перцептрон в качестве класса с интерфейсом, похожим на интерфейсы моделей из `scikit-learn`. Для этого достаточно реализовать функцию `fit` и `predict` для решения этого практического задания. Однако, ваша реализация может отличаться. Необходимое требование - это использование генератора случайных чисел, описанного выше.

### *РЕШЕНИЕ*

In [3]:
import random

class Perceptron:
    
    
    def __init__(self, num_features, learning_rate, t_max):
        self.__num_features = num_features
        self.__learning_rate = learning_rate
        self.__t_max = t_max
        self.__bias = 0.0
        self.__weight = np.zeros(num_features)
    
    
    @property
    def num_features(self):
        return self.__num_features
    
    @num_features.setter
    def num_features(self, num_features):
        if num_features > 0:
            self.__num_features = num_features
        else:
            raise ValueError
    
    
    @property
    def learning_rate(self):
        return self.__learning_rate
    
    @learning_rate.setter
    def learning_rate(self, learning_rate):
        if learning_rate > 0:
            self.__learning_rate = learning_rate
        else:
            raise ValueError
            
            
    @property
    def t_max(self):
        return self.__t_max
    
    @t_max.setter
    def t_max(self, t_max):
        if t_max > -1:
            self.__t_max = t_max
        else:
            raise ValueError
            
    @property
    def bias(self):
        return self.__bias
    
    @bias.setter
    def bias(self, bias):
        if bias > -1:
            self.__bias = bias
        else:
            raise ValueError
    
    
    @property
    def weight(self):
        return self.__weight
    
    @weight.setter
    def weight(self, weight):
        if len(weight) > 0:
            self.__weight = weight
        else:
            raise ValueError
            
            
    def fit(self, x, y, random_state = 42):
        n = len(x)
        t = 0        
        random.seed(random_state)
        
        while t < self.t_max:
            i = random.randint(0, n - 1)
            if (y[i] * (np.dot(self.weight, x[i]) + self.bias)) <= 0:
                self.bias += self.learning_rate * y[i]
                self.weight += self.learning_rate * y[i] * x[i]
            t += 1
            
    
    def predict(self, x):
        prediction_y = []
        
        for i in range(len(x)):
            if (np.dot(self.weight, x[i]) + self.bias) >= 0:
                prediction_y.append([1])
            else:
                prediction_y.append([-1])
        return prediction_y
        

Следующим шагом является проверка нашей модели. Случайно разделите выборку на тренировочный и тестовый датасет, используя функцию `tran_test_split` с параметрами `test_size=0.25` и `random_state=10`. Запустите обучение модели с параметрами $\eta=0.1$ и $t_{\max}=40$. Оцените качество на тестовой выборке и запишите результат в переменную `score` с точность до двух знаков после запятой, используя метрику `accuracy`. Это значение и будет являться ответом на это практическое задание.

### *РЕШЕНИЕ*

In [4]:
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=10)
model = Perceptron(num_features, 0.1, 40)
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
score = round(accuracy_score(y_test, y_pred), 2)

# Строка с ответами

In [5]:
print("score {0:.2f}".format(score))

score 1.00
