# Нейронные сети. Основы

## Реализация перцептрона

Перцептрон - это модель, предложенная Френком Розенблаттом в 1957 году и являющаяся прообразом современных нейронных сетей. По своей сути она представляет из себя значительно упрощенную схему восприятия информации мозгом. Целью этого практического задания будет реализация собственной модели перцептрона. Давайте разберем схему работы этого алгоритма в деталях.

* Мы работаем с тренировочной выборкой $S = \{(x_i, y_i)| i \in \{1,...,m\} \}$
* Инициализируем веса $\omega^{(0)} \leftarrow 0$ нулевым вектором.
* Инициализирует bias параметр $b = 0$.
* В начальный момент времени номер шага $t=0$.
* Задаем learning rate $\eta > 0$.
* Пока значение $t < t_{\max}$
    * случайно выбираем объект из тренировочной выборки $(x_i, y_i) \in S$.
    * если выполняется условие $y_i (\langle \omega^{(t)}, x_i\rangle + b) \leq 0$ тогда
        * $b^{(t+1)} \leftarrow b^{(t)} + \eta \times y_i$.
        * $\omega^{(t+1)} \leftarrow \omega^{(t)} + \eta \times y_i \times x_i$.
    * далее, обновляем $t \leftarrow t+1$.

Таким образом, финальное значение ветора весов $\omega$ и bias параметра $b$ позволяют классифицировать новый объект $x$. Если $(\langle \omega, x \rangle + b) \geq 0$, то мы относим объект к классу $+1$, в противном случае мы относим объект к классу $-1$.

Для начала загрузим датасет для задачи классификации цветков Ириса с помощь функции `load_iris` из `sklearn.datasets`. Давайте подготовим данные для задачи бинарной классификации. Для этого выберем первые 100 элементов из данного набора данных. Так же преобразуем класс $0$ в класс $-1$.

In [52]:
import numpy as np
from sklearn.datasets import load_iris

X, y = load_iris(return_X_y=True)
X, y = X[:100], y[:100]
num_features = X.shape[1]
y = np.array([1 if y_i == 1 else -1 for y_i in y])

Реализуйте алгоритм перцептрона приведенный выше. Для выборки случайного объекта из тренировочного датасета по индексу используйте функцию `randint` из модуля `random` с параметрами 0 и n, где n - это размер тренировочно выборки. Перед запуском итераций алгоритма установите `random.seed(42)`. Вы можете реализовать перцептрон в качестве класса с интерфейсом, похожим на интерфейсы моделей из `scikit-learn`. Для этого достаточно реализовать функцию `fit` и `predict` для решения этого практического задания. Однако, ваша реализация может отличаться. Необходимое требование - это использование генератора случайных чисел, описанного выше.

### *РЕШЕНИЕ*

In [57]:
import random

class Perceptron:

    def __init__(self, nu, t_max):
        self.nu = nu
        self.t_max = t_max

        self.w = [0, 0, 0, 0]
        
        self.b = 0

    def fit(self, X, y):
        random.seed(42)
        n = len(X)

        t = 0
        while t < self.t_max:
            rnd_index = random.randint(0, n - 1)

            tmp_X = X[rnd_index]
            tmp_y = y[rnd_index]

            if tmp_y * (np.dot(tmp_X, self.w) + self.b) <= 0:
                self.b += self.nu * tmp_y

                for i in range(len(self.w)):
                    self.w[i] += self.nu * tmp_y * tmp_X[i]

            t += 1

    def predict(self, X):
        out_y = []

        for x in X:
            if np.dot(x, self.w) + self.b >= 0:
                out_y.append(1)
            else:
                out_y.append(-1)

        return out_y

In [53]:
import random

class Perceptron:
    def __init__(self,rate,t_max):
        self.rate = rate
        self.t_max = t_max
        # Создаем нулевой вектор нужной длины
        self.w = np.zeros(4)
        # Устанавливаем начальное смещение
        self.b = 0
    
    def fit(self,X_train,y_train):
        # Устанавливаем параметры генератора рандомных чисел
        random.seed(42)
        # Длина массива
        n = len(X_train)
        # Номер шага
        t = 0
        while t < self.t_max:
            index = random.randint(0,n-1)
            
            # Сохраняем в переменные нужные вектора
            # в chosen_X находится список из 4 признаков
            # в chosen_y целевой признак 1 или -1
            chosen_X = X_train[index]
            chosen_y = y_train[index]
            # Перемножаем 2 вектора(не забывай что это будет скалярное произведение)
            if chosen_y * (np.dot(chosen_X,self.w) + self.b) <= 0:
                self.b = self.rate * chosen_y
                
                for i in range(len(self.w)):
                    self.w[i] += self.rate*chosen_y*chosen_X[i]
            t += 1
             if tmp_y * (np.dot(tmp_X, self.w) + self.b) <= 0:
                self.b += self.nu * tmp_y

                for i in range(len(self.w)):
                    self.w[i] += self.nu * tmp_y * tmp_X[i]

    
    def predict(self,X_test):
        predicted = []
        # Перебираем тестовую выборку
        
        for x in X_test:
            if np.dot(x,self.w)+self.b >=0:
                predicted.append(1)
            else:
                predicted.append(-1)
        return predicted
            

Следующим шагом является проверка нашей модели. Случайно разделите выборку на тренировочный и тестовый датасет, используя функцию `tran_test_split` с параметрами `test_size=0.25` и `random_state=10`. Запустите обучение модели с параметрами $\eta=0.1$ и $t_{\max}=40$. Оцените качество на тестовой выборке и запишите результат в переменную `score` с точность до двух знаков после запятой, используя метрику `accuracy`. Это значение и будет являться ответом на это практическое задание.

### *РЕШЕНИЕ*

In [58]:
from sklearn.metrics import accuracy_score
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=10)
model = Perceptron(0.1, 40)
model.fit(X_train, y_train)

y_pred = model.predict(X_test)
score = round(accuracy_score(y_test, y_pred), 2)


In [61]:
model.w

[-0.19999999999999996,
 -0.8900000000000003,
 1.2600000000000005,
 0.5099999999999999]

In [None]:
[-0.19999999999999996,
 -0.8900000000000003,
 1.2600000000000005,
 0.5099999999999999]

In [51]:
model.b

-0.1

# Строка с ответами

In [60]:
print("score {0:.2f}".format(score))

score 1.00
