### 1.1.1 Пример

Рассмотрим программу обучения персептрона на языке Python. Сначала  
рассмотрим основной класс персептрона, который умеет учиться по  
тестовым данным.

In [2]:
# класс, который реализует персептрон и его обучение
class Perceptron:
    def __init__(self, N):
    # создать нулевые веса
        self.w = list()
        for i in range(N):
            self.w.append(0)
    
    # метод для вычисления значения персептрона
    def calc(self, x):
        res = 0
        for i in range(len(self.w)):
            res = res + self.w[i] * x[i]
        return res
    # пороговая функция для активации персептрона
    def sign(self, x):
        if self.calc(x) > 0:
            return 1
        else:
            return -1
    # обучение на одном примере
    def learn(self, la, x, y):
        # обучаем только, когда результата неверный
        if y * self.calc(x) <= 0:
            for i in range(len(self.w)):
                self.w[i] = self.w[i] + la * y * x[i]
    # обучение по всем данным T - кортеж примеров
    def learning(self, la, T):
        # цикл обучения
        for n in range(100):
            # обучение по всему набору примеров
            for t in T:
                self.learn(la, t[0], t[1])
                

# создаем класс двумерного персептрона
perceptron = Perceptron(2)
la = 0.1 # константа обучения
# создаем примеры
T = list()
T.append([[2, 1], 1])
T.append([[3, 2], 1])
T.append([[4, 1], 1])
T.append([[1, 2], -1])
T.append([[2, 3], -1])
T.append([[5, 7], -1])
perceptron.learning(la, T) # обучение персептрона
print(perceptron.w) # печатаем веса
# проверяем работу на тестовых примерах
print(perceptron.sign([1.5, 2]))
print(perceptron.sign([3, 1.5]))
print(perceptron.sign([5, 1]))
print(perceptron.sign([5, 10]))

[0.1, -0.1]
-1
1
1
-1


### 1.1.2 Пример

Для написания кода нейрона будем использовать библиотеку Pytnon  
— NumPy:

In [3]:
import numpy as np
def sigmoid(x):
    # Функция активации: f(x) = 1 / (1 + e^(-x))
    return 1 / (1 + np.exp(-x))


class Neuron:
    def __init__(self, weights, bias):
        self.weights = weights
        self.bias = bias
    def feedforward(self, inputs):
        total = np.dot(self.weights, inputs) + self.bias
        return sigmoid(total)
    

weights = np.array([0, 1]) # w1 = 0, w2 = 1
bias = 4                   # c = 4
n = Neuron(weights, bias)
x = np.array([2, 3])
print(n.feedforward(x))

0.9990889488055994


Нейросеть состоит из множества соединенных между собой нейронов.  
Пример несложной нейронной сети
![](wb7p1.jpg)
>где:  
>$𝑥_1, 𝑥_2$ — входной слой;  
>$ℎ_1, ℎ_2$ — скрытый слой с двумя нейронами;  
>$𝑜_1$ — выходной слой.  

Например. Представим, что нейроны из графика выше имеют веса  
[0, 1]. Пороговое значение (𝑏) у обоих нейронов равно 0 и они имеют  
идентичную сигмоиду.  
При входных данных 𝑥 = [2, 3] получим:  

ℎ1 = ℎ2 = 𝑓(𝑤𝑥 + 𝑏) = 𝑓((02) + (1 ∗ 3) + 0) = 𝑓(3) = 0.95.  
𝑜1 = 𝑓(𝑤 ∗ [ℎ1, ℎ2] + 𝑏) = 𝑓((0ℎ1) + (1ℎ2) + 0) = 𝑓(0.95) = 0.72.  

Входные данные по нейронам передаются до тех пор, пока не  
получатся выходные значения.

In [6]:
import numpy as np
class OurNeuralNetwork:
    '''
    Данные нейросети:
        - два входа
        - два нейрона в скрытых слоях (h1, h2)
        - выход (o1)
    Нейроны имеют идентичные веса и пороги:
        - w = [0, 1]
        - b = 0
    '''
    def __init__(self):
        weights = np.array([0, 1])
        bias = 0
        # Класс Neuron из предыдущего раздела
        self.h1 = Neuron(weights, bias)
        self.h2 = Neuron(weights, bias)
        self.o1 = Neuron(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h2.feedforward(x)
        # Входы для o1 - это методы h1 и h2
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2]))
        return out_o1

network = OurNeuralNetwork()
x = np.array([2, 3])
print(network.feedforward(x)) # 0.7216325609518421

0.7216325609518421


### Задание

Реализовать классы нейросетей по аналогии с классом OurNeuralNetwork.  
Данные нейросети:  
- три входа (𝑥1, 𝑥2, 𝑥3);  
- три нейрона в скрытых слоях (ℎ1, ℎ2, ℎ3);  
- выход (𝑜1).  

Нейроны имеют идентичные веса и пороги:  
- 𝑤 = [0.5, 0.5, 0.5]  
- 𝑏 = 0  

Данные нейросети:  
- два входа (𝑥1, 𝑥2);  
- два нейрона в скрытых слоях (ℎ1, ℎ2);  
- два выхода (𝑜1, 𝑜2).  

Нейроны имеют идентичные веса и пороги:  
- 𝑤 = [1, 0];  
- 𝑏 = 1.

In [8]:
import numpy as np
def sigmoid(x):
    # Функция активации: f(x) = 1 / (1 + e^(-x))
    return 1 / (1 + np.exp(-x))

        
class Neuron:
    def __init__(self, weights, bias):
        self.weights = weights
        self.bias = bias
    def feedforward(self, inputs):
        total = np.dot(self.weights, inputs) + self.bias
        return sigmoid(total)
    
class OurNeuralNetwork1:
    '''
    Данные нейросети:
        - три входа (𝑥1, 𝑥2, 𝑥3);  
        - три нейрона в скрытых слоях (ℎ1, ℎ2, ℎ3);  
        - выход (𝑜1). 
    Нейроны имеют идентичные веса и пороги:
        - 𝑤 = [0.5, 0.5, 0.5]  
        - 𝑏 = 0  
    '''
    def __init__(self):
        weights = np.array([0.5, 0.5, 0.5]) # 𝑤 = [0.5, 0.5, 0.5]
        bias = 0                            # b = 0

        self.h1 = Neuron(weights, bias)
        self.h2 = Neuron(weights, bias)
        self.h3 = Neuron(weights, bias)
        self.o1 = Neuron(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h2.feedforward(x)
        out_h3 = self.h3.feedforward(x)
        # Входы для o1 - это методы h1, h2 и h3
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2, out_h3]))
        return out_o1

 
class OurNeuralNetwork2:
    '''
    Данные нейросети:
        - два входа (𝑥1, 𝑥2);  
        - два нейрона в скрытых слоях (ℎ1, ℎ2);  
        - два выхода (𝑜1, 𝑜2).  
    Нейроны имеют идентичные веса и пороги:
        - 𝑤 = [1, 0];  
        - 𝑏 = 1.
    '''
    def __init__(self):
        weights = np.array([1, 0]) # 𝑤 = [1, 0]
        bias = 1                   # b = 1

        self.h1 = Neuron(weights, bias)
        self.h2 = Neuron(weights, bias)
        self.o1 = Neuron(weights, bias)
        self.o2 = Neuron(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h2.feedforward(x)
        # Входы для o1 - это методы h1, h2 и h3
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2]))
        out_o2 = self.o2.feedforward(np.array([out_h2, out_h2]))
        return "{}   {}".format(out_o1, out_o2)


network1 = OurNeuralNetwork1()
network2 = OurNeuralNetwork2()

x1 = np.array([2, 3, 1])
x2 = np.array([2, 3])

print(network1.feedforward(x1)) # 0.8067238139969796
print(network2.feedforward(x2)) # 0.8757270529783324   0.8757270529783324

0.8067238139969796
0.8757270529783324   0.8757270529783324


### Задание

Реализуйте классы нейронных сетей с использованием других функций  
активации.
![](wb7p2.jpg)

In [10]:
import numpy as np
def sigmoid(x):
    # Функция активации: f(x) = 1 / (1 + e^(-x))
    return 1 / (1 + np.exp(-x))

def tanh(x):
    # Функция активации: f(x) = tanh(X)
    return np.tanh(x)

def ReLU(x):
    # Функция активации: f(x) = max(0, x)
    return max(0, x)


class Neuron:
    def __init__(self, weights, bias):
        self.weights = weights
        self.bias = bias
    def feedforward(self, inputs):
        total = np.dot(self.weights, inputs) + self.bias
        return sigmoid(total)

class Neuron1:
    def __init__(self, weights, bias):
        self.weights = weights
        self.bias = bias
    def feedforward(self, inputs):
        total = np.dot(self.weights, inputs) + self.bias
        return tanh(total)
    
class Neuron2:
    def __init__(self, weights, bias):
        self.weights = weights
        self.bias = bias
    def feedforward(self, inputs):
        total = np.dot(self.weights, inputs) + self.bias
        return ReLU(total)


class OurNeuralNetwork:
    '''
    Данные нейросети:
        - два входа
        - два нейрона в скрытых слоях (h1, h2)
        - выход (o1)
    Нейроны имеют идентичные веса и пороги:
        - w = [0, 1]
        - b = 0
    '''
    def __init__(self):
        weights = np.array([0, 1])
        bias = 0
        # Класс Neuron из предыдущего раздела
        self.h1 = Neuron(weights, bias)
        self.h2 = Neuron(weights, bias)
        self.o1 = Neuron(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h2.feedforward(x)
        # Входы для o1 - это методы h1 и h2
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2]))
        return out_o1

class OurNeuralNetwork1:
    '''
    Данные нейросети:
        - три входа (𝑥1, 𝑥2, 𝑥3);  
        - три нейрона в скрытых слоях (ℎ1, ℎ2, ℎ3);  
        - выход (𝑜1). 
    Нейроны имеют идентичные веса и пороги:
        - 𝑤 = [0.5, 0.5, 0.5]  
        - 𝑏 = 0  
    '''
    def __init__(self):
        weights = np.array([0.5, 0.5, 0.5]) # 𝑤 = [0.5, 0.5, 0.5]
        bias = 0                            # b = 0

        self.h1 = Neuron1(weights, bias)
        self.h2 = Neuron1(weights, bias)
        self.h3 = Neuron1(weights, bias)
        self.o1 = Neuron1(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h1.feedforward(x)
        out_h3 = self.h1.feedforward(x)
        # Входы для o1 - это методы h1, h2 и h3
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2, out_h3]))
        return out_o1

 
class OurNeuralNetwork2:
    '''
    Данные нейросети:
        - два входа (𝑥1, 𝑥2);  
        - два нейрона в скрытых слоях (ℎ1, ℎ2);  
        - два выхода (𝑜1, 𝑜2).  
    Нейроны имеют идентичные веса и пороги:
        - 𝑤 = [1, 0];  
        - 𝑏 = 1.
    '''
    def __init__(self):
        weights = np.array([1, 0]) # 𝑤 = [1, 0]
        bias = 1                   # b = 1

        self.h1 = Neuron2(weights, bias)
        self.h2 = Neuron2(weights, bias)
        self.o1 = Neuron2(weights, bias)
        self.o2 = Neuron2(weights, bias)
    def feedforward(self, x):
        out_h1 = self.h1.feedforward(x)
        out_h2 = self.h1.feedforward(x)
        # Входы для o1 - это методы h1, h2 и h3
        out_o1 = self.o1.feedforward(np.array([out_h1, out_h2]))
        out_o2 = self.o2.feedforward(np.array([out_h2, out_h2]))
        return "{}   {}".format(out_o1, out_o2)
    
    
network = OurNeuralNetwork()
network1 = OurNeuralNetwork1()
network2 = OurNeuralNetwork2()

x = np.array([2, 3])
x1 = np.array([2, 3, 1])
x2 = np.array([2, 3])


print('Used sigmoid', network.feedforward(x)) # 0.7216325609518421
print('Used tanh', network1.feedforward(x1)) # 0.903798759264991
print('Used ReLU', network2.feedforward(x2)) # 4   4


Used sigmoid 0.7216325609518421
Used tanh 0.903798759264991
Used ReLU 4   4


### Задание

Используйте классы MLPClassified и MLPRegressor для классификации и  
регрессии произвольных данных из интернета. Проведите анализ  
атрибуты, полученных моделей.  

Для классификации можете взять набор данных Ирисов:  
https://gist.githubusercontent.com/netj/8836201/raw/6f9306ad21398ea43cba4f7d537619d0e07d5ae3/iris.csv  
а для регрессии датасет зависимости заработной платы от опыта работы:
https://raw.githubusercontent.com/AnnaShestova/salary-years-simple-linear-regression/master/Salary_Data.csv

In [27]:
from sklearn.neural_network import MLPClassifier
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pandas as pd
import matplotlib.pyplot as plt


# Загрузка данных
url = "https://gist.githubusercontent.com/netj/8836201/raw/6f9306ad21398ea43cba4f7d537619d0e07d5ae3/iris.csv"
data = pd.read_csv(url)

# Разделение данных на признаки и целевую переменную
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y,train_size=0.80, test_size=0.20,
                                                    stratify=y, random_state=123)

# Создание объекта MLPClassifier
clf = MLPClassifier(random_state=123)

# MLPClassifier(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
#              beta_2=0.999, early_stopping=False, epsilon=1e-08,
#              hidden_layer_sizes=(100, ), learning_rate='constant',
#              learning_rate_init=0.001, max_iter=200, momentum=0.9,
#              n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
#              validation_fraction=0.1, verbose=False, warm_start=False)

# # Обучение модели
clf.fit(X_train, y_train)

# Обучение модели
clf.fit(X_train, y_train)

# Получение предсказаний на тестовой выборке
y_pred = clf.predict(X_test)

# Оценка качества модели
print(y_pred)
print(y_test)
print('Test Accuracy: %.3f'%clf.score(X_test, y_test))
print('Traiding Accuracy: %.3f'%clf.score(X_train, y_train))
print('Loss: ', clf.loss_)
print('Number of Coefs: ', len(clf.coefs_))
print('Number of Intercepts: ', len(clf.intercepts_))
print('Number of Iterations for Which Estimator Ran:', clf.n_iter_)
print('Name of Output Layer Activation Function: ', clf.out_activation_)

['Versicolor' 'Setosa' 'Virginica' 'Virginica' 'Setosa' 'Setosa'
 'Virginica' 'Virginica' 'Virginica' 'Setosa' 'Setosa' 'Versicolor'
 'Virginica' 'Versicolor' 'Virginica' 'Versicolor' 'Setosa' 'Setosa'
 'Setosa' 'Setosa' 'Setosa' 'Virginica' 'Virginica' 'Versicolor'
 'Virginica' 'Virginica' 'Versicolor' 'Versicolor' 'Virginica'
 'Versicolor']
['Versicolor' 'Setosa' 'Virginica' 'Virginica' 'Setosa' 'Setosa'
 'Virginica' 'Versicolor' 'Virginica' 'Setosa' 'Setosa' 'Versicolor'
 'Virginica' 'Versicolor' 'Virginica' 'Versicolor' 'Setosa' 'Setosa'
 'Setosa' 'Setosa' 'Setosa' 'Virginica' 'Virginica' 'Versicolor'
 'Virginica' 'Virginica' 'Versicolor' 'Versicolor' 'Versicolor'
 'Versicolor']
Test Accuracy: 0.933
Traiding Accuracy: 0.983
Loss:  0.2988789340197433
Number of Coefs:  2
Number of Intercepts:  2
Number of Iterations for Which Estimator Ran: 200
Name of Output Layer Activation Function:  softmax




In [32]:
from sklearn.neural_network import MLPRegressor
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import pandas as pd
import matplotlib.pyplot as plt


# Загрузка данных
url = "https://raw.githubusercontent.com/AnnaShestova/salary-years-simple-linear-regression/master/Salary_Data.csv"
data = pd.read_csv(url)

# Разделение данных на признаки и целевую переменную
X = data.iloc[:, :-1].values
y = data.iloc[:, -1].values

# Разделение данных на обучающую и тестовую выборки
X_train, X_test, y_train, y_test = train_test_split(X, y,train_size=0.80, test_size=0.20,
                                                    random_state=123)

# Создание объекта MLPClassifier
reg = MLPRegressor(random_state=123)
# reg = MLPRegressor(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
#              beta_2=0.999, early_stopping=False, epsilon=1e-08,
#              hidden_layer_sizes=(100, ), learning_rate='constant',
#              learning_rate_init=0.001, max_iter=200, momentum=0.9,
#              n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
#              random_state=123, shuffle=True, solver='adam', tol=0.0001,
#              validation_fraction=0.1, verbose=False, warm_start=False)

# MLPRegressor(activation='relu', alpha=0.0001, batch_size='auto', beta_1=0.9,
#              beta_2=0.999, early_stopping=False, epsilon=1e-08,
#              hidden_layer_sizes=(100, ), learning_rate='constant',
#              learning_rate_init=0.001, max_iter=200, momentum=0.9,
#              n_iter_no_change=10, nesterovs_momentum=True, power_t=0.5,
#              random_state=123, shuffle=True, solver='adam', tol=0.0001,
#              validation_fraction=0.1, verbose=False, warm_start=False)

# Обучение модели
reg.fit(X_train, y_train)

# Получение предсказаний на тестовой выборке
y_pred = reg.predict(X_test)

# Оценка качества модели
print(y_pred)
print(y_test)
print('Test R^2 Score: %.3f'%reg.score(X_test, y_test))
print('Traiding R^2 Score: %.3f'%reg.score(X_train, y_train))
print('Loss: ', reg.loss_)
print('Number of Coefs: ', len(reg.coefs_))
print('Number of Intercepts: ', len(reg.intercepts_))
print('Number of Iterations for Which Estimator Ran:', reg.n_iter_)
print('Name of Output Layer Activation Function: ', reg.out_activation_)

[20.26234628 55.2781752  18.82135812 50.48274487 20.26234628 50.9622879 ]
[ 54445. 121872.  56642. 116969.  64445. 112635.]
Test R^2 Score: -8.796
Traiding R^2 Score: -8.261
Loss:  2988058032.1601596
Number of Coefs:  2
Number of Intercepts:  2
Number of Iterations for Which Estimator Ran: 200
Name of Output Layer Activation Function:  identity


