In [None]:
import numpy as np

In [None]:
def sigmoid(x):
  # Наша функция активации: f(x) = 1 / (1 + e^(-x))
  return 1 / (1 + np.exp(-x))

In [None]:
class Neuron:
  def __init__(self, weights, bias):
    self.weights = weights
    self.bias = bias

  def feedforward(self, inputs):
    # Умножаем входы на веса, прибавляем порог, затем используем функцию активации
    total = np.dot(self.weights, inputs) + self.bias
    return sigmoid(total)


In [None]:
weights = np.array([0, 1])
bias = 4
n = Neuron(weights, bias)

In [None]:
x = np.array([2, 3])
print(n.feedforward(x))

0.9990889488055994


In [None]:
class OurNeuralNetwork:
  '''
  Нейронная сеть с:
    - 2 входами
    - скрытым слоем с 2 нейронами (h1, h2)
    - выходным слоем с 1 нейроном (o1)
  Все нейроны имеют одинаковые веса и пороги:
    - w = [0, 1]
    - b = 0
  '''
  def __init__(self):
    weights = np.array([0, 1])
    bias = 0

    # Используем класс Neuron из предыдущего раздела
    self.h1 = Neuron(weights, bias)
    self.h2 = Neuron(weights, bias)
    self.o1 = Neuron(weights, bias)

  def feedforward(self, x):
    out_h1 = self.h1.feedforward(x)
    out_h2 = self.h2.feedforward(x)

    out_o1 = self.o1.feedforward(np.array([out_h1, out_h2]))

    return out_o1

In [None]:
network = OurNeuralNetwork()
x = np.array([2, 3])
print(network.feedforward(x))

0.7216325609518421


In [None]:
def sigmoid(x):
  # Наша функция активации: f(x) = 1 / (1 + e^(-x))
  return 1 / (1 + np.exp(-x))

In [None]:
def mse_loss(y_true, y_pred):
  return ((y_true - y_pred) ** 2).mean()

In [None]:
def deriv_sigmoid(x):
  fx = sigmoid(x)
  return fx * (1 - fx)

In [None]:
class NewNeuralNetwork:
  '''
  Нейронная сеть с:
    - 2 входами
    - скрытым слоем с 2 нейронами (h1, h2)
    - выходной слой с 1 нейроном (o1)

  *** DISCLAIMER ***:
  Следующий код простой и обучающий, но НЕ оптимальный.
  Код реальных нейронных сетей совсем на него не похож. НЕ копируйте его!
  Изучайте и запускайте его, чтобы понять, как работает эта нейронная сеть.
  '''
  def __init__(self):
    # Weights
    self.w1 = np.random.normal()
    self.w2 = np.random.normal()
    self.w3 = np.random.normal()
    self.w4 = np.random.normal()
    self.w5 = np.random.normal()
    self.w6 = np.random.normal()

    # Biases
    self.b1 = np.random.normal()
    self.b2 = np.random.normal()
    self.b3 = np.random.normal()

  def feedforward(self, x):
    h1 = sigmoid(self.w1 * x[0] + self.w2 * x[1] + self.b1)
    h2 = sigmoid(self.w3 * x[0] + self.w4 * x[1] + self.b2)
    o1 = sigmoid(self.w5 * h1 + self.w6 * h2 + self.b3)
    return o1

  def train(self, data, all_y_trues):
    '''
    - data - массив numpy (n x 2) numpy, n = к-во наблюдений в наборе.
    - all_y_trues - массив numpy с n элементами.
      Элементы all_y_trues соответствуют наблюдениям в data.
    '''
    learn_rate = 0.1
    epochs = 1000

    for epoch in range(epochs):
      for x, y_true in zip(data, all_y_trues):
        sum_h1 = self.w1 * x[0] + self.w2 * x[1] + self.b1
        h1 = sigmoid(sum_h1)

        sum_h2 = self.w3 * x[0] + self.w4 * x[1] + self.b2
        h2 = sigmoid(sum_h2)

        sum_o1 = self.w5 * h1 + self.w6 * h2 + self.b3
        o1 = sigmoid(sum_o1)
        y_pred = o1

        # --- Считаем частные производные.
        # --- Имена: d_L_d_w1 = "частная производная L по w1"
        d_L_d_ypred = -2 * (y_true - y_pred)

        # Нейрон o1
        d_ypred_d_w5 = h1 * deriv_sigmoid(sum_o1)
        d_ypred_d_w6 = h2 * deriv_sigmoid(sum_o1)
        d_ypred_d_b3 = deriv_sigmoid(sum_o1)

        d_ypred_d_h1 = self.w5 * deriv_sigmoid(sum_o1)
        d_ypred_d_h2 = self.w6 * deriv_sigmoid(sum_o1)

        # Нейрон h1
        d_h1_d_w1 = x[0] * deriv_sigmoid(sum_h1)
        d_h1_d_w2 = x[1] * deriv_sigmoid(sum_h1)
        d_h1_d_b1 = deriv_sigmoid(sum_h1)

        # Нейрон h2
        d_h2_d_w3 = x[0] * deriv_sigmoid(sum_h2)
        d_h2_d_w4 = x[1] * deriv_sigmoid(sum_h2)
        d_h2_d_b2 = deriv_sigmoid(sum_h2)

        # --- Обновляем веса и пороги
        # Нейрон h1
        self.w1 -= learn_rate * d_L_d_ypred * d_ypred_d_h1 * d_h1_d_w1
        self.w2 -= learn_rate * d_L_d_ypred * d_ypred_d_h1 * d_h1_d_w2
        self.b1 -= learn_rate * d_L_d_ypred * d_ypred_d_h1 * d_h1_d_b1

        # Нейрон h2
        self.w3 -= learn_rate * d_L_d_ypred * d_ypred_d_h2 * d_h2_d_w3
        self.w4 -= learn_rate * d_L_d_ypred * d_ypred_d_h2 * d_h2_d_w4
        self.b2 -= learn_rate * d_L_d_ypred * d_ypred_d_h2 * d_h2_d_b2

        # Нейрон o1
        self.w5 -= learn_rate * d_L_d_ypred * d_ypred_d_w5
        self.w6 -= learn_rate * d_L_d_ypred * d_ypred_d_w6
        self.b3 -= learn_rate * d_L_d_ypred * d_ypred_d_b3

      # --- Считаем полные потери в конце каждой эпохи
      if epoch % 100 == 0:
        y_preds = np.apply_along_axis(self.feedforward, 1, data)
        loss = mse_loss(all_y_trues, y_preds)
        print("Epoch %d loss: %.3f" % (epoch, loss))

  def predict(self, new_data):
    return self.feedforward(new_data)

In [None]:
# Набор данных
data = np.array([
    [-2, -1], # Алиса
    [25, 6], # Боб
    [17, 4], # Чарли
    [-15, -6], # Диана
])

all_y_trues = np.array([
    1, # Алиса
    0, # Боб
    0, # Чарли
    1, # Диана
])

In [None]:
network = NewNeuralNetwork()
network.train(data, all_y_trues)

Epoch 0 loss: 0.300
Epoch 100 loss: 0.033
Epoch 200 loss: 0.015
Epoch 300 loss: 0.009
Epoch 400 loss: 0.006
Epoch 500 loss: 0.005
Epoch 600 loss: 0.004
Epoch 700 loss: 0.003
Epoch 800 loss: 0.003
Epoch 900 loss: 0.003


In [None]:
emily = np.array([-7, -3])
frank = np.array([20, 2])

print(network.predict(emily))
print(network.predict(frank))

0.9482816300669528
0.039095383041142795


# Homework: доделать НС с урока, добавить метод predict и проверить на своих собственных данных, оценить accuracy

In [None]:
import pandas as pd

In [None]:
def accuracy(y_true, y_pred):
    correct_predictions = 0
    total_predictions = len(y_true)

    for true, pred in zip(y_true, y_pred):
        if true == pred:
            correct_predictions += 1

    accuracy = correct_predictions / total_predictions
    return accuracy

In [None]:
data_pred = {
    'Emily': [-7, -3],
    'Frank': [20, 2],
    'Liza': [-47, -7],
    'Mike': [85, 0],
    'Ann': [-5, 3],
    'Peter': [8, 4]
}

y_trues = np.array([1, 0, 1, 0, 1, 0])

In [None]:
df = pd.DataFrame(data_pred, index=['Weight', 'Height']).T

df['Predict'] = [network.predict(np.array(v)) for v in data_pred.values()]
df['Gender'] = ['F' if i >= 0.5 else 'M' for i in df['Predict']]
df['y_trues'] = y_trues

print(df)

       Weight  Height   Predict Gender  y_trues
Emily      -7      -3  0.948282      F        1
Frank      20       2  0.039095      M        0
Liza      -47      -7  0.948282      F        1
Mike       85       0  0.039095      M        0
Ann        -5       3  0.682623      F        1
Peter       8       4  0.039095      M        0


In [None]:
print(accuracy(y_trues, round(df['Predict'])))

1.0


# Homework: обучите НС mlpclassifier от sklearn

In [None]:
from sklearn.neural_network import MLPClassifier

In [None]:
clf = MLPClassifier()
clf.fit(data, all_y_trues)

In [None]:
# clf.predict([v for v in data_pred.values()])

array([1, 0, 1, 0, 1, 0])

In [None]:
df = pd.DataFrame(data_pred, index=['Weight', 'Height']).T

df['Predict'] = clf.predict([v for v in data_pred.values()])
df['Gender'] = ['F' if i >= 0.5 else 'M' for i in df['Predict']]
df['y_trues'] = y_trues

print(df)

       Weight  Height  Predict Gender  y_trues
Emily      -7      -3        1      F        1
Frank      20       2        0      M        0
Liza      -47      -7        1      F        1
Mike       85       0        0      M        0
Ann        -5       3        1      F        1
Peter       8       4        0      M        0
