# Семинар 2. Погружаемся в нейроны

### 0. С чего вообще все пошло?

![нейрон](https://aisimple.ru/uploads/posts/2023-06/neuron.jpg)

Из строения нейрона делаем выводы:
- **Дендритов** (входных каналов) может быть **много**
- **Аксон** (выходной канал) может быть только **один** (но в будущем он может ветвиться)

У дендритов есть шипики, и чем больше шипиков, тем больше вклад (**вес**) конкретного дендрита в проводимость сигнала.  
Например: смотря на кошку, больший вклад в распознавание кошки вносят сигналы, получаемые зрительным нервом, нежели ощущения в пятке.

---

Теперь перенесемся к искусственным нейронам, имеем:
- Дендриты (входы)
- Аксон (выход)
- Тело нейрона 

![](https://wiki.loginom.ru/images/artificial-neuron.svg)

Внутри нейрона происходит суммирование всех сигналов с их весами:
$$
S = \sum_{i=1}^{n}{X_i \cdot w_i}
$$

**НО**  
Не все сигналы проходят дальше, иначе от нейронов не было смысла.  
На примере с кошкой представьте, что если бы у вас были закрыты глаза, а вы бы все равно распознавали образ кошки только потому что получаете сигналы от ощущений своей пятки.  
Поэтому нейрону необходимо еще **активироваться**, иначе говоря пропустить сигнал дальше при каких-то условиях, в простейшем случае - пороговая функция, как на рисунке ниже. 

![](https://aisimple.ru/uploads/posts/2020-04/1586743155_step.png)

Теперь перенесем имеющуюся информациию на язык Python.  
Инициализируем наши сигналы и веса.

In [1]:
x1 = 0.1
x2 = 0.3
x3 = 0.4
w1 = 0.2
w2 = -0.3
w3 = -0.1

Суммируем все это

In [2]:
s = x1 * w1 + x2 * w2 + x3 * w3
print(s)

-0.11


In [3]:
if s > 0:
    output_signal = 1
else:
    output_signal = 0
print(output_signal)

0


Нейрон не активировался, потому что суммарный сигнал оказался слишком слабым, чтобы пробить порог функции.  

Какие проблемы у кода выше? 
- Если много входов, то выражение для `s` станет невероятно большим, все придется писать руками.  
- Если хотим менять функцию активации, лучше обернуть ее в функцию Python.  

Можно ли сделать код еще лучше? Можно!

In [4]:
x = [0.1, 0.3, 0.4]
w = [0.2, -0.3, -0.1]


def sum_inside_neuron(x_list, w_list):
    output = 0
    for i in range(len(x_list)):
        output += x_list[i] * w_list[i]
    return output


def activation(input_signal):
    if input_signal > 0:
        return 1
    return 0

Проверяем

In [5]:
neuron_sum = sum_inside_neuron(x, w)
print(neuron_sum)

-0.11


In [6]:
print(activation(neuron_sum))

0


Теперь можем работать со сколь угодно большими по размерам `X` и `W`.

In [7]:
import random

In [8]:
random.random()  # возращает случайное число от 0 до 1

0.8595666295999562

In [9]:
x = [random.random() for _ in range(10000)]
w = [random.random() for _ in range(10000)]

neuron_sum = sum_inside_neuron(x, w)
print(neuron_sum)

print(activation(neuron_sum))

2468.993858269586
1


Хорошо, теперь умеем считать выход нашего нейрона для одного наблюдения за раз.  
А если хотим много наблюдений за раз?  
Что значит __много наблюдений__?  
Например, нейрон решает, пойду ли я гулять на основе 3 факторов:
1. Температура на улице
2. Скорость ветра
3. Есть ли у меня настроение гулять

Первые два признака называются __численными/непрерывными__, то есть могут принять любое число. Примеры: все, что можно посчитать и сравнить между собой, _температура_, _деньги_, _скорости_, _расстояния_, _возраст_ и т.д.   
Третий признак является __качественным/категориальным__, то есть может быть. Примеры: все, что нельзя сравнить между собой, и что является качеством объекта, _цвета_, _день недели_, _образование_, _гражданство_, _номер группы студента_.  

Допустим, вчера в 15:00 было -12 градусов на улице, скорость ветра 5 м/c, и у меня не было настроения (0).  
Тогда

In [10]:
x = [-12, 5, 0]
w = [random.random() for _ in range(3)]  # зададим случайные веса

neuron_sum = sum_inside_neuron(x, w)
print(neuron_sum)
print(activation(neuron_sum))

-6.899538649456054
0


Затем, вчера же в 16:00 было -10 градусов, скорость ветра 1 м/c, и у меня есть настроение (1)

In [11]:
x = [-10, 1, 1]
# веса мы не обновляем, нейрон же остался прежним

neuron_sum = sum_inside_neuron(x, w)
print(neuron_sum)
print(activation(neuron_sum))

-7.9040128514266215
0


Аналогично я могу собрать данные за все дни года, но неужели придется перепрогонять для каждого x эту ячейку снова и снова?  
**НЕТ**  
Мы умеем писать функции с необходимым функционалом

In [12]:
x_15_00 = [-12, 5, 0]
x_16_00 = [-10, 1, 1]
x_17_00 = [3, 0, 1]
x_18_00 = [5, 3, 0]

x_total = [x_15_00, x_16_00, x_17_00, x_18_00]
print(x_total)

[[-12, 5, 0], [-10, 1, 1], [3, 0, 1], [5, 3, 0]]


Обновляем функции, чтобы они умели работать с листами листов  
Варианта 2:
1. Переписать изначальную функцию  
2. Использовать первоначальную функцию для каждого листа

1 вариант

In [13]:
def sum_inside_neuron(x_list, w_list):
    output = []
    for x_one_list in x_list:
        total_sum = 0
        for i in range(len(x_one_list)):
            total_sum += x_one_list[i] * w_list[i]
        output.append(total_sum)
    return output


def activation(input_signal):
    output = []
    for one_signal in input_signal:
        if one_signal > 0:
            output.append(1)
        else:
            output.append(0)
    return output

In [14]:
sums = sum_inside_neuron(x_total, w)
print(sums)

[-6.899538649456054, -7.9040128514266215, 2.7879284854502155, 6.577900395724918]


In [15]:
print(activation(sums))

[0, 0, 1, 1]


2 вариант

In [16]:
def sum_inside_neuron(x_list, w_list):
    """Умеет считать сумму для одного наблюдения"""
    output = 0
    for i in range(len(x_list)):
        output += x_list[i] * w_list[i]
    return output


def activation(input_signal):
    """Умеет считать активацию для одного наблюдения"""
    if input_signal > 0:
        return 1
    return 0


def total_sum_inside_neuron(x_list, w_list):
    """Умеет считать сумму для любого количества наблюдений"""
    output = []
    for x_one_list in x_list:
        one_output = sum_inside_neuron(x_one_list, w_list)
        output.append(one_output)
    return output


def total_activation(input_signal):
    """Умеет считать активации для любого количества наблюдений"""
    output = []
    for one_signal in input_signal:
        one_output = activation(one_signal)
        output.append(one_output)
    return output

In [17]:
sums = total_sum_inside_neuron(x_total, w)
print(sums)

[-6.899538649456054, -7.9040128514266215, 2.7879284854502155, 6.577900395724918]


In [18]:
print(total_activation(sums))

[0, 0, 1, 1]


А насколько это быстро считается?

In [19]:
x_total = [[random.random() for _ in range(3)] for _ in range(5_000_000)]

In [20]:
%%time
sums = total_sum_inside_neuron(x_total, w)

CPU times: total: 2.84 s
Wall time: 3.61 s


In [21]:
%%time
activations = total_activation(sums)

CPU times: total: 719 ms
Wall time: 938 ms


Можно ли быстрее?  
**МОЖНО**

In [22]:
import numpy as np

In [23]:
x_total_np = np.array(x_total)
w_np = np.array(w)

In [24]:
%%time
output = x_total_np @ w_np  # через @ обозначается скалярное произведение векторов/матриц

CPU times: total: 31.2 ms
Wall time: 20 ms


In [25]:
%%time
activation_vectorized = np.vectorize(activation)
activations_np = activation_vectorized(output)

CPU times: total: 766 ms
Wall time: 1.02 s


In [26]:
activations[:10]

[1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

In [27]:
activations_np[:10]

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

In [28]:
sums[:5]

[0.777888645996561,
 0.21971968512704002,
 1.075363388318277,
 0.6719447588740731,
 0.6363019781767658]

In [29]:
output[:5]

array([0.77788865, 0.21971969, 1.07536339, 0.67194476, 0.63630198])

4.32 секунды VS 10.3 миллисекунды

In [30]:
profit = 4.32 * 1e3 / 10.3
print("Быстрее в", round(profit), "раз!")

Быстрее в 419 раз!


# Библиотеки

**NumPy** (https://numpy.org) -- библиотека для работы с массивами.  
Работаем с примерами отсюда https://numpy.org/doc/stable/user/quickstart.html#the-basics

In [62]:
a = np.arange(15)
a

array([ 0,  1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14])

In [63]:
a.shape

(15,)

In [64]:
type(a)

numpy.ndarray

In [65]:
a = a.reshape(3, 5)
a

array([[ 0,  1,  2,  3,  4],
       [ 5,  6,  7,  8,  9],
       [10, 11, 12, 13, 14]])

In [66]:
a.shape

(3, 5)

In [67]:
a.dtype

dtype('int32')

In [68]:
type(a)

numpy.ndarray

In [69]:
b = [2, 3, 4]
a = np.array(b)
a

array([2, 3, 4])

In [70]:
a.dtype

dtype('int32')

In [71]:
b = np.array([1.2, 3.5, 5.1])
b.dtype

dtype('float64')

In [72]:
b = np.array([(1.5, 2, 3), (4, 5, 6)])
b

array([[1.5, 2. , 3. ],
       [4. , 5. , 6. ]])

In [73]:
np.zeros((3, 4))

array([[0., 0., 0., 0.],
       [0., 0., 0., 0.],
       [0., 0., 0., 0.]])

In [74]:
np.ones((2, 3, 4), dtype=np.int16)

array([[[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]],

       [[1, 1, 1, 1],
        [1, 1, 1, 1],
        [1, 1, 1, 1]]], dtype=int16)

In [75]:
np.arange(10, 30, 5)

array([10, 15, 20, 25])

In [76]:
np.arange(0, 2, 0.3)

array([0. , 0.3, 0.6, 0.9, 1.2, 1.5, 1.8])

Операции с массивами

In [77]:
a = np.array([20, 30, 40, 50])
b = np.arange(4)
print(a)
print(b)

[20 30 40 50]
[0 1 2 3]


In [78]:
c = a - b
c

array([20, 29, 38, 47])

In [79]:
b ** 2

array([0, 1, 4, 9], dtype=int32)

In [80]:
b * 10

array([ 0, 10, 20, 30])

In [81]:
[0, 1, 2, 3] * 10

[0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3,
 0,
 1,
 2,
 3]

In [82]:
10 * np.sin(a)

array([ 9.12945251, -9.88031624,  7.4511316 , -2.62374854])

In [83]:
a < 35

array([ True,  True, False, False])

In [85]:
a

array([20, 30, 40, 50])

In [86]:
a[a < 35]

array([20, 30])

In [89]:
a = np.arange(12).reshape(6, 2)
a

array([[ 0,  1],
       [ 2,  3],
       [ 4,  5],
       [ 6,  7],
       [ 8,  9],
       [10, 11]])

In [91]:
a.T

array([[ 0,  2,  4,  6,  8, 10],
       [ 1,  3,  5,  7,  9, 11]])

In [94]:
a.shape

(6, 2)

In [95]:
a.T.shape

(2, 6)

In [92]:
a @ a.T

array([[  1,   3,   5,   7,   9,  11],
       [  3,  13,  23,  33,  43,  53],
       [  5,  23,  41,  59,  77,  95],
       [  7,  33,  59,  85, 111, 137],
       [  9,  43,  77, 111, 145, 179],
       [ 11,  53,  95, 137, 179, 221]])

In [96]:
(a @ a.T).shape

(6, 6)

In [93]:
a.T @ a

array([[220, 250],
       [250, 286]])

In [97]:
(a.T @ a).shape

(2, 2)

## Хорошо, но в реальных нейронных сетях не один нейрон, как быть в этом случае?
Вот нейронная сеть чуть посложнее, чем 1 нейрон  
![](https://robocraft.ru/files/neuronet/backpropagation/img01.gif)

Анализируем:
- Имеет два входа
- Потом 3 нейрона
- Потом еще 2
- И потом еще 1

Сгенерируем выборку

In [31]:
x_total = np.random.random(size=(10000, 2))

In [32]:
x_total[:5]

array([[0.82283514, 0.4473193 ],
       [0.55357875, 0.01568899],
       [0.00321317, 0.68312152],
       [0.34433634, 0.7446178 ],
       [0.44748385, 0.89752049]])

In [33]:
x_total.shape

(10000, 2)

Теперь разберемся с весами:    
У нас 3 нейрона, на каждый из них поступает сигнал с 2 входов.  
В прошлом примере у нас был 1 нейрон с 3 входами, и мы делали `w = [random.random() for _ in range(3)]`  
Теперь нейрон имеет 2 входа, значит `w = [random.random() for _ in range(2)]`

In [34]:
w_1 = [random.random() for _ in range(2)]

Но таких нейронов 3 штуки, значит, нужно 3 таких листа

In [35]:
w_1 = [random.random() for _ in range(2)]
w_2 = [random.random() for _ in range(2)]
w_3 = [random.random() for _ in range(2)]

Объединим их в один лист

In [36]:
w = [w_1, w_2, w_3]

In [37]:
w

[[0.03469703880701325, 0.9412822206059934],
 [0.5149446184525225, 0.335995540124698],
 [0.6414883079228135, 0.3235656419041443]]

In [38]:
w = np.array(w)
w.shape

(3, 2)

То есть матрица весов будет размером (__количество нейронов в слое__, __количество входных нейронов__)

Если у нас будет 7 нейронов в слое с 3 выходами, то

In [39]:
w = np.random.random(size=(7, 3))

In [40]:
w

array([[0.27696143, 0.87962476, 0.73792153],
       [0.31403014, 0.08928159, 0.90207004],
       [0.08169356, 0.32491989, 0.05152714],
       [0.43393239, 0.26814324, 0.47416476],
       [0.67677783, 0.25095344, 0.01624862],
       [0.00260219, 0.74177418, 0.26148313],
       [0.47190528, 0.64454532, 0.79976737]])

In [41]:
w.shape

(7, 3)

#### Вернемся к нашей изначальной нейросети с 3 нейронами в первом слое и 2 входами

In [42]:
w = np.random.random(size=(3, 2))
w

array([[0.10782442, 0.29883984],
       [0.89849684, 0.09412962],
       [0.10081501, 0.97177471]])

У нас есть X, у нас есть W, давайте их женить

In [43]:
x_total.shape

(10000, 2)

In [44]:
w.shape

(3, 2)

Если имеем 10000 наблюдений, то после прохода через 3 нейрона у нас должна быть матрица (10000, 3).  
Имеем матрицы (10000, 2) и (3, 2), как сделать (10000, 3)?

In [45]:
output = x_total @ w.T

In [46]:
output[:5]

array([[0.22239855, 0.78142077, 0.51764772],
       [0.06437781, 0.49886556, 0.07105522],
       [0.20449039, 0.06718899, 0.66416415],
       [0.25964933, 0.3794757 , 0.75831502],
       [0.31646457, 0.48654609, 0.91730081]])

In [47]:
output.shape

(10000, 3)

#### Дальше имеем 2 нейрона, где каждый получает сигнал от 3 сзадистоящих.  
Значит

In [48]:
w2 = np.random.random(size=(2, 3))

Как посчитать значения на нейронах дальше?  
Опять умножением

In [49]:
output.shape

(10000, 3)

In [50]:
w2.shape

(2, 3)

Из (10000, 3) и (2, 3) должны получить (10000, 2).

In [51]:
output_2 = output @ w2.T

In [52]:
output_2[:10]

array([[0.70819466, 0.53500584],
       [0.25250163, 0.10501544],
       [0.53770694, 0.61100732],
       [0.73399218, 0.72203646],
       [0.89878796, 0.87563458],
       [0.5604566 , 0.49098407],
       [0.16804757, 0.10244831],
       [0.28505656, 0.283178  ],
       [0.74039557, 0.56043752],
       [0.90926133, 0.78518365]])

In [53]:
output_2.shape

(10000, 2)

#### В самом конце у нас один нейрон, значит

In [54]:
w3 = np.random.random(size=(1, 2))
output_3 = output_2 @ w3.T

In [55]:
output_3[:10]

array([[0.09965938],
       [0.02518428],
       [0.10038697],
       [0.12351217],
       [0.15021553],
       [0.08702704],
       [0.02069061],
       [0.04830145],
       [0.10432423],
       [0.13981685]])

In [56]:
output_3.shape

(10000, 1)

Бинго, мы получили 1 чиселко для каждого из 10000 наблюдений в выборке.

![](http://memesmix.net/media/created/l7sksl.jpg)

## Это здорово, но как сети учатся?  
Это мы узнаем на следующем семинаре