## Введение в нейроны

На данный момент мы знаем, как создавать модели и заставлять компьютер автоматически учиться сопоставлять модель с данными. Это ядро того, как работает любой метод машинного обучения. 

Теперь давайте сузим наше внимание и посмотрим на **нейронные сети**. Нейронные сети (или «нейросети», для краткости) - это особый выбор **модели**. Это сеть, состоящая из **нейронов**; что, в свою очередь, приводит к вопросу 'что такое нейрон?'

### Модели с несколькими входами

До сих пор мы использовали сигмовидную функцию в качестве нашей модели. Одна из форм сигмоидальной функции, которую мы использовали,

$$\sigma_{w, b}(x) = \frac{1}{1 + \exp(-wx + b)},$$

где `x` и` w` одинарные числа. Мы использовали эту функцию, чтобы смоделировать, как количество зеленого цвета на изображении (`x`) может быть использовано для определения того, что изображено на изображении. Но что, если бы у нас было больше данных, которые мы хотели бы разметить? Мы можем расширить нашу модель, включив в нее несколько параметров, таких как

$$\sigma_{\mathbf{w},b}(\mathbf{x}) = \frac{1}{1 + \exp(-w_1 x_1 - w_2 x_2 - \cdots - w_n x_n + b)}$$

Обратите внимание, что теперь $ \mathbf {x} $ и $ \mathbf {w} $ являются векторами со многими компонентами, а не одним числом. 

Например, $ x_1 $ может быть количеством зеленого цвета на изображении, $ x_2 $ может быть высотой объекта на картинке, $ x_3 $ может быть шириной и т. д. Наша модель теперь имеет больше параметров, но та же самая идея градиентного спуска («катание шара вниз») все равно будет работать для обучения. 

Эта версия сигмоидальной модели, которая принимает несколько входов, является примером **нейрона (перцептрона)**.

На самом деле это карикатура на настоящие, биологические нейроны. И *искусственные*, и *биологические* нейроны имеют несколько входов $ x_1, \ldots, x_n $ и один выход $ y $. Схематично они выглядят так:

In [None]:
include("draw_neural_net.jl") # там рисовалка

In [None]:
# plotly() # plotlyjs() # pyplot()

In [None]:
number_inputs, number_neurons = 4, 1

draw_network([number_inputs, number_neurons])

Мы должны это воспринимать, как течение информации слева направо:
- Поступает 4 фрагмента входной информации (показано зеленым цветом слева);

- нейрон (показанный красным справа) получает все входные данные, обрабатывает их и выводит одно число справа.

Другими словами, нейрон - это просто тип функции, которая принимает несколько входов и возвращает один выход. 

Самый простой интересный случай, который мы рассмотрим в этой записной книжке, это когда есть только две части входных данных:

In [None]:
draw_network([2, 1])

Каждая связь между кружками выше представляет **вес** $ w $, который можно изменить, чтобы позволить нейрону учиться, поэтому в этом случае нейрон имеет два веса: $ w_1 $ и $ w_2 $. 

Нейрон также имеет одиночное смещение $ b $ и **функцию активации**, которую мы возьмем за сигмоидальную функцию $ \sigma $, которую мы уже использовали. (Обратите внимание, что могут использоваться другие функции активации!)

Давайте назовем наш нейрон $ f_ {w_1, w_2, b} (x_1, x_2) $, где 

$$ f_ {w_1, w_2, b} (x_1, x_2 ): = \sigma (w_1 x_1 + w_2 x_2 + b). $$ 

Обратите внимание, что $ f_ {w_1, w_2, b} (x_1, x_2) $ имеет 3 параметра: два веса и смещение. 

Чтобы упростить запись и подготовиться к более сложным сценариям позже, мы поместим два веса в вектор, а два значения данных в другой вектор:

$$
\mathbf{w} = \begin{pmatrix} w_1 \\ w_2 \end{pmatrix};
\qquad
\mathbf{x} = \begin{pmatrix} x_1 \\ x_2 \end{pmatrix}.
$$

Таким образом, мы имеем

$$f_{\mathbf{w}, b}(\mathbf{x}) = \sigma(\mathbf{w} \cdot \mathbf{x} + b),$$

где скалярное произведение $ \mathbf {w} \cdot \mathbf {x} $ является сокращенным синтаксисом для $ w_1 x_1 + w_2 x_2 $.

#### Упражнение 1

Объявите функцию `f (x, w, b)` в Julia. `f` должен принимать ` x` и `w` как векторы, а` b` - как скаляр. Кроме того `F` должен вызывать

```julia
σ(x) = 1 / (1 + exp(-x))
```

Какой выход вы получаете для

```julia
f(3, 4, 5)
```
?