## Нейронные сети

Теперь, когда мы знаем, что такое нейроны, мы готовы к последнему шагу: нейронной сети!

Нейронная сеть буквально состоит из нейронов, которые связаны друг с другом. Пока мы только что посмотрели на отдельные нейроны, которые имеют только один выход. Что если мы хотим получить несколько выходов?


### Модели с несколькими выходами

Что если бы мы хотели провести различие между яблоками, бананами и виноградом? Мы могли бы использовать *векторы* значений `0` или` 1`, чтобы символизировать каждый вывод.

<img src="data/fruit-salad.png" alt="Drawing" style="width: 300px;"/>

Идея использования векторов состоит в том, что различные направления в пространстве выходов кодируют информацию о различных типах входов.

Теперь мы расширяем нашу предыдущую модель, чтобы получить несколько выходов, повторяя ее с разными весами. Для первого элемента массива мы будем использовать:

$$\sigma(x;w^{(1)},b^{(1)}) := \frac{1}{1 + \exp(-w^{(1)} \cdot x + b^{(1)})};$$

тогда для второго мы будем использовать

$$\sigma(x;w^{(2)},b^{(2)}) := \frac{1}{1 + \exp(-w^{(2)} \cdot x + b^{(2)})};$$

и если бы вы хотели $ n $ выходов, вы бы имели для каждого

$$\sigma(x;w^{(i)},b^{(i)}) := \frac{1}{1 + \exp(-w^{(i)} \cdot x + b^{(i)})}.$$

Обратите внимание, что все эти уравнения одинаковы, за исключением параметров, поэтому мы можем написать эту модель более кратко, как изложено ниже. Давайте напишем $ b $ как массив:

$$b=\left[\begin{array}{c}
b_{1}\\
b_{2}\\
\vdots\\
b_{n}
\end{array}\right]$$

и представим наш массив весов в качестве матрицы:

$$ \mathsf{W}=\left[\begin{array}{c}
\\
\\
\\
\\
\end{array}\begin{array}{cccc}
w_{1}^{(1)} & w_{2}^{(1)} & \ldots & w_{n}^{(1)}\\
w_{1}^{(2)} & w_{2}^{(2)} & \ldots & w_{n}^{(2)}\\
\vdots & \vdots &  & \vdots\\
w_{1}^{(n)} & w_{2}^{(n)} & \ldots & w_{n}^{(n)}
\end{array}\right]
$$

Мы можем записать все это в одну строку как:

$$\sigma(x;w,b)= \left[\begin{array}{c}
\sigma^{(1)}\\
\sigma^{(2)}\\
\vdots\\
\sigma^{(n)}
\end{array}\right] = \frac{1}{1 + \exp(-\mathsf{W} x + b)}$$

$W x$ это операция под названием «матричное умножение»

$$
\begin{pmatrix}
W_{11} & W_{12} & W_{13}\\ 
 W_{21}& W_{22} & W_{23}
\end{pmatrix}
\begin{pmatrix}
x_1\\ 
x_2\\
x_3
\end{pmatrix}=
\begin{pmatrix}
W_{11}x_1 + W_{12}x_2 + W_{13}x_3\\ 
 W_{21}x_1 + W_{22}x_2 + W_{23}x_3
\end{pmatrix}
$$

Он берет каждый столбец весов и делает скалярное произведение против $ x $ (помните, именно так был определен $ \sigma ^ {(i)} $) и выделяет вектор, выполняя это с каждым столбцом. В результате получается вектор, который заставляет эту версию функции давать вектор выходных данных, который мы можем использовать для кодирования большего набора вариантов.

Матричное умножение также интересно, поскольку **графические процессоры (на видео картах) в основном являются просто машинами умножения матриц**, что означает, что, если написать уравнение таким образом, результат можно вычислить очень быстро.

Эта версия сигмоидальной функции «множественный вход и множественный выход» известна как *слой нейронов*. 

Ранее мы работали с одним нейроном, который мы визуализировали как

<img src="data/single-neuron.png" alt="Drawing" style="width: 300px;"/>

где у нас есть два куска данных (зеленый), поступающих в один нейрон (розовый), который возвратил один вывод. Мы могли бы использовать этот единственный выход для бинарной классификации - чтобы идентифицировать изображение фрукта как `1`, что означает банан или как` 0`, что означает не банан (или яблоко).

Для выполнения недвоичной классификации мы можем использовать слой нейронов, который мы можем визуализировать как

<img src="data/single-layer.png" alt="Drawing" style="width: 300px;"/>

Теперь мы поместили несколько нейронов друг на друга, чтобы они работали вместе и обучались выводить результаты более сложных функций. 

У нас все еще есть два входных фрагмента данных, но теперь есть несколько нейронов, каждый из которых производит вывод для данной двоичной классификации: 
* neuron 1: "это яблоко?"
* neuron 2: "это банан?"
* neuron 3: "это виноград?"