# 2. Нейрон: Описание и типы

## _Обобщенное описание_

**Искусственный нейрон** - узел искусственной нейронной сети, являющийся упрощённой моделью естественного нейрона. Математически искусственный нейрон обычно представляют как некоторую нелинейную функцию от единственного аргумента — линейной комбинации всех входных сигналов.

Схематически нейрон представлен следующим образом:
<div>
    <img src="pics/2-Neuron_Description-1-Neuron-description.drawio.png" width="400"/>
</div>

1. **Входные сигналы** $x_i: (x_1, x_2, x_3, ... , x_m)$
2. **Веса** $w_i: (w_1, w_2, w_3, .. , w_m)$ . Они домножаются на входные сигналы с тем же номером, делая сигнал более или менее весомым
3. **Сумматорная функция** $f_{\Sigma} = \sum_{i=1}^{m}{x_i w_i}$. Производит суммирование всех входных сигналов, умноженных на веса
4. **Активационная функция** $\phi(f_{\Sigma})$. Определяет выходной сигнал, который определяется набором входных сигналов
5. **Выходной сигнал**. Является результатом работы активационной функции


---
## _Виды нейронов_

### I. Линейный нейрон
**Определение**
$$
    f (X, W, b) = \sum_{i=1}^m x_i w_i + b
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
    \end{matrix}
$$

**Упрощенное определение**
$$
    f (X, W, b) = \sum_{i=1}^m x_i w_i
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация перцептрона} \\
        X \mbox{ - вектор входных активаций (включая фиктивную колонку)} \\
        W \mbox{ - вектор весов (включая смещение)} \\
    \end{matrix}
$$

### Замечание

Линейный нейрон может быть полезен при предсказании количественных параметров (например рост на основании пола и веса). В таком случае линейные нейроны ставят на выходном слое сети.

---

### II. Перцептрон

**Определение**
$$
    f (X, W, b) = \begin{cases}
        1, & \mbox{if} \sum_{i=1}^m x_i w_i + b > 0 \\
        0, & \mbox{else}
    \end{cases}
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций (вектор значений)} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
    \end{matrix}
$$

Функция активации имеет вид:
<div>
    <img src="pics/2-Neuron_Description-func_perceptron.png" width="250"/>
</div>

---

### III. Сигмоидальный (логистический) нейрон

**Определение**
$$
    f (X, W, b) = \sigma (W X + b)
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций (вектор значений)} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
        \sigma \mbox{ - логистическая функция} \\
    \end{matrix}
$$

где логистическая функция имеет следующий вид
$$
    \sigma (t) = {1 \over {1 + e^{-t}}}
$$
и график:
<div>
    <img src="pics/2-Neuron_Description-func_sigma.png" width="250"/>
</div>

---

### IV. Нейрон, основанный на гиперболическом тангенсе

**Определение**
$$
    f (X, W, b) = tanh (W X + b)
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций (вектор значений)} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
        tanh (t) \mbox{ - гиперболический тангенс} \\
    \end{matrix}
$$

где функция гиперболического тангенса имеет следующий вид
$$
    tanh (t) = {{e^{t} - e^{-t}} \over {e^{t} + e^{-t}}}
$$
и график:
<div>
    <img src="pics/2-Neuron_Description-func_tanh.png" width="250"/>
</div>

---

### V. Rectified linear unit (ReLU)

**Определение**
$$
    f (X, W, b) = max (W X + b, 0)
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций (вектор значений)} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
        max (a, b) \mbox{ - максимум из двух элементов} \\
    \end{matrix}
$$

где функция имеет следующий вид:
<div>
    <img src="pics/2-Neuron_Description-func_relu.png" width="250"/>
</div>

---

### VI. Softplus (аналитическое приближение ReLU)

**Определение**
$$
    f (X, W, b) = ln (1 + e^{W X + b})
$$
$$
    \begin{matrix}
        f (X, W, b) \mbox{ - выходная активация нейрона} \\
        X \mbox{ - вектор входных активаций (вектор значений)} \\
        W \mbox{ - вектор весов} \\
        b \mbox{ - смещение (bias)} \\
        ln (1 + e^{t}) \mbox{ - softplus функция (по определению)} \\
    \end{matrix}
$$

где функция $softplus$ имеет следующий вид (в сравнении с $ReLU$):
<div>
    <img src="pics/2-Neuron_Description-func_relu+softplus.png" width="250"/>
</div>

---