# Perceptrony i jednokierunkowe sieci neuronowe

## Perceptron

(Rysunki pochodzą z artykułu [A Quick Primer on Feedforward Neural Networks](https://builtin.com/data-science/feedforward-neural-network-intro).)

Poglądowy rysunek pokazujący budowę neuronu:

![artificial%20neural%20network.png](attachment:artificial%20neural%20network.png)

Każdy neuron ma *próg aktywacji*: bodziec przekazywany jest na synapsy wyjściowe jedynie jeśli suma sygnałów wejściowych przekroczy ten próg.

Za Wikipedią:

> Typowy neuron jest zbudowany z ciała komórki (perikarion) oraz odchodzących od niego wypustek: aksonu i dendrytów. Neurony kontaktują się między sobą poprzez synapsy, tworząc sieci neuronowe. Informacje od innych neuronów są odbierane przez synapsy położone na dendrytach, przewodzone wzdłuż neuronu i przekazywane dalej do synaps na zakończeniach aksonu.
>
>Przewodzenie informacji w postaci sygnału elektrycznego jest możliwe dzięki temu, że wszystkie neurony są elektrycznie pobudliwe, czyli zdolne do generowania i przewodzenia potencjałów elektrycznych. Niepobudzony neuron utrzymuje potencjał spoczynkowy (będący różnicą między potencjałem elektrycznym wnętrza neuronu a zewnętrznej powierzchni błony) dzięki działaniu leżących w błonie pomp jonowych, które przenoszą określone jony przez błonę i generują różnicę w stężeniu tych jonów po obu stronach błony.
>
> Pod wpływem dostatecznie silnego bodźca dochodzi do zmian w przepuszczalności określonych jonów przez błonę, co prowadzi do powstania potencjału czynnościowego – sygnału elektrycznego, który rozprzestrzenia się wzdłuż aksonu do synaps znajdujących się w zakończeniach aksonu.

Odpowiada temu matematyczny model, nazywany **perceptronem**.

![neural%20network%20activation%20weights.png](attachment:neural%20network%20activation%20weights.png)

Wejście: 

$$\text{ input = } x_1, x_2, \ldots, x_k.$$

Część liniowa: $$f(x) = \sum_{i = 1}^k w_k x_k + b,$$
gdzie $w_k$ to *wagi* - parametry perceptronu.

Nieliniowa aktywacja:
$$
\text{ output } = \left\{
\begin{array}{ll}
0 & \text{ jeżeli } \sum_{i = 1}^k w_k x_k + b \leq 0 \\
1 & \text{ jeżeli } \sum_{i = 1}^k w_k x_k + b > 0.
\end{array}
\right.
$$

Używa się wielu różnych funkcji aktywacji. Takiej (lub czasami $\pm 1$) używamy w przypadku perceptronu.

## Co mogą perceptrony?

Znów za Wikipedią:

>Single-layer perceptrons are only capable of learning linearly separable patterns; in 1969 in a famous monograph entitled Perceptrons, Marvin Minsky and Seymour Papert showed that it was impossible for a single-layer perceptron network to learn an XOR function (nonetheless, it was known that multi-layer perceptrons are capable of producing any possible boolean function).

Widzieliśmy już to rozwiązując kiedyś zadanie [separacji punktów na płaszczyźnie](../../laboratoria/laboratorium3/separacja_punktow.ipynb).

Rzeczywiście jeden perceptron grupuje dane wejściowe na te, które spełniają nierówność
$$
\sum_{i=1}^k w_k x_k \leq -b
$$
i na pozostałe. Oczywiście punkty te muszą leżeć w półprzestrzeni ograniczonej jedną nierównością liniową.

Funkcja XOR:
$$
xor(x, y) = \left\{
\begin{array}{ll}
0 & \text{ jeżeli } x = y \\
1 & \text{ w przeciwnym przypadku }
\end{array}
\right.
$$
dla $x, y \in \{ 0, 1 \}$. Oczywiście zbiór punktów, dla których $xor(x,y) = 0$ nie jest liniowo separowalny od zbioru punktów, dla których $xor(x, y) = 1$.

XOR można jednak policzyć używając dwuwarstwowej sieci (źródło - Wikipedia):

![xor_perceptron_net.png](attachment:xor_perceptron_net.png)

> A two-layer neural network capable of calculating XOR. The numbers within the neurons represent each neuron's explicit threshold (which can be factored out so that all neurons have the same threshold, usually 1). The numbers that annotate arrows represent the weight of the inputs. This net assumes that if the threshold is not reached, zero (not -1) is output. Note that the bottom layer of inputs is not always considered a real neural network layer

## Inne funkcje aktywacji

Proszę zwrócić uwagę, że bez nieliniowej funkcji aktywacji dodawanie nowych warstw do sieci nic by nie zmieniało.

Stosuje się różne funkcje aktywacji:

![neural%20network%20activation%20function.png](attachment:neural%20network%20activation%20function.png)

W praktyce najczęściej używana jest funkcja ReLU. (*Rectified linear unit.*)