# Sieci neuronowe

### Kategorie metod inspirowanych Naturą

- <span t="l2">Metody odtwarzające zjawiska występujące w Naturze (m.in. biologiczne), np. automaty komórkowe.</span>
- <span t="l2">Metody motywowane zjawiskami występującymi w Naturze (m.in. biologicznymi), np. algorytmy genetyczne, sieci neuronowe.</span>
- <span t="l2">Metody korzystające ze zjawisk występujących w Naturze (m.in. biologicznych) – obliczenia niekonwencjonalne.</span>

### Neuron biologiczny

<img src="../pliki_z_internetu/neuron.png" width="600"/>

- <span t="l2">Neurony kontaktują się między sobą poprzez synapsy tworząc sieci neuronowe.</span>
- <span t="l2">Nośnikiem informacji są sygnały elektryczne.</span>
- <span t="l2">Dendryty → Synapsy położone na dendrytach służą do odbierania informacji z innych neuronów ↔ Wejścia.</span>
- <span t="l2">Zakończenia aksonu → Synapsy położone na na zakończeniach aksonu służą do przekazywania informacji do innych neuronów ↔ Wyjścia.</span>

### Od neuronu biologicznego do sztucznego neuronu

<img src="../pliki_z_internetu/neuron2.png" width="600"/>

### Model neuronu
<img src="../pliki_z_internetu/neuron3.jpg" width="600"/>

- <span t="l2">$y=f(\sum_{i=0}^{n} w_i x_i)$</span>
- <span t="l2">f - funkcja aktywacji</span>
- <span t="l2">$x_1,x_2, ..., x_n$ - sygnały wejściowe</span>
- <span t="l2">$w_0, w_1, ..., w_n$ - wagi</span>
- <span t="l2">$y$ - sygnał wyjściowy</span>

### Przykładowe funkcje aktywacji 

<span t="l1">Unipolarna funkcja skokowa:</span>

<span t="l2">$f(z)=\left\{
\begin{array}{ccc}
0&\mbox{dla}&z<0\\
1&\mbox{dla}&z\geq 0
\end{array}
\right.$</span>

<span t="l2">Bipolarna funkcja skokowa:</span>

<span t="l2">$f(z)=\left\{
\begin{array}{ccc}
1&\mbox{dla}&z>0\\
-1&\mbox{dla}&z\leq 0
\end{array}
\right.$</span>


<span t="l1">Bipolarna funkcja sigmoidalna:</span>

<span t="l2">$f(z)=tanh(\beta z)$</span>

<span t="l1">Obcięta funkcja liniowa</span>

<span t="l2">$f(z)=\left\{
\begin{array}{ccc}
1&\mbox{dla}&z>1\\
z&\mbox{dla}&-1\leq z\leq 1\\
-1&\mbox{dla}&z<-1
\end{array}
\right.$</span>

### Perceptron

- <span t="l1">Perceptron to neuron z unipolarną skokową funkcją aktywacji.</span>
- <span t="l1">Perceptron najlepiej opisuje rzeczywisty neuron.</span>
- <span t="l1">Perceptron dokonuje jedynie liniowego podziału przestrzeni.</span>
    - <span t="l2">Przy jego pomocy nie można rozdzielić przypadków, które nie są liniowo separowalne.</span>


### Uczenie neuronu

<span t="l1">Uczenie nadzorowane (z nauczycielem)</span>

<span t="l1">Ciąg uczący (k przykładów):</span>
- <span t="l2">$(\vec{x}(t), d(x(t))$</span>
- <span t="l2">$\vec{x}(t)=[x_1(t),x_2(t), ..., x_n(t)]$ - wektor sygnałów wejściowych</span>
- <span t="l2">$d(\vec{x}(t))$ – wartość wzorcowa sygnału wyjściowego dla wektora sygnałów wejściowych</span>
- <span t="l2">$t=1,2, ..., k$</span>

<span t="l1">1. Wybieramy w sposób losowy wagi początkowe neuronu. Ustawiamy $t=1$.</span>

<span t="l1">2. Na wejścia neuronu podajemy wektor uczący: $\vec{x}(t)=[x_1(t),x_2(t), ..., x_n(t)]$</span>

<span t="l1">3. Obliczamy wartość wyjściową $y$ neuronu.</span>

<span t="l1">4. Porównujemy wartość wyjściową $y$ z wartością wzorcową $d(\vec{x}(t))$ znajdującą się w ciągu uczącym.</span>

<span t="l1">5. Dokonujemy modyfikacji wag wg. zależności:</span>

- <span t="l2">jeżeli $y \neq d(\vec{x}(t)): w_{i}(t+1)=w_i(t)+(d(\vec{x}(t))-y) \cdot x_i(t)$</span>
- <span t="l2">jeżeli $y = d(\vec{x}(t)): w_{i}(t+1)=w_i(t) $</span>

<span t="l1">6. Zwiększamy $t$ o 1 i jeśli $t$ nie jest większe od $k$ wracamy do punktu 2.</span>

- <span t="l1">Algorytm uczenia powtarza się tak długo, aż dla wszystkich wektorów wejściowych wchodzących w skład ciągu uczącego błąd na wyjściu będzie mniejszy od założonej tolerancji.</span>
- <span t="l1">Wykonanie jednej pętli algorytmu dotyczy tzw. jednej epoki, na którą składają się dane tworzące ciąg uczący.</span>
- <span t="l1">Algorytm może być wielokrotnie stosowany dla tego samego ciągu uczącego, aż do spełnienia warunku zakończenia (konieczne może więc być podanie wielu epok).</span>

### Przykład 1

Napisz skrypt dla środowiska R uczący perceptron funkcji sumy logicznej (OR). 

Krok 1: Definiujemy funkcję aktywacji (skok jednostkowy).

In [7]:
unit.step<-function(x)
{
  if(x>0.5) 
  {
    return(1.0);
  }
  else 
  {
    return(0.0);
  }
}

Krok 2: Tworzymy tablicę decyzyjną reprezentującą funkcję sumy logicznej.

In [2]:
decision.table<-data.frame(matrix(c(0,0,0,0,1,1,1,0,1,1,1,1), ncol=3, byrow=TRUE));
colnames(decision.table)<-c("x1", "x2", "y");
print(decision.table);

  x1 x2 y
1  0  0 0
2  0  1 1
3  1  0 1
4  1  1 1


Krok 3: Wyodrębniamy z tablicy decyzyjnej atrubuty warunkowe (dwie pierwsze kolumny) i atrybut decyzyjny (ostania kolumna).

In [4]:
x=decision.table[,-c(3)]
d=decision.table[,c(3)]

Krok 4: Losujemy wartości wektora wag (wartości z przedziału [0.0, 1.0]).

In [5]:
w=runif(n=2, min=0.0, max=1.0);

Krok 5: Uczymy neuron iteracyjnie (pętla zewnętrzna dotyczy epok, pętla wewnętrzna przypadków w danej epoce).

In [8]:
for(e in 1:50)
{
  for(i in 1:nrow(x))
  {
    s=sum(w*x[i,]);
    y=unit.step(s);

    if(y!=d[i])
    {
      w=w+0.02*(d[i]-y)*x[i,];
    }
  }
}

Krok 6: Wyświetlamy wektor wag po nauczeniu neuronu.

In [13]:
colnames(w)<-c("w1", "w2");
print(w);

         w1        w2
3 0.4966881 0.1994433


Krok 7: Sprawdzamy jak nauczył się neuron.

In [11]:
for(i in 1:nrow(x))
{
  s=sum(w*x[i,]);
  y=unit.step(s);
  print(y);
}

[1] 0
[1] 1
[1] 1
[1] 1


### Przykład 2

Napisz skrypt dla środowiska R uczący perceptron funkcji iloczynu logicznego (AND). 

Skrypt ma postać analogiczną jak w przykładzie 1 (różni się tablicą decyzyjną).

In [14]:
unit.step<-function(x)
{
  if(x>0.5) 
  {
    return(1.0);
  }
  else 
  {
    return(0.0);
  }
}

decision.table<-data.frame(matrix(c(0,0,0,0,1,0,1,0,0,1,1,1), ncol=3, byrow=TRUE));
colnames(decision.table)<-c("x1", "x2", "y");
print(decision.table);

x=decision.table[,-c(3)]
d=decision.table[,c(3)]

w=runif(n=2, min=0.0, max=1.0);

for(e in 1:50)
{
  for(i in 1:nrow(x))
  {
    s=sum(w*x[i,]);
    y=unit.step(s);

    if(y!=d[i])
    {
      w=w+0.02*(d[i]-y)*x[i,];
    }
  }
}

colnames(w)<-c("w1", "w2");
print(w);

for(i in 1:nrow(x))
{
  s=sum(w*x[i,]);
  y=unit.step(s);
  print(y);
}

  x1 x2 y
1  0  0 0
2  0  1 0
3  1  0 0
4  1  1 1
         w1         w2
3 0.4910686 0.02381247
[1] 0
[1] 0
[1] 0
[1] 1


### Przykład 3

Napisz skrypt dla środowiska R uczący perceptron funkcji alternatywy wykluczającej (EXOR). 

Skrypt ma postać analogiczną jak w przykładzie 1 (różni się tablicą decyzyjną).

In [16]:
unit.step<-function(x)
{
  if(x>0.5) 
  {
    return(1.0);
  }
  else 
  {
    return(0.0);
  }
}

decision.table<-data.frame(matrix(c(0,0,0,0,1,1,1,0,1,1,1,0), ncol=3, byrow=TRUE));
colnames(decision.table)<-c("x1", "x2", "y");
print(decision.table);

x=decision.table[,-c(3)]
d=decision.table[,c(3)]

w=runif(n=2, min=0.0, max=1.0);

for(e in 1:50)
{
  for(i in 1:nrow(x))
  {
    s=sum(w*x[i,]);
    y=unit.step(s);

    if(y!=d[i])
    {
      w=w+0.02*(d[i]-y)*x[i,];
    }
  }
}

print(w);

for(i in 1:nrow(x))
{
  s=sum(w*x[i,]);
  y=unit.step(s);
  print(y);
}

  x1 x2 y
1  0  0 0
2  0  1 1
3  1  0 1
4  1  1 0
        x1        x2
3 0.330138 0.4885378
[1] 0
[1] 0
[1] 0
[1] 1


UWAGA: Jeden neuron jest w stanie nauczyć się funkcji jeśli przypadki są liniowo separowalne. W przypadku funkcji EXOR tak nie jest i neuron nigdy jej się nie nauczy.

###  Wielowarstwowe sieci neuronowe

<img src="../pliki_z_internetu/deep_net.png" width="600"/>

<span t="l1">WARSTWA WEJŚCIOWA - WARSTWA UKRYTA - WARSTWA WYJŚCIOWA</span>

<img src="../pliki_z_internetu/deep_net_2.png" width="600"/>

<span t="l1">Modyfikacja wag metodą wstecznej propagacji</span>


<img src="../pliki_z_internetu/deep_net_3.png" width="600"/>



<span t="l1">Błąd neuronu wyjściowego:</span>

- <span t="l2">$e_i=y_i(1-y_i)(d_i-y_i)$</span>


<span t="l1">Nowe wagi neuronu wyjściowego:</span>

- <span t="l2">$w'_{ji}=w_{ji}+e_i \cdot h_j$</span>

<span t="l1">Błąd neuronu w warstwie ukrytej:</span>

- <span t="l2">$\varepsilon_j=h_j(1-h_j)\sum_{e_i}^{w_{ji}}$</span>

<span t="l1">Nowe wagi neuronu ukrytego:</span>
- <span t="l2">analogicznie jak dla neuronu wyjściowego</span>

### Inne modele sieci neuronowych

- <span t="l1">Sieci rekurencyjne, np. sieci Hopfielda, sieci Jordana, sieci Elmana.</span>
- <span t="l1">Sieci pamięci asocjacyjnej, np. sieci typu BAM, sieci Hamminga.</span>
- <span t="l1">Sieci samoorganizujące się, np. mapy samorganizujące się (SOM).</span>


### Przykład sieci rekurencyjnej

<img src="../pliki_z_internetu/siec_elmana.png" width="600"/>