# Warstwowa sieć neuronowa

Rozważmy 3 warstwową sieć typu "fully connected".
Niech liczba neuronów w warstwach wynosi 

 - 3 na wejściu
 - 4 na pierwszej warstwie
 - 2 na drugiej warstwie
 - 3 na ostatnie warstwie (czyli wyjście jest 3 liczbami)
 
 

$$
\sigma(x) = \frac{1}{1+e^{-x}}
$$

 - pierwsza warstwa: $y_1 = \sigma( X\cdot W^1 + b^1)$
 - druga warstwa: $y_2 = \sigma( y_1\cdot W^2 + b^2)$
 - trzecia warstwa: $y_3 = \sigma( y_2\cdot W^3 + b^3)$
 
 
Zaimplementuj powyższe obliczenia używając zapisu macierzowego w numpy:

`np.dot(x,W)+b` - odpowiada macierzowemu mnożeniu:  $x\cdot W+b$, gdzie

 - $x$ jest wejściem - macierzą  wymiarze (shape) $n_{examples}\times n_{inputs} $ 
 - $W$ jest macierzą wag, każda kolumny odpowiadają neuronom: $n_{inputs} \times n_{neurons}$
 - $b$ to bias, wektor o rozmiarze $n_{neurons}$ (po jednym dla każdego neuronu).
 
 


# Layered neural network

Consider a 3-layer "fully connected" type network.
Let the number of neurons in the layers be

 - 3 at the input
 - 4 on the first layer
 - 2 on the second layer
 - 3 on the last layer (i.e. the output is 3 numbers)
 
 

$$
\sigma(x) = \frac{1}{1+e^{-x}}
$$

 - first layer: $y_1 = \sigma( X\cdot W^1 + b^1)$
 - second layer: $y_2 = \sigma( y_1\cdot W^2 + b^2)$
 - third layer: $y_3 = \sigma( y_2\cdot W^3 + b^3)$
 
 
Implement the above calculations using the matrix notation in numpy:

`e.g..dot (x, W) + b` - corresponds to matrix multiplication: $x\cdot W+b$, where

 - $x$ is the input - shape matrix $n_{examples}\times n_{inputs} $
 - $W$ is a weight matrix, each column corresponds to neurons: $n_{inputs} \times n_{neurons}$
 - $b$ is bias, $n_{neurons}$ size vector (one for each neuron).

In [None]:
import numpy as np 

### Zaimplementuj funkcję  aktywacji
$$
\sigma(x) = \frac{1}{1+e^{-x}}
$$

### Implement the activation function
$$
\sigma(x) = \frac{1}{1+e^{-x}}
$$

In [None]:
s = None
### BEGIN SOLUTION
s = lambda x:1/(1+np.exp(-x))
### END SOLUTION

In [None]:
np.testing.assert_allclose(s(1.23),
                           0.773818574,rtol=1e-4)

In [None]:
np.testing.assert_allclose(s(np.array([1,2,3])),
                           [0.73105858, 0.88079708, 0.95257413],rtol=1e-4)

### Zainicjalizuj wagi

Przypisz wagom z i-tej warstwy takie same wartości równe $0.1\cdot i$   a bias-owi $0.2\cdot i$.

### Initialize the weights

Assign balances from the i-th layer the same values ​​equal to $0.1\cdot i$ and bias to $0.2\cdot i$.

In [None]:
W1,b1 = None,None
W2,b2 = None,None
W3,b3 = None,None

### BEGIN SOLUTION
W1,b1 = 0.1*1*np.ones((3,4)),0.2*1*np.ones(4)
W2,b2 = 0.1*2*np.ones((4,2)),0.2*2*np.ones(2)
W3,b3 = 0.1*3*np.ones((2,3)),0.2*3*np.ones(3)
### END SOLUTION

In [None]:
assert W1.shape == (3,4)
assert W2.shape == (4,2)
assert W3.shape == (2,3)
assert b1.shape[-1] == 4
assert b2.shape[-1] == 2
assert b3.shape[-1] == 3

Na wejsciu mamy zestaw dwóch przykładów.
Implementacja powinna przetworzyć poprawnie następujące dane:
    

At the input we have a set of two examples.
The implementation should process the following data correctly:

In [None]:
X = np.array([ [1,2,3],[1,0,0]])

### Zaimplementuj sieć


### Implement the network

In [None]:

y1 = None # Wyjscie z pierwszej warstwy
y2 = None
y3 = None


### BEGIN SOLUTION

z1 = X.dot(W1) + b1
y1 = s(z1)

z2 = y1.dot(W2) + b2
y2 = s(z2)

z3 = y2.dot(W3) + b3
y3 = s(z3)

### END SOLUTION


In [None]:
np.testing.assert_allclose(y3,[[0.73747926, 0.73747926, 0.73747926],
       [0.73527256, 0.73527256, 0.73527256]],rtol=1e-4)

y2.shape == (2,2)
y1.shape == (2,4)