# Übung Neuronale Netze I

### Neuronale Netze an einem generischen Datenset

Im Folgenden wollen wir ein Neuronales Netzwerk mit einem Hiddenlayer trainieren.
Wählen Sie zuerst eines der beiden folgenden (nicht linear trennbaren) Training Sets aus.

In [None]:
# Training Set 1

import numpy as np
import matplotlib.pyplot as plt

n = 2 # Anzahl Features
N = 500 # Anzahl Datenpunkte pro Klasse 
m = 2*N # Anzahl Training Examples
K=2 # Anzahl Klassen

X = np.random.rand(2*N,2)*2-1;
y = np.zeros(2*N, dtype='uint8')
y.shape

ind = np.reshape(np.where(X[:,0]**2<X[:,1]),-1)
y[ind] = 1

plt.scatter(X[:, 0], X[:, 1], c=y, s=40, cmap=plt.cm.Spectral)
plt.show()

X = X.T
print(X.shape)

In [None]:
# Training Set 2
import numpy as np
import matplotlib.pyplot as plt

n = 2 # Anzahl Features
K = 3 # Anzahl Klassen
N = 100 # Anzahl Datenpunkte pro Klasse

m = N*K # Anzahl Training Examples

X = np.zeros((m,n)) # data matrix (each row = single example)
y = np.zeros(m, dtype='uint8') # class labels
for j in range(K):
    ix = range(N*j,N*(j+1))
    r = np.linspace(0.0,1,N) # radius
    t = np.linspace(j*4,(j+1)*4,N) + 0.1*np.random.randn(N) # theta
    X[ix] = np.c_[r*np.sin(t), r*np.cos(t)]
    y[ix] = j
# lets visualize the data:
plt.scatter(X[:, 0], X[:, 1], c=y, cmap=plt.cm.Spectral)
plt.show()
X = X.T
print(X.shape)

Im folgenden sollen Sie ein Neuronales Netz einem dieser Training Sets trainieren. 

- Initialisieren Sie $\mathbf{W}_1,\mathbf{W}_2$ und $\vec{b}_1,\vec{b}_2$.
- Erstellen Sie die Matrix $\mathbf{Y}$.
- In jedem Schritt des Gradient Descent Verfahrens führen Sie zuerst  einen Forward Pass zu Berechnung von $\mathbf{H}$ aus. Im Anschluss wird der Backpropagation Algorithmus zur Bestimmung von $D\mathbf{W}_1, D\mathbf{W}_2, D\vec{b}_1, D\vec{b}_2$ verwendet.
- Berechnen Sie nach Konvergenz des Gradient Descent Verfahrens wie üblich die Accuracy (hier nur bezüglich Training Set).
- Plotten Sie die Cost-Function $J$ als Funktion des Iterationsschrittes.

In [None]:
# Anzahl Neuronen im Hidden Layer
h = 10
# Initialisierung W1, W2, b1, b2
W1 = np.random.randn(h,n)*0.01
W2 = np.random.randn(K,h)*0.01
b1 = np.zeros((h,1))
b2 = np.zeros((K,1))

# Erstellung der Matrix Y
Y = np.zeros((K,m))
Y[y,range(m)] = 1

# J_plot
J = []

# loop over epochs
iterations = 20000
alpha = 0.003
for i in range(iterations):
    ##############
    # Forward Pass
    ##############
    # Calculate Z1, A1, Z2, A2=H und J
    Z1 = np.dot(W1,X) + b1
    A1 = np.maximum(0,Z1)
    Z2 = np.dot(W2,A1)+b2
    H = np.exp(Z2)/np.sum(np.exp(Z2),axis=0,keepdims=True)
    J.append(-sum(np.log(H[y,range(m)])))
    
    #################
    # Backpropagation
    #################
    # Calculate Delta_2 and DW2, Db2
    Delta_2 = H-Y
    DW2 = np.dot(Delta_2,A1.T)
    Db2 = np.sum(Delta_2,axis=1,keepdims=True)
    
    # Calculate Delta_1 and dW1
    Delta_1 = np.dot(W2.T,Delta_2)
    Delta_1[Z1<=0] = 0
    DW1=np.dot(Delta_1,X.T)
    Db1 = np.sum(Delta_1,axis=1,keepdims=True)

    W2 += -alpha*DW2
    W1 += -alpha*DW1
    b2 += -alpha*Db2
    b1 += -alpha*Db1
        

   
# Berechne die Accuracy des Training Sets
z1 = np.dot(W1,X) + b1
a1 = np.maximum(0,Z1)
z2 = np.dot(W2,A1)+b2
predicted_class = np.argmax(Z2, axis=0)
print('training accuracy: %.2f' % (np.mean(predicted_class == y)))

In [None]:
plt.plot(J)

- Plotten Sie die Daten von oben zusammen mit den Decision Boundaries.

In [None]:
# Plot the boundaries
S=100
X_p,Y_p = np.meshgrid(np.linspace(-1.0,1.0,S),np.linspace(-1.0,1.0,S))
X_p = X_p.reshape(1,S**2)
Y_p = Y_p.reshape(1,S**2)
X_p = np.vstack([X_p,Y_p])
z1 = np.dot(W1,X_p) + b1
a1 = np.maximum(0,z1)
z2 = np.dot(W2,a1)+b2
predicted_class = np.argmax(z2, axis=0)
print(predicted_class.shape)
plt.scatter(X_p[0, :], X_p[1, :], c=predicted_class, s=40, cmap=plt.cm.Spectral)
plt.scatter(X[0,:], X[1, :], c=y)
plt.show()
X.shape

- Nutzen nun die erste Training Set mit K=2 Klassen und verwenden nur zwei Neuronen im Hidden Layer ($h=2$). Trainieren das Neuronale Netz und fertigen Sie danach einen Scatterplot der beiden Komponenten $a_1$ und $a_2$ des Aktivierungsvektors
$$
\vec{a}_1 = \begin{pmatrix} a_1 \\ a_2\end{pmatrix}
$$
im Hiddenlayer an. Sie sollten erkennen, dass die Daten linear separierbar sind.

In [None]:
#Z1 = np.dot(W1,X) + b1
#A1 = np.maximum(0,Z1)

plt.scatter(A1[0,:], A1[1, :], c=y)
plt.show()
a1.shape