# Cheatsheet
>## <ins>Table of contents</ins> <a name="up"></a>[<sup>[1]</sup>](#cite_note-1)
>* [**K1. Motivation und Grundlagen**](#K1)
    * [**1. **](#1.1.)

>* [**K2. Motivation und Grundlagen**](#K2)
>* [**K3. Motivation und Grundlagen**](#K3)
>* [**K4. Motivation und Grundlagen**](#K4)
>* [**K5. Motivation und Grundlagen**](#K5)
    * [**5.1. RNN**](#5.1.)
       * [**5.1. RNN**](#5.1.)
    * [**5.3. RNN**](#5.3.)
       * [**spaltenweise Konkatenation zweier Matrizen**](#5.3.1.)
       * [**One-Hot-Codierung**](#5.3.2.)
       * [**Berechnungsgraphen**](#5.3.3.)

>


In [2]:
import numpy as np


## 5.3. RNN <a name=5.1.><a>

### 5.3.1. spaltenweise Konkatenation zweier Matrizen <a name=5.3.1.><a>

Sei $A \in \mathbb{R}^{n \times m}$ und $B \in \mathbb{R}^{n \times m'}$ zwei Matrizen mit gleicher Anzahl an Zeilen, so ist $A \circ B \in \mathbb{R}^{n \times (m + m')}$ die entsprechende Konkatenation:

In [None]:
# Erstellen Sie die Matrizen A und B mit Dummy-Zahlen
A = np.array([[1, 2, 3], 
              [4, 5, 6], 
              [7, 8, 9]])

B = np.array([[10, 11, 12], 
              [13, 14, 15], 
              [16, 17, 18]])

# Führen Sie die Konkatenation durch
AB = np.concatenate((A, B), axis=1)
print(AB)

# Erstellen Sie die Vektoren v und w mit Dummy-Zahlen
v = np.array([1, 2, 3])  # v = (v1, ..., vm)^T
w = np.array([4, 5, 6])  # w = (w1, ..., wm')^T

# Führen Sie die Konkatenation durch
vw = np.concatenate((v, w))
print("v ◦ w =", vw)

Vergewissern Sie sich, dass für die obigen Definition gilt $(A \circ B)(v \circ w) = Av + Bw$.

In [None]:
result1 = np.dot(AB,vw)
result2 = np.dot(A,v) + np.dot(B,w)
print(result1 == result2)

### 5.3.2. One-Hot-Codierung <a name=5.3.2.><a>


Sei ein Alphabet gegeben durch

Σ={a,e,s,t}

1. Bestimmen Sie eine One-Hot-Codierung für Σ
. (Anwortformat '(1,2,3,4,5,6)', Vektorlänge ist selbst zu wä
2. Wie ist demnach das Wort test
 codiert 

(Anwortformat '((1,2,3,4,5,6),(7,8,9))')
#### Lösung
- a: (1, 0, 0, 0)
- e: (0, 1, 0, 0)
- s: (0, 0, 1, 0)
- t: (0, 0, 0, 1)

Unter Verwendung der zuvor definierten One-Hot-Codierung für das Alphabet Σ={a,e,s,t}, wird das Wort "test" wie folgt codiert:

- t: (0, 0, 0, 1)
- e: (0, 1, 0, 0)
- s: (0, 0, 1, 0)
- t: (0, 0, 0, 1)

Daher ist die Codierung des Wortes "test" in dem von Ihnen angegebenen Antwortformat:

((0, 0, 0, 1), (0, 1, 0, 0), (0, 0, 1, 0), (0, 0, 0, 1))

### 5.3.3. Berechnungsgraphen <a name=5.3.3.><a>
Im Allgemeinen gilt für eine Eingabe $x = (x^{(1)}, \ldots, x^{(m)})$:

$$
h(i) = \text{act}(Ux^{(i)} + Wh^{(i-1)}) \quad \text{(1)}
$$ <a name=hi><a>

$$
o(i) = \text{act}(Vh^{(i)}) \quad \text{(2)}
$$<a name=oi><a>

für $i = 1, \ldots, m$. Zu beachten ist, dass diese Netzwerkarchitektur mit Eingaben beliebiger Länge umgehen kann, aber eine fixe Anzahl an Parametern besitzt (in den Matrizen $U$, $V$, $W$).

Gegeben sei das abgebildete einfache RNN, wobei

$$\sum = \{\text{ist,nichts,niemand}\} = \{(1,0,0)^T,(0,1,0)^T,(0,0,1)^T\}$$
$$U= ((0, 0.9, 0.9), (0.5, 0.1, 0), (0.5, 0, 0.1))$$
$$W = ((0, 0.45, 0.45), (0.25, 0.05, 0), (0.25, 0, 0.05))$$
$$V = ((0.5, 0, 0), (0, 0.5, 0), (0, 0, 0.5))$$
$$h_0 = (0,1,1)^T$$

und die Aktivierungsfunktion $h^{relu}$ ist. Berechnen Sie die hidden states und die Ausgabe für die Eingabe $x = \text{'Niemand ist'} = ((0,0,1)^T,(1,0,0)^T)$. 
(Antwortformat '(1,2,3.456)')

In [None]:
import numpy as np

def hrelu(x):
    return np.maximum(0, x)

U = np.array([[0, 0.9, 0.9], [0.5, 0.1, 0], [0.5, 0, 0.1]])
W = np.array([[0, 0.45, 0.45], [0.25, 0.05, 0], [0.25, 0, 0.05]])
V = np.array([[0.5, 0, 0], [0, 0.5, 0], [0, 0, 0.5]])
h_0 = np.array([0,1,1]).T
x = np.array([[0,0,1],[1,0,0]]).T

h_1 = hrelu(np.dot(U, x[:,0]) + np.dot(W, h_0))
h_2 = hrelu(np.dot(U, x[:,1]) + np.dot(W, h_1))

o_1 = hrelu(np.dot(V, h_1))
o_2 = hrelu(np.dot(V, h_2))

print("h_1: ", h_1)
print("h_2: ", h_2)
print("o_1: ", o_1)
print("o_2: ", o_2)
