# 5.2 Convolutional Neural Networks
>## <ins>Table of contents</ins> <a name="up"></a>[<sup>[1]</sup>](#cite_note-1)
>* [**5.2.1. Faltung**](#5_2_1)
>* [**5.2.2. Padding und Stride**](#5_2_2)
>* [**5.2.3. Die Pooling-Operation**](#5_2_3)
>* [**5.2.4. CNN-Architektur**](#5_2_4)
>
>## <ins>Beispiele</ins>
>* [**Beispiel 1**:Darstellung von AND-, OR- und XOR-Funktionen mit Perzeptronen](#b1)
>* [**Beispiel 2**: Backpropagation-Algorithmus$](#b2)
>* [**Beispiel 3**: Q-Learning des Staubsaugerproblems](#b3)

### Useful code:

In [2]:
import numpy as np
import matplotlib.pyplot as plt

In [6]:
def multiply_matrix(matrix1, matrix2):
    result = np.dot(matrix1, matrix2)
    print(result)
    return result

In [4]:
import numpy as np

# Definieren Sie die Matrix MK
MK = np.array([
    [1/16, 1/16, 1/16],
    [1/16, 1/2, 1/16],
    [1/16, 1/16, 1/16]
])

# Definieren Sie die Matrix MI
MI = np.array([
    [12, 24, 28, 105, 250, 251],
    [54, 43, 43, 42, 221, 241],
    [67, 50, 89, 92, 210, 211],
    [105, 156, 178, 115, 201, 187],
    [19, 78, 125, 108, 52, 188],
    [112, 101, 154, 205, 198, 192]
])

# Wählen Sie eine Untermatrix aus
submatrix = MI[:3, :3]
submatrix

array([[12, 24, 28],
       [54, 43, 43],
       [67, 50, 89]])

In [5]:
 multiply_matrix(MK, submatrix)


[[ 8.3125  7.3125 10.    ]
 [31.9375 26.125  28.8125]
 [ 8.3125  7.3125 10.    ]]


array([[ 8.3125,  7.3125, 10.    ],
       [31.9375, 26.125 , 28.8125],
       [ 8.3125,  7.3125, 10.    ]])

## 5.2.0. Einleitung zum Convolutional Neural Network (CNN)<a name="5_1_0"></a>
---

Ein Convolutional Neural Network (CNN) ist eine spezielle Form eines Feedforward-Netzwerks, das für Daten verwendet wird, die in einer Gitterstruktur angeordnet sind oder bei denen Merkmale in einer räumlichen oder zeitlichen Beziehung zueinander stehen. Es wird häufig in der Bildanalyse eingesetzt, aber auch für Zeitreihen wie Signalmessungen oder natürliche Sprache.

#### Anwendungsgebiete von CNNs

- **Bilddaten**: Bilder werden als Matrizen interpretiert, wobei jede Zelle den Graustufenwert oder den Farbwert kodiert.
- **Zeitreihen**: Zum Beispiel Signalmessungen oder natürliche Sprache.
- In diesem Kontext werden wir uns auf die Anwendung in der Bildanalyse konzentrieren, insbesondere auf die Klassifikation von Objekten auf Bildern, wie z.B. die Erkennung von Hunden oder Katzen.

#### Herausforderungen bei der Bildanalyse

- **Komplexität der Merkmale**: Um Objekte auf Bildern zu klassifizieren, müssen komplexe Merkmale wie Schnurrhaare erkannt werden.
- **Variabilität der Position und Orientierung**: Die Merkmale können an verschiedenen Stellen des Bildes auftreten und in verschiedenen Orientierungen vorliegen.

#### Motivation für CNNs

- Ein herkömmliches Feedforward-Netzwerk würde sehr viele Parameter benötigen, um Merkmale an verschiedenen Stellen des Bildes zu erkennen, was zu Überanpassung führen kann.
- Viele Merkmale sind lokalisiert, d.h. bestimmte Bereiche des Bildes sind für die Erkennung bestimmter Merkmale relevant, während andere Bereiche irrelevant sind.

#### Zentrale Methode von CNNs: Faltungsoperation

- Die Faltungsoperation ist zentral für die Implementierung der Merkmalsextraktion in CNNs.
- Sie ermöglicht es, Merkmale wie Schnurrhaare an verschiedenen Positionen und in verschiedenen Orientierungen effizient zu erkennen, ohne dass jede Position separat trainiert werden muss.
- Dies reduziert die Anzahl der Parameter und macht das Modell robuster gegenüber Überanpassung.

## 5.2.1. Faltung <a name="5_2_1"></a>
---


Die (kontinuierliche) Faltungsoperation $\ast$ ist im einfachsten Fall eine mathematische Operation, die zwei reellwertige Funktionen $i, k : \mathbb{R} \rightarrow \mathbb{R}$ als Eingabe nimmt und eine reellwertige Funktion als Ausgabe liefert, d. h.,

$$\ast : (\mathbb{R} \rightarrow \mathbb{R}) \times (\mathbb{R} \rightarrow \mathbb{R}) \rightarrow (\mathbb{R} \rightarrow \mathbb{R})$$

Konkret ist $\ast$ definiert als

$$(i \ast k)(x) = \int_{-\infty}^{\infty} i(y)k(x-y)dy$$

Die Funktion $i$ heißt dabei Eingabefunktion und $k$ heißt Kernelfunktion (oder auch Filterfunktion). Die Ausgabe $i \ast k$ heißt (im CNN-Kontext) auch Feature Map von $i$ bzndet werden.

## 5.2.2. Padding und Stride <a name="5_2_2"></a>
---

## 5.2.3. Die Pooling-Operation <a name="5_2_3"></a>
---

## 5.2.4. CNN-Architektur <a name="5_2_4"></a>
---

---
<a name="up"></a>**`[Go Up!^](#up)**

##### Sources:

(1) Why does Q-Learning use epsilon-greedy during testing?. https://stats.stackexchange.com/questions/270618/why-does-q-learning-use-epsilon-greedy-during-testing.
(2) Epsilon-Greedy Q-learning | Baeldung on Computer Science. https://www.baeldung.com/cs/epsilon-greedy-q-learning.
(3) Epsilon and learning rate decay in epsilon greedy q learning. https://stackoverflow.com/questions/53198503/epsilon-and-learning-rate-decay-in-epsilon-greedy-q-learning.
(4) Exploration in Q learning: Epsilon greedy vs Exploration function. https://datascience.stackexchange.com/questions/94029/exploration-in-q-learning-epsilon-greedy-vs-exploration-function.