# Image Classification mit Google Quickdraw

Von Tristan Emig, Benno Grimm & Marcel Mertens

# Fahrplan
- Vorstellung des Problems
- Datenset
- Datenaufbereitung
- Überblick Neuronale Netze & CNN
- Ergebnisse

# Vorstellung des Problems

## Google Quickdraw

![1.png](attachment:fbf3f2fc-cec3-49fd-8129-4b9521a546f3.png)<br>
(Quelle: Screenshot https://quickdraw.withgoogle.com/)

## Idee
- Bilderkennung wie Google Quickdraw
- Quickdraw als Einstieg ins Thema => Auswahl des Datensets

# Datenset
- Suche nach geeigneten Datensets
- Als Anfänger => Suchen eines einfachen Datensets

### Auswahlkriterien:
- Ausschließen von Fotografien
- Ausschließen von Zeichnungen mit Farbe
- Ausschließen von zu komplexen Zeichnungen

=> Nutzen des Quickdraw Datensets

# Datenaufbereitung
- Rohdaten enthalten zeilenweise Informationen über einzelne, von Menschen gezeichneten, Doodles
- Daten enthalten auch Zeitinformationen, wann was gezeichnet wurde

### Aufbau eines Datensatzes
```
"drawing": [ 
  [  // First stroke 
    [x0, x1, x2, x3, ...],
    [y0, y1, y2, y3, ...],
    [t0, t1, t2, t3, ...]
  ],
  [  // Second stroke
    [x0, x1, x2, x3, ...],
    [y0, y1, y2, y3, ...],
    [t0, t1, t2, t3, ...]
  ],
  ... // Additional strokes
]```

### Aufbereitung
- Zeitinformationen ignorieren
- Alle Bilder auf die gleiche Größe bringen

### Plotten der Rohdaten
![pizza_example_bad.png](attachment:60bd1196-e7a6-4360-a562-06b65dcbb52f.png)

### Füllen der Linien (Strokes)
![pizza_example_better.png](attachment:665db7b9-8502-4fd9-b979-d4b16859d78c.png)

### Zugeschnittene und skalierte Zeichnungen
![pizza_example_done.png](attachment:c6efbd2c-4466-4acb-a605-a204b48b1867.png)

### Unser fertiges Datenformat
- Bilder sollen eine Größe von `256x256` Pixeln haben
- Zur Speicherung: Nutzen einer `256x256` Matrix
- Eine `1` repräsentiert ein schwarzes Pixel
- Eine `0` repräsentiert ein weißes Pixel

# Überblick Neuronale Netze und CNN
- Es gibt eine Vielzahl an Neuronalen Netzen<br>
=> Herausfinden, welches sich für uns eignet

## Einige Beispiele

|                                     |                                   |
| ----------------------------------- | --------------------------------- |
| - Perceptron (P)                    | - Restricted BM (RBM) |
| - Feed Forward (FF)                 | - Deep Beliefe Network (DBN) |
| - Radial Basis Network (RBF)        | - Deep Convolutional Network (DCN) |
| - Deep Feed Forward (DFF)           | - Deconvolutional Network (DN) |
| - Recurrent Neural Networks (RNN)   | - Deep Convolutional Inverse Graphics Network (DCIGN) |
| - Long / Short Term Memory (LSTM)   | - Generative Adversarial Network (GAN) |
| - Gated Recurrent Unit (GRU)        | - Liquid State Machine (LSM) |
| - Auto Encoder (AE)                 | - Extreme Learning Machine (ELM) |
| - Variational AE (VAE)              | - Echo State Network (ESN) |
| - Denoising AE (DAE)                | - Deep Residual Network (DRN) |
| - Sparse AE (SAE)                   | - Kohonen Network (KN) |
| - Markov Chain (MC)                 | - Support Vector Machine (SVM) |
| - Hopfield Network (HN)             | - Neural Turing Machine (NTM) |
| - Boltzmann Machine (BM)            | - Convolutional Neural Network (CNN) |


### Perceptron
- Perceptron ist ein einzelnes Neuron
- Bildet die Grundlage für größere Netze

### Schaubild Perceptron
![2.png](attachment:a426a96e-b549-43dd-bc98-8d0e0166892b.png)<br>
(Quelle: https://towardsdatascience.com/the-mostly-complete-chart-of-neural-networks-explained-3fb6f2367464)

### Feed Forward Netze (FF)
- Alle Knoten vernetzt
- Daten werden durch verschiedene Schichten (Layer) gegeben
- Schichten zwischen Eingabe und Ausgabe sind "hidden Layer"
- Netze dieser Art werden durch "Backpropagation" oder auch "Rückpropagierung" trainiert<br>
=> Überwachtes Lernverfahren (externer Lehrer kennt zu jedem Zeitpunkt einer Eingabe die gewünschte Ausgabe)

### Schaubild Feed Forward Netze
![3.png](attachment:2ce796b7-189a-4739-a38c-d64dbcae6312.png)<br>
(Quelle: https://towardsdatascience.com/the-mostly-complete-chart-of-neural-networks-explained-3fb6f2367464)

### Mögliche Netze für die Klassifizierung
- Feed Forward Netze
- Deep Feed Forward Netze
- Autoencoder
- <b>Deep Convolutional Networks</b>

### Schaubild Deep Convolutional Networks
![4.png](attachment:6e55ff75-9fe8-49e6-8d16-97b3f1360ac1.png)<br>
(Quelle: https://towardsdatascience.com/the-mostly-complete-chart-of-neural-networks-explained-3fb6f2367464)

### Convolutional Neuronal Networks (CNN)
- werden als "Stars" der künstlichen Neuronalen Netze betrachtet
- Besitzen verschiedene Schichten
- Am Anfang werden die Eingabedaten komprimiert und vereinfacht (Pooling-Layer)
- Werden für Erkennung und Klassifizierung verwendet
- Sind eine Sonderform mehrlagiger Perceptrons

### Funktion von CNNs bei Bildern
- Aufteilung in kleinere Ausschnitte
- weitere Schichten erkennen Muster

Beispiel:
1. Schicht: Linien
2. Schicht: Farbverläufe
3. Schicht: Formen
4. Schicht: Objekte

### Schaubild zur Funktionsweise von CNNs
![5.jpeg](attachment:482f566c-e31a-4b32-be84-829a495dbf8c.jpeg)<br>
(Quelle: https://medium.com/@RaghavPrabhu/understanding-of-convolutional-neural-network-cnn-deep-learning-99760835f148)

### Vorteile
- Können eine Matrix als Eingabe verwenden (viele NNs brauchen einen Vektor)
- Können verwendet werden um Objekte zu klassifizieren

### Nachteil
- Als Sonderform von FF-Netzen: Fehlerraten von Schichten müssen minimiert werden

# Ergebnisse
- Daten des Datenset werden erkannt (im `.ndjson`-Format)
- Aus `.ndjson`-Dateien des Datensets können `.png`-Dateien erstellt und erkannt werden
- Handgemalte Bilder können erkannt werden<br>
=> Bilder müssen dazu im Grayscale gemalt werden und eine Größe von `256x256` Pixeln haben

## Error rate over trained sample size
![error_over_sample_size.png](attachment:12d3d967-a62c-4273-a4d6-c7ec41d47ae6.png)<br>
(Quelle: Eigene Darstellung)

## Confusionmatrix mit absoluten Werten
![cm_absolute.png](attachment:b38febfb-9de2-4441-9c6e-b56aa424b815.png)<br>
(Quelle: Eigene Darstellung)

## Confusionmatrix mit normalisierten Werten
![cm_normalized.png](attachment:02307b1e-c929-4ed5-9b58-898f4ed7a843.png)<br>
(Quelle: Eigene Darstellung)

# Demo