# Convolutional Neural Networks II


### Deep Convolutinal Neural Networks

Mit den in der letzten Vorlesung eingeführten Operationen (Convolution, Pooling und Fully Connected Layer) können nun sehr tiefe ("Deep Learning") Faltungsnetzwerke für **Visual Recognition** erstellt werden. Als Beispiel  ist in der folgenden Abbildung VGG16-Netz (Karen Simonyan und Andrew Zisserman, Visual Geometry Group,  https://arxiv.org/pdf/1409.1556.pdf) gezeigt.

<img src="VGG16.png" height="100" width="600"/>

Das Netz hat folgende Struktur:

Der Eingang hat eine feste Größe von (224,224,3) als RGB-Bild. Das Bild wird durch einen Stack von Covolution Layer 
geleitet, wobei Filterkerne mit einem receptive field von (3,3) verwendet werden. Die Pooling Operation wird von fünf Max-Pooling-Layern durchgeführt (über ein Feld der Größe (2,2) und einen Stride S=2.

Den Abschluss bilden drei Fully-Connected Layer  und eine Softmax Classification mit $K=1000$-Kassen.

Keras hat einige vortrainierte Netze bereits an Board (siehe https://keras.io/applications/). Diese Modelle lassen sich sehr bequem einlesen und nutzen (hier am Beispiel das oben gezeigten VGG16 Netzes https://keras.io/applications/#vgg16 ):

In [None]:
from keras.applications.vgg16 import VGG16

model = VGG16()
model.summary()

In [None]:
from keras.applications.vgg16 import VGG16

model = VGG16()
model.summary()

In [None]:
model.layers[4].get_weights()[0].shape

### Setup eines ConvNets mittels Keras

Die Hauptbestandteile eines Convnets (Convolution und Pooling) lassen sich mittels der beiden in keras.layers enthaltenen Funktionen 

- Conv2D (https://keras.io/layers/convolutional/#conv2d)
- MaxPooling2D (https://keras.io/layers/pooling/#maxpooling2d)

Darüber hinaus wird am der der Convolution Blöcke einer sogenannter Flatten-Layer gebildet (dieser fasst schlicht den letzten Tensor der Convolution als Vektor zusammen), von dem ausgehend sich dann ein Fully-Connected Netzwerk befindet. 

- Flatten (https://keras.io/layers/core/#flatten)

### Visualisierung von Convolutional Networks

In der folgenden Veröffentlichung ist veranschaulicht, welche Strukturen die verschiedenen Convolutional Layer in einem CNN lernen. Abbildung 2 zeigt die Top 9 Aktivierungen aus
einer zufällig ausgewählten Menge von Feature Maps bezüglich der Validierungsdaten, zurückgerechnet auf den Input.

https://cs.nyu.edu/~fergus/papers/zeilerECCV2014.pdf

### Training and Backpropagation

Das Training eines CNN erfolgt via Backprogapation analog zu den ANN, siehe z.B.:

https://github.com/ZZUTK/An-Example-of-CNN-on-MNIST-dataset/blob/master/doc/Derivation_of_Backpropagation_in_CNN.pdf


### Data Augmentation, Dropout und Local Response Normalization
Um Overfitting zu vermeiden, werden bei ConvNets oft einige oder alle der folgeden Methoden verwendet

- Data Augmentation
- Dropout (https://arxiv.org/pdf/1207.0580.pdf)
- Local Response Normalization (Section 3.3 in http://www.cs.toronto.edu/~fritz/absps/imagenet.pdf)

### Data-Sets

Typische Datensätze zum Trainieren von CNN sind 

| Dataset      |  Number of Classes | URL                                        |
|--------------|--------------------|------------------------------------------- |
|  CIFAR-10    | 10                 |https://www.cs.toronto.edu/~kriz/cifar.html |
|  CIFAR-100   | 100                |https://www.cs.toronto.edu/~kriz/cifar.html |
|  ImageNet    | 20.000             |http://image-net.org/                       |




### CNN Demo for MNIST

Unter dem folgenden Link findet sich die Animation eines auf MNIST-Daten
trainierten ConvNets:

https://cs.stanford.edu/people/karpathy/convnetjs/demo/mnist.html