# Prototyp: AlexNet Modell

AlexNet ist ein Convolutional Neural Network (CNN), das zunächst im Jahr 2012 von Alex Krizhesky et al. veröffentlicht wurde. Es ist ein wichtiger Meilenstein bei den visuellen Erkennungsaufgaben. Nach seiner Veröffentlichung wuchs die Popularität von Deep Learning und insbesondere die Popularität von CNNs drastisch. Unten ist die Architektur von AlexNet dargestellt:

![AlexNet](/images/alexnet-full.png "AlexNet Architektur")

Das Modell wurde gemäß der Spezifikationen aus dem Paper (s. u.) so genau wie möglich implementiert. Im Originalpaper wird das Modell in zwei Teile aufgeteilt, um gleichzeitig auf 2 GPUs trainiert zu werden. Im Gegensatz wird unser Modell auf 1 GPU trainiert.

Quellenliteratur: [AlexNet Paper](https://papers.nips.cc/paper/2012/file/c399862d3b9d6b76c8436e924a68c45b-Paper.pdf)

In [None]:
import tensorflow as tf

# Input
inputs = tf.keras.Input(shape=(224, 224, 3), name="alexnet_input")

# Schicht 1: Convolution
l1 = tf.keras.layers.Conv2D(filters=96, kernel_size=11, strides=4, padding="same")(inputs)
l1 = tf.keras.layers.BatchNormalization()(l1)
l1 = tf.keras.layers.ReLU()(l1)
l1 = tf.keras.layers.MaxPooling2D(pool_size=3, strides=2)(l1)

# Schicht 2: Convolution
l2 = tf.keras.layers.Conv2D(filters=256, kernel_size=5, strides=1, padding="same")(l1)
l2 = tf.keras.layers.BatchNormalization()(l2)
l2 = tf.keras.layers.ReLU()(l2)
l2 = tf.keras.layers.MaxPooling2D(pool_size=3, strides=2)(l2)

# Schicht 3: Convolution
l3 = tf.keras.layers.Conv2D(filters=384, kernel_size=3, strides=1, padding="same")(l2)
l3 = tf.keras.layers.ReLU()(l3)

# Schicht 4: Convolution
l4 = tf.keras.layers.Conv2D(filters=384, kernel_size=3, strides=1, padding="same")(l3)
l4 = tf.keras.layers.ReLU()(l4)

# Schicht 5: Convolution
l5 = tf.keras.layers.Conv2D(filters=256, kernel_size=3, strides=1, padding="same")(l4)
l5 = tf.keras.layers.ReLU()(l5)
l5 = tf.keras.layers.MaxPooling2D(pool_size=3, strides=2)(l5)

# Schicht 6: Dense
l6_pre = tf.keras.layers.Flatten()(l5)

l6 = tf.keras.layers.Dense(units=4096)(l6_pre)
l6 = tf.keras.layers.ReLU()(l6)
l6 = tf.keras.layers.Dropout(rate=0.5)(l6)

# Schicht 7: Dense
l7 = tf.keras.layers.Dense(units=4096)(l6)
l7 = tf.keras.layers.ReLU()(l7)
l7 = tf.keras.layers.Dropout(rate=0.5)(l7)

# Schicht 8: Dense
l8 = tf.keras.layers.Dense(units=1000)(l7)
l8 = tf.keras.layers.Softmax(dtype=tf.float32, name="alexnet_output")(l8)

alexnet = tf.keras.models.Model(inputs=inputs, outputs=l8)

In [None]:
alexnet.summary()