In [1]:
import numpy as np
import matplotlib.pyplot as plt
import mnist
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Conv2D, MaxPooling2D, Dense, Flatten
from tensorflow.keras.utils import to_categorical

  _np_qint8 = np.dtype([("qint8", np.int8, 1)])
  _np_quint8 = np.dtype([("quint8", np.uint8, 1)])
  _np_qint16 = np.dtype([("qint16", np.int16, 1)])
  _np_quint16 = np.dtype([("quint16", np.uint16, 1)])
  _np_qint32 = np.dtype([("qint32", np.int32, 1)])
  np_resource = np.dtype([("resource", np.ubyte, 1)])


In [2]:
from scripts.load_data import load_train, load_test

# Convolutional Neural Network

Een CNN is veel beter geschikt voor taken zoals foto herkenning en taal patronen. In tegenstelling tot een normaal NN heeft een CNN layers met nodes die niet allemaal aan elkaar verbonden zijn. 

Een heel basic CNN kan de volgende structuur hebben:


We beginnen met een input layer. Deze input layer kan bijvoorbeeld een afbeelding als input nemen. Vervolgens hebben we de Convolution Layer. Daarna hebben we een Pooling Layer. Elk van deze layers krijgt verder op in het Notebook een verdere uitleg. 

Wat opvalt is dat we een Fully Connected Layer hebben. Dit is uiteindelijk nodig voor de onze Output Layer. 

## Voordelen
* CNN heeft niet het probleem dat je heel snel kan eindigen met 150+ miljoen weights; een CNN is dus makkelijker te trainen dan een NN om deze reden
* Voor een CNN maakt het niet uit of een hond linksboven of rechtsonder staat in de foto. Een CNN focused niet op iedere pixel maar kijkt eerder naar pixels in de context van hun buren om zo een afbeelding te herkennen. 


### Convolution Layer

Net als in elke andere laag ontvangt een convolutional layer een bepaalde input, transformeert het de input op een bepaalde manier en stuurt het resultaat van de transformatie door naar de volgende laag.  

Convolution lagen bestaan uit een set van leerbare filters (ook wel *kernels* genoemd). Iedere filter is in de ruimtelijke zin klein (qua hoogte en breedte), maar strekt zich uit over de volledige diepte van de input.  

Tijdens de forward propagation glijdt elke filter over de hoogte en breedte van de input en berekend de dot product tu

<img src="src/convolution_schematic.gif" width="100" align="center">

  
  
  
De convolution layer maakt gebruik bepaalde filters die over de afbeelding ‘convolven’ (ruimtelijk over de afbeelding glijden terwijl het dot products  

## CNN bouwen

In [3]:
# Het importeren en bewerken van de data 
train_images, train_labels = load_train()
test_images, test_labels = load_test()

# Normalizeren van de images
train_images = (train_images / 255) - 0.5
test_images = (test_images / 255) - 0.5

# Reshapen van de images zodat ze de juiste dimensies hebben
train_images = np.expand_dims(train_images, axis=3)
test_images = np.expand_dims(test_images, axis=3)

In [4]:
print(train_images.shape)
print(test_images.shape)

(60000, 28, 31, 1)
(10000, 28, 31, 1)


In [10]:
# Onze CNN

# Stap 1: bepaal hoeveel filters je wilt, hoe groot je filter size moet zijn (let op je filter size mag niet te groot zijn vergeleken met je images), en wat je pool size is. 
num_filters = 31 #remove val
filter_size = 3 #remove val
pool_size = 2 #remove val

# Stap 2: maak het model. 
#    Conv2D parameters: num_filters, filter_size, input_shape=(x, y, z) 
#    MaxPooling2D parameters: pool_size=pool_size
#    Flatten
#    Dense parameters: aantal outputs, activation='softmax' 
#model = Sequential([])

model = Sequential([
    Conv2D(num_filters, filter_size, input_shape = (28, 28, 1), activation="relu"),
    MaxPooling2D(pool_size=pool_size),
    Conv2D(64, filter_size, activation="relu"),
    MaxPooling2D(pool_size=pool_size),
    Conv2D(64, filter_size, activation="relu"),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation="softmax")
])

In [11]:
# Stap 3: het compilen van het model. 
# model.compile parameters: 'adam', loss='categorial_crossentropy', metrics=['accuracy']
#model.compile()
model.compile(
    'adam',
    loss='categorical_crossentropy',
    metrics=['accuracy'],
)


# Stap 4: fit het model. 
#    Data om op te trainen: train_images, to_categorial(train_labels)
#    epochs = 3
#    validation_data = test_images, to_categorial(test_labels)
#model.fit()
model.fit(
  train_images,
  to_categorical(train_labels),
  epochs=3,
  validation_data=(test_images, to_categorical(test_labels)),
)

ValueError: Error when checking input: expected conv2d_4_input to have shape (28, 28, 1) but got array with shape (28, 31, 1)

In [None]:
# Stap 5: evalueer het model
test_loss, test_acc = model.evaluate(test_images,  to_categorical(test_labels), verbose=2)
print(test_acc)

In [None]:
# Stap 6: extra layer(s). Wat gebeurt er als je een extra Conv Layer toevoegd aan je model? 
#    Voeg een extra layer(s) toe en train het model opnieuw. 
# Stap 7: parameters. Wat gebeurt er bijvoorbeeld als je geen softmax gebruikt maar een andere activatie? 
#    Pas op z'n minst 1 parameter aan en train je model opnieuw. 

## CIFAR-10

In [None]:
import keras
# Data inladen
(train_images10, train_labels10), (test_images10, test_labels10) = keras.datasets.cifar10.load_data()

# Normalizeren
train_images10, test_images10 = train_images10 / 255.0, test_images10 / 255.0

In [None]:
model_cif = Sequential([
    Conv2D(32, filter_size, input_shape = (32, 32, 3), activation="relu"),
    MaxPooling2D(pool_size=pool_size),
    Conv2D(64, filter_size, activation="relu"),
    MaxPooling2D(pool_size=pool_size),
    Conv2D(64, filter_size, activation="relu"),
    Flatten(),
    Dense(64, activation='relu'),
    Dense(10, activation="softmax")
])

model_cif.compile(
    'adam',
    loss='categorical_crossentropy',
    metrics=['accuracy'],
)



In [None]:
model_cif.fit(
  train_images10,
  to_categorical(train_labels10),
  epochs=10,
  validation_data=(test_images10, to_categorical(test_labels10)),
)

In [None]:
test_loss, test_acc = model_cif.evaluate(test_images10,  to_categorical(test_labels10), verbose=2)

In [None]:
print(test_acc)