# Herkenning van handgeschreven cijfers met CNN

## Convolutionele Neurale Netwerken

- Minor AAI - Hogeschool van Amsterdam
- Docenten:  Michiel Bontenbal & Maarten Post
- Vrijdag 6 september 2024

### Boek & tutorials:

**Deep Learning with Python - Francois Chollet - Chapter 8**
- https://learning-oreilly-com.rps.hva.nl/library/view/deep-learning-with/9781617296864/

**Tutorials**
- https://keras.io/examples/vision/mnist_convnet/ 
- https://www.geeksforgeeks.org/applying-convolutional-neural-network-on-mnist-dataset/ 

## Importeer libraries & check versions

In [None]:
#import libraries. Ignore a potential tensorflow warning.

#Import keras methods. Study this for a moment, as this is important
from keras import models, layers, datasets

#These are the layers in the deep learning model
from keras.layers import Conv2D, MaxPooling2D, AveragePooling2D, Flatten, Dense, Dropout

#import numpy and matplotlib 
import numpy as np
import matplotlib.pyplot as plt

#import a tensorflow utensil
from tensorflow.keras.utils import to_categorical

In [None]:
from platform import python_version
print(python_version())

In [None]:
import keras
keras.__version__

## Verover de data

In [None]:
#load dataset from Keras and split into train and test sets
(train_images, train_labels), (test_images, test_labels) = datasets.mnist.load_data()

In [None]:
train_images.shape

In [None]:
train_labels.shape

## Prepareer de images

* normalizeren --> pixel waardes tussen 0.0 en 1.0
* reshapen --> extra dimensie!

In [None]:
train_images.shape

In [None]:
train_images_normalized = train_images.astype('float32')/255

In [None]:
train_images_enhanced = train_images_normalized.reshape(60000,28,28,1)

In [None]:
train_images_enhanced.shape

In [None]:
#show the first image
import matplotlib.pyplot as plt
image = train_images[0]
plt.imshow(image, cmap=plt.cm.binary)
plt.show
print(f'The label is: {train_labels[0]}')

In [None]:
#Check the pixelvalues of the image
train_images[0]

### OEFENING 1: Doe hetzelfde met de test images als wat hierboven met de train images is gedaan.

In [None]:
# YOUR CODE HERE


In [None]:
# YOUR CODE HERE
test_images_enhanced # = ?

In [None]:
# YOUR CODE HERE
test_images_enhanced.shape

## Prepareer de labels

### OEFENING 2: Zet de labels om naar vectoren met 'one-hot encoding'. 

One-hot encoding wordt gebruikt om van het label (een categorie) een 1D-array (vector) te maken. 

Hint: zoek op ```to_categorical``` in de keras documentatie.

In [None]:
train_labels

In [None]:
# YOUR CODE HERE
train_labels_encoded # = ?
test_labels_encoded # = ?

In [None]:
train_labels_encoded

In [None]:
test_labels_encoded

## Maak het CNN-model

### OEFENING 3: voeg Conv2D en/of Pooling la(a)g(en) toe.

In [None]:
cnn = models.Sequential()

cnn.add(Conv2D(filters=32,
                  kernel_size=(3, 3),
                  activation='relu', 
                  input_shape=(28,28,1),
                  strides=(1, 1))) #kernel 1 step to right, 1 step down

cnn.add(MaxPooling2D(pool_size=(2,2), strides=(2,2)))

#YOUR CODE EDIT HERE

cnn.add(Flatten())

cnn.add(Dense(units=64, activation='relu'))
cnn.add(Dense(units=10, activation = 'softmax'))

In [None]:
cnn.summary()

In [None]:
cnn.compile(optimizer='adam',
            metrics = ['accuracy'],
            loss = 'categorical_crossentropy')

In [None]:

history_cnn = cnn.fit(train_images_enhanced,
        train_labels_encoded,
        epochs = 3, 
        batch_size = 128,
        validation_data = (test_images_enhanced, test_labels_encoded))

history_cnn


In [None]:
# do the testing
loss, acc = cnn.evaluate(test_images_enhanced,
                         test_labels_encoded)
print(acc)

### OEFENING 4: voeg labels aan deze grafiek toe

In [None]:
plt.plot(history_cnn.history['accuracy'], 'blue')
plt.plot(history_cnn.history['val_accuracy'],'red')
plt.ylim(0.75,1.0)
plt.show()

## Evalueer cijferherkenning CNN

#### OPDRACHT: Pas je CNN aan. 

Je kan je CNN verder optimaliseren door de Hyperparameters aan te passen. Dit zijn bijvoorbeeld:
- extra lagen in het CNN (Conv2D, Pooling, Dense)
- Kernel size variëren (bijv. 2e Conv2D laag grotere kernel) 
- Aantal filters 
- Average pooling vs Max Pooling. Pool_size en Strides
- Eventueel een dropout laag toevoegen (voorkomt o.a. overfitting)
- aantal epochs

Ook interessante oefening: haal de 2D en pooling layers eens weg. Werkt het dan nog steeds? Wat is je accuracy?

Maak aantekeningen (in dit notebook) zodat je weet welke aanpassing welke verbetering opleverde.


#### Reflectie
Deze vragen gaan over het begrip van het model wat je hebt gebruikt. 
Beantwoord de volgende vragen in je eigen woorden. 

1. Welke lagen heb je gebruikt in je model?

2. Beschrijf kort hoe de Conv2D laag werkt (in je eigen woorden)

3. Waarom gebruik je een pooling laag?

4. Wat doet de dense laag?

### To do: 
1. Upload de notebooks naar je Gitlab
2. maak een aantekening in je logboek
3. werk je Bloom-tabel bij.