# Bootcamp dag 7 - ochtend

In deze opgave classificeren afbeeldingen van bloemen uit de iris dataset met behulp van een neuraal netwerk.

### Imports

In [1]:
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder

### Dataset laden
Laad de dataset en maak een feature matrix X en een target vector y.

In [2]:
iris = sns.load_dataset('iris')

# we gebruiken .values om een Numpy array te krijgen in plaats van een Pandas DataFrame
X_iris = iris.drop('species', axis=1).values 
y_iris = iris['species'].values

In [3]:
y_iris = y_iris.reshape(-1, 1) # maak een array van array's, dit is nodig voor de volgende stap
print(y_iris[:10])

[['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']
 ['setosa']]


### One Hot Encoding
Een neuraal netwerk kan niet omgaan met categorische labels zoals de namen van de planten, maar heeft getallen als uitput nodig. We hebben hier drie klassen (setosa, versicolor, virginica) daarom maken we een target vector met per label drie waarden. Een 1 voor de eerste waarde correspondeert met 'setosa', een 1 voor de 2e waade met 'versicolor' en een 1 voor de derde waarde met 'virginica'.

Doe dit met behulp van het `OneHotEncoder` object uit sklearn.

In [4]:
enc = OneHotEncoder(sparse=False)
encoded_y_iris = enc.fit_transform(y_iris)



We hebben de data nu in een geschikt formaat. Splits de data in training en test data.

In [5]:
X_train, X_test, y_train, y_test = train_test_split(X_iris, encoded_y_iris, test_size=0.2, random_state=6)

### Layers
Maak een eenvoudig neuraal netwerk met 3 lagen, waarin elke neuron in een laag met elk neuron in de vorige laag verbonden is ('Dense'). 
Voeg voor de eeste laag een parameter `input_shape` toe die aangeeft hoeveel features een element in 'X' heeft.
Het aantal neuronen in de laaste laag is gelijk aan het aantal waarden in een label in `y`. 

In [21]:
from keras.models import Sequential
from keras.layers import Dense

model = Sequential()

model.add(Dense(4, input_shape = [4], activation = 'relu'))
model.add(Dense(3, activation = 'relu'))
model.add(Dense(3, activation = 'relu'))
model.add(Dense(3, activation = 'softmax'))
X_iris.shape



#voeg lagen toe met model.add()

(150, 4)

### Compiling
Compileer en bekijk het netwerk door onderstaande code te runnen.

In [22]:
from tensorflow.keras.optimizers import Adam

model.compile(Adam(lr=0.01),'categorical_crossentropy',metrics=['accuracy'])

model.summary()

Model: "sequential_2"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_7 (Dense)             (None, 4)                 20        
                                                                 
 dense_8 (Dense)             (None, 3)                 15        
                                                                 
 dense_9 (Dense)             (None, 3)                 12        
                                                                 
 dense_10 (Dense)            (None, 3)                 12        
                                                                 
Total params: 59
Trainable params: 59
Non-trainable params: 0
_________________________________________________________________


### Training
Nu kunnen we ons model trainen met behulp van de `fit` methode.

In [23]:
model.fit(X_train, y_train, epochs = 35, batch_size = 5)

Epoch 1/35

2022-02-15 12:27:14.034182: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/35
Epoch 3/35
Epoch 4/35
Epoch 5/35
Epoch 6/35
Epoch 7/35
Epoch 8/35
Epoch 9/35
Epoch 10/35
Epoch 11/35
Epoch 12/35
Epoch 13/35
Epoch 14/35
Epoch 15/35
Epoch 16/35
Epoch 17/35
Epoch 18/35
Epoch 19/35
Epoch 20/35
Epoch 21/35
Epoch 22/35
Epoch 23/35
Epoch 24/35
Epoch 25/35
Epoch 26/35
Epoch 27/35
Epoch 28/35
Epoch 29/35
Epoch 30/35
Epoch 31/35
Epoch 32/35
Epoch 33/35
Epoch 34/35
Epoch 35/35


<keras.callbacks.History at 0x16b3a6bb0>

Met `model_evaluate` kunnen we bepalen hoe goed het model werkt op de test data.

In [24]:
test_loss, test_acc = model.evaluate(X_test, y_test)
print(test_acc)

1.0


2022-02-15 12:27:25.010274: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Experimenteer met bovenstaand model. Wat gebeurt er als je meer lagen toevoegt of een laag weghaalt of het aantal neuronen in een laag verandert? 

Probeer ook eens andere activatiefuncties dan `relu`, zoals `tanh` of `sigmoid`.

Welke invloed heeft het aantal epochs?

In [10]:
# Door 2 layer erbij toe te voegen werd de accuracy van van .96 naar 1
# Door 1 layer weg te halen, werd de accuracy lager (0.95)
# Teveel layers toevoegen, verlaagt het weer
# Door activation te veranderen naar tanh, is de accuracy weer 0.95
# Door activision te veranderen naar sigmoid, is de accuracy lager geworden (0.93)
# Door aantal epochs van 25 naar 30 te veranderen, wordt de accuracy ook verhoogd. Het wordt dus vaker getrained, wat beter is
# Tot een bepaald punt heeft het aantal epochs invloed op de accuracy

### Mnist dataset
We kunnen dezelfde aanpak gebruiken voor andere data, bijvoorbeeld voor het herkennen van cijfers. We gebruiken de `MNist` dataset die bestaat uit plaatjes van cijfers. Ieder plaatje bestaat uit 28 x 28 pixels.

In [11]:
from keras.datasets import mnist

(train_images, train_labels), (test_images, test_labels) = mnist.load_data()

import warnings
warnings.filterwarnings('ignore')

In [12]:
train_images.shape

(60000, 28, 28)

In [13]:
len(train_labels)

60000

In [14]:
print(train_labels)

[5 0 4 ... 5 6 8]


Een eenvoudig neuraal netwerk heeft een array van inputwaarden nodig i.p.v. een 2D afbeelding.
We maken van de inputs (waarden tussen 0 en 255) getallen tussen 0 en 1.

In [15]:
train_images = train_images.reshape((60000, 28 * 28)) # lijst van waarden i.p.v. 2D afbeelding
train_images = train_images.astype('float32') / 255 # getallen tussen 0 en 1

test_images = test_images.reshape((10000, 28 * 28))
test_images = test_images.astype('float32') / 255

Voor elk label (een cijfer) maken we een array met 10 waarden: 9 nullen en een één, waarbij de positie van de één aangeeft om welk cijfer het gaat (One hot encoding). Dit keer gebruiken we hiervoor de `keras` functie `to_categorical`.

In [16]:
from tensorflow.keras.utils import to_categorical

train_labels = to_categorical(train_labels)
test_labels = to_categorical(test_labels)


Maak nu een neuraal netwerk met twee lagen, een eerste laag met 512 neuronen en een output laag met 10 neuronen. Geef bij de eerste laag aan hoeveel inputs er zijn en wat de activatiefunctie is. De output laag heeft een `softmax` activatiefunctie.

In [17]:
network_seq = Sequential()

network_seq.add(Dense(512, activation="relu", input_shape=[28*28]))
network_seq.add(Dense(10, activation="softmax"))


compileer het netwerk.

In [18]:
network_seq.compile(Adam(lr=0.01),'categorical_crossentropy',metrics=['accuracy'])

network_seq.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 512)               401920    
                                                                 
 dense_6 (Dense)             (None, 10)                5130      
                                                                 
Total params: 407,050
Trainable params: 407,050
Non-trainable params: 0
_________________________________________________________________


train het netwerk 5 epochs met een batch_size van 128.

In [19]:
network_seq.fit(train_images, train_labels, epochs = 5, batch_size = 128)

Epoch 1/5


2022-02-15 12:26:15.193011: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5


<keras.callbacks.History at 0x177677a90>

Evalueer het netwerk op de test set.

In [29]:
test_loss, test_acc = network_seq.evaluate(test_images, test_labels)
print(test_acc)

 19/313 [>.............................] - ETA: 1s - loss: 0.1263 - accuracy: 0.9671

2022-02-15 12:30:24.887341: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


0.9690000414848328


Experimenteer met verschillende netwerken. Varieer het aantal lagen, het aantal neuronen, de activatiefunties en het aantal epochs.

### Test 1 - Batch size increase

In [31]:
model = Sequential()

network_seq.add(Dense(512, activation="relu", input_shape=[28*28]))
network_seq.add(Dense(10, activation="softmax"))

network_seq.compile(Adam(lr=0.01),'categorical_crossentropy',metrics=['accuracy'])

print(network_seq.summary())

network_seq.fit(train_images, train_labels, epochs = 25, batch_size = 128)

test_loss, test_acc = network_seq.evaluate(test_images, test_labels)
print(test_acc)

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 512)               401920    
                                                                 
 dense_6 (Dense)             (None, 10)                5130      
                                                                 
 dense_11 (Dense)            (None, 512)               5632      
                                                                 
 dense_12 (Dense)            (None, 10)                5130      
                                                                 
 dense_13 (Dense)            (None, 512)               5632      
                                                                 
 dense_14 (Dense)            (None, 10)                5130      
                                                                 
Total params: 428,574
Trainable params: 428,574
Non-tr

2022-02-15 12:55:04.452239: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/25
Epoch 3/25
Epoch 4/25
Epoch 5/25
Epoch 6/25
Epoch 7/25
Epoch 8/25
Epoch 9/25
Epoch 10/25
Epoch 11/25
Epoch 12/25
Epoch 13/25
Epoch 14/25
Epoch 15/25
Epoch 16/25
Epoch 17/25
Epoch 18/25
Epoch 19/25
Epoch 20/25
Epoch 21/25
Epoch 22/25
Epoch 23/25
Epoch 24/25
Epoch 25/25
 10/313 [..............................] - ETA: 1s - loss: 0.3608 - accuracy: 0.9281 

2022-02-15 12:56:43.103349: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


0.8964000344276428


### Test 2 - More layers

In [32]:
model = Sequential()

network_seq.add(Dense(512, activation="relu", input_shape=[28*28]))
network_seq.add(Dense(10, activation="relu"))
network_seq.add(Dense(10, activation="relu"))
network_seq.add(Dense(10, activation="relu"))
network_seq.add(Dense(10, activation="softmax"))

network_seq.compile(Adam(lr=0.01),'categorical_crossentropy',metrics=['accuracy'])

print(network_seq.summary())

network_seq.fit(train_images, train_labels, epochs = 5, batch_size = 128)

test_loss, test_acc = network_seq.evaluate(test_images, test_labels)
print(test_acc)

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 512)               401920    
                                                                 
 dense_6 (Dense)             (None, 10)                5130      
                                                                 
 dense_11 (Dense)            (None, 512)               5632      
                                                                 
 dense_12 (Dense)            (None, 10)                5130      
                                                                 
 dense_13 (Dense)            (None, 512)               5632      
                                                                 
 dense_14 (Dense)            (None, 10)                5130      
                                                                 
 dense_15 (Dense)            (None, 512)              

2022-02-15 12:59:13.503106: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/5
Epoch 3/5
Epoch 4/5
Epoch 5/5
 17/313 [>.............................] - ETA: 1s - loss: 1.1383 - accuracy: 0.5938

2022-02-15 12:59:38.993898: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


0.6109000444412231


### Test 3- check for tanh activation

In [37]:
model = Sequential()

network_seq.add(Dense(512, activation="tanh", input_shape=[28*28]))
network_seq.add(Dense(10, activation="softmax"))


network_seq.compile(Adam(lr=0.01),'categorical_crossentropy',metrics=['accuracy'])

print(network_seq.summary())

network_seq.fit(train_images, train_labels, epochs = 15, batch_size = 128)

test_loss, test_acc = network_seq.evaluate(test_images, test_labels)
print(test_acc)

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 dense_5 (Dense)             (None, 512)               401920    
                                                                 
 dense_6 (Dense)             (None, 10)                5130      
                                                                 
 dense_11 (Dense)            (None, 512)               5632      
                                                                 
 dense_12 (Dense)            (None, 10)                5130      
                                                                 
 dense_13 (Dense)            (None, 512)               5632      
                                                                 
 dense_14 (Dense)            (None, 10)                5130      
                                                                 
 dense_15 (Dense)            (None, 512)              

2022-02-15 13:03:12.550520: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


Epoch 2/15
Epoch 3/15
Epoch 4/15
Epoch 5/15
Epoch 6/15
Epoch 7/15
Epoch 8/15
Epoch 9/15
Epoch 10/15
Epoch 11/15
Epoch 12/15
Epoch 13/15
Epoch 14/15
Epoch 15/15
  1/313 [..............................] - ETA: 1:09 - loss: 1.8891 - accuracy: 0.3125

2022-02-15 13:04:59.878720: I tensorflow/core/grappler/optimizers/custom_graph_optimizer_registry.cc:113] Plugin optimizer for device_type GPU is enabled.


0.19930000603199005


### Summary

Activation gebruik is echt afhankelijk van aantal factoren. Tahn aan het begin gebruiken in is dus niet optimaal met deze dataset. Het aantal epochs zijn ook van belang. Ook heeft het toevoegen van layers een positief of netagief effect op de accuracy.

Uiteindelijk is de eerste test bij mij wel de beste uitgekomen. een 90% rate is niet verkeerd. Natuurlijk kan het beter, maar voor nu is dat voldoende.