Deep Learning in het Nederlands
=============

Tensorflow in Dutch
------------
TensorFlow is een open source software bibliotheek voor Machine Learning waarmee je neurale netwerken kunt bouwen en trainen om patronen en correlaties te detecteren en te ontcijferen: [Tensorflow](https://github.com/tensorflow/tensorflow.git). 

Deze opdrachten volgen het leertraject van [Udacity](https://github.com/tensorflow/tensorflow/tree/master/tensorflow/examples/udacity) en zijn in het Engels beschikbaar in de standaard TensorFlow repository. Ik heb ze naar het Nederlands vertaald en in een repository geplaatst. 

In de reeks `Deep Learning in het Nederlands - Tensorflow in Dutch` maak je kennis met de methodes en technieken voor Deep Learning met Tensorflow. Experimenteer, duik in het diepe of leer bij met de 6 opdrachten. De volledige repository staat op mijn [Github](https://github.com/victorr0/Deep-Learning-Nederlands). 

Opdracht 3
------------

In de vorige opdracht `2_fullyconnected.ipynb`, trainde je een logistic regression en a neural network model.

Het doel van deze opdracht is het onderzoeken van regularisatie technieken (regularization techniques).

In [1]:
# Dit zijn alle modules die nodig zijn voor dit notebook. 
# Zorg dat ze allemaal geimporteerd kunnen worden
# voordat je verder gaat.
from __future__ import print_function
import numpy as np
import tensorflow as tf
from six.moves import cPickle as pickle

Eerst laden we opnieuw de data uit `1_notmnist.ipynb`.

In [0]:
pickle_file = 'notMNIST.pickle'

with open(pickle_file, 'rb') as f:
  save = pickle.load(f)
  train_dataset = save['train_dataset']
  train_labels = save['train_labels']
  valid_dataset = save['valid_dataset']
  valid_labels = save['valid_labels']
  test_dataset = save['test_dataset']
  test_labels = save['test_labels']
  del save  # Hint om geheugen vrij te maken.
  print('Training set', train_dataset.shape, train_labels.shape)
  print('Validation set', valid_dataset.shape, valid_labels.shape)
  print('Test set', test_dataset.shape, test_labels.shape)

Training set (200000, 28, 28) (200000,)
Validation set (10000, 28, 28) (10000,)
Test set (18724, 28, 28) (18724,)


Nu formatteren we de data zodat die beter past bij de modellen die we gaan trainen:
- data als een flat matrix,
- labels als float 1-hot encodings.

In [0]:
image_size = 28
num_labels = 10

def reformat(dataset, labels):
  dataset = dataset.reshape((-1, image_size * image_size)).astype(np.float32)
  # Map 1 naar [0.0, 1.0, 0.0 ...], 2 naar [0.0, 0.0, 1.0 ...]
  labels = (np.arange(num_labels) == labels[:,None]).astype(np.float32)
  return dataset, labels
train_dataset, train_labels = reformat(train_dataset, train_labels)
valid_dataset, valid_labels = reformat(valid_dataset, valid_labels)
test_dataset, test_labels = reformat(test_dataset, test_labels)
print('Training set', train_dataset.shape, train_labels.shape)
print('Validation set', valid_dataset.shape, valid_labels.shape)
print('Test set', test_dataset.shape, test_labels.shape)

Training set (200000, 784) (200000, 10)
Validation set (10000, 784) (10000, 10)
Test set (18724, 784) (18724, 10)


In [0]:
def accuracy(predictions, labels):
  return (100.0 * np.sum(np.argmax(predictions, 1) == np.argmax(labels, 1))
          / predictions.shape[0])

---
Probleem/vraag 1
---------


Introduceer en stem de L2 regularisatie af voor zowel logistieke als neurale netwerkmodellen. Onthoud dat L2 een penalty/straf oplevert op de norm van de gewichten (weights) naar het verlies (loss). In TensorFlow kunt je het L2 verlies voor een tensor t berekenen met `nn.l2_loss(t)`. De juiste hoeveelheid regularisatie moeten jouw validatie- / testnauwkeurigheid verbeteren.


---
Probleem/vraag 2
---------
Laten we een extreem geval van overfitting demonstreren. Beperk je trainingsgegevens op slechts een paar batches. Wat gebeurt er?

---

---
Probleem/vraag 3
---------
Introduceer Dropout op de verborgen laag van het neurale netwerk. Onthoud: Uitval moet alleen worden ingevoerd tijdens de training, geen evaluatie, anders zijn uw evaluatieresultaten ook stochastisch. TensorFlow biedt hiervoor `nn.dropout()`, maar je moet ervoor zorgen dat het alleen tijdens de training wordt ingevoerd.

Wat gebeurt er met onze extreme overfitting case?

---

---
Probleem/vraag 4
---------

Probeer de beste prestaties te verkrijgen die u kunt gebruiken met een multi-layer model! De beste gerapporteerde testnauwkeurigheid met behulp van een diep netwerk is [97.1%](http://yaroslavvb.blogspot.com/2011/09/notmnist-dataset.html?showComment=1391023266211#c8758720086795711595).

Een weg die je kunt verkennen is het toevoegen van meerdere lagen.

Een ander is het gebruik van leermiddelenverval (learning decay rate):

    global_step = tf.Variable(0)  # tel het aantal genomen stappen.
    learning_rate = tf.train.exponential_decay(0.5, global_step, ...)
    optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss, global_step=global_step)
 
 ---
