# Übung zu TensorFlow Einführung - Lösung

## 1) Theorie

### Aufgabe 1:
Was zeichnet ein **Feedforward Netz** aus?

Antwort: Feedforward beschreibt die Tatsache, dass die Daten nur in eine Richtung durch das Netzwerk fließen. <br>
(Andere Arten von neuronalen Netzen und Deep Learning Modellen beinhalten Architekturen, die es den Daten erlauben sich auch "rückwärts" oder in Schleifen im Netzwerk zu bewegen.)

### Aufgabe 2:
Was ist der Unterschied zwischen **Platzhaltern** und **Variablen** in TensorFlow?

Antwort: Die Datentypen der Platzhalter müssen im Voraus fix definiert und können nicht zur Laufzeit angepasst werden. Variablen sind dagegen flexibel und können Ihre Werte während der Laufzeit der Berechnung verändern.

### Aufgabe 3:
Wieso sind die **Gewichtungsmatrizen** und **Biasvektoren** so wichtig?

Antwort: Weil die Art und Weise, wie die initialen Gewichtungsmatrizen und Biasvektoren gefüllt werden, <!--einen großen Einfluss darauf hat,-->hat einen großen Einfluss darauf, wie schnell und wie gut sich das Modell an die vorliegenden Daten anpassen kann.

### Aufgabe 4:
Was machen **Aktivierungsfunktionen**?

Antwort: Aktivierungsfunktionen führen eine nichtlineare Transformation der Outputs der Hidden Layer durch bevor diese an den nächsten Layer weitergegeben werden. Dadurch wird das gesamte System nichtlinear und kann sich dadurch sowohl an lineare als auch nichtlineare Funktionen anpassen.

### Aufgabe 5:
Wofür wird die **Kostenfunktion** verwendet?

Antwort: Um eine Maßzahl zur Bestimmung der Abweichung zwischen der Prognose des Modells und den tatsächlich beobachteten Daten zu berechnen.

### Aufgabe 6:
Welche Aufgabe hat der **Optimierer**?

Antwort: Der Optimierer hat die Aufgabe, auf Basis der berechneten Modellabweichungen der Kostenfunktion, die Gewichte und Biaswerte des Netzes während des Trainings anzupassen.

## 2) Praxis

### Aufgabe 1:
Installieren und importieren Sie TensorFlow und testen Sie die Ausgabe **"Hallo, Welt!**.

In [6]:
import tensorflow as tf
hello = tf.constant("Hallo, Welt!")
with tf.Session() as sess:
    erg = sess.run(hello)
print(erg)

b'Hallo, Welt!'


### Aufgabe 2:
Lese Sie den MNIST-Datensatz extern ein und benutzen Sie die eingebaute Hilfsfunktion, um den Datensatz bei Bedarf zu holen.

In [5]:
from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("data/", one_hot=True)

Extracting data/train-images-idx3-ubyte.gz
Extracting data/train-labels-idx1-ubyte.gz
Extracting data/t10k-images-idx3-ubyte.gz
Extracting data/t10k-labels-idx1-ubyte.gz


### Aufgabe 3:
Versuchen Sie mit Tensorflow eine Genauigkeit von mindestens 96% zu erreichen. 
> Hinweis:
> - Sie können die Anzahl der Neuronen verändern.
> - Sie können verschiedene Initialisierungstrategien testen (z.B. `tf.truncated_normal()`).
> - Sie können die Anzahl der Hidden Layer verändern
> - Sie können verschiedene Kostenfunktionen testen.
> - Sie können die Batch Größe verändern.
> - Sie können die Anzahl der Epochen verändern.

In [8]:
inputs_anzahl = 784
outputs_anzahl = 10

# Hidden Layer: z.B. die Anzahl an Neuronen ändern
versteckte_schicht_knoten_1 = 400
versteckte_schicht_knoten_2 = 400
output_schicht_knoten = 300

# z.B. die Batch Größe ändern
batch_groesse = 150

x = tf.placeholder('float', [None, inputs_anzahl])
y = tf.placeholder('float')

# z.B. Initialisierungstrategie ändern statt tf.random_normal() -> tf.truncated_normal() mit Standardabweichung
input_schicht = {'weights': tf.Variable(tf.truncated_normal([inputs_anzahl,versteckte_schicht_knoten_1], stddev=0.1)),
                 'biases': tf.Variable(tf.truncated_normal([versteckte_schicht_knoten_1], stddev=0.1))}

versteckte_schicht_1 = {'weights': tf.Variable(tf.truncated_normal([versteckte_schicht_knoten_1, versteckte_schicht_knoten_2], stddev=0.1)),
                        'biases': tf.Variable(tf.truncated_normal([versteckte_schicht_knoten_2], stddev=0.1))}

versteckte_schicht_2 = {'weights': tf.Variable(tf.truncated_normal([versteckte_schicht_knoten_2, output_schicht_knoten], stddev=0.1)),
                        'biases': tf.Variable(tf.truncated_normal([output_schicht_knoten], stddev=0.1))}

output_schicht = {'weights': tf.Variable(tf.truncated_normal([output_schicht_knoten, outputs_anzahl], stddev=0.1)),
                  'biases': tf.Variable(tf.truncated_normal([outputs_anzahl], stddev=0.1))}


input_schicht_summe = tf.add(tf.matmul(x, input_schicht['weights']), input_schicht['biases'])
input_schicht_summe = tf.nn.relu(input_schicht_summe)

versteckte_schicht_1_summe = tf.add(tf.matmul(input_schicht_summe, versteckte_schicht_1['weights']), versteckte_schicht_1['biases'])
versteckte_schicht_1_summe = tf.nn.relu(versteckte_schicht_1_summe)

versteckte_schicht_2_summe = tf.add(tf.matmul(versteckte_schicht_1_summe, versteckte_schicht_2['weights']), versteckte_schicht_2['biases'])
versteckte_schicht_2_summe = tf.nn.relu(versteckte_schicht_2_summe)

output_schicht_summe = tf.add(tf.matmul(versteckte_schicht_2_summe, output_schicht['weights']), output_schicht['biases'])


vorhersage = output_schicht_summe

# z.B. Kostenfunktion bzw. Fehlerfunktion verändern
#fehler = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=vorhersage, labels=y))
fehler = tf.reduce_mean(tf.squared_difference(vorhersage, y))

# Optimierer
optimierer = tf.train.AdamOptimizer().minimize(fehler)

# z.B. Trainingsdurchläufe ändern
epochen = 30

with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())
    
    for epoche in range(epochen):
        epoche_fehler = 0
        for _ in range(int(mnist.train.num_examples / batch_groesse)):
            epoche_x, epoche_y = mnist.train.next_batch(batch_groesse)
            _, kosten = sess.run([optimierer, fehler], feed_dict={x: epoche_x, y: epoche_y})
            epoche_fehler += kosten
                
        print('Epoche', epoche, 'von', epochen, 'Fehleranzahl:', epoche_fehler)

    richtiges_ergebnis = tf.equal(tf.argmax(vorhersage, 1), tf.argmax(y, 1))
        
    genauigkeit = tf.reduce_mean(tf.cast(richtiges_ergebnis, 'float'))
        
    print('Genauigkeit:', genauigkeit.eval({x: mnist.test.images, y:mnist.test.labels}))

Epoche 0 von 30 Fehleranzahl: 19.4333662558347
Epoche 1 von 30 Fehleranzahl: 5.2465693755075336
Epoche 2 von 30 Fehleranzahl: 3.354029950685799
Epoche 3 von 30 Fehleranzahl: 2.399135280866176
Epoche 4 von 30 Fehleranzahl: 1.7854389373678714
Epoche 5 von 30 Fehleranzahl: 1.35845065000467
Epoche 6 von 30 Fehleranzahl: 1.045437863911502
Epoche 7 von 30 Fehleranzahl: 0.8112868081079796
Epoche 8 von 30 Fehleranzahl: 0.6438511332380585
Epoche 9 von 30 Fehleranzahl: 0.5054265198414214
Epoche 10 von 30 Fehleranzahl: 0.40276321503915824
Epoche 11 von 30 Fehleranzahl: 0.3734016614034772
Epoche 12 von 30 Fehleranzahl: 0.2866677249985514
Epoche 13 von 30 Fehleranzahl: 0.2482088070246391
Epoche 14 von 30 Fehleranzahl: 0.2972177489864407
Epoche 15 von 30 Fehleranzahl: 0.36083575544762425
Epoche 16 von 30 Fehleranzahl: 0.2740551330643939
Epoche 17 von 30 Fehleranzahl: 0.22521702147787437
Epoche 18 von 30 Fehleranzahl: 0.21798393670178484
Epoche 19 von 30 Fehleranzahl: 0.197368223380181
Epoche 20 von 