# Workshop KI in der Medizin
Wir trainieren unser eigenes neuronales Netzwerk um Bilder zu klassifizieren. Dazu können wir drei verschiedene Datensätze verwenden.
In jedem Datensatz gibt es zwei Klassen, die wir jeweils mit `0` bzw. `1` definieren.
Das Netzwerk bekommt dann ein Bild aus einer der beiden Klassen als Input und soll je nachdem eine `0` oder eine `1` ausgeben.

##### 1. Kopf-MRT ohne oder mit Tumor
Klasse `0`: Kein Tumor<br>
Klasse `1`: Tumor<br>
<span style="font-size:12px">
(Datensatzquelle: <a href=https://www.kaggle.com/datasets/navoneel/brain-mri-images-for-brain-tumor-detection>https://www.kaggle.com/datasets/navoneel/brain-mri-images-for-brain-tumor-detection</a>)
</span>

<img src="./bilder/notumorvstumor.png" width="600"/><br>

##### 2. Herz-MRT in Lang- oder Kurzachse
Klasse `0`: Langachsen<br>
Klasse `1`: Kurzachsen<br>
<span style="font-size:12px">
(Datensatzquelle: <a href=https://www.cardiacatlas.org/sunnybrook-cardiac-data>https://www.cardiacatlas.org/sunnybrook-cardiac-data</a>)
</span>

<img src="./bilder/laxvssax.png" width="800"/>

##### 3. Katzen vs. Hunde
Klasse `0`: Katzen<br>
Klasse `1`: Hunde<br>
<span style="font-size:12px">
(Datensatzquelle: <a href=https://www.kaggle.com/datasets/samuelcortinhas/cats-and-dogs-image-classification>https://www.kaggle.com/datasets/samuelcortinhas/cats-and-dogs-image-classification</a>)
</span>

<img src="./bilder/catsvsdogs.png" width="600"/>

## Vorbereitung
Der folgende Block muss nur einmal zu Beginn ausgeführt werden.

In [None]:
from simpleclassifier import *

## Netzwerkarchitektur
Unsere Netzwerkarchitektur basiert auf einem sogenannten *LeNet*. Dabei handelt es sich um ein *Convolutional Neural Network*, das ist eine Klasse von neuronalen Netzen die sich sehr gut für die Bildverarbeitung eignet. Das *LeNet* beinhaltet drei Arten von Basisoperationen:
1. Convolutional Layers (Bild-Operationen / Faltungen)
2. Pooling Layers (Bildverkleinerung)
3. Fully-connected Layers (Vektor-Operation)

Nach Convolutional und Fully-connected Layers kann außerdem eine *Aktivierungsfunktion* eingefügt werden.

### Convolutional Layer
*Convolutions* (Faltungen) erlauben dem neuronalen Netz, sich auf kleinere Bereiche im Bild zu fokussieren und relevante Informationen daraus zu extrahieren. Die extrahierte Information ist ebenfalls in Form von Bildern gespeichert. Diese Bilder nennt man dann *Feature Maps*. In der Regel berechnet man aus dem selben Eingangsbild mehrere *Feature Maps*, welche dann alle an das nächste Layer weitergegeben werden.
* `in_channels`: Anzahl der Feature Maps aus dem vorangehenden Convolution Layer. **Beim ersten Convolution Layer ist dieser Wert 1.**
* `out_channels`: Anzahl der Feature Maps die durch die Convolution berechnet und an das nächste Layer weitergereicht werden.
* `kernel_size`: Die Größe der Bereiche auf die sich das Netz bei der Convolution fokussieren soll. In der Regel ein ungerader Wert.
* `activation`: Die Aktivierungsfunktion, die nach der Convolution verwendet werden soll (Erklärung siehe weiter unten).

<img src="./bilder/conv.png" width="1000"/>

### Pooling Layer
*Pooling* erlaubt es dem neuronalen Netz, nur die relevantesten Inhalte der *Feature Maps* zu extrahieren und folglich nur diese für weitere Operationen zu verwenden. 
* `kernel_size`: Der Faktor, um den das Bild bzw. die Feature Map verkleinert werden soll.

<img src="./bilder/pooling.png" width="450"/>

### Fully-connected Layer
*Fully-connected Layer* arbeiten auf ein-dimensionalen Vektoren. Jeder Wert in diesem Vektor (*Feature*) wird mit einem Gewicht multipliziert und aufsummiert um wiederum einen *Feature* zu berechnen. Dies kann man mit mehreren Sets von Gewichten wiederholen, um mehrere *Features* zu berechnen. 
* `in_features`: Anzahl der Eingangsfeatures.
* `out_features`: Anzahl der berechneten Ausgangsfeatures. *Beim letzten Fully-connected Layer ist dieser Wert 1.*
* `activation`: Die Aktivierungsfunktion, die nach dem Fully-connected Layer verwendet werden soll (Erklärung siehe weiter unten).

<img src="./bilder/fcnn_.png" width="350"/>

### Aktivierungsfunktion
Aktivierungsfunktionen werden typischerweise auf die Resultate von Convolution und Fully-connected Layern angewandt. Sie erlauben es dem Netzwerk, komplexere (nichtlineare) Zusammenhänge zu erlernen. Ohne Aktivierungsfunktionen wäre das nur bedingt möglich. Außerdem können sie dazu verwendet werden, die Resultate einer vorausgegangenen Layer auf einen bestimmten Wertebereich zu beschränken.

Arten:
* `Relu`: Setzt den Wertebereich auf `[0, inf]`
* `Sigmoid`: Setzt den Wertebereich auf `[0, 1]`
* `Tanh`: Setzt den Wertebereich auf `[-1, 1]`
* `NoActivation`: Keine Aktivierungsfunktion verwenden.

<img src="./bilder/akt.png" width="600"/>

### Lossfunktion
Die Lossfunktion bewertet, wie gut unser Netzwerk vorhandene Trainingsdaten klassifiziert. Während des Trainings versucht das Netzwerk, diesen Wert zu minimieren​. Je niedriger dieser Wert, desto besser funktioniert das Netzwerk auf den Trainingsdaten.

Es gibt viele verschiedene Arten von Lossfunktionen, welche oft für die Lösung bestimmter Problemklassen gedacht sind. Für unser Klassifikationsnetzwerk haben wir euch die Wahl der Lossfunktion abgenommen.

### Jetzt du
Unser Netzwerk besteht aus zwei Teilen. Im ersten Teil befinden sich nur Bildbasierte Operationen, also Convolutions und Poolings. Im zweiten Teil nur Fully-connected Layers.
Im Folgenden kannst du dein Netzwerk parametrisieren. Verwende dazu folgende Schreibweise (ersetze dabei alle `?` durch deine Parameter):
* für Convolutional Layers: `ConvolutionalLayer(in_channels=?, out_channels=?, kernel_size=?, activation=?)`
* für Pooling Layers: `PoolingLayer(kernel_size=?)`
* für Fully-connected Layers: `FullyConnectedLayer(in_features=?, out_features=?, activation=?)`

Dabei müssen gelten:
* `in_channels` des ersten Convolutional Layers muss `1` sein.
* `out_channels` bzw. `in_channels` von aufeinander folgenden Convolutional Layers müssen gleich sein.
* `in_features` des ersten Fully-connected Layers muss `flattened_features` sein (dieser Wert ergibt sich aus der Konfiguration des ersten Teils des Netzwerks - die Berechnung übernehmen wir im Hintergrund).
* `out_features` bzw. `in_features` von aufeinander folgenden Fully-connected Layers müssen gleich sein.
* `out_features` des letzten Fully-connected Layers muss `1` sein.

Schreibe alle Convolutional und Pooling Layers jeweils durch ein Komma getrennt in die eckigen Klammern hinter `network_config_conv` und alle Fully Connected Layers in die eckigen Klammern hinter `network_config_fc`.

In [None]:
network_config_conv = [
    # Hier nur ConvolutionalLayer und PoolingLayer hinzufügen
    ConvolutionalLayer(in_channels=1, out_channels=2, kernel_size=3, activation=NoActivation),
    PoolingLayer(kernel_size=4),
]
flattened_features = compute_flattened_features(network_config_conv)  # <-- diese Zeile bitte nicht verändern!
network_config_fc = [
    # Hier nur FullyConnectedLayer hinzufügen
    FullyConnectedLayer(in_features=flattened_features, out_features=1, activation=Sigmoid),
]
network = create_network(conv_config=network_config_conv, fc_config=network_config_fc)  # <-- diese Zeile bitte nicht verändern!

## Datensatz
Hier laden wir unsere Daten für Netzwerktraining. Alle notwendigen Operationen dafür passieren im Hintergrund. Es kann allerdings die Anzahl an verwendeten Bilder der jeweiligen Klassen festgelegt werden.

* Kopf-MRT ohne oder mit Tumor: `dataset = BrainTumorDataset(notumor=?, tumor=?)`
  * max. Anzahl `notumor`: 88
  * max. Anzahl `tumor`: 145
* Herz-MRT in Lang- oder Kurzachse: `dataset = CardiacViewDataset(long_axes=?, short_axes=?)`
  * max. Anzahl `long_axes`: 78
  * max. Anzahl `short_axes`: 80
* Katzen vs. Hunde: `dataset = CatsVsDogsDataset(cats=?, dogs=?)`
  * max. Anzahl `cats`: 279
  * max. Anzahl `dogs`: 278

Um alle verfügbaren Bilder zu verwenden, kannst du die Parameter in den Klammern auch einfach weglassen (also z.B. `dataset = BrainTumorDataset()`).

In [None]:
dataset = BrainTumorDataset(notumor=50, tumor=50)

Wir können uns einige (zufällige) Bilder aus dem Datensatz anschauen. Du kannst die folgende Zelle mehrfach ausführen, um andere Bilder zu sehen.

In [None]:
dataset.show_examples()

## Training
Das Netzwerk ist erstellt und die Trainingsdaten sind geladen. Wir können also unser Training starten. Auch hier werden alle notwendigen Operationen im Hintergrund durchgeführt. Es kann allerdings die Anzahl an Trainingsepochen festgelegt werden. 
* `epochs`: Anzahl der verwendeten Trainingsepochen

**Achtung:** Je mehr Epochen verwendet werden, desto länger dauert das Training. Viele Epochen sind nicht immer hilfreich!

Übrigens: Wir verwenden im Hintergrund eine Grafikkarte. Dadurch geht das Training deutlich schneller. Falls du ausprobieren möchtest, wie viel Unterschied dies macht, kannst du `gpu=False` als Parameter hinzufügen.

In [None]:
train(network=network, dataset=dataset, epochs=20)

## Testen
Zuletzt testen wir unser Netzwerk auf Bildern, welches es während des Trainings nicht gesehen hat. In der folgenden Zelle musst du nichts ändern.

In [None]:
test(network=network, dataset_type=type(dataset))

## Experiment 1
* Modifiziere das Netzwerk oder das Training so, dass es möglichst gute Testergebnisse liefert.
* Welche Klassifizierungsaufgabe ist leichter, welche ist schwieriger?
* Wie verändern sich die Testergebisse wenn man die Convolutional Layer weglässt?
* Welche Einstellungen am Netzwerk oder Training waren besonders wichtig für gute Ergebnisse?

## Experiment 2
* Spiele mit der Anzahl Trainingsdaten herum.
* Was passiert, wenn der Datensatz unausgewogen ist? (mehr Trainingsdaten einer Klasse)
* Was passiert, wenn eine Klasse gar nicht im Trainingsdatensatz repräsentiert ist?
* Was passiert, wenn insgesamt sehr wenige Daten zur Verfügung stehen?