# **Reflectie en Documentatie**

## **1. Doel van het project**

Het doel van dit project was om **semantic segmentation** uit te voeren op driedimensionale MRI-scans van hersenen met behulp van de **BraTS dataset**. Door tijdsdruk is het trainen van het model niet gerealiseerd. In plaats daarvan is gefocust op het ontwikkelen van een workflow en het uitvoeren van voorspellingen met een reeds bestaand getraind model. 

De nadruk van dit project ligt op het aantonen van voortgang en het reflecteren op gemaakte keuzes en obstakels. Het project toont inzicht in de uitdagingen en stappen die nodig zijn om volumetrische medische beelden te verwerken en te segmenteren. Er is een tutorial gebruikt voor het meerendeel van dit project:

[https://www.youtube.com/playlist?list=PLZsOBAyNTZwYgF8O1bTdV-lBdN55wLHDr](https://www.youtube.com/playlist?list=PLZsOBAyNTZwYgF8O1bTdV-lBdN55wLHDr)

---

## **2. Herkomst van data**

De gebruikte data is afkomstig van de **BraTS (Brain Tumor Segmentation) dataset**, beschikbaar via Kaggle. Deze dataset is een gevestigde standaard voor onderzoek naar hersentumoren en bevat multimodale MRI-scans en bijbehorende segmentatiemaskers, geannoteerd door radiologen.

De dataset biedt scans in vier modaliteiten (T1, T1Gd, T2, FLAIR) en segmentatiemaskers met labels voor tumoren en omliggende weefsels. De preprocessing is al uitgevoerd door de datasetbeheerders, wat het gebruik van de data vereenvoudigde.

Meer informatie over de dataset is te vinden op Kaggle:  
[https://www.kaggle.com/datasets/awsaf49/brats20-dataset-training-validation](https://www.kaggle.com/datasets/awsaf49/brats20-dataset-training-validation)

---

## **3. Beschrijving van de data**

De BraTS dataset bevat volumetrische MRI-scans in de vorm van **NIfTI-bestanden** (`.nii.gz`). Elke scan bestaat uit vier modaliteiten:
- **T1:** Anatomisch beeld met hoge resolutie.
- **T1Gd:** Post-contrast beelden die tumoren versterken.
- **T2:** Beelden die vocht en zwelling benadrukken.
- **FLAIR:** Onderdrukt vloeistofsignalen om pathologische regio's te benadrukken.

De bijbehorende segmentatiemaskers bevatten vier klassen:
- **Label 0:** Achtergrond.
- **Label 1:** Necrotische of niet-versterkende tumor.
- **Label 2:** Peritumoraal oedeem.
- **Label 4:** GD-versterkte tumor.

De scans en maskers zijn co-geregistreerd en genormaliseerd naar een resolutie van \(1 \text{mm}^3\).

## **4. Methode en gemaakte keuzes**

### **4.1 Data preprocessing**
- **EDA:** De data werd eerst onderzocht met een enkele set segmentatiegegevens, waarbij inzicht werd verkregen in de structuur en mogelijke uitdagingen.  
- **Automatisering:** Scripts zoals `tutorial_dataprep` en `tutorial_data_generator` werden ontwikkeld om preprocessing op de volledige dataset toe te passen.  
- **Cropping en regioselectie:** Alleen relevante delen van het hersenvolume ((128 X 128 X 128) voxels) werden behouden om geheugen- en rekenkracht te besparen.  
- **Normalisatie:** Alle voxelwaarden werden geschaald naar het bereik ([0, 1]).  
- **Opslag:** Verwerkte data werd opgeslagen als `.npy`-bestanden om de laadtijd te minimaliseren.

### **4.2 Predicties uitvoeren**
Vanwege tijdsdruk is ervoor gekozen om het model niet zelf te trainen, maar in plaats daarvan voorspellingen te genereren met behulp van een bestaand getraind model. Dit model werd geladen met Keras, en segmentatievoorspellingen werden uitgevoerd op de verwerkte MRI-data.

### **4.3 Reflectie op methodologie**
- Het aanpassen van de pipeline naar PyTorch bleek tijdrovend en werd om die reden gestaakt. Het project werd voortgezet in TensorFlow.  
- De **`load_model()`** functie van Keras veroorzaakte onverwachte problemen vanwege het standaard gebruik van `compile=True`, wat handmatige aanpassingen vereiste.
- Er is specifiek voor gekozen om drie epochs uit te voeren om een trajectory te zien. Voor het doel van dit project is dat genoeg.

---

## **5. Wat werkte en wat niet (reflectie)**

### **Wat werkte goed:**
1. **Data preprocessing:** Het automatiseren van preprocessing en regioselectie maakte het mogelijk om grote hoeveelheden data efficiënt te verwerken.  
2. **Custom data generator:** Deze flexibiliteit zorgde voor eenvoudige integratie met het model, ondanks de complexiteit van volumetrische data.  
3. **Predictie-output:** Het gebruikte model genereerde segmentaties die een goed uitgangspunt vormen voor verdere optimalisaties.  

### **Wat werkte niet goed:**
1. **Modeltraining:** Door tijdsbeperkingen was het niet mogelijk om een eigen model te trainen en hyperparameters te optimaliseren.  
2. **Migratie naar PyTorch:** Dit kostte te veel tijd en resources binnen het kader van het project.  
3. **Legacy-functies in Keras:** De standaardinstellingen van functies zoals **`load_model()`** veroorzaakten onverwachte problemen. 

### **Reflectie:**  
Het project heeft aangetoond dat het mogelijk is om een werkende workflow te implementeren voor 3D medische beeldsegmentatie. Echter, de tijdsdruk beperkte de mogelijkheid om het model te trainen en te optimaliseren, wat van invloed was op de uiteindelijke resultaten.

---

## **6. Uitkomsten en reflectie op resultaten**

### **Resultaten:**
- Segmentatievoorspellingen werden gegenereerd met een bestaand model. Deze voorspellingen geven een nog geen duidelijke indicatie van tumorlocaties, en bevatten enkele onnauwkeurigheden.  
- De resultaten tonen aan dat de preprocessing en visualisatie van MRI-data correct zijn uitgevoerd.

### **Vergelijking met verwachtingen:**
Hoewel het einddoel om een getraind model te hebben niet is gehaald, heeft het project waardevolle inzichten opgeleverd in het verwerken en segmenteren van 3D medische beelden. De voorspellingen laten zien dat de gekozen aanpak potentie heeft.

---

## **7. Aandachtspunten voor vervolgonderzoek**

- **Eigen modeltraining:** Het trainen van een model op de volledige dataset zal de nauwkeurigheid en robuustheid van de voorspellingen verbeteren.  
- **Frameworkkeuze:** Een definitieve keuze tussen TensorFlow en PyTorch kan verdere ontwikkeling efficiënter maken, sinds de support voor Pytorch beter is de laatste jaren, is aangeraden hiervoor te kiezen.  
- **Optimalisatie:** Experimenteren met lossfuncties en modelarchitecturen kan helpen bij het aanpakken van klasse-imbalance en achtergrondartefacten.

---

## **8. Relatie tot biologische/medische context**

Het project heeft aangetoond dat een geautomatiseerde pipeline voor hersentumorsegmentatie mogelijk is. Hoewel verdere optimalisaties nodig zijn, kan deze aanpak uiteindelijk bijdragen aan:
- Het ondersteunen van radiologen bij het analyseren van complexe MRI-scans.  
- Het versnellen van de diagnostische processen in klinische settings.  
