<img src="images/logodwengo.png" alt="logodwengo" style="width:200px;"/>

<div style='color: #690027;' markdown="1">
    <h1>VAN BLAD NAAR LABEL: STOMATADETECTIE</h1> 
</div>

<div class="alert alert-box alert-success">
In deze notebook train en test je jouw eigen diep neuraal netwerk om stomata te detecteren. De methodologie is dezelfde zoals uitgelegd in de paper van Meeus et al. [1].
</div>

<img src="images/stomatamethodologie.png" alt="methodologie" style="width:600px;"/>

Zoals hierboven geïllustreerd, glijdt er een venster over je microfoto (A). Dit *sliding window* verdeelt je foto dus in kleine overlappende vlakken of patches (B) van 120 op 120 pixels. Er is een diep neuraal netwerk (VGG19) getraind om deze patches te labelen (C). Positief gelabelde patches van een microfoto  worden geclusterd (D),  wat uitmondt in de detectie (E). Deze detectie is afhankelijk van de drempelwaarde, de *threshold*, die je koos.

### Nodige modules importeren

Je start met het inladen van enkele Python-modules:

- [PIL](https://pillow.readthedocs.io/en/stable/): een handige Python-module om te werken met beelden;
- [NumPy](https://numpy.org): de basismodule om wetenschappelijke bewerkingen in Python uit te voeren;
- [sklearn](https://scikit-learn.org/stable/): de scikit-learn module voor machinaal leren, in het bijzonder voor de functionaliteit van het clusteren;
- [os](https://docs.python.org/3/library/os.html): een Python-module voor functionaliteiten die afhankelijk zijn van het besturingssysteem, bv. lezen, schrijven en bestanden oplijsten;
- [Matplotlib](https://matplotlib.org): een Python-module om grafieken te maken.

Een diep neuraal netwerk bestaat uit meerdere lagen die aaneengeschakeld zijn. De Python-module Keras voorziet bouwblokken om een neuraal netwerk op te bouwen. In de achterliggende code zijn de nodige functionaliteiten vervat. Voor het rekenen met tensoren en andere rekenkundige bewerkingen doet Keras zelf een beroep op het platform TensorFlow.

In [1]:
from PIL import Image, ImageEnhance, ImageOps
import numpy as np
from sklearn.cluster import MeanShift, estimate_bandwidth
import os
import matplotlib.pyplot as plt

Vervolgens laad je meerdere [Keras](https://keras.io/getting_started/intro_to_keras_for_researchers/)-modules in.

In [2]:
from tensorflow.keras import backend as K
from tensorflow.keras.layers import Input, Convolution2D, Conv2D, MaxPooling2D, Activation, concatenate, Dropout, GlobalAveragePooling2D, Flatten, Dense
from tensorflow.keras.models import Model, load_model
from tensorflow.keras.utils import get_source_inputs
from tensorflow.keras.utils import get_file
from tensorflow.python.keras.utils import layer_utils
import tensorflow.keras as keras
from tensorflow.keras.preprocessing.image import load_img
from tensorflow.keras.preprocessing.image import img_to_array
from tensorflow.keras.preprocessing.image import ImageDataGenerator
import tensorflow as tf

# limiteren GPU VRAM
config = tf.compat.v1.ConfigProto()
config.gpu_options.allow_growth = True
sess = tf.compat.v1.Session(config=config)

2022-03-09 15:06:23.650697: I tensorflow/core/platform/cpu_feature_guard.cc:142] This TensorFlow binary is optimized with oneAPI Deep Neural Network Library (oneDNN) to use the following CPU instructions in performance-critical operations:  AVX2 FMA
To enable them in other operations, rebuild TensorFlow with the appropriate compiler flags.
2022-03-09 15:06:24.227627: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1510] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 38459 MB memory:  -> device: 0, name: A100-PCIE-40GB MIG 7g.40gb, pci bus id: 0000:e1:00.0, compute capability: 8.0


<div style='color: #690027;' markdown="1">
    <h2>1. Dataset</h2> 
</div>

Om een *deep learning*-model te kunnen trainen, heb je data nodig. Zoals eerder vermeld, zal het deep learning-model stomata detecteren op vierkante patches van 120 op 120 pixels. Dat komt omdat het getraind wordt met zo'n patches. Om een robuust model te bekomen, moeten zowel positieve als negatieve voorbeelden aan het systeem worden gepresenteerd. Positieve voorbeelden zijn voorbeelden met een stoma, negatieve voorbeelden zijn voorbeelden zonder stoma.

De data worden opgesplitst in drie delen:
- De trainingset, dit zijn de data die gebruikt worden om de gewichten, de *weights*, van het (diep) neuraal netwerk aan te passen;
- De validatieset, dit zijn de data waarmee wordt gekeken hoe goed het leerproces vordert en om de hyperparameters van het model fijner af te stellen;
- De testset, dit zijn de data die je na de training aan het systeem geeft om het ontwikkelde model te testen.

Deze notebook bevat de training en de validering van het *deep learning*-systeem voor stomatadetectie, en een kleine dataset die beperkt is tot *Carapa procera* en geschikt is voor didactische doeleinden. Hierdoor zijn ook de computationele noden binnen de perken gehouden (een volledige training met meerdere plantensoorten (zie de paper) vergt meer tijd en geduld).

Na de training zou het model in principe moeten getest worden op de testset. In deze notebook wordt die test beperkt tot één afbeelding. Dit omwille van de tijd en omdat dit volstaat voor het doeleinde van deze notebook: demonstreren hoe een convolutioneel neuraal netwerk voor stomatadetectie opgebouwd, getraind, gevalideerd en tot slot ingezet wordt.

Download en unzip eerst de dataset:

In [3]:
!wget https://zenodo.org/record/3902280/files/data.zip
!unzip "data.zip"

--2022-03-09 15:06:24--  https://zenodo.org/record/3902280/files/data.zip
Resolving zenodo.org (zenodo.org)... 137.138.76.77
Connecting to zenodo.org (zenodo.org)|137.138.76.77|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 10337927 (9.9M) [application/octet-stream]
Saving to: ‘data.zip’


2022-03-09 15:06:26 (11.3 MB/s) - ‘data.zip’ saved [10337927/10337927]

Archive:  data.zip
   creating: data/
   creating: data/training/
   creating: data/training/positive/
  inflating: data/training/positive/Carapa procera_CBMFO M3-53_leaf1-field1_BR0000013004071_26.jpg  
  inflating: data/training/positive/Carapa procera_CBMFO M3-53_leaf1-field1_BR0000013004071_32.jpg  
  inflating: data/training/positive/Carapa procera_CBMFO G2-436_leaf1-field2_BR0000013009175_7238.jpg  
  inflating: data/training/positive/Carapa procera_CBMFO M3-53_leaf4-field3_BR0000013004071_373.jpg  
  inflating: data/training/positive/Carapa procera_CBMFO M3-53_leaf4-field3_BR0000013004071_367.jpg

In [4]:
train_dir = "./data/training/"
val_dir = "./data/validation/"

De trainings- en validatiedata bevatten patches van 120 op 120 pixels. Een positief gelabelde patch vertoont een stoma:

<img src="images/carapapositief.jpg" width="120" />
    
Een negatief gelabelde patch van *Carapa procera* heeft geen stoma (tenzij misschien een deel ervan):

<img src="images/carapanegatief.jpg" width="120" />

Om zulke patches te bekomen, moet je beschikken over geannoteerde microfoto's (microfoto's waarvan je de coördinaat kent van het midden van de aanwezige stoma). De patches kunnen dan, gebaseerd op deze coördinaten, uitgesneden worden door middel van de [*crop*-functie](https://pillow.readthedocs.io/en/stable/reference/Image.html) van PIL of nog eenvoudiger door gebruik te maken van [*matrix slicing*](https://numpy.org/doc/stable/reference/arrays.indexing.html) in NumPy.

Het aantal elementen in de dataset wordt vergroot door middel van *data augmentation*. De preprocessor [ImageDataGenerator](https://keras.io/api/preprocessing/image/#imagedatagenerator-class), definieert de *data augmentation* die toegepast zal worden op de dataset. Hier bestaat die uit willekeurige rotaties, en horizontale en verticale *flips* van de patches.

In [5]:
train_datagen = keras.preprocessing.image.ImageDataGenerator(rotation_range=180, horizontal_flip=True, vertical_flip=True, rescale=1/255.)

Behalve het bepalen van de *data augmentation* die zal worden toegepast, gebruik je de ImageDataGenerator ook om enkele zaken vast te leggen: 
- de afmetingen van de patches (120 x 120 pixels); 
- de kleurenmodus (grijswaarden of rgb);
- de grootte van de batch (dit is het aantal samples dat gebruikt wordt in een epoch van de training, dus in elke trainingiteratie);
- het classificatietype van de te volbrengen taak (hier binaire classificatie: een patch krijgt ofwel een positief ofwel een negatief label);
- of de data geshuffeld moeten worden of niet;
- de *seed*, het startpunt, van de willekeurige getalgenerator. 

Tot slot voorzie je een pad naar de map met de trainingdata.

In [6]:
batch_size = 128

In [7]:
train_generator = train_datagen.flow_from_directory(
    directory=r"./data/training/",
    target_size=(120, 120),
    color_mode="rgb",
    batch_size=batch_size,
    class_mode="binary",
    shuffle=True,
    seed=53
)

Found 3081 images belonging to 2 classes.


Ook voor de validatie stel je een ImageDataGenerator in. Deze definieer je met dezelfde eigenschappen als diegene voor de training maar zonder *data augmentation*.

In [8]:
test_datagen = ImageDataGenerator(rescale=1/255.)

validation_generator = test_datagen.flow_from_directory(
        r"./data/validation/",
        target_size=(120, 120),
        color_mode="rgb",
        batch_size=batch_size,
        class_mode='binary')

Found 36 images belonging to 2 classes.


<div style='color: #690027;' markdown="1">
    <h2>2. Netwerkarchitectuur met nodige parameters</h2> 
</div>

Je vertrekt van het convolutionele neurale netwerk van het [VGG19-model](https://arxiv.org/abs/1409.1556) waar je twee *dense layers* aan toevoegt. <br>
De convolutionele neurale lagen zijn voorgetraind op [ImageNet](https://ieeexplore.ieee.org/abstract/document/5206848). Bijgevolg moeten enkel de *dense layers* nog getraind worden.<br>
De voorgetrainde gewichten van het convnet download je van Keras via het sleutelwoord 'imagenet'.

In [9]:
number_dense_neurons = 2048

In [10]:
# We starten van VGG19
from tensorflow.keras.applications import VGG19

# We starten met de convolutionele lagen van VGG19 met voorgetrainde gewichten op Imagenet
vgg19_base = VGG19(weights="imagenet",include_top=False,input_shape=(120,120,3))
x = vgg19_base.output
x = Flatten()(x)

# We voegen onze eigen classificatielagen toe
x = Dense(2*number_dense_neurons,activation='relu')(x)
x = Dropout(0.5)(x)
x = Dense(number_dense_neurons,activation='relu')(x)
x = Dropout(0.5)(x)

# We voegen een output laag toe
x = Dense(1,activation="sigmoid")(x)

model = Model(inputs=vgg19_base.input, outputs=x)

# We stellen in dat we de (voorgetrainde) VGG19 lagen niet trainen
for layer in vgg19_base.layers:
    layer.trainable = False

# Hoe ziet het netwerk eruit
model.summary()

Downloading data from https://storage.googleapis.com/tensorflow/keras-applications/vgg19/vgg19_weights_tf_dim_ordering_tf_kernels_notop.h5


2022-03-09 15:06:27.423676: I tensorflow/core/common_runtime/gpu/gpu_device.cc:1510] Created device /job:localhost/replica:0/task:0/device:GPU:0 with 38459 MB memory:  -> device: 0, name: A100-PCIE-40GB MIG 7g.40gb, pci bus id: 0000:e1:00.0, compute capability: 8.0


Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
input_1 (InputLayer)         [(None, 120, 120, 3)]     0         
_________________________________________________________________
block1_conv1 (Conv2D)        (None, 120, 120, 64)      1792      
_________________________________________________________________
block1_conv2 (Conv2D)        (None, 120, 120, 64)      36928     
_________________________________________________________________
block1_pool (MaxPooling2D)   (None, 60, 60, 64)        0         
_________________________________________________________________
block2_conv1 (Conv2D)        (None, 60, 60, 128)       73856     
_________________________________________________________________
block2_conv2 (Conv2D)        (None, 60, 60, 128)       147584    
_________________________________________________________________
block2_pool (MaxPooling2D)   (None, 30, 30, 128)       0     

<div style='color: #690027;' markdown="1">
    <h2>3. Train het model en sla het op</h2> 
</div>

De parameters worden geoptimaliseerd door een beroep te doen op de optimalisatiefunctie [Adam](https://arxiv.org/pdf/1412.6980.pdf); hiervoor werd de *learning rate* gefinetuned en uiteindelijk op 0.000005 afgesteld. Tot slot leg je de *loss* en de *metrics* voor training en validatie vast.

In [11]:
learning_rate = 0.000005
# Initialiseer Stochastic Gradient Descent met momentum, learning rate om te finetunen
opt = tf.keras.optimizers.Adam(lr=learning_rate, beta_1=0.9, beta_2=0.999, amsgrad=False)
# Bepaal de loss en metrics voor training en validatie
model.compile(loss="binary_crossentropy", optimizer=opt, metrics=["binary_accuracy"])



Training gebeurt door middel van de functie *fit()* gedurende 50 epochs. Merk op dat de architectuur op zo'n manier werd geconfigureerd dat enkel de gewichten van de *dense layers* aangepast worden. 

In [None]:
epochs = 50
history = model.fit(
        train_generator,
        epochs=epochs,
        validation_data=validation_generator)

2022-03-09 15:06:29.121248: I tensorflow/compiler/mlir/mlir_graph_optimization_pass.cc:185] None of the MLIR Optimization Passes are enabled (registered 2)


Epoch 1/50


2022-03-09 15:06:30.647810: I tensorflow/stream_executor/cuda/cuda_dnn.cc:369] Loaded cuDNN version 8101
2022-03-09 15:06:31.173163: I tensorflow/core/platform/default/subprocess.cc:304] Start cannot spawn child process: No such file or directory
2022-03-09 15:06:31.173981: I tensorflow/core/platform/default/subprocess.cc:304] Start cannot spawn child process: No such file or directory
2022-03-09 15:06:31.174005: W tensorflow/stream_executor/gpu/asm_compiler.cc:77] Couldn't get ptxas version string: Internal: Couldn't invoke ptxas --version
2022-03-09 15:06:31.175006: I tensorflow/core/platform/default/subprocess.cc:304] Start cannot spawn child process: No such file or directory
2022-03-09 15:06:31.175074: W tensorflow/stream_executor/gpu/redzone_allocator.cc:314] Internal: Failed to launch ptxas
Relying on driver to perform ptx compilation. 
Modify $PATH to customize ptxas location.
This message will be only logged once.


 1/25 [>.............................] - ETA: 1:52 - loss: 0.9825 - binary_accuracy: 0.2969

2022-03-09 15:06:33.914232: I tensorflow/stream_executor/cuda/cuda_blas.cc:1760] TensorFloat-32 will be used for the matrix multiplication. This will only be logged once.


Epoch 2/50
Epoch 3/50
Epoch 4/50
Epoch 5/50
Epoch 6/50
Epoch 7/50
Epoch 8/50
Epoch 9/50
Epoch 10/50
Epoch 11/50
Epoch 12/50
Epoch 13/50
Epoch 14/50
Epoch 15/50
Epoch 16/50
Epoch 17/50
Epoch 18/50
Epoch 19/50
Epoch 20/50
Epoch 21/50
Epoch 22/50
Epoch 23/50
Epoch 24/50
Epoch 25/50
Epoch 26/50
Epoch 27/50
Epoch 28/50
Epoch 29/50
Epoch 30/50
Epoch 31/50
Epoch 32/50
Epoch 33/50
Epoch 34/50
Epoch 35/50
Epoch 36/50
Epoch 37/50
Epoch 38/50
Epoch 39/50
Epoch 40/50
Epoch 41/50
Epoch 42/50
Epoch 43/50
Epoch 44/50
Epoch 45/50
Epoch 46/50
Epoch 47/50
Epoch 48/50

Nu ben je toe aan de volgende stap. Het netwerk is immers getraind en kan nu gebruikt worden.<br>
Om het AI-systeem te kunnen gebruiken, moet je de parameters van het model opslaan. Dit kan je doen door de instructie *model.save(path)* met *path* het pad naar het bestand waarin je de parameters wilt bewaren.<br>
Bovendien geeft de functie *fit()* een *history* object terug. Dit object omvat de vooruitgang van de training en van de validatie over de verschillende epochs. Bijgevolg is dit nuttig om het trainingsproces in het oog te houden, bijvoorbeeld om de resultaten van verschillende instellingen van de hyperparameters, zoals de *learning rate*, het aantal *epochs* en de grootte van de *batches*, te vergelijken.

In [None]:
# Bewaar the Carapa procera deep learning model
model.save("my_carapa_procera_model")

# Geef de prestaties voor training en validatie weer
plt.plot(history.history["loss"], label="Training loss")
plt.plot(history.history["val_loss"], label="Validation loss")

<div style='color: #690027;' markdown="1">
    <h2>4. Laad het deep learning-model in</h2> 
</div>

Nu heb je een eerste deep learning-model voor stomatadetectie bij de *Carapa procera* getraind. Dit model is opgeslagen als het object *model*.<br> Als je van een gesaved deep learning-model wilt vertrekken, dan haal je het op vanuit de file door de instructie *model = load_model(path_to_model)* uit te voeren.

In [None]:
# Haal de volgende regel uit commentaar, indien je met je eerder opgeslagen model wil werken zonder opnieuw het trainingsproces te doorlopen
# model = load_model("my_carapa_procera_model")

<div style='color: #690027;' markdown="1">
    <h2>5. Beeld- en detectieparameters</h2> 
</div>

Het model kan enkel stomata detecteren op afbeeldingen van 120 op 120 pixels. Daarom moet een aangeboden afbeelding eerst verdeeld worden in patches. Het model maakt daarvoor gebruik van een werkwijze met een *sliding window*.<br>
Hoewel deze methode niet de meest (computationeel) efficiënte is, is ze zeer gemakkelijk te begrijpen. Het venster is 120 op 120 pixels groot en verschuift telkens met een stap van 10 pixels.<br> Je start door je afbeelding in te laden:

In [None]:
demo_image = "./data/Carapa_procero_demo.jpg" # Je kan een andere Carapa procero microfoto gebruiken

In [None]:
image = Image.open(demo_image)
fig, ax = plt.subplots(figsize=(20, 10))
image = np.array(image) # Conversie naar Numpy array
ax.imshow(image)

In [None]:
shift = 10
patch_size = 120

Ook het aantal slides dat uitgevoerd wordt, maakt deel uit van de detectieparameters:

In [None]:
no_x_shifts = (np.shape(image)[0] - patch_size) // shift
no_y_shifts = (np.shape(image)[1] - patch_size) // shift
print("We doen "+str(no_x_shifts*no_y_shifts)+" verschuivingen. Bijgevolg wordt het deep learning model op "+str(no_x_shifts*no_y_shifts)+" patches toegepast.")

<div style='color: #690027;' markdown="1">
    <h2>6. Classificatie met het deep learning-model</h2> 
</div>

Nu alle vensters geïdentificeerd zijn, kan het deep learning-model in actie treden. Je bewerkstelligt dit door de functie *predict()* te aanroepen. Weliswaar moet je de gebruikte afbeelding eerst converteren (omzetten naar het verwachte formaat) en normaliseren (elementen krijgen waarden van 0 t.e.m. 1).<br> 
De output van het deep learning model is een getal tussen 0 en 1 dat weergeeft hoe zeker het model is dat de afbeelding een stoma vertoont. Daarom moet je ook een drempelwaarde, *threshold*, vastleggen vanaf dewelke de output als een positieve classificatie wordt geaccepteerd. Hoe hoger deze threshold, hoe strenger het systeem zal handelen bij het detecteren van de stomata. Als de threshold echter te hoog is, zal het systeem niet in staat zijn om ook maar één stoma te detecteren. De threshold hieronder is dezelfde als in de paper:

In [None]:
threshold = 0.7 

In [None]:
patches = []
coordinaten = []
stomata = []
offset = patch_size // 2
for x in np.arange(no_x_shifts + 1):
    for y in np.arange(no_y_shifts + 1):
        # Midden van het venster
        x_c = x * shift + offset
        y_c = y * shift + offset
        
        # Uitknippen van het venster en omzetten naar verwachte formaat vooraleer toepassing van het deep learning model
        patch = image[x_c - offset:x_c + offset, y_c - offset:y_c + offset, :]
        patch = patch.astype("float32")
        patch /= 255
        patches.append(np.expand_dims(patch, axis=0))
        coordinaten.append([x_c,y_c])
        
        
        batch_size = 128
        for b in range(0, len(patches), batch_size):
            batch = batches[i:i + batch_size[
                
        
            # Het model toepassen om de detectie te doen
            y_model = model.predict(np.vstack(batch))
                
            for p in range(0, len(y_model)):
                # Stoma indien de output van het model boven de threshold ligt 
                if y_model[p] > threshold:
                    stomata.append(coordinaten[b + p])

<div style='color: #690027;' markdown="1">
    <h2>7. Clustering van de gedetecteerde stomata</h2> 
</div>

Alle positief gelabelde patches worden geclusterd door middel van *mean shift clustering*. Deze techniek groepeert naburige (of zelfs overlappende) positief gelabelde patches waaruit de coördinaat van de effectieve stoma afgeleid wordt. Hiervoor kun je een beroep doen op de module [MeanShift](https://scikit-learn.org/stable/modules/generated/sklearn.cluster.MeanShift.html), die beschikbaar is in [scikit-learn](https://scikit-learn.org).

In [None]:
bandwidth = patch_size // 2

ms = MeanShift(bandwidth=bandwidth, bin_seeding=True)
ms.fit(stomata)
stomata = np.array([[x[1], x[0]] for x in ms.cluster_centers_]) # cluster_centers_ is inverted

<div style='color: #690027;' markdown="1">
    <h2>8. Grafische voorstelling van de resultaten</h2> 
</div>

In [None]:
fig, ax = plt.subplots(figsize=(20, 10))
ax.imshow(image)
ax.plot(stomata[:,0], stomata[:,1], 'xr', alpha=0.75, markeredgewidth=3, markersize=12)

### Referentielijst

[1] Meeus, S., Van den Bulcke, J., & wyffels, F. (2020). From leaf to label: A robust automated workflow for stomata detection. *Ecology and evolution 10*(17),<br>&nbsp; &nbsp; &nbsp; &nbsp; 9178-9191. [doi:10.1002/ece3.6571](https://doi.org/10.1002/ece3.6571) <br>
[2]  Simonyan, K., & Zisserman, A. (2014). Very deep convolutional networks for large-scale image recognition. *arXiv preprint*. [arXiv:1409.1556](https://arxiv.org/abs/1409.1556) <br>
[3]  Deng, J., et al. (2009). Imagenet: A large-scale hierarchical image database. *IEEE conference on computer vision and pattern recognition*. [IEEE](https://ieeexplore.ieee.org/abstract/document/5206848) <br>
[4] Kingma, D. P., & Ba, J. (2014). Adam: A method for stochastic optimization. *arXiv preprint*. [arXiv:1412.6980](https://arxiv.org/pdf/1412.6980.pdf)

<img src="images/cclic.png" alt="Banner" align="left" style="width:100px;"/><br><br>
Notebook KIKS, zie <a href="http://www.aiopschool.be">AI Op School</a>,  van F. wyffels voor Dwengo vzw, in licentie gegeven volgens een <a href="http://creativecommons.org/licenses/by-nc-sa/4.0/">Creative Commons Naamsvermelding-NietCommercieel-GelijkDelen 4.0 Internationaal-licentie</a>. 