### Genetisch algioritme voor optimale hyper-parameters verkrijgen uit de iris dataset

Deze code-cel begint met het importeren van de benodigde Python-bibliotheken en instellingen voor het uitvoeren van hyperparameteroptimalisatie voor een neuraal netwerkmodel. Hier zijn de belangrijkste elementen die in deze cel gebeuren:

1. **Importeren van Numpy en scikit-learn Libraries**:
   - De code importeert `numpy` als `np` voor numerieke berekeningen.
   - Het laadt de Iris-dataset met behulp van de `load_iris` functie van scikit-learn. Deze dataset zal worden gebruikt voor het evalueren van het neuraal netwerkmodel.
   - Het importeert `train_test_split` om de dataset te splitsen in trainings- en testgegevens.
   - Het gebruikt `MLPClassifier` van scikit-learn om een meerlaagse perceptron-neuraal netwerk voor classificatie te definiëren en te configureren.

2. **Importeren van de Tabulate-bibliotheek**:
   - De code importeert de `tabulate`-bibliotheek. Deze bibliotheek wordt later gebruikt om de resulterende error metrics op een nette manier als een tabel weer te geven.

3. **Importeren van Regressiemetrieken uit sklearn**
   - De code importeert de scoringsmetrieken `accuracy_score`, `precision_score`, `recall_score`, `f1_score` en `confusion_matrix` uit sklearn om het genetisch algoritme te scoren.

3. **Uitschakelen van Waarschuwingen**:
   - Er wordt een waarschuwingssuppressie geactiveerd om te voorkomen dat waarschuwingen de uitvoer onnodig vervuilen.

Deze voorbereidende stappen zijn cruciaal voor het correct uitvoeren van de hyperparameteroptimalisatie voor het neurale netwerkmodel en voor het weergeven van de resultaten in een overzichtelijke tabel met error metrics aan het einde van het script.


In [1]:
# General imports for the hyperparameter optimization
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.neural_network import MLPClassifier

# Import the tabulate library for a nice table at the end of the file for the error metrics
from tabulate import tabulate

# Importeer relevante evaluatiemetrics
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, confusion_matrix

# Ignoring all warnings because it clutters the space where the results are supposed to go in to
import warnings
warnings.filterwarnings("ignore")


### Gebruik van de Iris Dataset en Dataverdeling

In deze code-cel wordt de Iris-dataset gebruikt en wordt de dataset verdeeld in trainings- en testgegevens. Hier zijn de belangrijkste elementen die in deze cel gebeuren:

1. **Laden van de Iris Dataset**:
   - De code laadt de Iris-dataset met behulp van de `load_iris` functie. De Iris-dataset bevat informatie over irisbloemen en wordt vaak gebruikt voor machinaal leren toepassingen.

2. **Dataverdeling**:
   - De code splitst de gegevens in onafhankelijke variabelen (`X`) en de doelvariabele (`y`). `X` bevat de kenmerken van de bloemen, terwijl `y` de bijbehorende klasselabels bevat.
   - De dataset wordt verder opgesplitst in trainings- en testgegevens met behulp van `train_test_split`. Hierbij wordt 80% van de gegevens toegewezen aan de trainingsset en 20% aan de testset.
   - De `random_state` wordt ingesteld op 42 (“the Ultimate Question of Life, the Universe, and Everything.") om ervoor te zorgen dat de verdeling van de gegevens reproduceerbaar is.

Deze stappen zijn essentieel voor het voorbereiden van de gegevens voor de training en evaluatie van het neurale netwerkmodel. De Iris-dataset wordt gebruikt als de basis voor dit machine learning-assignment.


In [2]:
# We're using the iris dataset for this assignment
data = load_iris()

# Splitting the data into training and testing data
X, y = data.data, data.target
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### Definitie van te Testen Hyperparameters

In deze code-cel worden de hyperparameters gedefinieerd die zullen worden getest bij het optimaliseren van het neurale netwerkmodel. Hier zijn de belangrijkste elementen die in deze cel gebeuren:

1. **Activatiefuncties**:
   - De code definieert een lijst `activation_functions` met verschillende activatiefuncties die zullen worden getest. Deze functies beïnvloeden de overgang van informatie tussen neuronen in het netwerk. De beschikbare activatiefuncties zijn 'logistic', 'tanh', 'relu', en 'identity'.

2. **Grootte van Verborgen Lagen**:
   - De grootte van de verborgen lagen wordt gedefinieerd als een lijst van getallen in `hidden_layer_sizes`. Elke waarde in de lijst vertegenwoordigt de grootte van een verborgen laag in het neurale netwerk. Dit geeft flexibiliteit bij het testen van verschillende architecturen.

3. **Optimalisatie Solvers**:
   - De code definieert een lijst `solvers` met verschillende optimalisatiesolvers die worden gebruikt om de optimale gewichten voor het neurale netwerk te vinden. De beschikbare solvers zijn 'lbfgs', 'sgd', en 'adam'. Het standaard leerpercentage wordt gebruikt voor elk van deze solvers.

Deze definitie van hyperparameters is cruciaal voor het begeleiden van de hyperparameteroptimalisatie van het neurale netwerkmodel. Door verschillende combinaties van activatiefuncties, verborgen laaggroottes en solvers te testen, kan de optimale configuratie van het model worden bepaald.


In [3]:
# Defining the hyperparameters that we want to test
activation_functions = ['logistic', 'tanh', 'relu', 'identity']
# The hidden layer sizes are defined as a list of tuples, where each tuple represents a hidden layer
hidden_layer_sizes = [10, 20, 30, 40]
# The solvers are the optimizers that are used to find the optimal weights
# We're using the default learning rate for each solver
solvers = ['lbfgs', 'sgd', 'adam']

### Evaluatie van Individuen en Genetisch Algoritme

Deze code-cel bevat de implementatie van een functie voor het evalueren van de nauwkeurigheid van individuele neurale netwerkconfiguraties, evenals een genetisch algoritme voor het zoeken naar de beste individuele configuratie. Hier zijn de belangrijkste elementen die in deze cel gebeuren:

**Functie voor Evaluatie van Individuen**:
- De functie `evaluate_individual` ontvangt drie parameters: `activation_function`, `hidden_layer_size`, en `solver`.
- Binnen deze functie wordt een `MLPClassifier`-model geïnitialiseerd en getraind met de opgegeven hyperparameters. Het model maakt gebruik van een enkele verborgen laag met de specificaties.
- De nauwkeurigheid van het model wordt berekend op basis van de testgegevens (`X_test` en `y_test`) en geretourneerd als het evaluatieresultaat.

**Genetisch Algoritme voor Hyperparameteroptimalisatie**:
- De functie `genetic_algorithm` wordt gebruikt om het genetisch algoritme uit te voeren voor hyperparameteroptimalisatie.
- Een initiële populatie van individuen wordt gecreëerd, waarbij de hyperparameters willekeurig worden gekozen uit de gedefinieerde sets van activatiefuncties, verborgen laaggroottes en solvers.
- Het genetisch algoritme wordt vervolgens uitgevoerd over meerdere generaties, waarbij individuen worden geëvalueerd en de beste individuen worden geselecteerd op basis van hun nauwkeurigheid.
- Nieuwe individuen worden gegenereerd door combinaties van ouders en een willekeurige mutatie wordt geïntroduceerd om diversiteit te behouden.
- Het genetisch algoritme zoekt naar het beste individu met de hoogste nauwkeurigheid en retourneert de hyperparameters van dat individu als resultaat.

Deze implementaties zijn cruciaal voor het automatisch zoeken naar de optimale hyperparameters van het neurale netwerkmodel. Het genetisch algoritme evolueert de populatie van individuen om de configuratie te vinden die leidt tot de beste nauwkeurigheid bij classificatie.


In [4]:
# The function that evaluates the accuracy of an individual
def evaluate_individual(activation_function, hidden_layer_size, solver):
    clf = MLPClassifier(hidden_layer_sizes=(hidden_layer_size,), activation=activation_function, solver=solver, max_iter=2000, random_state=42) # max_iter is not optimal at 2000 but this way the code doesn't run forever
    clf.fit(X_train, y_train)
    accuracy = clf.score(X_test, y_test)
    return accuracy

# The genetic algorithm that finds the best individual
def genetic_algorithm(population_size, generations):
    population = []

    # Creating the initial population
    for _ in range(population_size):
        activation_function = np.random.choice(activation_functions)
        hidden_layer_size = np.random.choice(hidden_layer_sizes)
        solver = np.random.choice(solvers)
        individual = (activation_function, hidden_layer_size, solver)
        population.append(individual)

    # Running the genetic algorithm
    for generation in range(generations):
        scores = [evaluate_individual(activation_function, hidden_layer_size, solver) for activation_function, hidden_layer_size, solver in population]
        selected_indices = np.argsort(scores)[::-1][:int(population_size * 0.2)]
        selected_population = [population[i] for i in selected_indices]

        # Creating the new population
        new_population = []
        for _ in range(population_size):
            index1, index2 = np.random.choice(len(selected_population), size=2, replace=False)
            parent1 = selected_population[index1]
            parent2 = selected_population[index2]
            parent1_activation_function, parent1_hidden_layer_size, parent1_solver = parent1
            parent2_activation_function, parent2_hidden_layer_size, parent2_solver = parent2
            child = (parent1_activation_function, parent2_hidden_layer_size, parent2_solver)
            new_population.append(child)

        # Mutating the new population
        population = new_population

    # Finding the best individual
    best_individual = max(population, key=lambda ind: evaluate_individual(ind[0], ind[1], ind[2]))
    return best_individual


### Uitvoeren van het Genetisch Algoritme en Afdrukken van Resultaten

In deze code-cel wordt het genetisch algoritme uitgevoerd om de optimale hyperparameters voor het neurale netwerkmodel te vinden, en worden de resultaten afgedrukt. Hier zijn de belangrijkste elementen die in deze cel gebeuren:

**Uitvoeren van het Genetisch Algoritme**:
- De functie `genetic_algorithm` wordt opgeroepen met twee parameters: `population_size` en `generations`. Hier worden respectievelijk de grootte van de populatie en het aantal generaties voor het genetisch algoritme gespecificeerd.
- Het genetisch algoritme zal meerdere generaties doorlopen en proberen de optimale hyperparameters te vinden op basis van de prestaties van individuen.

**Afdrukken van de Optimale Hyperparameters**:
- Nadat het genetisch algoritme is voltooid, worden de optimale hyperparameters verkregen en opgeslagen in de variabele `best_hyperparameters`.
- Deze optimale hyperparameters worden afgedrukt naar de console met de tekst "Optimal hyperparameters:", gevolgd door de daadwerkelijke hyperparameters.

Deze code is de laatste stap in het proces van hyperparameteroptimalisatie en onthult de optimale configuratie die is gevonden door het genetisch algoritme. Dit is belangrijke informatie om de prestaties van het neurale netwerkmodel te verbeteren.


In [5]:
# Running the genetic algorithm and printing the results
best_hyperparameters = genetic_algorithm(population_size=50, generations=10)
print("Optimal hyperparameters:", best_hyperparameters)


Optimal hyperparameters: ('identity', 20, 'sgd')


### Evaluatie van het Geoptimaliseerde Neurale Netwerk Model Algoritme (met de juiste error metrics)

Deze code-cel is bedoeld voor de evaluatie van het prestaties van een geoptimaliseerd neuronaal netwerkmodel op een testdataset. De neuronaal netwerk hyperparameters, inclusief de activatiefunctie, de grootte van de verborgen laag en de solver, zijn geoptimaliseerd met behulp van een genetisch algoritme. De code toont hoe de prestaties van het model worden beoordeeld met behulp van verschillende evaluatiemetrics.

1. **Model Training**:
   - De code initialiseert en traint een neuronaal netwerkmodel (`best_clf`) met de geoptimaliseerde hyperparameters. De hyperparameters worden opgehaald uit `best_hyperparameters`, die zijn bepaald door het genetisch algoritme.
   - Het model wordt getraind op de trainingsdataset (`X_train` en `y_train`).

2. **Model Voorspelling**:
   - Het getrainde model wordt gebruikt om voorspellingen te doen op de testdataset (`X_test`) om de prestaties te evalueren.

3. **Importeren van Relevante Metrics**:
   - Diverse evaluatiemetrics worden geïmporteerd uit scikit-learn, waaronder nauwkeurigheid, precisie, recall en F1-score. Deze metrics worden vaak gebruikt om de prestaties van classificatiemodellen te beoordelen.

4. **Berekening van Metrics**:
   - De code berekent de volgende evaluatiemetrics op basis van de voorspellingen van het model en de ware labels uit de testdataset:
     - **Nauwkeurigheid**: Het deel van correct geclassificeerde voorbeelden.
     - **Precisie**: Het vermogen van het model om positieve voorspellingen correct te maken.
     - **Recall (Gevoeligheid)**: Het vermogen van het model om positieve voorbeelden correct te identificeren.
     - **F1-score**: Het harmonische gemiddelde van precisie en recall, wat een gebalanceerde maatstaf voor de prestaties van het model biedt.

5. **Confusion Matrix**:
   - Een confusion matrix (verwarringsmatrix) wordt gemaakt met behulp van de functie `confusion_matrix`. De confusion matrix geeft een gedetailleerdere uitsplitsing van de prestaties van het model door het aantal ware positieven, valse negatieven, valse positieven en ware negatieven voor elke klasse weer te geven.

6. **Tabel met Metrics**:
   - De code creëert een tabel die de berekende evaluatiemetrics en hun bijbehorende waarden weergeeft. Hiervoor wordt de `tabulate`-bibliotheek gebruikt om de metrics als een tabel met koppen weer te geven.

De resulterende tabel biedt een duidelijk en georganiseerd overzicht van hoe goed het geoptimaliseerde neuronaal netwerkmodel presteert op het gebied van nauwkeurigheid, precisie, recall en F1-score. De confusion matrix biedt aanvullende inzichten in de prestaties van het model door te laten zien hoe het voorbeelden classificeert voor elke klasse in de dataset.


In [6]:
# Training the classification model with the best hyperparameters
best_activation_function, best_hidden_layer_size, best_solver = best_hyperparameters
best_clf = MLPClassifier(hidden_layer_sizes=(best_hidden_layer_size,), activation=best_activation_function, solver=best_solver, max_iter=2000, random_state=42)
best_clf.fit(X_train, y_train)

# Predictions for the testdata
y_pred = best_clf.predict(X_test)

# Calculate and print the error metrics
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='weighted')  # 'weighted' is handy for multiclass classification
recall = recall_score(y_test, y_pred, average='weighted')
f1 = f1_score(y_test, y_pred, average='weighted')
conf_matrix = confusion_matrix(y_test, y_pred)

# Create a list of error metrics and their corresponding values
metrics_values = [
    ["Accuracy", accuracy],
    ["Precision", precision],
    ["Recall", recall],
    ["F1-score", f1],
]
# Printing the tabel with classification metrics
print(tabulate(metrics_values, headers=["Error Metrics", "Values"], tablefmt="pretty"))


+---------------+--------+
| Error Metrics | Values |
+---------------+--------+
|   Accuracy    |  1.0   |
|   Precision   |  1.0   |
|    Recall     |  1.0   |
|   F1-score    |  1.0   |
+---------------+--------+


### Confusion Matrix met Descriptieve Klasselabels

Deze code-cel is gewijd aan het opstellen van een confusion matrix met mensvriendelijke klasselabels voor de Iris-dataset. De Iris-dataset bevat drie soorten irisbloemen: Setosa, Versicolor en Virginica. De code vertaalt de standaardklasselabels naar mensvriendelijke labels en presenteert deze in de confusion matrix.

1. **Definiëren van Mensvriendelijke Klasselabels**:
   - Het eerste deel van de code definieert mensvriendelijke klasselabels voor de Iris-dataset. Hier worden de labels "Setosa," "Versicolor," en "Virginica" toegewezen aan respectievelijk de klassen 0, 1 en 2.

2. **Creëren van de Confusion Matrix**:
   - Vervolgens wordt een lijst van lijsten (`conf_matrix_values`) gemaakt om de confusion matrix te construeren. Elk element in deze lijst bevat een descriptieve klassenaam, gevolgd door een beschrijving van het type correcte of foutieve classificatie (bijvoorbeeld "True Positive" of "False Negative").
   - De waarden in de confusion matrix (bijvoorbeeld het aantal ware positieven) worden opgehaald uit de oorspronkelijke `conf_matrix` en gekoppeld aan de descriptieve klasselabels.

3. **Tabel van de Confusion Matrix**:
   - Tot slot wordt de confusion matrix als een geformatteerde tabel weergegeven. De `tabulate`-bibliotheek wordt gebruikt om de mensvriendelijke klasselabels en de bijbehorende waarden te presenteren.
   
   Het resultaat is een heldere en begrijpelijke weergave van de confusion matrix met begrijpelijke klasselabels. Dit vergemakkelijkt de interpretatie van de prestaties van een classificatiemodel, vooral voor iemand die niet bekend is met de standaardklasselabels van de Iris-dataset.


In [7]:
# Define human-friendly class labels for the iris dataset
class_labels = ["Setosa", "Versicolor", "Virginica"]

# Create a list of lists for the confusion matrix with descriptive class labels
conf_matrix_values = [
    [f"{class_labels[0]} (True Positive)", conf_matrix[0, 0]],
    [f"{class_labels[0]} (False Negative)", conf_matrix[0, 1]],
    [f"{class_labels[0]} (False Positive)", conf_matrix[0, 2]],
    [f"{class_labels[1]} (False Positive)", conf_matrix[1, 0]],
    [f"{class_labels[1]} (True Positive)", conf_matrix[1, 1]],
    [f"{class_labels[1]} (False Negative)", conf_matrix[1, 2]],
    [f"{class_labels[2]} (False Positive)", conf_matrix[2, 0]],
    [f"{class_labels[2]} (False Negative)", conf_matrix[2, 1]],
    [f"{class_labels[2]} (True Positive)", conf_matrix[2, 2]],
]

# Print the confusion matrix as a table
print(tabulate(conf_matrix_values, headers=["Confusion Matrix", "Values"], tablefmt="pretty"))



+-----------------------------+--------+
|      Confusion Matrix       | Values |
+-----------------------------+--------+
|   Setosa (True Positive)    |   10   |
|   Setosa (False Negative)   |   0    |
|   Setosa (False Positive)   |   0    |
| Versicolor (False Positive) |   0    |
| Versicolor (True Positive)  |   9    |
| Versicolor (False Negative) |   0    |
| Virginica (False Positive)  |   0    |
| Virginica (False Negative)  |   0    |
|  Virginica (True Positive)  |   11   |
+-----------------------------+--------+
