# PI 7 Deel 1 - Mijn Aanpak

In deze opdracht werk ik aan het implementeren en aanpassen van een genetisch algoritme (GA). Ik gebruik de basiscode die is meegeleverd en onderzoek verschillende mogelijkheden voor de belangrijkste stappen van het algoritme: parentselectie, crossover en mutatie. Door relevante literatuur te bestuderen, maak ik onderbouwde keuzes voor de invulling van deze stappen en pas ik de code hierop aan.

## Doel van de opdracht

Het doel is om inzicht te krijgen in de flexibiliteit van genetische algoritmes en te leren hoe verschillende keuzes invloed hebben op de prestaties van het algoritme voor een specifiek probleem. Door te experimenteren met verschillende methoden voor selectie, crossover en mutatie, kan ik bepalen welke aanpak het beste werkt voor deze opdracht.

## Mijn werkwijze

- **Literatuurstudie:** Ik heb verschillende methoden voor selectie, crossover en mutatie onderzocht.
- **Keuze en implementatie:** Op basis van mijn bevindingen heb ik keuzes gemaakt en deze geïmplementeerd in de code.
- **Evaluatie:** Ik heb de prestaties van het algoritme geëvalueerd en mijn keuzes waar nodig aangepast.

In [385]:
import random
import math
import pandas as pd

In [386]:
df = pd.read_csv('pi-7-voorbeeld-dataset.csv') # Importeren van dataset
print("\nVoor sorteren:")
print(df)

df.sort_values(by=['profit'], ascending=False) # Sorteren van dataset op kolom 'profit'

print("\nNa sorteren:")
print(df)


Voor sorteren:
      id  deadline  profit
0     95         6     100
1     23        10     100
2    155         6      99
3     57         2      97
4    162         8      97
..   ...       ...     ...
195   63         8       3
196  118         3       2
197   55         2       1
198  181         3       1
199   15        10       1

[200 rows x 3 columns]

Na sorteren:
      id  deadline  profit
0     95         6     100
1     23        10     100
2    155         6      99
3     57         2      97
4    162         8      97
..   ...       ...     ...
195   63         8       3
196  118         3       2
197   55         2       1
198  181         3       1
199   15        10       1

[200 rows x 3 columns]


### Initialisatie van de populatie

De functie maakt een **initiële populatie**:  
- `initialise_population`: genereert `n_pop` willekeurige permutaties van `0..n_jobs-1`  
- Parameters (`N_POP`, `N_JOBS`, `N_ITERS`, `MUTATION_RATE`) stellen de GA in  
- Daarna wordt de populatie aangemaakt en geprint

In [None]:
def initialise_population(n_pop, n_jobs):
    # Genereer n_pop lijsten, elk een willekeurige volgorde van 0..n_jobs-1
    return [random.sample(range(n_jobs), n_jobs) for i in range(n_pop)]

def fitness(solution, df):
    n = len(df)
    deadlines = df['deadline'].tolist()
    profits = df['profit'].tolist()
    schedule = [None] * n  # hierin komt welke job per slot
    for job in solution:
        deadline = min(deadlines[job], n)  # max n
        # zoek het laatste vrije slot vóór de deadline
        while deadline > 0 and schedule[deadline-1] is not None:
            deadline -= 1
        if deadline > 0:
            schedule[deadline-1] = job
    # tel de winst op van alle geplande jobs
    total_profit = sum(profits[j] for j in schedule if j is not None)
    return total_profit

def evaluate(population, df):
    return [fitness(sol, df) for sol in population]

def parent_selection(population, fitness_scores):
    total_fitness = sum(fitness_scores)
    selection_probs = [f / total_fitness for f in fitness_scores]
    parents = random.choices(population, weights=selection_probs, k=2)
    return parents

def single_point_crossover(parents):
    p1 = parents[0]
    p2 = parents[1]
    # Bepaal cutoff point
    cutoff = random.randint(0, len(df)-1)
    c1 = p1[:cutoff] + p2[cutoff:]
    c2 = p2[:cutoff] + p1[cutoff:]
    return c1, c2

In [None]:
# GA parameters
N_POP = 100
N_JOBS = len(df)
N_ITERS = 20
MUTATION_RATE = 0.1

# Maak populatie aan (lijst van n_pop willekeurige volgorde van n_jobs)
population = initialise_population(N_POP, N_JOBS)

fitness_scores = evaluate(population, df)

parents = parent_selection(population, fitness_scores)
childern = single_point_crossover(parents)


[[33, 138, 5, 35, 12, 36, 26, 1, 191, 125, 118, 18, 65, 15, 11, 73, 155, 106, 137, 77, 165, 162, 56, 99, 167, 98, 53, 144, 192, 150, 42, 79, 188, 24, 52, 21, 195, 143, 20, 54, 25, 190, 66, 80, 198, 130, 176, 127, 182, 81, 40, 0, 31, 93, 149, 152, 61, 43, 141, 169, 44, 121, 9, 48, 84, 55, 92, 100, 178, 69, 94, 115, 128, 161, 110, 51, 70, 189, 183, 23, 145, 197, 112, 16, 29, 158, 4, 120, 104, 76, 135, 8, 186, 38, 72, 184, 148, 17, 196, 57, 146, 124, 126, 27, 139, 39, 163, 3, 22, 166, 32, 180, 102, 123, 30, 173, 87, 107, 71, 90, 172, 116, 58, 103, 14, 19, 41, 193, 171, 170, 6, 59, 134, 140, 117, 74, 47, 156, 129, 89, 181, 157, 28, 68, 194, 151, 105, 164, 179, 83, 96, 119, 60, 34, 199, 174, 49, 86, 45, 85, 37, 50, 10, 64, 142, 78, 7, 82, 131, 46, 185, 132, 122, 13, 101, 114, 109, 177, 113, 2, 133, 63, 187, 136, 168, 108, 111, 154, 88, 67, 97, 159, 95, 75, 147, 91, 153, 175, 62, 160], [131, 103, 5, 0, 4, 45, 84, 97, 55, 18, 82, 113, 139, 60, 135, 178, 67, 19, 166, 170, 199, 158, 179, 112, 2