# Evaluation BOW
In this notebook we will look at the effectiveness of our model using precision@K. Results will be elaborated on inside of our report.

## 1. Model Testing
We start by creating 3 mocked student profiles

In [1]:
from helpers.notebook_pipelines.yes_tuned_bow_model import run_evaluation_multi
from helpers.functs.StudentProfile import StudentProfile
from IPython.display import display
import pandas as pd

# Our mocked student profiles
student1 = StudentProfile(
    current_study= "Kunst & Onderzoek",
    interests=[
        "Tekening",
        "Animatie",
        "Kunst",
        "Artistiek",
        "Drama",
        "Het vermaken van mensen. Via zingen, dansen, toneel. Graag op het podium. Mensen betrekken bij kunst. Veel vrijheid en ruimte voor creativiteit."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Sociale vaardigheden", "Zelfverzekerheid", "Vermaken"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

student2 = StudentProfile(
    current_study= "Informatica",
    interests=[
        "Programmeren",
        "AI",
        "Coderen",
        "Techniek",
        "Software",
        "Werken met computers en techniek heb ik altijd interessant gevonden. Met de opkomst van kunstmatige intelligentie wil is dit ook iets waar ik me in wil gaan verdiepen. Zoals machine learning, reinforcement learning, etc."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Multitasken", "Kritisch denken", "Technische Vaardigheden"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

student3 = StudentProfile(
    current_study= "Psychologie",
    interests=[
        "Mensen",
        "Emoties",
        "Gedrag",
        "Psychologie",
        "Waarom mensen bepaalde dingen doen. Hun gedrag, persoonlijkheid, emoties, etc. Ook het toepassen van psychologie om het welzijn van mensen te bevorderen."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Multitasken", "Communicatie vaardigheden", "Sociale Vaardigheden"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

# Ground-truth relevant modules per student
matching_models_list = [
    [388, 392, 191, 385, 386, 379, 389, 377, 233],          # student1
    [304, 305, 312, 317, 318, 322, 321, 334, 336, 340],     # student2
    [159, 290, 397, 180, 177]      #student 3
]

students = [student1, student2, student3]

Now pulling them through our model

In [2]:
all_results, avg_p_at_k = run_evaluation_multi(students, matching_models_list, top_n=5, k=5)

print("Average precision@5 over all students:", avg_p_at_k)

# Print model output for each student individually
for idx, (student, result) in enumerate(zip(students, all_results), start=1):
    name = getattr(student, "name", f"Student {idx}")
    print("=" * 60)
    print(f"Results for {name} (index {idx}):")
    print(f"precision@5: {result['precision_at_k']:.3f}")

    # Pandas settings for max width columns
    old_width = pd.get_option("display.max_colwidth")
    pd.set_option("display.max_colwidth", None)

    # Show updated recommendations
    display(result["recs"])

    # Restoring original pandas setting
    pd.set_option("display.max_colwidth", old_width)



(211, 22499)
Relevant module IDs (ground truth): [191, 233, 377, 379, 385, 386, 388, 389, 392]
Top-5 recommended IDs: [191, 388, 377, 392, 233]
Hits in top-5: 5
precision@5: 1.000
--------------------------------------------------
Relevant module IDs (ground truth): [304, 305, 312, 317, 318, 321, 322, 334, 336, 340]
Top-5 recommended IDs: [334, 318, 303, 340, 361]
Hits in top-5: 3
precision@5: 0.600
--------------------------------------------------
Relevant module IDs (ground truth): [159, 177, 180, 290, 397]
Top-5 recommended IDs: [159, 193, 357, 290, 207]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Average precision@5 over all students: 0.6666666666666666
Results for Student 1 (index 1):
precision@5: 1.000


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,191,De Kracht van de kunsten,0.7079,"het, drama, graag, artistiek, kunst","Op basis van jouw antwoorden is een bijna perfecte match met jouw interesses. Je profiel vertelt over **het, drama, graag, artistiek, kunst**, en deze interesses komen sterk terug in deze module."
1,2,388,Tekenen,0.277907,tekening,"Tekenen heeft een gematigde overlap met jouw interesses. Je profiel vertelt over **tekening**, en deze interesses komen sterk terug in deze module."
2,3,377,Art & Activisme,0.229192,"het, toneel, op","Op basis van jouw antwoorden heeft een gematigde overlap met jouw interesses. Je profiel vertelt over **het, toneel, op**, en deze interesses komen sterk terug in deze module."
3,4,392,Research in Art istic Practice,0.227053,"artistiek, creativiteit, kunst","Op basis van jouw antwoorden heeft een gematigde overlap met jouw interesses. We zien dat **artistiek, creativiteit, kunst** uit jouw antwoorden sterk overlappen met deze module."
4,5,233,"Artistiek ondernemerschap voor kunst, design en performance",0.220672,"het, dansen, artistiek, vrijheid","Deze module heeft een gematigde overlap met jouw interesses. Je profiel vertelt over **het, dansen, artistiek, vrijheid**, en deze interesses komen sterk terug in deze module."


Results for Student 2 (index 2):
precision@5: 0.600


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,334,Artifical Intelligence,0.496158,"intelligentie, kunstmatige, reinforcement learning, ai, gevonden","Op basis van jouw antwoorden lijkt behoorlijk goed bij jou te passen. Je profiel vertelt over **intelligentie, kunstmatige, reinforcement learning, ai, gevonden**, en deze interesses komen sterk terug in deze module."
1,2,318,AI Driven Robotics,0.292568,"ai, intelligentie, machin learning, opkomst, gevonden","Op basis van jouw antwoorden kan een interessante extra optie zijn. Je profiel vertelt over **ai, intelligentie, machin learning, opkomst, gevonden**, en deze interesses komen sterk terug in deze module."
2,3,303,Operations Research,0.254082,"computers, iets, techniek softwar, kritisch denk, software","Op basis van jouw antwoorden heeft een gematigde overlap met jouw interesses. In jouw studentenprofiel noem je **computers, iets, techniek softwar, kritisch denk, software**, wat goed aansluit bij deze module."
3,4,340,AI Translator,0.248526,"computers, ai, kunstmat intelligentie, ik, ik","AI Translator kan een interessante extra optie zijn. Je profiel vertelt over **computers, ai, kunstmat intelligentie, ik, ik**, en deze interesses komen sterk terug in deze module."
4,5,361,Infectiepreventie (BML),0.215363,"kritisch denk, iets, ik, waar, me","Infectiepreventie (BML) kan een interessante extra optie zijn. Je profiel vertelt over **kritisch denk, iets, ik, waar, me**, en deze interesses komen sterk terug in deze module."


Results for Student 3 (index 3):
precision@5: 0.400


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,159,Kennismaking met Psychologie,0.48143,"etc, doen, van","Deze module sluit goed aan bij jouw profiel. Je profiel vertelt over **etc, doen, van**, en deze interesses komen sterk terug in deze module."
1,2,193,Gedrag,0.320842,"doen, mensen","Deze module kan een interessante extra optie zijn. Je profiel vertelt over **doen, mensen**, en deze interesses komen sterk terug in deze module."
2,3,357,minor Forensisch Onderzoek in de Rechtbank- (IF/KA),0.258895,"etc, waarom, emoties","Op basis van jouw antwoorden kan alsnog relevant zijn op basis van delen van jouw profiel. Je profiel vertelt over **etc, waarom, emoties**, en deze interesses komen sterk terug in deze module."
3,4,290,Organizational Behavior (samenwerking HRM - IVK),0.247553,"etc, doen","Op basis van jouw antwoorden heeft een gematigde overlap met jouw interesses. We zien dat **etc, doen** uit jouw antwoorden sterk overlappen met deze module."
4,5,207,Zorg in de langdurige hulpverlening,0.234067,het,Zorg in de langdurige hulpverlening heeft een gematigde overlap met jouw interesses. We zien dat **het** uit jouw antwoorden sterk overlappen met deze module.


We see an average precision@k score of 0.6666 in this case. We're quite pleased with this, as TF-IDF has some weaknesses, as discussed in our report.

## 2. A Random Baseline
To create a baseline against which we can compare our model, we created a random baseline for our BOW model. This gives us an idea of ​​how much better our model is compared to something that bases its choices on nothing.

In [3]:
import random

def random_recommender_evaluation(students, matching_models_list, all_module_ids, top_k=5, seed=None):
    """
    Simpele random-based recommender:
    - Neemt voor elke student random top_k module_ids uit all_module_ids.
    - Berekent precision@k per student tov zijn/haar ground truth.
    - Geeft de random aanbevelingen, per-student precision@k en gemiddelde precision@k terug.
    """
    if len(students) != len(matching_models_list):
        raise ValueError("students en matching_models_list moeten even lang zijn")

    random.seed(seed)

    all_results_random = []
    precisions = []

    for student, matching_models in zip(students, matching_models_list):
        # Kies willekeurige, unieke modules
        recs_random = random.sample(all_module_ids, k=min(top_k, len(all_module_ids)))

        relevant_ids = set(matching_models)
        recommended_ids = recs_random
        kk = min(top_k, len(recommended_ids))
        top_k_ids = recommended_ids[:kk]

        hits = sum(1 for mid in top_k_ids if mid in relevant_ids)
        precision_at_k = hits / kk if kk > 0 else 0.0

        print(f"Random recommender voor student (ground truth: {sorted(relevant_ids)})")
        print(f"Random top-{kk} IDs: {top_k_ids}")
        print(f"Hits in top-{kk}: {hits}")
        print(f"precision@{kk}: {precision_at_k:.3f}")
        print("-" * 50)

        all_results_random.append({
            "student": student,
            "recommended_ids": recommended_ids,
            "precision_at_k": precision_at_k,
        })
        precisions.append(precision_at_k)

    avg_precision_at_k = float(sum(precisions) / len(precisions)) if precisions else 0.0
    return all_results_random, avg_precision_at_k


import pandas as pd
from pathlib import Path

df_all = pd.read_csv(Path("../Data/Cleaned/cleaned_dataset.csv"))
all_module_ids = df_all["id"].tolist()

random_results, random_avg_p_at_k = random_recommender_evaluation(
    students,
    matching_models_list,
    all_module_ids,
    top_k=5,
    seed=None,
)

print("Average precision@5 voor random recommender:", random_avg_p_at_k)

Random recommender voor student (ground truth: [191, 233, 377, 379, 385, 386, 388, 389, 392])
Random top-5 IDs: [321, 227, 194, 343, 266]
Hits in top-5: 0
precision@5: 0.000
--------------------------------------------------
Random recommender voor student (ground truth: [304, 305, 312, 317, 318, 321, 322, 334, 336, 340])
Random top-5 IDs: [306, 351, 304, 172, 300]
Hits in top-5: 1
precision@5: 0.200
--------------------------------------------------
Random recommender voor student (ground truth: [159, 177, 180, 290, 397])
Random top-5 IDs: [327, 276, 204, 394, 360]
Hits in top-5: 0
precision@5: 0.000
--------------------------------------------------
Average precision@5 voor random recommender: 0.06666666666666667


In [4]:
n_runs = 10000
avg_precisions = []

for _ in range(n_runs):
    _, avg_p = random_recommender_evaluation(
        students,
        matching_models_list,
        all_module_ids,
        top_k=5,
        seed=None
    )
    avg_precisions.append(avg_p)

expected_precision = sum(avg_precisions) / n_runs
print("Verwachte precision@5 random:", expected_precision)

Random recommender voor student (ground truth: [191, 233, 377, 379, 385, 386, 388, 389, 392])
Random top-5 IDs: [280, 223, 364, 327, 304]
Hits in top-5: 0
precision@5: 0.000
--------------------------------------------------
Random recommender voor student (ground truth: [304, 305, 312, 317, 318, 321, 322, 334, 336, 340])
Random top-5 IDs: [373, 336, 375, 340, 249]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Random recommender voor student (ground truth: [159, 177, 180, 290, 397])
Random top-5 IDs: [360, 282, 192, 385, 177]
Hits in top-5: 1
precision@5: 0.200
--------------------------------------------------
Random recommender voor student (ground truth: [191, 233, 377, 379, 385, 386, 388, 389, 392])
Random top-5 IDs: [173, 318, 257, 309, 253]
Hits in top-5: 0
precision@5: 0.000
--------------------------------------------------
Random recommender voor student (ground truth: [304, 305, 312, 317, 318, 321, 322, 334, 336, 340])
Random top-5 IDs