# Evaluation SE
In this notebook we will look at the effectiveness of our model using precision@K. Results will be elaborated on inside of our report.

## 1. Model Testing
We start by creating 3 mocked student profiles

In [None]:
from helpers.notebook_pipelines.not_tuned_se_model import run_evaluation_multi
from helpers.functs.StudentProfile import StudentProfile
from IPython.display import display
import pandas as pd


# Our mocked student profiles
student1 = StudentProfile(
    current_study= "Kunst & Onderzoek",
    interests=[
        "Tekening",
        "Animatie",
        "Kunst",
        "Artistiek",
        "Drama",
        "Het vermaken van mensen. Via zingen, dansen, toneel. Graag op het podium. Mensen betrekken bij kunst. Veel vrijheid en ruimte voor creativiteit."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Sociale vaardigheden", "Zelfverzekerheid", "Vermaken"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
)

student2 = StudentProfile(
    current_study= "Informatica",
    interests=[
        "Programmeren",
        "AI",
        "Coderen",
        "Techniek",
        "Software",
        "Werken met computers en techniek heb ik altijd interessant gevonden. Met de opkomst van kunstmatige intelligentie wil is dit ook iets waar ik me in wil gaan verdiepen. Zoals machine learning, reinforcement learning, etc."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Multitasken", "Kritisch denken", "Technische Vaardigheden"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
)

student3 = StudentProfile(
    current_study= "Psychologie",
    interests=[
        "Mensen",
        "Emoties",
        "Gedrag",
        "Psychologie",
        "Waarom mensen bepaalde dingen doen. Hun gedrag, persoonlijkheid, emoties, etc. Ook het toepassen van psychologie om het welzijn van mensen te bevorderen."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Carrière groei", "Multitasken", "Communicatie vaardigheden", "Sociale Vaardigheden"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
)

# Ground-truth relevant modules per student
matching_models_list = [
    [388, 392, 191, 385, 386, 379, 389, 377, 233],          # student1
    [304, 305, 312, 317, 318, 322, 321, 334, 336, 340],     # student2
    [159, 290, 397, 180, 177]      #student 3
]

students = [student1, student2, student3]

Now pulling them through our model

In [None]:
all_results, avg_p_at_k = run_evaluation_multi(students, matching_models_list, top_n=5, k=5)

print("Average precision@5 over all students:", avg_p_at_k)

for idx, (student, result) in enumerate(zip(students, all_results), start=1):
    name = getattr(student, "name", f"Student {idx}")
    print("=" * 60)
    print(f"Results for {name} (index {idx}):")
    print(f"precision@5: {result['precision_at_k']:.3f}")

    old_width = pd.get_option("display.max_colwidth")
    pd.set_option("display.max_colwidth", None)
    display(result["recs"])
    pd.set_option("display.max_colwidth", old_width)

Relevant module IDs (ground truth): [191, 233, 377, 379, 385, 386, 388, 389, 392]
Top-5 recommended IDs: [191, 389, 391, 377, 379]
Hits in top-5: 4
precision@5: 0.800
--------------------------------------------------
Relevant module IDs (ground truth): [304, 305, 312, 317, 318, 321, 322, 334, 336, 340]
Top-5 recommended IDs: [333, 340, 176, 171, 334]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Relevant module IDs (ground truth): [159, 177, 180, 290, 397]
Top-5 recommended IDs: [290, 159, 397, 208, 173]
Hits in top-5: 3
precision@5: 0.600
--------------------------------------------------
Average precision@5 over all students: 0.6000000000000001
Results for Student 1 (index 1):
precision@5: 0.800


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,191,De Kracht van de kunsten,0.646944,"Op basis van jouw antwoorden sluit extreem goed aan bij jouw profiel. Met name jouw beschrijving ""Tekening Animatie Kunst Artistiek Drama Het vermaken van mensen"" komt sterk terug in deze module."
1,2,389,Performance in Art,0.611126,"Deze module past heel sterk bij wat jij leuk vindt. Dit sluit aan bij wat je vertelt: ""Tekening Animatie Kunst Artistiek Drama Het vermaken van mensen""."
2,3,391,Art & Humanity (nieuwe naam formuleren),0.604097,"Art & Humanity (nieuwe naam formuleren) is een bijna perfecte match met jouw interesses. Dit sluit aan bij wat je vertelt: ""Carrière groei Sociale vaardigheden Zelfverzekerheid Vermaken Kunst & Onderzoek""."
3,4,377,Art & Activisme,0.589216,"Art & Activisme is een sterke match met jouw interesses. Met name jouw beschrijving ""Carrière groei Sociale vaardigheden Zelfverzekerheid Vermaken Kunst & Onderzoek"" komt sterk terug in deze module."
4,5,379,Creative AI,0.588265,"Deze module sluit goed aan bij jouw profiel. We herkennen hierin wat je schreef: ""Carrière groei Sociale vaardigheden Zelfverzekerheid Vermaken Kunst & Onderzoek""."


Results for Student 2 (index 2):
precision@5: 0.400


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,333,Smart Industry & Internet of Things,0.695087,"Deze module sluit extreem goed aan bij jouw profiel. Dit sluit aan bij wat je vertelt: ""Programmeren AI Coderen Techniek Software Werken met computers en techniek heb ik altijd interessant gevonden""."
1,2,340,AI Translator,0.639112,"AI Translator past heel sterk bij wat jij leuk vindt. Je profiel benadrukt vooral ""Programmeren AI Coderen Techniek Software Werken met computers en techniek heb ik altijd interessant gevonden"", wat hier goed bij past."
2,3,176,Technologie die ècht werkt: innovatie in zorg en welzijn,0.637871,"Technologie die ècht werkt: innovatie in zorg en welzijn is een bijna perfecte match met jouw interesses. Vooral omdat je aangeeft: ""Programmeren AI Coderen Techniek Software Werken met computers en techniek heb ik altijd interessant gevonden""."
3,4,171,Technologie in zorg en welzijn,0.636033,"Op basis van jouw antwoorden is een bijna perfecte match met jouw interesses. We herkennen hierin wat je schreef: ""Met de opkomst van kunstmatige intelligentie wil is dit ook iets waar ik me in wil gaan verdiepen""."
4,5,334,Artifical Intelligence,0.63441,"Op basis van jouw antwoorden is een bijna perfecte match met jouw interesses. Je profiel benadrukt vooral ""Programmeren AI Coderen Techniek Software Werken met computers en techniek heb ik altijd interessant gevonden"", wat hier goed bij past."


Results for Student 3 (index 3):
precision@5: 0.600


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,290,Organizational Behavior (samenwerking HRM - IVK),0.613082,"Deze module past heel sterk bij wat jij leuk vindt. We herkennen hierin wat je schreef: ""Ook het toepassen van psychologie om het welzijn van mensen te bevorderen""."
1,2,159,Kennismaking met Psychologie,0.611937,"Deze module is een bijna perfecte match met jouw interesses. Vooral omdat je aangeeft: ""Ook het toepassen van psychologie om het welzijn van mensen te bevorderen""."
2,3,397,De stem van je geweten. Ga opzoek naar jouw moreel kompas.,0.602854,"Deze module past heel sterk bij wat jij leuk vindt. Je profiel benadrukt vooral ""Ook het toepassen van psychologie om het welzijn van mensen te bevorderen"", wat hier goed bij past."
3,4,208,Welzijn en samenleving,0.591246,"Deze module lijkt behoorlijk goed bij jou te passen. Dit sluit aan bij wat je vertelt: ""Ook het toepassen van psychologie om het welzijn van mensen te bevorderen""."
4,5,173,Langer thuis in de wijk,0.582335,"Deze module sluit goed aan bij jouw profiel. Dit sluit aan bij wat je vertelt: ""Ook het toepassen van psychologie om het welzijn van mensen te bevorderen""."


We see a mean precision@k score of 0.6. This is lower than our TF-IDF approach, however when we closely inspect modules that are inside of recommendations of the SE model that are not present in the ground truths, they are actually decent matches we overlooked ourselves. We will write about this in our report and do a better comparison using more student profiles with different kind of inputs.