# User Input Research
In the evaluation of our report, we discussed the differences between the final performance of both models. However, during our investigation, we suspected that we unintentionally formulated the user inputs to facilitate their use in a TF-IDF model.

Therefore, we will compare the models again, but this time with modified and new user inputs.

## 1. Previously Used Student Profiles Adjusted
Here we will adjust the 3 already known user profile to contain more natural data. The data that they contained earlier cannot be expected from a real user, they don't write in such concise manner. Especially when writing about their personal interests.

In [1]:
from helpers.notebook_pipelines.not_tuned_se_model import run_evaluation_multi as run_evaluation_multi_se
from helpers.notebook_pipelines.not_tuned_bow_model import run_evaluation_multi as run_evaluation_multi_bow
from helpers.functs.StudentProfile import StudentProfile
from IPython.display import display
import pandas as pd


# Our mocked student profiles
student1 = StudentProfile(
    current_study= "Kunst & Onderzoek",
    interests=[
        "Tekenen",
        "Animatie",
        "Kunst",
        "Drama",
        "Ik hou ervan om mensen te vermaken. Dit doe ik het liefst door bijvoorbeeld te dansen, te zingen of toneelspelen. In het algemeen vind ik het fijn om creatief bezig te zijn. Ik ben graag onder de mensen."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Kritisch denken", "Sociale vaardigheden", "Zelfverzekerdheid", "Ik wil o.a. leren hoe ik betere illustraties kan maken zowel analoog als digitaal."],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

student2 = StudentProfile(
    current_study= "Informatica",
    interests=[
        "Programmeren",
        "AI",
        "Coderen",
        "Techniek",
        "Software",
        "Ik heb werken met computers en techniek van jongs af aan al interessant gevonden. Kunstmatige intelligentie is nu ook zeker iets dat me interesseert, zeker met de sterke opkomst hiervan. Zo kun je denken aan machine learning, deep learning, etc. Ik wil me vooral bezighouden met software."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Kritisch denken", "Technische Vaardigheden", "Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

student3 = StudentProfile(
    current_study= "Psychologie",
    interests=[
        "Mensen",
        "Emoties",
        "Gedrag",
        "Psychologie",
        "Ik wil graag weten waarom mensen bepaalde dingen doen; ik wil mensen hun gedrag kunnen begrijpen. Naast hun gedrag wil ik ook leren over, persoonlijkheden en emoties. Graag wil ik mensen hun welzijn kunnen bevorderen met het gebruik van psychologische kennis."
    ],
    wanted_study_credit_range=(15, 30),
    location_preference=["Den Bosch", "Breda", "Tilburg"],
    learning_goals=["Kritisch denken", "Sociale Vaardigheden", "Ik wil leren hoe ik mensen en hun gedrag beter kan analyseren"],
    level_preference=["NLQF5", "NLQF6"],
    preferred_language="NL",
    preferred_start_range="any"
)

# Ground-truth relevant modules per student
matching_models_list = [
    [388, 392, 191, 385, 386, 379, 389, 377, 391, 233],          # student1
    [304, 305, 312, 317, 318, 322, 321, 334, 336, 340, 333],     # student2
    [159, 290, 397, 180, 177, 208, 173, 193, 357]                # student3
]

students = [student1, student2, student3]

## Running through SBERT model

In [2]:
all_results, avg_p_at_k = run_evaluation_multi_se(students, matching_models_list, top_n=5, k=5)

print("Average precision@5 over all students:", avg_p_at_k)

for idx, (student, result) in enumerate(zip(students, all_results), start=1):
    name = getattr(student, "name", f"Student {idx}")
    print("=" * 60)
    print(f"Results for {name} (index {idx}):")
    print(f"precision@5: {result['precision_at_k']:.3f}")

    old_width = pd.get_option("display.max_colwidth")
    pd.set_option("display.max_colwidth", None)
    display(result["recs"])
    pd.set_option("display.max_colwidth", old_width)

Relevant module IDs (ground truth): [191, 233, 377, 379, 385, 386, 388, 389, 391, 392]
Top-5 recommended IDs: [191, 391, 233, 386, 384]
Hits in top-5: 4
precision@5: 0.800
--------------------------------------------------
Relevant module IDs (ground truth): [304, 305, 312, 317, 318, 321, 322, 333, 334, 336, 340]
Top-5 recommended IDs: [333, 366, 171, 340, 226]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Relevant module IDs (ground truth): [159, 173, 177, 180, 193, 208, 290, 357, 397]
Top-5 recommended IDs: [159, 173, 197, 391, 177]
Hits in top-5: 3
precision@5: 0.600
--------------------------------------------------
Average precision@5 over all students: 0.6000000000000001
Results for Student 1 (index 1):
precision@5: 0.800


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,191,De Kracht van de kunsten,0.687917,"Deze module past heel sterk bij wat jij leuk vindt. Vooral omdat je aangeeft: ""Tekenen Animatie Kunst Drama Ik hou ervan om mensen te vermaken""."
1,2,391,Art & Humanity (nieuwe naam formuleren),0.667841,"Deze module sluit extreem goed aan bij jouw profiel. Dit sluit aan bij wat je vertelt: ""Tekenen Animatie Kunst Drama Ik hou ervan om mensen te vermaken""."
2,3,233,"Artistiek ondernemerschap voor kunst, design en performance",0.600675,"Deze module sluit extreem goed aan bij jouw profiel. Je profiel benadrukt vooral ""leren hoe ik betere illustraties kan maken zowel analoog als digitaal"", wat hier goed bij past."
3,4,386,Graphic Novel,0.599407,"Graphic Novel lijkt behoorlijk goed bij jou te passen. Je profiel benadrukt vooral ""Dit doe ik het liefst door bijvoorbeeld te dansen, te zingen of toneelspelen"", wat hier goed bij past."
4,5,384,Development for Storytelling,0.594137,"Op basis van jouw antwoorden lijkt behoorlijk goed bij jou te passen. Je profiel benadrukt vooral ""leren hoe ik betere illustraties kan maken zowel analoog als digitaal"", wat hier goed bij past."


Results for Student 2 (index 2):
precision@5: 0.400


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,333,Smart Industry & Internet of Things,0.717085,"Op basis van jouw antwoorden past heel sterk bij wat jij leuk vindt. Dit sluit aan bij wat je vertelt: ""Kritisch denken Technische Vaardigheden Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk Informatica""."
1,2,366,Didactiek voor N&G en N&T,0.68046,"Deze module is een bijna perfecte match met jouw interesses. Vooral omdat je aangeeft: ""Kritisch denken Technische Vaardigheden Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk Informatica""."
2,3,171,Technologie in zorg en welzijn,0.671237,"Op basis van jouw antwoorden past heel sterk bij wat jij leuk vindt. We herkennen hierin wat je schreef: ""Kritisch denken Technische Vaardigheden Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk Informatica""."
3,4,340,AI Translator,0.669332,"Deze module is een bijna perfecte match met jouw interesses. Dit sluit aan bij wat je vertelt: ""Kritisch denken Technische Vaardigheden Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk Informatica""."
4,5,226,"Digital Nomads NLQF 6, 30 + 15 EC",0.663012,"Op basis van jouw antwoorden is een bijna perfecte match met jouw interesses. Dit sluit aan bij wat je vertelt: ""Kritisch denken Technische Vaardigheden Eén van de dingen die ik wil leren is het toepassen van mijn kennis in de praktijk Informatica""."


Results for Student 3 (index 3):
precision@5: 0.600


Unnamed: 0,rank,module_id,module_name,score,motivation_full
0,1,159,Kennismaking met Psychologie,0.641677,"Op basis van jouw antwoorden sluit extreem goed aan bij jouw profiel. Dit sluit aan bij wat je vertelt: ""Graag wil ik mensen hun welzijn kunnen bevorderen met het gebruik van psychologische kennis""."
1,2,173,Langer thuis in de wijk,0.611109,"Langer thuis in de wijk sluit extreem goed aan bij jouw profiel. Vooral omdat je aangeeft: ""Graag wil ik mensen hun welzijn kunnen bevorderen met het gebruik van psychologische kennis""."
2,3,197,Werken in gedwongen kader,0.563634,"Werken in gedwongen kader sluit goed aan bij jouw profiel. Vooral omdat je aangeeft: ""Kritisch denken Sociale Vaardigheden Ik wil leren hoe ik mensen en hun gedrag beter kan analyseren Psychologie""."
3,4,391,Art & Humanity (nieuwe naam formuleren),0.559185,"Art & Humanity (nieuwe naam formuleren) is een sterke match met jouw interesses. Je profiel benadrukt vooral ""Mensen Emoties Gedrag Psychologie Ik wil graag weten waarom mensen bepaalde dingen doen; ik wil mensen hun gedrag kunnen begrijpen"", wat hier goed bij past."
4,5,177,Patronen doorbreken: basis,0.534506,"Patronen doorbreken: basis sluit goed aan bij jouw profiel. Vooral omdat je aangeeft: ""Graag wil ik mensen hun welzijn kunnen bevorderen met het gebruik van psychologische kennis""."


## Running through TF-IDF model

In [3]:
all_results, avg_p_at_k = run_evaluation_multi_bow(students, matching_models_list, top_n=5, k=5)

print("Average precision@5 over all students:", avg_p_at_k)

# Print model output for each student individually
for idx, (student, result) in enumerate(zip(students, all_results), start=1):
    name = getattr(student, "name", f"Student {idx}")
    print("=" * 60)
    print(f"Results for {name} (index {idx}):")
    print(f"precision@5: {result['precision_at_k']:.3f}")

    # Pandas settings for max width columns
    old_width = pd.get_option("display.max_colwidth")
    pd.set_option("display.max_colwidth", None)

    # Show updated recommendations
    display(result["recs"])

    # Restoring original pandas setting
    pd.set_option("display.max_colwidth", old_width)

(211, 12596)
Relevant module IDs (ground truth): [191, 233, 377, 379, 385, 386, 388, 389, 391, 392]
Top-5 recommended IDs: [191, 388, 393, 161, 356]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Relevant module IDs (ground truth): [304, 305, 312, 317, 318, 321, 322, 333, 334, 336, 340]
Top-5 recommended IDs: [334, 361, 327, 332, 303]
Hits in top-5: 1
precision@5: 0.200
--------------------------------------------------
Relevant module IDs (ground truth): [159, 173, 177, 180, 193, 208, 290, 357, 397]
Top-5 recommended IDs: [159, 193, 361, 207, 382]
Hits in top-5: 2
precision@5: 0.400
--------------------------------------------------
Average precision@5 over all students: 0.3333333333333333
Results for Student 1 (index 1):
precision@5: 0.400


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,191,De Kracht van de kunsten,0.539528,"kunst, drama, ervan, fijn, vind","Deze module is een sterke match met jouw interesses. In jouw studentenprofiel noem je **kunst, drama, ervan, fijn, vind**, wat goed aansluit bij deze module."
1,2,388,Tekenen,0.339489,"tekenen, of, fijn, vind","Tekenen heeft een gematigde overlap met jouw interesses. We zien dat **tekenen, of, fijn, vind** uit jouw antwoorden sterk overlappen met deze module."
2,3,393,Ethiek & kritisch denken,0.253207,"kunst, kritisch denk, om, zingen, of","Op basis van jouw antwoorden kan alsnog relevant zijn op basis van delen van jouw profiel. We zien dat **kunst, kritisch denk, om, zingen, of** uit jouw antwoorden sterk overlappen met deze module."
3,4,161,Proactieve zorgplanning,0.233174,"denk social, dansen, vermaken, of, toneelspelen","Op basis van jouw antwoorden heeft een gematigde overlap met jouw interesses. In jouw studentenprofiel noem je **denk social, dansen, vermaken, of, toneelspelen**, wat goed aansluit bij deze module."
4,5,356,The art of biology,0.225731,"kunst, tekenen, algemeen","Op basis van jouw antwoorden kan een interessante extra optie zijn. Je profiel vertelt over **kunst, tekenen, algemeen**, en deze interesses komen sterk terug in deze module."


Results for Student 2 (index 2):
precision@5: 0.200


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,334,Artifical Intelligence,0.315691,"iets, ai, kun","Artifical Intelligence kan een interessante extra optie zijn. We zien dat **iets, ai, kun** uit jouw antwoorden sterk overlappen met deze module."
1,2,361,Infectiepreventie (BML),0.303218,"de, kritisch denk, denken, met, sterke","Deze module heeft een gematigde overlap met jouw interesses. We zien dat **de, kritisch denk, denken, met, sterke** uit jouw antwoorden sterk overlappen met deze module."
2,3,327,Analyseren van software en infrastructuur (1.3 BIM),0.2958,"software, kun","Deze module kan alsnog relevant zijn op basis van delen van jouw profiel. In jouw studentenprofiel noem je **software, kun**, wat goed aansluit bij deze module."
3,4,332,"Software engineering, kwaliteit en testen",0.284021,"software, aan","Software engineering, kwaliteit en testen kan alsnog relevant zijn op basis van delen van jouw profiel. We zien dat **software, aan** uit jouw antwoorden sterk overlappen met deze module."
4,5,303,Operations Research,0.273788,"techniek, met, software, techniek softwar, de","Deze module kan een interessante extra optie zijn. In jouw studentenprofiel noem je **techniek, met, software, techniek softwar, de**, wat goed aansluit bij deze module."


Results for Student 3 (index 3):
precision@5: 0.400


Unnamed: 0,rank,module_id,module_name,score,Motivation,motivation_full
0,1,159,Kennismaking met Psychologie,0.436239,"dingen, mensen, doen, ik, over","Op basis van jouw antwoorden is een sterke match met jouw interesses. We zien dat **dingen, mensen, doen, ik, over** uit jouw antwoorden sterk overlappen met deze module."
1,2,193,Gedrag,0.395505,"dingen, persoonlijkheden, ik","Gedrag kan alsnog relevant zijn op basis van delen van jouw profiel. In jouw studentenprofiel noem je **dingen, persoonlijkheden, ik**, wat goed aansluit bij deze module."
2,3,361,Infectiepreventie (BML),0.273995,"dingen, kritisch denk, ik, ook, leren","Infectiepreventie (BML) kan een interessante extra optie zijn. We zien dat **dingen, kritisch denk, ik, ook, leren** uit jouw antwoorden sterk overlappen met deze module."
3,4,207,Zorg in de langdurige hulpverlening,0.272277,begrijpen,Deze module kan alsnog relevant zijn op basis van delen van jouw profiel. We zien dat **begrijpen** uit jouw antwoorden sterk overlappen met deze module.
4,5,382,Veranderen is Mensenwerk,0.269923,"begrijpen, wil, en, doen, persoonlijkheden","Deze module kan alsnog relevant zijn op basis van delen van jouw profiel. Je profiel vertelt over **begrijpen, wil, en, doen, persoonlijkheden**, en deze interesses komen sterk terug in deze module."
