In [11]:
import pandas as pd
import numpy as np

### Chargement de dataset

In [12]:
try:
    df = pd.read_csv('student_grades.csv')
    print("✅ Dataset chargé avec succès.")
except FileNotFoundError:
    print("❌ Erreur : Le fichier 'student_grades.csv' est introuvable.")
    exit()

✅ Dataset chargé avec succès.


### Définition du "Catalogue" (Ce qu'on recommande)
 On définit quels cours universitaires correspondent à quelles matières du lycée.
 Les poids (weights) indiquent l'importance de la matière pour ce cursus.

In [13]:
university_programs = {
    "Computer Science": {"Maths": 0.5, "Science": 0.3, "English": 0.2},
    "Literature & Journalism": {"English": 0.4, "Hindi": 0.3, "History": 0.3},
    "Civil Engineering": {"Maths": 0.4, "Science": 0.4, "Geograpgy": 0.2}, 
    "History & Archaeology": {"History": 0.6, "Geograpgy": 0.3, "English": 0.1},
    "Medical Science": {"Science": 0.7, "English": 0.2, "Maths": 0.1},
    "Data Analysis": {"Maths": 0.6, "Science": 0.2, "English": 0.2},
    "International Relations": {"Geograpgy": 0.3, "History": 0.3, "English": 0.4}
}

### Fonction de recommandation

In [14]:
def recommend_programs(student_row):
    scores = {}
    
    # Pour chaque programme universitaire
    for program, criteria in university_programs.items():
        score = 0
        total_weight = 0
        
        # On calcule le score pondéré basé sur les notes de l'étudiant
        for subject, weight in criteria.items():
            if subject in student_row:
                # On récupère la note de l'étudiant pour cette matière
                grade = student_row[subject] 
                score += grade * weight
                total_weight += weight
        
        scores[program] = score
    
    # On trie les programmes du meilleur score au pire
    sorted_programs = sorted(scores.items(), key=lambda x: x[1], reverse=True)
    
    # On retourne le Top 1 et le Top 2
    return pd.Series([sorted_programs[0][0], sorted_programs[1][0]])

### Application sur tout le dataset
On crée deux nouvelles colonnes dans le dataset 

Sauvegarde et Aperçu

In [15]:
df[['Recommended_Progam_1', 'Recommended_Program_2']] = df.apply(recommend_programs, axis=1)
output_file = 'student_recommendations_final.csv'
df.to_csv(output_file, index=False)

In [16]:
print(df[['Maths', 'History', 'Recommended_Progam_1']].head(10))

   Maths  History     Recommended_Progam_1
0      3       71    History & Archaeology
1     67       91  Literature & Journalism
2     99       60            Data Analysis
3     94       52            Data Analysis
4     38        6  International Relations
5     53       64    History & Archaeology
6     38       50  Literature & Journalism
7     65       15          Medical Science
8     43       59  International Relations
9     76       83          Medical Science
