# 🧠 Spécialités Advisor – A Decision Tool for French High School Students

## 🎯 Goal

This project aims to help French high school students in **classe de 2nde** choose the best **enseignements de spécialité** for Première and Terminale, based on:
- Their academic **interests**
- Their **strengths in subjects studied in 2nde**
- Their **desired university fields** (if known)

The final version will be deployed as a **Streamlit web app**.

## 🧰 Inputs

Students will be asked to provide:
- ✅ Their **interests** (academic or personal)
- ✅ Their **strongest 2nde subjects**, such as:
  - Français
  - Histoire-Géographie
  - Langues Vivantes
  - SES
  - Mathématiques
  - Physique-Chimie
  - SVT
  - EPS
  - EMC
  - SNT

## 📌 Output

The tool will return:
- Suggested **3 spécialités** to choose for Première
- Which one to drop in Terminale (optional suggestion)
- Matching university degree examples
- Relevant admission statistics (from Parcoursup)


In [36]:
# 🔍 Define the list of interests that students can choose from

interests_list = [
    # 🎓 Academic & Career-Oriented
    "Medicine & health", "Engineering & technology", "Law & politics", "Economics & business",
    "Environment & sustainability", "Psychology & human behavior", "Education & teaching",
    "Architecture & design", "Science & research", "Mathematics & logic", "Literature & philosophy",
    "History & geopolitics", "Computer science", "Space & astronomy",

    # 🎨 Creative & Artistic
    "Music", "Visual arts", "Theater & performance", "Writing & storytelling",
    "Film & media", "Fashion & aesthetics", "Design & architecture",

    # 💼 Practical & Social
    "Entrepreneurship", "Communication", "Leadership", "Helping others / volunteering",
    "Public speaking", "Management", "Travel & cultures",

    # 🧘 Personal & Lifestyle
    "Sports & fitness", "Gaming", "Nature & animals", "Food & cooking",
    "DIY / crafting", "Photography", "Digital tools & technology"
]

In [38]:
# 🔗 Map each interest to one or more relevant spécialités
interest_to_specialite = {
    "Medicine & health": ["Sciences de la Vie et de la Terre", "Physique-Chimie"],
    "Engineering & technology": ["Mathématiques", "Physique-Chimie", "Numérique et Sciences Informatiques", "Sciences de l’Ingénieur"],
    "Law & politics": ["Histoire-Géographie, Géopolitique et Sciences Politiques", "Sciences économiques et sociales", "Humanités, Littérature et Philosophie"],
    "Economics & business": ["Mathématiques", "Sciences économiques et sociales"],
    "Environment & sustainability": ["Sciences de la Vie et de la Terre", "Physique-Chimie"],
    "Psychology & human behavior": ["Sciences de la Vie et de la Terre", "Humanités, Littérature et Philosophie"],
    "Education & teaching": ["Humanités, Littérature et Philosophie", "Littérature, langues et cultures de l’Antiquité"],

    "Architecture & design": ["Arts", "Mathématiques", "Sciences de l’Ingénieur"],
    "Science & research": ["Mathématiques", "Physique-Chimie", "Sciences de la Vie et de la Terre"],
    "Mathematics & logic": ["Mathématiques", "Numérique et Sciences Informatiques"],
    "Literature & philosophy": ["Humanités, Littérature et Philosophie", "Littérature, langues et cultures de l’Antiquité", "Langues, littératures et cultures étrangères"],
    "History & geopolitics": ["Histoire-Géographie, Géopolitique et Sciences Politiques", "Humanités, Littérature et Philosophie"],
    "Computer science": ["Numérique et Sciences Informatiques", "Mathématiques"],
    "Space & astronomy": ["Mathématiques", "Physique-Chimie"],

    "Music": ["Arts"],
    "Visual arts": ["Arts"],
    "Theater & performance": ["Arts", "Humanités, Littérature et Philosophie"],
    "Writing & storytelling": ["Humanités, Littérature et Philosophie", "Littérature, langues et cultures de l’Antiquité"],
    "Film & media": ["Arts", "Langues, littératures et cultures étrangères"],
    "Fashion & aesthetics": ["Arts"],
    "Design & architecture": ["Arts", "Sciences de l’Ingénieur"],

    "Entrepreneurship": ["Sciences économiques et sociales", "Mathématiques"],
    "Communication": ["Langues, littératures et cultures étrangères", "Humanités, Littérature et Philosophie"],
    "Leadership": ["Sciences économiques et sociales", "Histoire-Géographie, Géopolitique et Sciences Politiques"],
    "Helping others / volunteering": ["Sciences de la Vie et de la Terre", "Humanités, Littérature et Philosophie"],
    "Public speaking": ["Histoire-Géographie, Géopolitique et Sciences Politiques", "Langues, littératures et cultures étrangères"],
    "Management": ["Sciences économiques et sociales", "Mathématiques"],
    "Travel & cultures": ["Histoire-Géographie, Géopolitique et Sciences Politiques", "Langues, littératures et cultures étrangères"],

    "Sports & fitness": ["Sciences de la Vie et de la Terre", "Mathématiques"],
    "Gaming": ["Numérique et Sciences Informatiques", "Mathématiques"],
    "Nature & animals": ["Sciences de la Vie et de la Terre"],
    "Food & cooking": ["Sciences de la Vie et de la Terre", "Physique-Chimie"],
    "DIY / crafting": ["Arts", "Sciences de l’Ingénieur"],
    "Photography": ["Arts"],
    "Digital tools & technology": ["Numérique et Sciences Informatiques", "Mathématiques"],
}

In [40]:
# 📚 Define the list of 2nde subjects the user can select as their strengths

strengths_list = [
    "Français",
    "Histoire-Géographie",
    "Langues vivantes (A ou B)",
    "Sciences économiques et sociales (SES)",
    "Mathématiques",
    "Physique-Chimie",
    "Sciences de la vie et de la Terre (SVT)",
    "Éducation physique et sportive (EPS)",
    "Enseignement moral et civique (EMC)",
    "Sciences numériques et technologie (SNT)"
]

In [42]:
# 🎓 Map 2nde subjects to related spécialités
strength_to_specialite = {
    "Français": ["Humanités, Littérature et Philosophie", "Littérature, langues et cultures de l’Antiquité"],
    "Histoire-Géographie": ["Histoire-Géographie, Géopolitique et Sciences Politiques", "Humanités, Littérature et Philosophie"],
    "Langues vivantes (A ou B)": ["Langues, littératures et cultures étrangères", "Littérature, langues et cultures de l’Antiquité"],
    "Sciences économiques et sociales (SES)": ["Sciences économiques et sociales", "Histoire-Géographie, Géopolitique et Sciences Politiques"],
    "Mathématiques": ["Mathématiques", "Numérique et Sciences Informatiques", "Physique-Chimie"],
    "Physique-Chimie": ["Physique-Chimie", "Mathématiques", "Sciences de l’Ingénieur"],
    "Sciences de la vie et de la Terre (SVT)": ["Sciences de la Vie et de la Terre", "Physique-Chimie"],
    "Éducation physique et sportive (EPS)": ["Sciences de la Vie et de la Terre"],
    "Enseignement moral et civique (EMC)": ["Humanités, Littérature et Philosophie", "Histoire-Géographie, Géopolitique et Sciences Politiques"],
    "Sciences numériques et technologie (SNT)": ["Numérique et Sciences Informatiques", "Mathématiques"],
}


In [44]:
from collections import Counter

def recommend_specialites(interests_selected, strengths_selected, weight_interests=1, weight_strengths=2):
    total_scores = Counter()

    # Add scores from interests
    for interest in interests_selected:
        for sp in interest_to_specialite.get(interest, []):
            total_scores[sp] += weight_interests

    # Add scores from strengths
    for strength in strengths_selected:
        for sp in strength_to_specialite.get(strength, []):
            total_scores[sp] += weight_strengths

    # Return top 3 spécialités
    return [sp for sp, _ in total_scores.most_common(3)]


In [50]:
def top_two_specialites(interests_selected, strengths_selected, weight_strengths=1):
    recos = recommend_specialites(interests_selected, strengths_selected, weight_strengths)

    if len(recos) >= 2:
        to_keep = recos[:2]
        to_drop = recos[2] if len(recos) >= 3 else None
    else:
        to_keep = recos
        to_drop = None

    return {
        "to_keep": to_keep,
        "to_drop": to_drop
    }


In [64]:
import pandas as pd
df = pd.read_csv("cleaned_specialites.csv")

In [66]:
df

Unnamed: 0,specialites,formation,nb_candidats_voeu,nb_candidats_admis,nb_candidats_acceptes
0,"['Arts', 'Humanités, Littérature et Philosophie']",CPGE L,391,266.0,138
1,"['Arts', 'Numérique et Sciences Informatiques']",CPGE ECG,2,1.0,0
2,"['Arts', 'Numérique et Sciences Informatiques']",Formations d'ART,163,51.0,32
3,"['Arts', 'Physique-Chimie']","Licence Archéologie, Ethno, Préhistoire, Anthr...",3,2.0,1
4,"['Arts', 'Physique-Chimie']",Ensemble des candidats bacheliers,513,470.0,350
...,...,...,...,...,...
3180,"['Sciences de la vie et de la terre', ""Littéra...",CPGE ECG,0,0.0,0
3181,"['Sciences de la vie et de la terre', ""Science...",Licence AES,4,4.0,0
3182,"['Sciences de la vie et de la terre', ""Science...",BTS production,35,20.0,4
3183,"['Sciences de la vie et de la terre', ""Science...",CPGE ECG,0,0.0,0


In [86]:
recommended = ['Mathématiques', 'Physique-Chimie']
filtered_df = df[df['specialites'].apply(lambda x: all(spec in x for spec in recommended))]