# Projet SDP : Explications de classements par Trade-offs

**Membres du groupe** : Adham Noureldin, Aymane Chalh, Daphné Maschas

**Date** : 19 Janvier 2026

In [36]:
import gurobipy as gp
from gurobipy import GRB

## 1. Introduction

Ce projet vise à fournir des explications intelligibles pour le classement des candidats au concours de l'internat de médecine. Au lieu d'utiliser la somme pondérée brute, nous justifions qu'un candidat $x$ est meilleur qu'un candidat $y$ en montrant comment ses points forts compensent ses points faibles via des modèles d'optimisation (MIP).

## 2. Préparation des données

Dans cette section, nous définissons les poids des matières et les notes des candidats de référence.

In [37]:
matieres = ["Anatomie", "Biologie", "Chirurgie", "Diagnostic", "Epidemiologie", "Forensic Pathology", "Génétique"]
poids = [8, 7, 7, 6, 6, 5, 6]

# Notes des candidats 
notes_x = [85, 81, 71, 69, 75, 81, 88] # Xavier
notes_y = [81, 81, 75, 63, 67, 88, 95] # Yvonne
notes_z = [74, 89, 74, 81, 68, 84, 79]
notes_t = [74, 71, 84, 91, 77, 76, 73]
notes_w = [79, 69, 78, 76, 67, 84, 79]
notes_w_prime = [57, 76, 81, 76, 82, 86, 77]
notes_u = [72, 66, 75, 85, 88, 66, 93]
notes_v = [71, 73, 63, 92, 76, 79, 93]

# Autres candidats
notes_a1 = [89, 74, 81, 68, 84, 79, 77]
notes_a2 = [71, 84, 91, 79, 78, 73.5, 77] # 73.5 pour Forensic

Fonctions utilitaires:

In [38]:
def preparer_donnees(notes_a, notes_b, poids):
    """Calcule les contributions et sépare les Pros et les Cons."""
    contribs = [poids[i] * (notes_a[i] - notes_b[i]) for i in range(len(poids))]
    P = [i for i, c in enumerate(contribs) if c > 0]
    C = [i for i, c in enumerate(contribs) if c < 0]
    return contribs, P, C

def afficher_resultats(titre, status, explication):
    """Affiche proprement le résultat d'un modèle d'optimisation."""
    print(f"\n=== {titre} ===")
    if status == "OPTIMAL" and explication:
        print("SUCCÈS : Une explication a été trouvée :")
        for groupe in explication:
            print(f"  • {groupe}")
    else:
        print("ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.")
    print("-" * 50)

## 3. Question 1 : Explication de type (1-1)

**Démarche** : Nous cherchons à coupler chaque critère défavorable à un unique critère favorable qui le compense individuellement.

**Contrainte** : Chaque "Pro" est utilisé au plus une fois, chaque "Con" est couvert une fois.

**Condition** : $c_{pro} + c_{con} > 0$.

In [39]:
def explication_1_1(notes_a, notes_b, poids, features):
    """
    Calcule une explication de type (1-1) où chaque point fort compense un unique point faible.
    
    Args:
        notes_a (list): Notes du candidat supérieur.
        notes_b (list): Notes du candidat inférieur.
        
    Returns:
        tuple: (status, explication) où status est "OPTIMAL" ou "INFEASIBLE" 
               et explication est une liste de chaînes décrivant les binômes.
    """
    contribs, P, C = preparer_donnees(notes_a, notes_b, poids)
    
    m = gp.Model("Q1_1_1")
    m.Params.OutputFlag = 0
    
    # x[i,j] = 1 si le pro i compense le con j
    x = m.addVars(P, C, vtype=GRB.BINARY, name="x")
    
    # Contraintes : Couplage parfait
    for j in C:
        m.addConstr(gp.quicksum(x[i,j] for i in P) == 1)
    for i in P:
        m.addConstr(gp.quicksum(x[i,j] for j in C) <= 1)
        
    # Validité : pro + con > 0
    for i in P:
        for j in C:
            if contribs[i] + contribs[j] <= 0:
                m.addConstr(x[i,j] == 0)

    m.optimize()
    
    if m.Status == GRB.OPTIMAL:
        res = [f"{features[i]} (+{contribs[i]}) compense {features[j]} ({contribs[j]})" 
                       for i in P for j in C if x[i,j].X > 0.5]
        return "OPTIMAL", res
    return "INFEASIBLE", None

In [40]:
status, explication = explication_1_1(notes_x, notes_y, poids, matieres)
afficher_resultats("QUESTION 1 (1-1) : Xavier vs Yvonne", status, explication)


=== QUESTION 1 (1-1) : Xavier vs Yvonne ===
SUCCÈS : Une explication a été trouvée :
  • Anatomie (+32) compense Chirurgie (-28)
  • Diagnostic (+36) compense Forensic Pathology (-35)
  • Epidemiologie (+48) compense Génétique (-42)
--------------------------------------------------


## 4. Question 2: Explication (1-m)

**Démarche** : Nous généralisons le modèle.

**Type (1-m)** : Un avantage puissant peut compenser plusieurs faiblesses. C'est utile quand un candidat excelle dans une matière à gros coefficient.

In [41]:
def explication_1_m(notes_a, notes_b, poids, features, epsilon=1e-4):
    """
    Calcule une explication de type (1-m) où un point fort peut compenser plusieurs points faibles.
    
    Args:
        notes_a (list): Notes du candidat supérieur.
        notes_b (list): Notes du candidat inférieur.
        poids (list): Coefficients des matières.
        features (list): Noms des matières.
        epsilon (float): Seuil de supériorité pour le trade-off.
        
    Returns:
        tuple: (status, explication) où explication est une liste de chaînes.
    """
    # Calcul des contributions
    contribs, P, C = preparer_donnees(notes_a, notes_b, poids)
    
    # Modèle Gurobi
    m = gp.Model("Explication_1_m")
    m.setParam('OutputFlag', 0) # Mode silencieux

    # Variables
    # x[i,j] = 1 si Pro i couvre Con j
    x = {}
    for i in P:
        for j in C:
            x[i, j] = m.addVar(vtype=GRB.BINARY, name=f"link_{i}_{j}")
    
    # y[i] = 1 si Pro i est utilisé
    y = {}
    for i in P:
        y[i] = m.addVar(vtype=GRB.BINARY, name=f"use_{i}")

    # Contrainte C1: Chaque Con doit être couvert exactement une fois
    for j in C:
        m.addConstr(gp.quicksum(x[i, j] for i in P) == 1, name=f"cover_{j}")

    # Contrainte C2: Lien x_ij <= y_i
    for i in P:
        for j in C:
            m.addConstr(x[i, j] <= y[i], name=f"link_logic_{i}_{j}")

    # Contrainte C3: Somme pondérée positive pour chaque groupe (1-m)
    # delta_i * y_i + sum(contribs_j * x_ij) >= epsilon * y_i
    for i in P:
        sum_cons = gp.quicksum(contribs[j] * x[i, j] for j in C)
        m.addConstr(contribs[i] * y[i] + sum_cons >= epsilon * y[i], name=f"validity_{i}")

    # Résolution
    m.optimize()

    # Analyse
    if m.Status == GRB.OPTIMAL:
        res = []
        for i in P:
            if y[i].X > 0.5:
                cons = [features[j] for j in C if x[i, j].X > 0.5]
                res.append(f"{features[i]} compense le groupe {cons}")
        return "OPTIMAL", res
    elif m.Status == GRB.INFEASIBLE:
        return "INFEASIBLE", None
    else:
        return f"Status {m.Status}", None

In [42]:
status, result = explication_1_m(notes_w, notes_w_prime, poids, matieres)
afficher_resultats("QUESTION 2 (1-m) : w vs w'", status, result)


=== QUESTION 2 (1-m) : w vs w' ===
SUCCÈS : Une explication a été trouvée :
  • Anatomie compense le groupe ['Biologie', 'Chirurgie', 'Epidemiologie', 'Forensic Pathology']
  • Génétique compense le groupe []
--------------------------------------------------


In [43]:
status, result = explication_1_m(notes_u, notes_v, poids, matieres)
afficher_resultats("QUESTION 2 (1-m) : u vs v", status, result)


=== QUESTION 2 (1-m) : u vs v ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------


## 5. Question 3: Explication (m-1)

**Démarche** : Nous généralisons le modèle.

**Type (m-1)** : Plusieurs petits avantages s'unissent pour compenser une faiblesse majeure.

In [44]:
def explication_m_1(candidate_sup, candidate_inf, notes_a, notes_b, poids, features):
    """
    Calcule une explication de type (m-1) où plusieurs points forts s'unissent 
    pour compenser un seul point faible.
    
    Args:
        notes_a (list): Notes du candidat supérieur.
        notes_b (list): Notes du candidat inférieur.
        poids (list): Coefficients des matières.
        features (list): Noms des matières.
        
    Returns:
        tuple: (status, explication) où explication est une liste de chaînes.
    """
    # Calcul des contributions
    contribs, P, C = preparer_donnees(notes_a, notes_b, poids)

    # Modèle Gurobi
    m = gp.Model(f"Explication_m_1_{candidate_sup}_{candidate_inf}")
    m.setParam('OutputFlag', 0)

    # Variables x[i, j] : Pro i aide à couvrir Con j
    x = {}
    for i in P:
        for j in C:
            x[i, j] = m.addVar(vtype=GRB.BINARY, name=f"x_{features[i]}_{features[j]}")

    # Contrainte C1: Chaque Pro utilisé au max 1 fois
    for i in P:
        m.addConstr(gp.quicksum(x[i, j] for j in C) <= 1, name=f"disjoint_{features[i]}")

    # Contrainte C2: Chaque Con doit être compensé (Somme Pros + Con >= 0)
    for j in C:
        m.addConstr(gp.quicksum(contribs[i] * x[i, j] for i in P) + contribs[j] >= 0, 
                    name=f"cover_{features[j]}")

    # Résolution
    m.optimize()

    # Analyse
    if m.Status == GRB.OPTIMAL:
        res = []
        for j in C:
            avantages = [features[i] for i in P if x[i,j].X > 0.5]
            res.append(f"L'union de {avantages} compense {features[j]} ({contribs[j]})")
        return "OPTIMAL", res
    return "INFEASIBLE", None

In [45]:
status, result = explication_m_1("y", "z", notes_y, notes_z, poids, matieres)
afficher_resultats("QUESTION 3 (m-1) : Candidat y vs z", status, result)


=== QUESTION 3 (m-1) : Candidat y vs z ===
SUCCÈS : Une explication a été trouvée :
  • L'union de ['Anatomie'] compense Biologie (-56)
  • L'union de ['Forensic Pathology', 'Génétique'] compense Diagnostic (-108)
  • L'union de ['Chirurgie'] compense Epidemiologie (-6)
--------------------------------------------------


In [46]:
status, result = explication_m_1("z", "t", notes_z, notes_t, poids, matieres)
afficher_resultats("QUESTION 3 (m-1) : Candidat z vs t", status, result)


=== QUESTION 3 (m-1) : Candidat z vs t ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------


## 6. Question 4: Modèle Hybride

**Démarche** : Certains cas, comme $u > v$, ne possèdent pas d'explication simple. Nous implémentons un modèle hybride qui autorise une partition arbitraire des critères en groupes (1-m) ou (m-1). Nous utilisons une formulation avec des variables binaires et des contraintes de type "Big-M" pour activer les trade-offs.

In [47]:
def explication_hybride(notes_a, notes_b, poids, features):
    """
    Résout le problème d'explication mixte (Question 4).
    Autorise la création d'une partition flexible combinant des structures (1-m) et (m-1).
    
    Args:
        notes_a (list): Notes du candidat supérieur.
        notes_b (list): Notes du candidat inférieur.
        epsilon (float): Seuil de supériorité pour valider un groupe.
        
    Returns:
        tuple: (status, explication) où explication est une liste de chaînes de caractères.
    """
    # Calcul des contributions
    contribs, P, C = preparer_donnees(notes_a, notes_b, poids)

    # Modèle
    m = gp.Model("Mixed_Explanation")
    m.setParam('OutputFlag', 0)
    
    # Variables de liaison pour les deux types de structures
    x_1m = {} # x_1m[i,j] = 1 si le Pro i (Hub) couvre le Con j
    x_m1 = {} # x_m1[i,j] = 1 si le Con j (Hub) est couvert par le Pro i

    for i in P:
        for j in C:
            x_1m[i, j] = m.addVar(vtype=GRB.BINARY, name=f"1m_{features[i]}_{features[j]}")
            x_m1[i, j] = m.addVar(vtype=GRB.BINARY, name=f"m1_{features[i]}_{features[j]}")

    # Indicateurs de rôle "Hub"
    # h_P[i] = 1 si le Pro i est utilisé comme centre d'un (1-m)
    h_P = {i: m.addVar(vtype=GRB.BINARY) for i in P}
    
    # h_C[j] = 1 si le Con j est utilisé comme centre d'un (m-1)
    h_C = {j: m.addVar(vtype=GRB.BINARY) for j in C}

    # Contraintes
    # Contrainte C1: Tout Con doit être couvert exactement une fois
    for j in C:
        m.addConstr(gp.quicksum(x_1m[i, j] for i in P) + h_C[j] == 1, name=f"Cover_{j}")

    # Contrainte C2: Tout Pro utilisé au max une fois
    for i in P:
        m.addConstr(h_P[i] + gp.quicksum(x_m1[i, j] for j in C) <= 1, name=f"Use_{i}")

    # Contrainte C3: Cohérence logique des liens
    for i in P:
        for j in C:
            m.addConstr(x_1m[i, j] <= h_P[i], name=f"Logic_1m_{i}_{j}")
            m.addConstr(x_m1[i, j] <= h_C[j], name=f"Logic_m1_{i}_{j}")

    # Contrainte C4: Validité des Trade-offs (Somme pondérée > 0)
    
    for i in P: # Pour chaque Pro Hub (Structure 1-m): delta_i + sum(delta_j * x_1m_ij) >= 0
        contrib_cons = gp.quicksum(contribs[j] * x_1m[i, j] for j in C)
        m.addConstr(contribs[i] * h_P[i] + contrib_cons >= 0, name=f"Valid_1m_{i}")
    
    for j in C: # Pour chaque Con Hub (Structure m-1): sum(delta_i * x_m1_ij) + delta_j >= 0
        contrib_pros = gp.quicksum(contribs[i] * x_m1[i, j] for i in P)
        m.addConstr(contrib_pros + contribs[j] * h_C[j] >= 0, name=f"Valid_m1_{j}")

    # Résolution
    m.optimize()

    # Analyse
    if m.Status == GRB.OPTIMAL:
        res = []
        # Structures (1-m)
        for i in P:
            if h_P[i].X > 0.5:
                cons_covered = [features[j] for j in C if x_1m[i, j].X > 0.5]
                if cons_covered:
                    res.append(f"Groupe (1-m) : L'avantage {features[i]} (+{contribs[i]}) compense {cons_covered}")
        
        # Structures (m-1)
        for j in C:
            if h_C[j].X > 0.5:
                pros_used = [features[i] for i in P if x_m1[i, j].X > 0.5]
                val_pros = sum(contribs[i] for i in P if x_m1[i, j].X > 0.5)
                res.append(f"Groupe (m-1) : Les avantages {pros_used} (+{val_pros}) compensent {features[j]} ({contribs[j]})")
        
        return "OPTIMAL", res
    
    return "INFEASIBLE", None

In [48]:
status, result = explication_hybride(notes_z, notes_t, poids, matieres)
afficher_resultats("QUESTION 4 (hybride) : Candidat z vs t", status, result)


=== QUESTION 4 (hybride) : Candidat z vs t ===
SUCCÈS : Une explication a été trouvée :
  • Groupe (1-m) : L'avantage Biologie (+126) compense ['Diagnostic', 'Epidemiologie']
  • Groupe (m-1) : Les avantages ['Forensic Pathology', 'Génétique'] (+76) compensent Chirurgie (-70)
--------------------------------------------------


In [49]:
status, result = explication_hybride(notes_a1, notes_a2, poids, matieres)
afficher_resultats("QUESTION 4 (hybride) : Candidat a1 vs a2", status, result)


=== QUESTION 4 (hybride) : Candidat a1 vs a2 ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------


## 7. Application aux données réelles

### 1. Dataset Breast Cancer

### 2. Dataset RATP

L'idée est d'expliquer, en utilisant les algorithmes développés, quelles stations de métro est plus prioritaire pour être rénové. 

On commence par faire un scoring en prenant la somme pondérée des features des stations pour avoir une idée de leur classement en terme de priorité de rénovation.

In [50]:
import pandas as pd

ratp_data = pd.read_csv('data/ratp_cleaned_data.csv', index_col=0, sep=';')
ratp_weights = [0.021, 0.188, 0.038, 0.322, 16.124, 67.183, 16.124]
ratp_feature_cols = ratp_data.columns.tolist()

stations_dict = {}

for index, row in ratp_data.iterrows():
    station_name = index
    values = row[ratp_feature_cols].values.tolist()
    stations_dict[station_name] = values


# 1. Create a dictionary of just the scores
scores = {
    key: sum(val * w for val, w in zip(values, ratp_weights)) 
    for key, values in stations_dict.items()
}

print("--- Calculated Scores ---")
for key, score in scores.items():
    print(f"Key '{key}': {score:.2f}")


# 3. Sort the original data based on these scores
# We look up the score in the 'scores' dict we just made
sorted_data = dict(sorted(
    stations_dict.items(), 
    key=lambda item: scores[item[0]], 
    reverse=True
))

print("\n--- Final Sorted Data ---")
print(sorted_data)

--- Calculated Scores ---
Key 'Odéon (Ligne 4)': 9484.28
Key 'Place d'Italie (Lign 6)': 9457.61
Key 'Jussieu (Ligne 7)': 9436.20
Key 'Nation (Ligne 9)': 9389.68
Key 'La Motte Picquet-Grenelle (Ligne 10)': 9349.76
Key 'Porte d'Orléans (Ligne 4)': 9328.05
Key 'Daumenil (Ligne 6)': 9144.58
Key 'Vaugirard (Ligne 12)': 9107.66
Key 'Oberkampf (Ligne 9)': 9229.01
Key 'Reuilly-Diderot (Ligne 1)': 9240.69

--- Final Sorted Data ---
{'Odéon (Ligne 4)': [85000.0, 8100.0, 35500.0, 3450.0, 75.0, 16.2, 88.0], "Place d'Italie (Lign 6)": [81000.0, 8100.0, 37500.0, 3150.0, 67.0, 17.6, 95.0], 'Jussieu (Ligne 7)': [74000.0, 8900.0, 37000.0, 4050.0, 68.0, 16.8, 79.0], 'Nation (Ligne 9)': [74000.0, 7100.0, 42000.0, 4550.0, 77.0, 15.2, 73.0], 'La Motte Picquet-Grenelle (Ligne 10)': [72000.0, 7500.0, 33000.0, 4250.0, 88.0, 13.2, 93.0], "Porte d'Orléans (Ligne 4)": [71000.0, 7300.0, 31500.0, 4600.0, 76.0, 15.8, 93.0], 'Reuilly-Diderot (Ligne 1)': [72000.0, 8700.0, 36000.0, 4000.0, 66.0, 16.6, 78.0], 'Oberkamp

On voit alors que c'est la station Odéon qui est la plus susceptible à avoir besoin de rénovation. On cacule 1 à 1, dans l'ordre de la liste, l'explication fournie par notre algorithme (1-m) et (m-1) mélangé.

In [51]:
for i in range(len(ratp_data)-1):
    station_i = ratp_data.index[i]
    station_i1 = ratp_data.index[i+1]
    notes_i = stations_dict[station_i]
    notes_j = stations_dict[station_i1]
    status, result = explication_hybride(notes_i, notes_j, ratp_weights, ratp_feature_cols)
    afficher_resultats(f"DONNÉES RATP : La station {station_i} vs {station_i1}", status, result)


=== DONNÉES RATP : La station Odéon (Ligne 4) vs Place d'Italie (Lign 6) ===
SUCCÈS : Une explication a été trouvée :
  • Groupe (1-m) : L'avantage peak-entering-passengers/h (+84.0) compense ['off-peak-entering-passengers/h']
  • Groupe (m-1) : Les avantages ['off-peak-passing-passengers/h'] (+96.60000000000001) compensent Station degradation level ([0,20]  scale) (-94.05620000000015)
  • Groupe (m-1) : Les avantages ['strategic priority [0,10]'] (+128.992) compensent connectivity index [0,100] (-112.868)
--------------------------------------------------

=== DONNÉES RATP : La station Place d'Italie (Lign 6) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Jussieu (Ligne 7) vs Nation (Ligne 9) ===
SUCCÈS : Une explication a été trouvée :
  • Groupe (1-m) : L'avantage peak-passing-passengers/h (+338.4) compense ['off-peak-passing-passengers/h', 'strategic

On obtient alors les explicaitons suivantes :
- Odéon -> Place d'Italie 
- Jussieu -> Nation 
- La Motte Picquet-Grenelle -> Porte D'Orléans
- Porte d'Orléans -> Daumesnil
- Daumenil -> Vaugirard

On essaie donc de "boucher les trous évidents" si on en trouve. Par exemple, on essaie d'expliquer que Place D'Italie prime sur Nation.


In [54]:
# Place d'Italie vs Nation
station_place_italie = ratp_data.index[1]
notes_place_italie = stations_dict[station_place_italie]
station_nation = ratp_data.index[3]
notes_nation = stations_dict[station_nation]
status, result = explication_hybride(notes_place_italie, notes_nation, ratp_weights, ratp_feature_cols)
afficher_resultats(f"DONNÉES RATP : La station {station_place_italie} vs {station_nation}", status, result)


# Nation vs Porte d'Orléans
station_nation = ratp_data.index[3]
notes_nation = stations_dict[station_nation]
station_porte_orleans = ratp_data.index[5]
notes_porte_orleans = stations_dict[station_porte_orleans]
status, result = explication_hybride(notes_nation, notes_porte_orleans, ratp_weights, ratp_feature_cols)
afficher_resultats(f"DONNÉES RATP : La station {station_nation} vs {station_porte_orleans}", status, result)

# Odéon vs La motte Picquet
station_odeon = ratp_data.index[0]
notes_odeon = stations_dict[station_odeon]
station_la_motte_picquet = ratp_data.index[4]
notes_la_motte_picquet = stations_dict[station_la_motte_picquet]
status, result = explication_hybride(notes_odeon, notes_la_motte_picquet, ratp_weights, ratp_feature_cols)
afficher_resultats(f"DONNÉES RATP : La station {station_odeon} vs {station_la_motte_picquet}", status, result)


=== DONNÉES RATP : La station Place d'Italie (Lign 6) vs Nation (Ligne 9) ===
SUCCÈS : Une explication a été trouvée :
  • Groupe (1-m) : L'avantage connectivity index [0,100] (+354.72799999999995) compense ['off-peak-entering-passengers/h', 'strategic priority [0,10]']
  • Groupe (m-1) : Les avantages ['peak-entering-passengers/h', 'peak-passing-passengers/h', 'Station degradation level ([0,20]  scale)'] (+496.23920000000015) compensent off-peak-passing-passengers/h (-450.8)
--------------------------------------------------

=== DONNÉES RATP : La station Nation (Ligne 9) vs Porte d'Orléans (Ligne 4) ===
SUCCÈS : Une explication a été trouvée :
  • Groupe (1-m) : L'avantage off-peak-entering-passengers/h (+399.0) compense ['Station degradation level ([0,20]  scale)', 'connectivity index [0,100]']
  • Groupe (m-1) : Les avantages ['peak-entering-passengers/h'] (+63.00000000000001) compensent peak-passing-passengers/h (-37.6)
  • Groupe (m-1) : Les avantages ['strategic priority [0,10]

On a alors :
- Odéon prime sur Place d'Italie
- Odéon ne prime pas sur Jussieu pour l'instant
- Odéon prime sur Nation par transitivité car Place d'Italie prime sur Nation
- Odéon prime sur La Motte Picquet
- Odéon prime sur Porte d'Orléans par transitivié car Nation prime sur Porte d'Orléans
- Odéon prime sur Daumesnil par transitivité car Porte d'Orléans prime sur Daumesnil
- Odéon prime sur Vaugirard par transitivité car Daumesnil prime sur Vaugirard
- Odéon ne prime pas sur Oberkampf pour l'instant
- Odéon ne prime pas sur Reuilly Diderot pour l'instant

Afin de procéder avec les trois stations restantes, on essaie de voir quelles stations priment sur eux.

In [55]:
# Jussieu
station_jussieu = ratp_data.index[2]
notes_jussieu = stations_dict[station_jussieu]

for i in range(len(ratp_data)):
    if i == 2:
        continue
    station_i = ratp_data.index[i]
    notes_i = stations_dict[station_i]
    status, result = explication_hybride(notes_i, notes_jussieu, ratp_weights, ratp_feature_cols)
    afficher_resultats(f"DONNÉES RATP : La station {station_i} vs {station_jussieu}", status, result)


# Oberkampf
station_oberkampf = ratp_data.index[8]
notes_oberkampf = stations_dict[station_oberkampf]

for i in range(len(ratp_data)):
    if i == 8:
        continue
    station_i = ratp_data.index[i]
    notes_i = stations_dict[station_i]
    status, result = explication_hybride(notes_i, notes_oberkampf, ratp_weights, ratp_feature_cols)
    afficher_resultats(f"DONNÉES RATP : La station {station_i} vs {station_oberkampf}", status, result)


# Reuilly Diderot
station_reuilly_diderot = ratp_data.index[9]
notes_reuilly_diderot = stations_dict[station_reuilly_diderot]

for i in range(len(ratp_data)):
    if i == 9:
        continue
    station_i = ratp_data.index[i]
    notes_i = stations_dict[station_i]
    status, result = explication_hybride(notes_i, notes_reuilly_diderot, ratp_weights, ratp_feature_cols)
    afficher_resultats(f"DONNÉES RATP : La station {station_i} vs {station_reuilly_diderot}", status, result)


=== DONNÉES RATP : La station Odéon (Ligne 4) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Place d'Italie (Lign 6) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Nation (Ligne 9) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station La Motte Picquet-Grenelle (Ligne 10) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Porte d'Orléans (Ligne 4) vs Jussieu (Ligne 7) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
-------------------------------

On trouve alors les observations suivantes.
- Odéon prime sur Oberkampf par transitivité car Place d'Italie prime sur Oberlampf.
- Odéon prime sur Reuilly Diderot.

Il n'y a aucune station qui prime sur Jussieu.

In [56]:
# Odéon
station_odeon = ratp_data.index[0]
notes_odeon = stations_dict[station_odeon]

for i in range(len(ratp_data)):
    if i == 0:
        continue
    station_i = ratp_data.index[i]
    notes_i = stations_dict[station_i]
    status, result = explication_hybride(notes_i, notes_odeon, ratp_weights, ratp_feature_cols)
    afficher_resultats(f"DONNÉES RATP : La station {station_i} vs {station_odeon}", status, result)


=== DONNÉES RATP : La station Place d'Italie (Lign 6) vs Odéon (Ligne 4) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Jussieu (Ligne 7) vs Odéon (Ligne 4) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Nation (Ligne 9) vs Odéon (Ligne 4) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station La Motte Picquet-Grenelle (Ligne 10) vs Odéon (Ligne 4) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
--------------------------------------------------

=== DONNÉES RATP : La station Porte d'Orléans (Ligne 4) vs Odéon (Ligne 4) ===
ÉCHEC : Aucune explication de ce type n'est possible pour ces candidats.
---------------------------------------

Il n'y a aucune station qui prime sur Odéon non plus. On en déduit que, bien que Odéon prime sur toutes les autres station, et prime sur Jussieu en terme de somme pondérée des features, on ne peut pas l'expliquer avec nos algorithmes présent.

### 3. Données avec 27 features