# 04_All_Experiments.ipynb ‚Äî Failed Experiments & Ablations


## Configuration

In [7]:
import sys
import pandas as pd
import numpy as np
from scipy import sparse

# Ajout du path pour acc√©der au dossier src
sys.path.append('..')

from src.preprocessing import DataLoader
from src.metrics import mapk_score
# Import de toutes les classes exp√©rimentales d√©finies dans src/models/experimental.py
from src.models import (
    BM25Recommender,
    EASERecommender,
    SVDRecommender,
    DiversifiedRecommender,
    EnsembleHybridRecommender,
    HistoryFilterRecommender,
    LowInteractionRecommender,
    CoupledSemanticRecommender,
    SemanticHybridRecommenderChatGPT

)

# --- 1. CONFIGURATION & DONN√âES ---
print("--- Chargement des donn√©es ---")
loader = DataLoader('../data/interactions_train.csv', '../data/items.csv')
train_df, val_df = loader.get_time_split(train_ratio=0.8)

# Cr√©ation de la Matrice de Validation (Ground Truth) une seule fois
print("Construction de la matrice de validation...")
val_rows = val_df['u_idx'].values
val_cols = val_df['i_idx'].values
val_data = np.ones(len(val_df))
val_matrix = sparse.csr_matrix(
    (val_data, (val_rows, val_cols)),
    shape=(loader.n_users, loader.n_items)
)

# Liste pour stocker les r√©sultats
results = []

def run_experiment(model_class, name, **kwargs):
    """
    Fonction utilitaire pour entra√Æner, pr√©dire et √©valuer un mod√®le exp√©rimental.
    """
    print(f"\nüß™ EXP√âRIENCE : {name}")
    try:
        # Instanciation
        model = model_class(loader.n_users, loader.n_items)

        # Entra√Ænement
        print(f"   -> Entra√Ænement avec params : {kwargs}...")
        model.fit(train_df, loader.items_df, **kwargs)

        # Pr√©diction
        print("   -> Pr√©diction...")
        preds = model.predict(k=10)

        # √âvaluation
        score = mapk_score(preds, val_matrix, k=10)
        print(f"   -> ‚ùå Score MAP@10 : {score:.5f}")

        results.append({
            'Approche': name,
            'MAP@10': score,
            'Param√®tres': str(kwargs),
            'Statut': 'Inf√©rieur au Best Model'
        })

    except Exception as e:
        print(f"   -> üí• CRASH : {e}")
        results.append({'Approche': name, 'MAP@10': 0.0, 'Param√®tres': str(kwargs), 'Statut': 'Erreur/OOM'})

--- Chargement des donn√©es ---
Construction de la matrice de validation...


# --- 2. LANCEMENT DES EXP√âRIENCES ---

# ---------------------------------------------------------
# GROUPE A : Changement de Mod√®le Math√©matique
# ---------------------------------------------------------

# 1. BM25 (Probabiliste)
# Id√©e : Mieux g√©rer la saturation des termes que TF-IDF.

In [8]:
run_experiment(BM25Recommender, "BM25 Probabilistic", k1=1.5, b=0.75)


üß™ EXP√âRIENCE : BM25 Probabilistic
   -> Entra√Ænement avec params : {'k1': 1.5, 'b': 0.75}...
Fitting EXP: BM25 Model (k1=1.5, b=0.75)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.19539


# 2. EASE (Linear Autoencoder)
# Id√©e : Apprendre la matrice de poids optimale directement.
# Probl√®me : Tr√®s lourd en RAM, risque d'overfitting sur ce dataset.

In [9]:
run_experiment(EASERecommender, "EASE (Linear Model)", lambda_reg=500)


üß™ EXP√âRIENCE : EASE (Linear Model)
   -> Entra√Ænement avec params : {'lambda_reg': 500}...
Fitting EXP: EASE Model (Lambda=500)...
 Computing Gram Matrix (Heavy RAM)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.10668


# 3. SVD (Factorisation Matricielle)
# Id√©e : Capturer les facteurs latents cach√©s.
# Constat : Moins performant que le Content-Based sur ce dataset sp√©cifique.

In [10]:
run_experiment(SVDRecommender, "SVD (Latent Factors)", n_factors=30)


üß™ EXP√âRIENCE : SVD (Latent Factors)
   -> Entra√Ænement avec params : {'n_factors': 30}...
Fitting EXP: SVD Model (Factors=30)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.04000


# ---------------------------------------------------------
# GROUPE B : Strat√©gies Temporelles Avanc√©es
# ---------------------------------------------------------

# 4. Ensemble Short-Term / Long-Term
# Id√©e : Combiner un mod√®le 'r√©cent' (7j) et un 'historique' (90j).
# Constat : Complexit√© inutile, un simple half-life de 30j suffit.

In [11]:
run_experiment(EnsembleHybridRecommender, "Ensemble Short/Long Term", half_lives=[7, 90])


üß™ EXP√âRIENCE : Ensemble Short/Long Term
   -> Entra√Ænement avec params : {'half_lives': [7, 90]}...
Fitting EXP: Ensemble Model with Half-lives: [7, 90]...
   -> Sub-model 7 days...
   -> Sub-model 90 days...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.20263


# ---------------------------------------------------------
# GROUPE C : Filtrage et Contraintes
# ---------------------------------------------------------

# 5. Diversification (Auteur)
# Id√©e : Interdire plus de 2 livres du m√™me auteur dans le top 10.
# Constat : Baisse m√©canique du MAP@K car on retire des "vrais" items pertinents.

In [12]:
run_experiment(DiversifiedRecommender, "Diversification (Max 2/Author)")


üß™ EXP√âRIENCE : Diversification (Max 2/Author)
   -> Entra√Ænement avec params : {}...
Fitting EXP: Diversified Model (Max 2 books/author)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.19403


# 6. Filtrage Strict "D√©j√† Vu"
# Id√©e : Interdire de recommander un livre d√©j√† lu (Score = -Infini).
# Constat : Baisse du score, le "re-buy" (ou relecture) est un signal positif ici.

In [13]:
run_experiment(HistoryFilterRecommender, "Filtre Strict Historique")


üß™ EXP√âRIENCE : Filtre Strict Historique
   -> Entra√Ænement avec params : {}...
Fitting EXP: History Filter Model (No Re-buy allowed)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.02075


# 7. Suppression Items Rares (Cold Start)
# Id√©e : Ignorer les items vus moins de 3 fois pour r√©duire le bruit.
# Constat : Perte d'information trop importante sur la "Long Tail".

In [14]:
run_experiment(LowInteractionRecommender, "Filtre Items Rares (<3 vues)", min_interactions=3)


üß™ EXP√âRIENCE : Filtre Items Rares (<3 vues)
   -> Entra√Ænement avec params : {'min_interactions': 3}...
Fitting EXP: Low Interaction Filter (Min 3 views)...
   -> Dropped 6938 interactions on rare items.
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.16306


# ---------------------------------------------------------
# GROUPE D : Architecture S√©mantique (It√©rations pr√©c√©dentes)
# ---------------------------------------------------------

# 8. Coupled Semantic Ensemble (Archived Version)
# Probl√®me : Le boost de relecture √©tait appliqu√© DANS la moyenne pond√©r√©e.
# Le mod√®le "court terme" (qui ne connait pas les vieux items) tirait la moyenne vers le bas pour les favoris.

In [15]:
run_experiment(
    CoupledSemanticRecommender,
    "Coupled Semantic (Re-buy Dilution)",
    alpha=0.5,
    half_life_days=[30, 150],
    ensemble_weights=[0.7, 0.3]
)


üß™ EXP√âRIENCE : Coupled Semantic (Re-buy Dilution)
   -> Entra√Ænement avec params : {'alpha': 0.5, 'half_life_days': [30, 150], 'ensemble_weights': [0.7, 0.3]}...
Fitting EXP: Coupled Semantic Ensemble (Flawed Logic)...
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.20452


 # ---------------------------------------------------------
 # GROUPE E : Enrichissement S√©mantique (ChatGPT)
# ---------------------------------------------------------

# 9. Semantic Hybrid (ChatGPT Metadata),
 # Id√©e : Utiliser des descriptions et auteurs nettoy√©s par LLM pour am√©liorer le Content-Based

In [16]:
loader = DataLoader('../data/interactions_train.csv', '../data/items_enriched_ai_turbo.csv')

run_experiment(SemanticHybridRecommenderChatGPT, "Semantic Hybrid (ChatGPT Enriched)",
    alpha=0.5,
    half_life_days=[30, 150]
)


üß™ EXP√âRIENCE : Semantic Hybrid (ChatGPT Enriched)
   -> Entra√Ænement avec params : {'alpha': 0.5, 'half_life_days': [30, 150]}...
Fitting SemanticHybrid Decoupled | Alpha=0.5, HL=[30, 150]...
Loading S-BERT & Encoding ENRICHED Metadata...


Batches: 100%|‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà‚ñà| 473/473 [00:18<00:00, 25.72it/s]



--- Building Sub-Model 1 (Half-life=30d) ---

--- Building Sub-Model 2 (Half-life=150d) ---

Computing Global Popularity Scores...
Ensemble Model Fitted Successfully.
   -> Pr√©diction...
   -> ‚ùå Score MAP@10 : 0.20397


# --- 3. SYNTH√àSE DES R√âSULTATS ---

In [17]:
print("\n" + "="*50)
print("R√âSUM√â FINAL DES √âCHECS (FAILED EXPERIMENTS)")
print("="*50)

df_results = pd.DataFrame(results).sort_values('MAP@10', ascending=False)
pd.set_option('display.max_colwidth', None)
print(df_results[['Approche', 'MAP@10', 'Statut']])

print("\n--- ANALYSE DE L'√âCHEC DU 'COUPLED SEMANTIC' ---")
print("L'exp√©rience #8 montre que faire une moyenne pond√©r√©e na√Øve entre Court et Long terme")
print("est nuisible pour le 'Re-buy'. Le mod√®le court terme a 'oubli√©' les vieux favoris")
print("et dilue leur score lors de la fusion. La solution (Production) a √©t√© de s√©parer")
print("l'exploration (Ensemble) de l'exploitation (Re-buy sur historique global).")


R√âSUM√â FINAL DES √âCHECS (FAILED EXPERIMENTS)
                             Approche    MAP@10                   Statut
7  Coupled Semantic (Re-buy Dilution)  0.204524  Inf√©rieur au Best Model
8  Semantic Hybrid (ChatGPT Enriched)  0.203973  Inf√©rieur au Best Model
3            Ensemble Short/Long Term  0.202633  Inf√©rieur au Best Model
0                  BM25 Probabilistic  0.195390  Inf√©rieur au Best Model
4      Diversification (Max 2/Author)  0.194026  Inf√©rieur au Best Model
6        Filtre Items Rares (<3 vues)  0.163061  Inf√©rieur au Best Model
1                 EASE (Linear Model)  0.106677  Inf√©rieur au Best Model
2                SVD (Latent Factors)  0.040002  Inf√©rieur au Best Model
5            Filtre Strict Historique  0.020747  Inf√©rieur au Best Model

--- ANALYSE DE L'√âCHEC DU 'COUPLED SEMANTIC' ---
L'exp√©rience #8 montre que faire une moyenne pond√©r√©e na√Øve entre Court et Long terme
est nuisible pour le 'Re-buy'. Le mod√®le court terme a 'oubli√©' les v