# Évaluation des Modèles de Recommandation d'Hôpitaux

Ce notebook effectue une évaluation complète de notre système de recommandation d'hôpitaux.

In [None]:
import sys
sys.path.append('../')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from google.cloud import bigquery
import os

from utils.data_preparation import load_data, prepare_datasets
from classification_service.service_classifier import train_service_classifier
from duration_prediction.duration_predictor import train_duration_predictor
from recommendation.hospital_recommender import HospitalRecommender
from evaluation.temporal_validation import TemporalValidator
from evaluation.metrics import (
    evaluate_service_classification,
    evaluate_duration_prediction,
    evaluate_recommendations
)

## 1. Chargement et Préparation des Données

In [None]:
# Charger les données
df_hospi = load_data()
datasets = prepare_datasets(df_hospi)

# Afficher les informations sur les données
print("Taille des ensembles de données :")
for name, df in datasets.items():
    print(f"{name}: {df.shape}")

## 2. Évaluation du Modèle de Classification des Services

In [None]:
# Initialiser le validateur temporel
validator = TemporalValidator(n_splits=3)

# Valider le modèle de classification
service_results = validator.validate_service_classifier(
    train_service_classifier,
    datasets['dpt_ens']
)

# Afficher les résultats
print("\nMétriques moyennes de classification :")
for metric, value in service_results['avg_metrics'].items():
    print(f"{metric}: {value:.4f}")

# Visualiser l'évolution des métriques
plt.figure(figsize=(12, 6))
metrics_to_plot = ['accuracy', 'macro_f1']
for metric in metrics_to_plot:
    values = [split[metric] for split in service_results['split_metrics']]
    plt.plot(values, label=metric)
plt.title('Évolution des Métriques de Classification')
plt.xlabel('Split Temporel')
plt.ylabel('Score')
plt.legend()
plt.show()

## 3. Évaluation du Modèle de Prédiction de Durée

In [None]:
# Valider le modèle de prédiction de durée
duration_results = validator.validate_duration_predictor(
    train_duration_predictor,
    datasets['dpt_ens']
)

# Afficher les résultats
print("\nMétriques moyennes de prédiction de durée :")
for metric, value in duration_results['avg_metrics'].items():
    print(f"{metric}: {value:.4f}")

# Visualiser l'évolution des métriques
plt.figure(figsize=(12, 6))
metrics_to_plot = ['mae', 'rmse']
for metric in metrics_to_plot:
    values = [split[metric] for split in duration_results['split_metrics']]
    plt.plot(values, label=metric)
plt.title('Évolution des Métriques de Prédiction de Durée')
plt.xlabel('Split Temporel')
plt.ylabel('Erreur')
plt.legend()
plt.show()

## 4. Évaluation du Système de Recommandation

In [None]:
# Créer des cas de test
test_cases = [
    {
        'patient_data': {
            'age': 45,
            'sexe': 'H',
            'pathologie': 'example_pathology',
            'region': 'Île-de-France'
        },
        'ground_truth': {
            'appropriate_hospitals': ['Hospital_1', 'Hospital_2'],
            'relevance_scores': {'Hospital_1': 0.9, 'Hospital_2': 0.8}
        }
    }
    # Ajouter plus de cas de test ici
]

# Initialiser le système de recommandation
recommender = HospitalRecommender()

# Valider le système de recommandation
recommendation_results = validator.validate_recommendation_system(
    recommender,
    datasets['dpt_ens'],
    test_cases
)

# Afficher les résultats
print("\nMétriques moyennes de recommandation :")
for metric, value in recommendation_results['avg_metrics'].items():
    print(f"{metric}: {value:.4f}")

## 5. Analyse des Tendances Temporelles

In [None]:
# Analyser les tendances temporelles
service_trends = validator.analyze_temporal_trends(service_results)
duration_trends = validator.analyze_temporal_trends(duration_results)

# Afficher les résultats
print("\nTendances temporelles - Classification des Services :")
for metric, trend in service_trends.items():
    print(f"{metric}:")
    print(f"  - Pente: {trend['slope']:.4f}")
    print(f"  - Stabilité: {trend['stability']:.4f}")

print("\nTendances temporelles - Prédiction de Durée :")
for metric, trend in duration_trends.items():
    print(f"{metric}:")
    print(f"  - Pente: {trend['slope']:.4f}")
    print(f"  - Stabilité: {trend['stability']:.4f}")

## 6. Conclusions et Recommandations

Basé sur les résultats ci-dessus, nous pouvons conclure :

1. **Classification des Services** :
   - Performance globale
   - Points forts et faiblesses par service
   - Stabilité temporelle

2. **Prédiction de Durée** :
   - Précision des prédictions
   - Variations par tranche de durée
   - Évolution temporelle

3. **Système de Recommandation** :
   - Pertinence des recommandations
   - Diversité des suggestions
   - Adaptation aux contraintes géographiques

### Recommandations d'Amélioration :

1. [À compléter après l'analyse des résultats]
2. [À compléter après l'analyse des résultats]
3. [À compléter après l'analyse des résultats]