# 📓 Notebook 02 – Outils et Visualisations DR5

> But : Ce notebook regroupe les outils interactifs développés pour explorer, diagnostiquer et affiner les spectres téléchargés du catalogue LAMOST DR5, sans relancer le pipeline complet.  
> Il est destiné à l’analyse exploratoire rapide, à la visualisation augmentée, et au debug scientifique.

<br/>

## ⚙️ Setup & Imports
L'environnement est initialisé dynamiquement avec détection de la racine du projet et ajout du dossier ``src/`` au ``sys.path``.  
On y importe les classes utilitaires ``AstroVisualizer`` et ``setup_project_env``.

In [None]:
# --- Imports des librairies externes ---
import os
import sys
from IPython.display import display, Markdown

# --- Imports de la librairie "astrospectro" ---
from utils import setup_project_env
from tools.visualizer import AstroVisualizer
from pipeline.classifier import SpectralClassifier

# --- Initialisation ---
paths = setup_project_env()
visualizer = AstroVisualizer(paths)

print("\nSetup terminé. Les outils de visualisation sont prêts.")

#

## Tableau de Bord de l'État du Dataset

1. **Importe ``DatasetBuilder`` :** On réutilise l'outil conçu pour gérer les lots d'entraînement.
2. ``_list_available_fits()`` : On appelle cette méthode pour qu'elle scanne le dossier ``data/raw/`` et compte tous les fichiers ``.fits.gz`` téléchargés.
3. ``_load_trained_log()`` : On appelle cette méthode pour qu'elle lise le ``fichier trained_spectra.csv`` et compte combien de spectres ont déjà été marqués comme "_utilisés_".

In [None]:
visualizer.display_dataset_dashboard()

#

## 🧠 Explorateur de Header FITS

Outil interactif permettant de charger dynamiquement un spectre ``.fits.gz`` et d’en afficher les métadonnées structurées.

### **Utilisation typique :**

- Vérifier la cohérence des champs : coordonnées, type d’objet, date, filtre, seeing…
- Déboguer un spectre problématique
- Détecter des valeurs aberrantes avant traitement massif

*Compatible avec les headers compressés grâce à ``astropy.io.fits.``*

In [None]:
display(Markdown("## Explorateur de Header FITS"))
display(Markdown("Utilisez le menu déroulant pour sélectionner un spectre et afficher ses métadonnées complètes."))
visualizer.interactive_header_explorer()

#

## ⚗️ Tuning Interactif des Raies Spectrales

Permet d’ajuster en direct les paramètres de détection des raies spectrales :

- **Prominence** (hauteur minimale pour détecter un pic)
- **Fenêtre** (largeur du sliding window autour du pic)

**Objectif : tester visuellement les hyperparamètres avant traitement global du dataset.**

In [None]:
display(Markdown("--- \n## Analyseur de Spectre Augmenté"))
display(Markdown(
    "Cet outil tout-en-un vous permet de visualiser un spectre, d'ajuster les "
    "paramètres de détection de pics en temps réel, et d'évaluer la qualité "
    "des données et de l'analyse."
))

from tools.visualizer import AstroVisualizer
visualizer = AstroVisualizer(paths)
# Cet appel unique crée maintenant l'interface complète
visualizer.interactive_peak_tuner()

#

## 🧼 Analyse des Features Nulles
Analyse de qualité des données extraites, avec graphique à barres des colonnes avec trop de valeurs nulles ``(0.0)``.

In [None]:
display(Markdown("--- \n## Analyse de la Qualité des Features"))
display(Markdown("Cet outil analyse le dernier fichier de features généré et montre le pourcentage de valeurs nulles pour chaque feature. C'est essentiel pour identifier les features peu informatives."))
visualizer.analyze_feature_zeros()

#

## 🌌 Carte de Couverture Céleste

Affiche une **projection Mollweide** des plans d’observation inclus dans les spectres téléchargés.

In [None]:
display(Markdown("--- \n## Carte de Couverture Céleste"))
display(Markdown("Cette carte montre la position des plans d'observation que tu as téléchargés. La taille et la couleur des points indiquent le nombre de spectres par plan."))
visualizer.plot_sky_coverage()

#

## 🔎 Inspecteur de Modèles Entraînés

Outil permettant d'explorer les modèles sauvegardés ``.pkl`` :

- Visualisation des hyperparamètres
- Affichage de la feature importance (triée)

**Très utile pour analyser la qualité du classifieur, l’importance des raies spectrales, et affiner le feature engineering.**

In [None]:
display(Markdown("--- \n## Inspecteur de Modèles Entraînés"))
display(Markdown(
    "Utilisez le menu déroulant pour sélectionner un modèle `.pkl` sauvegardé. "
    "Cet outil affichera ses hyperparamètres et un graphique montrant l'importance de chaque feature "
    "pour la classification."
))

# Cet appel unique crée l'interface d'inspection
visualizer.interactive_model_inspector()

#

## 🔭 Comparateur de Spectres Interactif

Cet outil puissant vous permet de superposer plusieurs spectres sur un même graphique pour une analyse comparative détaillée. C'est un instrument essentiel pour :

-   **Comparer des Étoiles de Même Type :** Visualisez les variations subtiles entre plusieurs étoiles de type 'G', par exemple.
-   **Comparer des Types Différents :** Superposez un spectre de type 'A' et un de type 'M' pour voir de vos propres yeux les différences fondamentales dans leurs signatures spectrales.
-   **Analyser l'Évolution Temporelle :** Si vous avez plusieurs observations d'une même étoile variable, vous pouvez les superposer pour étudier son évolution.

### Utilisation

1.  **Sélection Multiple :** Cliquez sur les noms de fichiers dans la liste. Maintenez la touche `Ctrl` (ou `Cmd` sur Mac) pour sélectionner plusieurs fichiers individuellement, ou `Shift` pour sélectionner une plage continue.
2.  **Normalisation :** Cochez la case "Normaliser les spectres" (recommandé) pour ramener tous les spectres à une échelle comparable.
3.  **Décalage Vertical :** Utilisez le slider "Décalage Y" pour espacer verticalement les spectres afin de mieux les distinguer et éviter qu'ils ne se chevauchent.

In [None]:
display(Markdown("--- \n## Comparateur de Spectres"))
display(Markdown("Sélectionnez plusieurs spectres (maintenez `Ctrl` ou `Shift`) pour les superposer. Ajustez le décalage pour mieux les distinguer."))
visualizer.interactive_spectra_comparator()

#

## Comparateur de normalisation de spectre (en développement)

*Cellule pour générer la figure de normalisation "Avant/Après"*

In [None]:
visualizer.plot_normalization_comparison()

#

## Cellule : Analyse d'Interprétabilité des Modèles (SHAP)

In [None]:
visualizer.interactive_shap_explainer()

#

In [None]:
from datetime import datetime, timezone
ts = datetime.now(timezone.utc).strftime("%Y%m%dT%H%M%SZ")
out_dir = os.path.join(visualizer.paths["LOGS_DIR"], "shap"); os.makedirs(out_dir, exist_ok=True)

visualizer.plot_shap_summary_bar(top_n=25, save_path=os.path.join(out_dir, f"shap_bar_{ts}.png"))
visualizer.plot_shap_beeswarm(max_display=20, save_path=os.path.join(out_dir, f"shap_beeswarm_{ts}.png"))

#

## Distribution des 50 sous-classes les plus fréquentes

In [None]:
# Distribution des sous-classes (top 15, en %)
visualizer.plot_subclass_distribution(top_n=25, normalize=True)

<br/>
<br/>

### Analyse en profondeur des features 

In [None]:
# Lancement complet (EDA + corr + RF + permutation) et sauvegardes dans logs/features/
summary = visualizer.feature_explorer(
    pattern=None,               # auto: <PROJECT_ROOT>/data/processed/features_*.csv
    save_dir=None,              # auto: <LOGS_DIR>/features
    max_hists=24,
    corr_top_n=30,
    rf_estimators=400,
    random_state=42,
    do_permutation=True,
)

# Re-tracer un bar chart des importances RF (si besoin, avec un autre top N)
visualizer._plot_feature_importances_bar(top_n=40,
    save_path=os.path.join(summary["save_dir"], "rf_importances_top40.png"))
