# üìì Notebook 02 ‚Äì Outils et Visualisations DR5

> But : Ce notebook regroupe les outils interactifs d√©velopp√©s pour explorer, diagnostiquer et affiner les spectres t√©l√©charg√©s du catalogue LAMOST DR5, sans relancer le pipeline complet.  
> Il est destin√© √† l‚Äôanalyse exploratoire rapide, √† la visualisation augment√©e, et au debug scientifique.

<br/>

## ‚öôÔ∏è Setup & Imports
L'environnement est initialis√© dynamiquement avec d√©tection de la racine du projet et ajout du dossier ``src/`` au ``sys.path``.  
On y importe les classes utilitaires ``AstroVisualizer`` et ``setup_project_env``.

In [None]:
# --- Imports des librairies externes ---
import os
import sys
from IPython.display import display, Markdown

# --- Imports de la librairie "astrospectro" ---
from utils import setup_project_env
from tools.visualizer import AstroVisualizer
from pipeline.classifier import SpectralClassifier

# --- Initialisation ---
paths = setup_project_env()
visualizer = AstroVisualizer(paths)

print("\nSetup termin√©. Les outils de visualisation sont pr√™ts.")

#

## Tableau de Bord de l'√âtat du Dataset

1. **Importe ``DatasetBuilder`` :** On r√©utilise l'outil con√ßu pour g√©rer les lots d'entra√Ænement.
2. ``_list_available_fits()`` : On appelle cette m√©thode pour qu'elle scanne le dossier ``data/raw/`` et compte tous les fichiers ``.fits.gz`` t√©l√©charg√©s.
3. ``_load_trained_log()`` : On appelle cette m√©thode pour qu'elle lise le ``fichier trained_spectra.csv`` et compte combien de spectres ont d√©j√† √©t√© marqu√©s comme "_utilis√©s_".

In [None]:
visualizer.display_dataset_dashboard()

#

## üß† Explorateur de Header FITS

Outil interactif permettant de charger dynamiquement un spectre ``.fits.gz`` et d‚Äôen afficher les m√©tadonn√©es structur√©es.

### **Utilisation typique :**

- V√©rifier la coh√©rence des champs : coordonn√©es, type d‚Äôobjet, date, filtre, seeing‚Ä¶
- D√©boguer un spectre probl√©matique
- D√©tecter des valeurs aberrantes avant traitement massif

*Compatible avec les headers compress√©s gr√¢ce √† ``astropy.io.fits.``*

In [None]:
display(Markdown("## Explorateur de Header FITS"))
display(Markdown("Utilisez le menu d√©roulant pour s√©lectionner un spectre et afficher ses m√©tadonn√©es compl√®tes."))
visualizer.interactive_header_explorer()

#

## ‚öóÔ∏è Tuning Interactif des Raies Spectrales

Permet d‚Äôajuster en direct les param√®tres de d√©tection des raies spectrales :

- **Prominence** (hauteur minimale pour d√©tecter un pic)
- **Fen√™tre** (largeur du sliding window autour du pic)

**Objectif : tester visuellement les hyperparam√®tres avant traitement global du dataset.**

In [None]:
display(Markdown("--- \n## Analyseur de Spectre Augment√©"))
display(Markdown(
    "Cet outil tout-en-un vous permet de visualiser un spectre, d'ajuster les "
    "param√®tres de d√©tection de pics en temps r√©el, et d'√©valuer la qualit√© "
    "des donn√©es et de l'analyse."
))

from tools.visualizer import AstroVisualizer
visualizer = AstroVisualizer(paths)
# Cet appel unique cr√©e maintenant l'interface compl√®te
visualizer.interactive_peak_tuner()

#

## üßº Analyse des Features Nulles
Analyse de qualit√© des donn√©es extraites, avec graphique √† barres des colonnes avec trop de valeurs nulles ``(0.0)``.

In [None]:
display(Markdown("--- \n## Analyse de la Qualit√© des Features"))
display(Markdown("Cet outil analyse le dernier fichier de features g√©n√©r√© et montre le pourcentage de valeurs nulles pour chaque feature. C'est essentiel pour identifier les features peu informatives."))
visualizer.analyze_feature_zeros()

#

## üåå Carte de Couverture C√©leste

Affiche une **projection Mollweide** des plans d‚Äôobservation inclus dans les spectres t√©l√©charg√©s.

In [None]:
display(Markdown("--- \n## Carte de Couverture C√©leste"))
display(Markdown("Cette carte montre la position des plans d'observation que tu as t√©l√©charg√©s. La taille et la couleur des points indiquent le nombre de spectres par plan."))
visualizer.plot_sky_coverage()

#

## üîé Inspecteur de Mod√®les Entra√Æn√©s

Outil permettant d'explorer les mod√®les sauvegard√©s ``.pkl`` :

- Visualisation des hyperparam√®tres
- Affichage de la feature importance (tri√©e)

**Tr√®s utile pour analyser la qualit√© du classifieur, l‚Äôimportance des raies spectrales, et affiner le feature engineering.**

In [None]:
display(Markdown("--- \n## Inspecteur de Mod√®les Entra√Æn√©s"))
display(Markdown(
    "Utilisez le menu d√©roulant pour s√©lectionner un mod√®le `.pkl` sauvegard√©. "
    "Cet outil affichera ses hyperparam√®tres et un graphique montrant l'importance de chaque feature "
    "pour la classification."
))

# Cet appel unique cr√©e l'interface d'inspection
visualizer.interactive_model_inspector()

#

## üî≠ Comparateur de Spectres Interactif

Cet outil puissant vous permet de superposer plusieurs spectres sur un m√™me graphique pour une analyse comparative d√©taill√©e. C'est un instrument essentiel pour :

-   **Comparer des √âtoiles de M√™me Type :** Visualisez les variations subtiles entre plusieurs √©toiles de type 'G', par exemple.
-   **Comparer des Types Diff√©rents :** Superposez un spectre de type 'A' et un de type 'M' pour voir de vos propres yeux les diff√©rences fondamentales dans leurs signatures spectrales.
-   **Analyser l'√âvolution Temporelle :** Si vous avez plusieurs observations d'une m√™me √©toile variable, vous pouvez les superposer pour √©tudier son √©volution.

### Utilisation

1.  **S√©lection Multiple :** Cliquez sur les noms de fichiers dans la liste. Maintenez la touche `Ctrl` (ou `Cmd` sur Mac) pour s√©lectionner plusieurs fichiers individuellement, ou `Shift` pour s√©lectionner une plage continue.
2.  **Normalisation :** Cochez la case "Normaliser les spectres" (recommand√©) pour ramener tous les spectres √† une √©chelle comparable.
3.  **D√©calage Vertical :** Utilisez le slider "D√©calage Y" pour espacer verticalement les spectres afin de mieux les distinguer et √©viter qu'ils ne se chevauchent.

In [None]:
display(Markdown("--- \n## Comparateur de Spectres"))
display(Markdown("S√©lectionnez plusieurs spectres (maintenez `Ctrl` ou `Shift`) pour les superposer. Ajustez le d√©calage pour mieux les distinguer."))
visualizer.interactive_spectra_comparator()

#

## Comparateur de normalisation de spectre (en d√©veloppement)

*Cellule pour g√©n√©rer la figure de normalisation "Avant/Apr√®s"*

In [None]:
visualizer.plot_normalization_comparison()

#

## Cellule : Analyse d'Interpr√©tabilit√© des Mod√®les (SHAP)

In [None]:
visualizer.interactive_shap_explainer()

#

In [None]:
from datetime import datetime, timezone
ts = datetime.now(timezone.utc).strftime("%Y%m%dT%H%M%SZ")
out_dir = os.path.join(visualizer.paths["LOGS_DIR"], "shap"); os.makedirs(out_dir, exist_ok=True)

visualizer.plot_shap_summary_bar(top_n=25, save_path=os.path.join(out_dir, f"shap_bar_{ts}.png"))
visualizer.plot_shap_beeswarm(max_display=20, save_path=os.path.join(out_dir, f"shap_beeswarm_{ts}.png"))

#

## Distribution des 50 sous-classes les plus fr√©quentes

In [None]:
# Distribution des sous-classes (top 15, en %)
visualizer.plot_subclass_distribution(top_n=25, normalize=True)

<br/>
<br/>

### Analyse en profondeur des features 

In [None]:
# Lancement complet (EDA + corr + RF + permutation) et sauvegardes dans logs/features/
summary = visualizer.feature_explorer(
    pattern=None,               # auto: <PROJECT_ROOT>/data/processed/features_*.csv
    save_dir=None,              # auto: <LOGS_DIR>/features
    max_hists=24,
    corr_top_n=30,
    rf_estimators=400,
    random_state=42,
    do_permutation=True,
)

# Re-tracer un bar chart des importances RF (si besoin, avec un autre top N)
visualizer._plot_feature_importances_bar(top_n=40,
    save_path=os.path.join(summary["save_dir"], "rf_importances_top40.png"))
