# Session 1 : Fondamentaux de Plotly et Visualisations Interactives


## OBJECTIFS DE LA SESSION :
- Comprendre l'architecture de Plotly
- Maîtriser Plotly Express pour des visualisations rapides
- Explorer l'interactivité native de Plotly
- Créer des layouts professionnels avec subplots

### POURQUOI PLOTLY ?

Comparaison avec les autres bibliothèques :

| Bibliothèque  | Interactivité | Courbe apprentissage | Rendu web | Usage principal      |
|---------------|---------------|----------------------|-----------|----------------------|
| Matplotlib    |  Limitée    | Moyenne              |  Statique| Exploration rapide   |
| Seaborn       |  Aucune     | Facile               |  Statique| Visualisations stats |
| Plotly        |  Native     | Facile (Express)     |  HTML    | Dashboards web       |
| Bokeh         |  Native     | Difficile            |  HTML    | Viz complexes        |

PLOTLY = Interactivité + Simplicité + Qualité professionnelle


In [None]:
# Installation (si nécessaire)
# !pip install plotly pandas numpy

import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import pandas as pd
import numpy as np

### ARCHITECTURE DE PLOTLY

1. **Plotly Express (px)** : API haut niveau, syntaxe simple
   - Idéal pour : exploration rapide, graphiques standards
   - Principe : 1 ligne de code = 1 graphique interactif
   
2. **Plotly Graph Objects (go)** : API bas niveau, contrôle total
   - Idéal pour : customisation avancée, graphiques complexes
   - Principe : construction objet par objet

3. **Types de rendu** :
   - Notebook Jupyter : fig.show()
   - HTML standalone : fig.write_html("graph.html")
   - Image statique : fig.write_image("graph.png")
   - Dash app : intégration dans application web

In [3]:
# ============================================================================
# DÉMO 1 : PREMIER GRAPHIQUE INTERACTIF EN 5 LIGNES
# ============================================================================

print("\n" + "="*70)
print("DÉMO 1 : Mon Premier Graphique Interactif")
print("="*70)

# Chargement du dataset Iris (intégré dans Plotly)
df_iris = px.data.iris()
print("\n Dataset Iris - Aperçu :")
print(df_iris.head())

# Graphique interactif en 1 ligne !
fig1 = px.scatter(px.data.iris(), x="sepal_width", y="sepal_length", color="species")
fig = px.scatter(
    df_iris, 
    x="sepal_width", 
    y="sepal_length",
    color="species",  # Couleur par espèce
    size="petal_width",  # Taille selon largeur pétale
    hover_data=['petal_length'],  # Info au survol
    title=" Analyse des Iris - Sépales"
)

# Affichage
fig1.show() 


DÉMO 1 : Mon Premier Graphique Interactif

 Dataset Iris - Aperçu :
   sepal_length  sepal_width  petal_length  petal_width species  species_id
0           5.1          3.5           1.4          0.2  setosa           1
1           4.9          3.0           1.4          0.2  setosa           1
2           4.7          3.2           1.3          0.2  setosa           1
3           4.6          3.1           1.5          0.2  setosa           1
4           5.0          3.6           1.4          0.2  setosa           1


**INTERACTIVITÉ NATIVE**
 - Zoom : sélectionnez une zone"
 - Pan : déplacez le graphique"
 - Hover : survolez les points"
 - Légende : cliquez pour montrer/cacher"
 - Double-clic : réinitialiser"

## PARTIE 2 : PLOTLY EXPRESS - VISUALISATIONS RAPIDES 

### PLOTLY EXPRESS : GALERIE DES GRAPHIQUES ESSENTIELS

Syntaxe générale :

px.type_de_graphique(dataframe, x=..., y=..., color=..., **options)

Paramètres universels :
- x, y : colonnes pour axes
- color : coloration par catégorie
- size : taille proportionnelle
- hover_data : données supplémentaires au survol
- facet_row / facet_col : sous-graphiques
- animation_frame : animation temporelle
- title, labels : textes personnalisés

In [4]:
# Préparation d'un dataset de démonstration
np.random.seed(42)
df_demo = pd.DataFrame({
    'date': pd.date_range('2024-01-01', periods=100, freq='D'),
    'ventes': np.random.poisson(50, 100) + np.linspace(0, 20, 100),
    'profit': np.random.normal(1000, 200, 100),
    'categorie': np.random.choice(['A', 'B', 'C'], 100),
    'region': np.random.choice(['Nord', 'Sud', 'Est', 'Ouest'], 100)
})

print("\n" + "="*70)
print("DÉMO 2 : 5 Types de Graphiques avec Plotly Express")
print("="*70)


DÉMO 2 : 5 Types de Graphiques avec Plotly Express


In [5]:
# ============================================================================
# GRAPHIQUE 1 : SCATTER PLOT (Nuage de points)
# ============================================================================

print("\n SCATTER PLOT - Relation entre deux variables")

fig_scatter = px.scatter(
    df_demo,
    x='ventes',
    y='profit',
    color='categorie',
    size='ventes',
    hover_data=['date', 'region'],
    title=' Relation Ventes-Profit par Catégorie',
    labels={'ventes': 'Ventes (unités)', 'profit': 'Profit (€)'},
    color_discrete_sequence=px.colors.qualitative.Set2
)

# Customisation
fig_scatter.update_traces(marker=dict(opacity=0.7))
fig_scatter.show()


 SCATTER PLOT - Relation entre deux variables


In [6]:
# ============================================================================
# GRAPHIQUE 2 : LINE CHART (Courbe temporelle)
# ============================================================================

print("\nLINE CHART - Évolution temporelle")

fig_line = px.line(
    df_demo,
    x='date',
    y='ventes',
    color='categorie',
    title='Évolution des Ventes dans le Temps',
    labels={'ventes': 'Ventes quotidiennes', 'date': 'Date'}
)

# Ajouter des marqueurs sur les points
fig_line.update_traces(mode='lines+markers')
fig_line.show()


LINE CHART - Évolution temporelle


In [7]:
# ============================================================================
# GRAPHIQUE 3 : BAR CHART (Graphique en barres)
# ============================================================================

print("\n BAR CHART - Comparaison de catégories")

# Agrégation des données
df_agg = df_demo.groupby('categorie')['ventes'].sum().reset_index()

fig_bar = px.bar(
    df_agg,
    x='categorie',
    y='ventes',
    title=' Total des Ventes par Catégorie',
    color='ventes',
    color_continuous_scale='Blues',
    text='ventes'  # Afficher les valeurs sur les barres
)

# Positionner le texte
fig_bar.update_traces(textposition='outside')
fig_bar.show()


 BAR CHART - Comparaison de catégories


In [8]:
# ============================================================================
# GRAPHIQUE 4 : HISTOGRAM (Histogramme de distribution)
# ============================================================================

print("\n HISTOGRAM - Distribution des données")

fig_hist = px.histogram(
    df_demo,
    x='profit',
    color='categorie',
    nbins=20,
    title=' Distribution des Profits',
    marginal='box',  # Ajoute un boxplot au dessus
    hover_data=df_demo.columns
)

fig_hist.show()


 HISTOGRAM - Distribution des données


In [9]:
# ============================================================================
# GRAPHIQUE 5 : BOX PLOT (Boîte à moustaches)
# ============================================================================

print("\n BOX PLOT - Statistiques descriptives")

fig_box = px.box(
    df_demo,
    x='categorie',
    y='profit',
    color='region',
    title=' Distribution des Profits par Catégorie et Région',
    points='all',  # Afficher tous les points
    notched=True  # Afficher l'encoche (intervalle de confiance)
)

fig_box.show()


 BOX PLOT - Statistiques descriptives


In [10]:
# ============================================================================
# GRAPHIQUES BONUS : AUTRES TYPES UTILES
# ============================================================================

print("\n AUTRES GRAPHIQUES DISPONIBLES :")
print("   - px.pie() : Graphique circulaire")
print("   - px.sunburst() : Graphique hiérarchique")
print("   - px.treemap() : Carte arborescente")
print("   - px.violin() : Violin plot")
print("   - px.density_heatmap() : Heatmap de densité")
print("   - px.scatter_matrix() : Matrice de scatter plots")

# Exemple : Pie chart
df_pie = df_demo.groupby('categorie')['ventes'].sum().reset_index()
fig_pie = px.pie(
    df_pie,
    values='ventes',
    names='categorie',
    title=' Répartition des Ventes'
)
fig_pie.show()


 AUTRES GRAPHIQUES DISPONIBLES :
   - px.pie() : Graphique circulaire
   - px.sunburst() : Graphique hiérarchique
   - px.treemap() : Carte arborescente
   - px.violin() : Violin plot
   - px.density_heatmap() : Heatmap de densité
   - px.scatter_matrix() : Matrice de scatter plots


### PARTIE 3 : INTERACTIVITÉ AVANCÉE 

TYPES D'INTERACTIVITÉ DANS PLOTLY

1. **Native (automatique)** :
   - Zoom, pan, hover
   - Sélection de légende
   - Téléchargement d'image

2. **Hover tooltips personnalisés** :
   - Format des données affichées
   - Informations supplémentaires

3. **Widgets interactifs** :
   - Boutons (buttons)
   - Menus déroulants (dropdowns)
   - Sliders (curseurs)

4. **Sélection de données** :
   - Box select
   - Lasso select

In [11]:
# ============================================================================
# HOVER TOOLTIPS PERSONNALISÉS
# ============================================================================

print("\n Personnalisation des Tooltips")

fig_hover = px.scatter(
    df_demo,
    x='ventes',
    y='profit',
    color='categorie',
    title='Scatter avec Tooltip Personnalisé'
)

# Personnalisation du hover
fig_hover.update_traces(
    hovertemplate='<br>'.join([
        '<b>Catégorie: %{fullData.name}</b>',
        'Ventes: %{x} unités',
        'Profit: %{y:.2f} €',
        '<extra></extra>'  # Enlève le nom de la trace
    ])
)

fig_hover.show()


 Personnalisation des Tooltips


In [12]:
# ============================================================================
# DROPDOWN MENU (Menu déroulant)
# ============================================================================

print("\n Dropdown pour changer de variable")

# Créer plusieurs traces
fig_dropdown = go.Figure()

# Trace 1 : Ventes
fig_dropdown.add_trace(
    go.Scatter(
        x=df_demo['date'],
        y=df_demo['ventes'],
        mode='lines',
        name='Ventes',
        visible=True  # Visible par défaut
    )
)

# Trace 2 : Profit
fig_dropdown.add_trace(
    go.Scatter(
        x=df_demo['date'],
        y=df_demo['profit'],
        mode='lines',
        name='Profit',
        visible=False  # Caché par défaut
    )
)

# Ajouter le dropdown
fig_dropdown.update_layout(
    title=' Évolution Temporelle - Sélectionnez la métrique',
    updatemenus=[
        dict(
            buttons=list([
                dict(
                    label="Ventes",
                    method="update",
                    args=[{"visible": [True, False]},
                          {"yaxis": {"title": "Ventes (unités)"}}]
                ),
                dict(
                    label="Profit",
                    method="update",
                    args=[{"visible": [False, True]},
                          {"yaxis": {"title": "Profit (€)"}}]
                )
            ]),
            direction="down",
            showactive=True,
            x=0.1,
            y=1.15
        )
    ]
)

fig_dropdown.show()


 Dropdown pour changer de variable


In [13]:
# ============================================================================
# RANGE SLIDER (Curseur de plage)
# ============================================================================

print("\n Range Slider pour zoomer sur une période")

fig_slider = px.line(
    df_demo,
    x='date',
    y='ventes',
    title='📈 Ventes avec Range Slider'
)

# Ajouter le range slider
fig_slider.update_xaxes(
    rangeslider_visible=True,
    rangeselector=dict(
        buttons=list([
            dict(count=7, label="1 semaine", step="day", stepmode="backward"),
            dict(count=1, label="1 mois", step="month", stepmode="backward"),
            dict(step="all", label="Tout")
        ])
    )
)

fig_slider.show()


 Range Slider pour zoomer sur une période


In [14]:
# ============================================================================
# BOUTONS D'ACTION
# ============================================================================

print("\n Boutons pour changer le type de graphique")

fig_buttons = go.Figure()

# Données
x = df_demo['categorie'].value_counts().index
y = df_demo['categorie'].value_counts().values

# Barres
fig_buttons.add_trace(go.Bar(x=x, y=y, visible=True, name='Bar'))

# Pie
fig_buttons.add_trace(go.Pie(labels=x, values=y, visible=False, name='Pie'))

# Boutons
fig_buttons.update_layout(
    title=' Répartition par Catégorie',
    updatemenus=[
        dict(
            type="buttons",
            direction="left",
            buttons=list([
                dict(label="Barres", method="update",
                     args=[{"visible": [True, False]}]),
                dict(label="Camembert", method="update",
                     args=[{"visible": [False, True]}])
            ]),
            x=0.1, y=1.1
        )
    ]
)

fig_buttons.show()


 Boutons pour changer le type de graphique


### PARTIE 4 : MISE EN PAGE ET SUBPLOTS 

**Layouts Professionnels et Subplots

CUSTOMISATION AVEC update_layout()

Éléments principaux :
- title : titre du graphique
- xaxis, yaxis : configuration des axes
- legend : position et style de la légende
- template : thème visuel
- hovermode : comportement du hover
- margin : marges autour du graphique
- width, height : dimensions

In [15]:
# ============================================================================
# CUSTOMISATION COMPLÈTE
# ============================================================================

print("\n Customisation complète d'un graphique")

fig_custom = px.scatter(
    df_demo,
    x='ventes',
    y='profit',
    color='categorie',
    size='ventes'
)

# Customisation avancée
fig_custom.update_layout(
    # Titre
    title={
        'text': ' Analyse Ventes-Profit',
        'x': 0.5,  # Centré
        'xanchor': 'center',
        'font': {'size': 24, 'color': '#2c3e50'}
    },
    
    # Axes
    xaxis=dict(
        title='Ventes (unités)',
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    ),
    yaxis=dict(
        title='Profit (€)',
        showgrid=True,
        gridwidth=1,
        gridcolor='LightGray'
    ),
    
    # Légende
    legend=dict(
        title='Catégorie',
        orientation='v',
        x=1.02,
        y=1
    ),
    
    # Thème
    template='plotly_white',  # Options: plotly, plotly_white, plotly_dark, ggplot2, seaborn
    
    # Hover
    hovermode='closest',
    
    # Dimensions
    width=800,
    height=500,
    
    # Marges
    margin=dict(l=50, r=150, t=80, b=50)
)

fig_custom.show()


 Customisation complète d'un graphique


**THÈMES DISPONIBLES**
- plotly : défaut Plotly"
- plotly_white : fond blanc, grille légère"
- plotly_dark : mode sombre"
- ggplot2 : style R ggplot2"
- seaborn : style Seaborn"
- simple_white : minimaliste"

In [16]:
# ============================================================================
# SUBPLOTS (Sous-graphiques)
# ============================================================================

print("\n Création de Subplots (Dashboard multi-vues)")

# Créer une grille 2x2
fig_subplots = make_subplots(
    rows=2, cols=2,
    subplot_titles=('Evolution Ventes', 'Distribution Profit',
                    'Ventes par Catégorie', 'Corrélation'),
    specs=[[{"type": "scatter"}, {"type": "histogram"}],
           [{"type": "bar"}, {"type": "scatter"}]],
    vertical_spacing=0.12,
    horizontal_spacing=0.1
)

# Graphique 1 : Ligne temporelle (row=1, col=1)
fig_subplots.add_trace(
    go.Scatter(
        x=df_demo['date'],
        y=df_demo['ventes'],
        mode='lines',
        name='Ventes',
        line=dict(color='royalblue')
    ),
    row=1, col=1
)

# Graphique 2 : Histogramme (row=1, col=2)
fig_subplots.add_trace(
    go.Histogram(
        x=df_demo['profit'],
        name='Distribution',
        marker_color='indianred'
    ),
    row=1, col=2
)

# Graphique 3 : Barres (row=2, col=1)
df_cat = df_demo.groupby('categorie')['ventes'].sum()
fig_subplots.add_trace(
    go.Bar(
        x=df_cat.index,
        y=df_cat.values,
        name='Par catégorie',
        marker_color='lightseagreen'
    ),
    row=2, col=1
)

# Graphique 4 : Scatter (row=2, col=2)
fig_subplots.add_trace(
    go.Scatter(
        x=df_demo['ventes'],
        y=df_demo['profit'],
        mode='markers',
        name='Corrélation',
        marker=dict(color='orange', size=8)
    ),
    row=2, col=2
)

# Mise en page globale
fig_subplots.update_layout(
    title_text="📊 Dashboard Multi-Vues",
    showlegend=True,
    height=700,
    width=1000,
    template='plotly_white'
)

# Labels des axes
fig_subplots.update_xaxes(title_text="Date", row=1, col=1)
fig_subplots.update_xaxes(title_text="Profit (€)", row=1, col=2)
fig_subplots.update_xaxes(title_text="Catégorie", row=2, col=1)
fig_subplots.update_xaxes(title_text="Ventes", row=2, col=2)

fig_subplots.update_yaxes(title_text="Ventes", row=1, col=1)
fig_subplots.update_yaxes(title_text="Fréquence", row=1, col=2)
fig_subplots.update_yaxes(title_text="Total", row=2, col=1)
fig_subplots.update_yaxes(title_text="Profit", row=2, col=2)

fig_subplots.show()


 Création de Subplots (Dashboard multi-vues)


### EXPORT DES GRAPHIQUES

MÉTHODES D'EXPORT :

1. HTML interactif (recommandé pour partage) :
   fig.write_html("mon_graphique.html")

2. Image statique (PNG, JPG, PDF, SVG) :
   fig.write_image("mon_graphique.png", width=1200, height=800)
   Note : nécessite kaleido : pip install kaleido

3. JSON (pour réutilisation) :
   fig.write_json("mon_graphique.json")


In [17]:
# Export HTML
# fig_subplots.write_html("dashboard_exemple.html")
print(" Export HTML : dashboard_exemple.html")

# Export image (décommentez si kaleido installé)
# fig_subplots.write_image("dashboard_exemple.png", width=1200, height=800)
# print(" Export PNG : dashboard_exemple.png")

 Export HTML : dashboard_exemple.html


### BEST PRACTICES POUR DASHBOARDS PROFESSIONNELS
10 RÈGLES D'OR :

1. **Cohérence visuelle** : 
   - Palette de couleurs harmonieuse (max 5-6 couleurs)
   - Même template pour tous les graphiques
   
2. **Hiérarchie de l'information** :
   - KPIs en haut et en grand
   - Détails en dessous
   
3. **Interactivité utile** :
   - Éviter les widgets inutiles
   - Chaque interaction doit apporter de la valeur
   
4. **Performance** :
   - Limiter à 5-10 graphiques par page
   - Optimiser les données (agrégation)
   
5. **Accessibilité** :
   - Textes lisibles (min 12px)
   - Contraste suffisant
   - Tooltips explicites
   
6. **Responsive design** :
   - Tester sur différentes tailles d'écran
   - Utiliser des proportions relatives
   
7. **Clarté** :
   - Titres explicites
   - Labels d'axes clairs
   - Légende positionnée intelligemment
   
8. **Éviter la surcharge** :
   - Pas plus de 3-4 couleurs par graphique
   - Grilles discrètes
   - Espace blanc suffisant
   
9. **Contexte** :
   - Toujours indiquer les unités
   - Ajouter des lignes de référence si utile
   
10. **Story telling** :
    - Ordre logique des graphiques
    - Guider l'œil de l'utilisateur

In [18]:
# Exemple : Dashboard avec bonnes pratiques
print("\n Exemple de Dashboard Professionnel")

# Palette de couleurs cohérente
COLOR_PALETTE = {
    'primary': '#3498db',
    'secondary': '#2ecc71',
    'warning': '#f39c12',
    'danger': '#e74c3c',
    'neutral': '#95a5a6'
}

# Créer un dashboard avec best practices
fig_best = make_subplots(
    rows=2, cols=2,
    subplot_titles=('KPI: Évolution Ventes', 'Distribution par Région',
                    'Top Catégories', 'Performance Temporelle'),
    vertical_spacing=0.15,
    horizontal_spacing=0.12,
    specs=[[{"type": "scatter"}, {"type": "bar"}],
           [{"type": "bar"}, {"type": "scatter"}]]
)

# Graphiques avec cohérence visuelle
# ... (utiliser COLOR_PALETTE pour tous les graphiques)

print("\n✅ Dashboard créé avec les best practices appliquées")


 Exemple de Dashboard Professionnel

✅ Dashboard créé avec les best practices appliquées


###RÉCAPITULATIF

1. PLOTLY EXPRESS (px)
   ✓ 5 types de graphiques essentiels (scatter, line, bar, histogram, box)
   ✓ Paramètres universels (color, size, hover_data)
   ✓ Syntaxe simple et rapide

2. INTERACTIVITÉ
   ✓ Hover tooltips personnalisés
   ✓ Dropdowns et boutons
   ✓ Range sliders
   ✓ Sélection de données

3. LAYOUTS & SUBPLOTS
   ✓ update_layout() pour customisation
   ✓ make_subplots() pour dashboards multi-vues
   ✓ Thèmes et templates

4. EXPORT
   ✓ HTML interactif
   ✓ Images statiques
   ✓ JSON

5. BEST PRACTICES
   ✓ Cohérence visuelle
   ✓ Hiérarchie de l'information
   ✓ Interactivité utile
   ✓ Clarté et accessibilité

### RESSOURCES SUPPLÉMENTAIRES POUR ALLER PLUS LOIN

1. Documentation officielle :
   - Plotly Express : https://plotly.com/python/plotly-express/
   - Graph Objects : https://plotly.com/python/graph-objects/
   - Galerie d'exemples : https://plotly.com/python/

2. Palettes de couleurs :
   - Plotly colors : https://plotly.com/python/discrete-color/
   - ColorBrewer : https://colorbrewer2.org/

3. Inspiration :
   - Plotly Community : https://community.plotly.com/
   - GitHub Examples : https://github.com/plotly/plotly.py

4. Datasets pour pratiquer :
   - px.data (intégrés dans Plotly)
   - Kaggle : https://www.kaggle.com/datasets
   - UCI ML Repository : https://archive.ics.uci.edu/ml/