---

# Data viz avec plotly 

---

<div style="text-align: center;">
    <img src="https://cdn.pixabay.com/photo/2020/02/03/20/49/technology-4816658_1280.jpg" alt="Mon Image" style="width: 1000px; height:400px; auto;"/>
</div>

In [1]:
# Librairies 
import pandas as pd
import plotly.express as px

Ton premier graphe en Quelques lignes de code (le reste n'est que desing). Ready? 

In [None]:
# Données
data = pd.DataFrame({
    'annee': ['2017', '2018', '2019', '2020', '2021', '2022'],
    'PIB': [2500, 2650, 2800, 2900, 3050, 3200] 
})

# Création du graphique en barres 
fig = px.bar(data, x='annee', y='PIB', text='PIB', color_discrete_sequence=['#003DA5'])

plotly.io.show(fig)

#### Dans toute la suite on verra comment l'améliorer. Pas mal pour un début n'est-ce pas ? 😏  

## I. Les variables qualitatives 

### I.1. Les barplots 

In [4]:
# Données
data = pd.DataFrame({
    'categorie': ['A', 'B', 'A', 'C', 'B', 'A', 'A', 'B', 'C', 'A', 'B', 'C', 'B', 'A', 'C']
})

# Calcul de la fréquence et des pourcentages
frequences = data['categorie'].value_counts(normalize=True) * 100
# On replace les noms des colonnes
frequences_df = frequences.reset_index()
# On récupère les noms des colonnes
frequences_df.columns = ['categorie', 'pourcentage']
# Création du graphique en barres
fig = px.bar(frequences_df, x='categorie', y='pourcentage', text='pourcentage')
# Etiquettes de pourcentage
fig.update_traces(texttemplate='%{text:.2f}%', textposition='outside', width=0.5)
# Affichage du graphique
fig.update_layout(
    title="Répartition des catégories.............",
    xaxis_title="Catégorie",
    yaxis_title="Pourcentage",
    yaxis_tickformat = ",.2f",
    showlegend=False
)

# Afichage 
fig.show()


In [5]:
# Données pour le niveau d'instruction
data = pd.DataFrame({
    'niveau_instruction': [
        'Primaire', 'Secondaire', 'Secondaire', 'Supérieur', 'Primaire',
        'Primaire', 'Supérieur', 'Secondaire', 'Secondaire', 'Primaire',
        'Supérieur', 'Primaire', 'Supérieur', 'Secondaire', 'Primaire'
    ]
})

# Calcul des pourcentages de chaque catégorie
frequences = data['niveau_instruction'].value_counts(normalize=True) * 100
frequences_df = frequences.reset_index()
frequences_df.columns = ['niveau_instruction', 'pourcentage']
# Création du graphique en barres horizontales
fig = px.bar(frequences_df, y='niveau_instruction', x='pourcentage', text='pourcentage', orientation='h',
             color_discrete_sequence=['green'])
# Etiquettes de pourcentage
fig.update_traces(texttemplate='%{text:.2f}%', textposition='outside', width=0.6)
# Configure le layout pour les barres horizontales
fig.update_layout(
    title="Répartition des niveaux d'instruction avec pourcentages",
    xaxis_title="Pourcentage",
    yaxis_title="Niveau d'instruction",
    yaxis=dict(categoryorder="total ascending"), 
    xaxis_tickformat=",.2f",
    showlegend=False
)

# Affichage 
fig.show()


### I.2. Les camemberts 

In [6]:
# Situation matrimoniale
data = pd.DataFrame({
    'situation_matrimoniale': ['Célibataire', 'Marié', 'Divorcé', 'Veuf'],
    'nombre': [30, 50, 15, 5]
})

# Création du camembert
fig = px.pie(data, 
             names='situation_matrimoniale', 
             values='nombre', 
             title='Répartition suivant la situation matrimoniale',
             color_discrete_sequence=px.colors.qualitative.Plotly)

# Pour afficher le pourcentage et le label
fig.update_traces(textinfo='percent+label')  

# Affichage
fig.show()

### I.3. Graphique en anneau 

In [7]:
# Type de transport
data = pd.DataFrame({
    'type_transport': ['Voiture', 'Bus', 'Train', 'Bicyclette', 'Marche'],
    'nombre': [45, 30, 15, 5, 5] 
})

# Création du graphique n anneau
fig = px.pie(data, 
             names='type_transport', 
             values='nombre', 
             title='Répartition selon le type de transport',
             color_discrete_sequence=px.colors.qualitative.Plotly,
             hole=0.4)

# Personnalisation du graphique
fig.update_traces(textinfo='percent+label') 

# Affichage
fig.show()

### I.4. Compartimentage (treemap)

In [8]:
# Données
data = pd.DataFrame({
    'secteur_emploi': ['Santé', 'Éducation', 'Informatique', 'Commerce', 'Agriculture', 'Transport'],
    'nombre': [40, 35, 20, 30, 15, 10]  # Nombre de personnes travaillant dans chaque secteur
})

# Graphique en compartiments
fig = px.treemap(data, 
                 path=['secteur_emploi'],                  # variable catégorielle
                 values='nombre',                          # Valeurs numériques pour les compartiments
                 title="Répartition par secteur d'emploi",
                 color='nombre',                           # Coleur en fonction des valeurs
                 color_continuous_scale='Blues')           # Palette de couleur choisie

# Affichage
fig.show()


### I.6. Entonnoir

In [9]:
# Données
data = pd.DataFrame({
    'etape': ['Visites site web', 'Ajouts au panier', 'Inscriptions', 'Achats finalisés'],
    'nombre': [5000, 3000, 1500, 700]  # Nombre de personnes à chaque étape
})

# Création du graphique en entonnoir
fig = px.funnel(data, 
                x='nombre', 
                y='etape', 
                title="Processus de vente",
                labels={'nombre': 'Nombre de personnes', 'etape': 'Étapes du processus'})

# Affichage
fig.show()

### I.6. Radar 

In [10]:
# Données
data = pd.DataFrame({
    'compétence': ['Communication', 'Gestion du temps', 'Connaissances techniques', 'Travail en équipe', 'Adaptabilité'],
    'Candidat A': [8, 7, 9, 6, 7],
    'Candidat B': [6, 9, 7, 8, 8],
    'Candidat C': [7, 6, 8, 7, 9]
})

# Transformation des données au format long
data_long = data.melt(id_vars='compétence', var_name='candidat', value_name='score')

# Création du graphique en radar
fig = px.line_polar(data_long, 
                    r='score', 
                    theta='compétence', 
                    color='candidat', 
                    line_close=True,
                    title="Comparaison des compétences des candidats")

# Pour le remplissage à l'intérieur des formes 
fig.update_traces(fill='toself') 

# Affichage 
fig.show()


### I.7. Graphiques en rayons de soleil (sunburst)

Pratique pour les analyser les ventes. 

In [11]:
# Données des ventes d'un magasin
data = pd.DataFrame({
    'categorie': ['Électronique', 'Électronique', 'Électronique', 'Maison', 'Maison', 'Maison', 'Vêtements', 'Vêtements'],
    'sous_categorie': ['Télévisions', 'Téléphones', 'Ordinateurs', 'Meubles', 'Décorations', 'Électroménager', 'Homme', 'Femme'],
    'produit': ['TV LED', 'iPhone', 'Laptop', 'Canapé', 'Tableau', 'Aspirateur', 'T-shirts', 'Robes'],
    'ventes': [2000, 1500, 1800, 800, 600, 700, 1200, 1300]
})

# Création du graphique en rayon de soleil
fig = px.sunburst(data, 
                  path=['categorie', 'sous_categorie', 'produit'],  # Définit la hiérarchie
                  values='ventes',                                  # Définit la taille de chaque portion
                  title="Répartition des ventes par catégorie de produit")

# Personnalisation des couleurs
fig.update_traces(textinfo='label+percent parent')                  # Affiche les étiquettes et le pourcentage par rapport au parent

# Affichage
fig.show()


### I.8. Cascade 

In [12]:
import plotly.graph_objects as go

# Données 
data = pd.DataFrame({
    'étapes': ['Revenus initiaux', 'Ventes', 'Publicité', 'Salaires', 'Frais généraux', 'Taxes', 'Revenus finaux'],
    'montant': [10000, 3000, -1500, -2000, -1200, -800, 13500]  # Valeurs positives et négatives
})

# Calcul des positions de départ pour chaque barre
data['position_depart'] = data['montant'].cumsum() - data['montant']

# Création du graphique en cascade
fig = go.Figure()

# Ajout des barres de cascade
fig.add_trace(go.Bar(
    x=data['étapes'],
    y=data['montant'],
    base=data['position_depart'],
    text=data['montant'],
    texttemplate='%{text:+.0f}',  
    textposition="outside",
    marker_color=['blue', 'green', 'red', 'red', 'red', 'red', 'blue']
))

# Personnalisation de l'apparence du graphique
fig.update_layout(
    title="Revenus et dépenses",
    xaxis_title="Étapes",
    yaxis_title="Montant ($)",
    showlegend=False
)

# Affichage du graphique
fig.show()

### I.9. Boursier

In [14]:
# On simule les données
import numpy as np
np.random.seed(42)
dates = pd.date_range(start='2023-01-01', periods=100)
opening_prices = np.random.normal(100, 5, size=len(dates))
closing_prices = opening_prices + np.random.normal(0, 2, size=len(dates))
low_prices = np.minimum(opening_prices, closing_prices) - np.random.uniform(0, 5, size=len(dates))
high_prices = np.maximum(opening_prices, closing_prices) + np.random.uniform(0, 5, size=len(dates))

# DataFrame
data = pd.DataFrame({
    'Date': dates,
    'Open': opening_prices,
    'Close': closing_prices,
    'Low': low_prices,
    'High': high_prices
})

# Création du graphique
fig = go.Figure(data=[go.Candlestick(x=data['Date'],
                                       open=data['Open'],
                                       high=data['High'],
                                       low=data['Low'],
                                       close=data['Close'],
                                       name='Prix boursier')])

# Personnalisation
fig.update_layout(
    title="Graphique Boursier (Chandelier)",
    xaxis_title="Date",
    yaxis_title="Prix",
    xaxis_rangeslider_visible=False,
    template="plotly_white"
)

# Affichage
fig.show()

### Oupss Le réseau social avec le plus grand nombre d'utilisateurs

In [15]:
# Données (fausses)
data = pd.DataFrame({
    'annee': ['2018', '2019', '2020', '2021', '2022'],
    'Facebook': [1200, 1300, 1400, 1500, 1550],
    'Instagram': [800, 900, 950, 1000, 1100],
    'Twitter': [500, 550, 600, 620, 630],
    'LinkedIn': [300, 320, 350, 380, 400]
})

# Transformation des donnéesen en format long, nécessaire pour un graphique en aires empilées
data_long = data.melt(id_vars='annee', var_name='reseau_social', value_name='utilisateurs')

# Création du graphique d’aire empilée
fig = px.area(data_long, 
              x='annee', 
              y='utilisateurs', 
              color='reseau_social', 
              title="Évolution des utilisateurs de réseaux sociaux par année",
              labels={'utilisateurs': 'Nombre d’utilisateurs (en milliers)', 'annee': 'Année'},
              color_discrete_sequence=px.colors.qualitative.Set2)

# Affichage du graphique
fig.show()

### Le PIB ne fait pas le bonheur 

In [16]:
# Données
data = pd.DataFrame({
    'annee': ['2017', '2018', '2019', '2020', '2021', '2022'],
    'PIB': [2500, 2650, 2800, 2900, 3050, 3200] 
})

# Graphique en barres 
fig = px.bar(data, x='annee', y='PIB', text='PIB', color_discrete_sequence=['#003DA5'])

# Personnalisation des étiquettes
fig.update_traces(
    texttemplate='%{text:.0f} M$',  # Format des étiquettes en millions de dollars
    textposition='outside',  # Position au milieu des barres
    textfont=dict(color="black"),  # Couleur blanche pour les étiquettes
    width=0.6
)




# Configuration du layout pour le graphique
fig.update_layout(
    title="Évolution du PIB en millions de dollars (2017-2022)",
    xaxis_title="Année",
    yaxis_title="PIB (millions de dollars)",
    yaxis_tickformat=",.0f", 
    showlegend=False
)

fig.show()

## II. Les variables quantitatives 

### II.1 Histogramme 

In [17]:
# Revenus (en milliers de dollars)
np.random.seed(42)
data = pd.DataFrame({
    'revenu': np.random.normal(50, 15, 1000)       # Moyenne de 50k, écart-type de 15k
})

# Création de l'histogramme
fig = px.histogram(data, x='revenu', nbins=30,     # nombre de barres
                   title="Distribution des revenus",
                   labels={'revenu': "Revenu (en milliers de dollars)"})

# Personnalisation de l'histogramme
fig.update_layout(
    xaxis_title="Revenu (en milliers de dollars)",
    yaxis_title="Fréquence",
    bargap=0.1,                                     # Espace entre les barres
    template="plotly_white"                         # Fond blanc
)

# Affichage
fig.show()


### II.2. Box-plot

In [18]:
# Données
np.random.seed(42)
data = pd.DataFrame({
    'revenu': np.random.normal(50, 15, 1000)  # Moyenne de 50k, écart-type de 15k
})

# Box-plot
fig = px.box(data, y='revenu', 
              title="Box-plot des revenus individuels",
              labels={'revenu': "Revenu (en milliers de dollars)"})

# Personnalisation 
fig.update_layout(
    yaxis_title="Revenu (en milliers de dollars)",
    template="plotly_white"
)

# Affichage
fig.show()

## III. Croisement de variables 

### III.1 Nuage de point

In [19]:
# Données
data = pd.DataFrame({
    'Pays': ['Sénégal', 'Cameroun', 'Mali', 'Nigeria', 'Ghana', 'Tanzanie', 'Kenya', 'Zambie', 'Uganda', 'Rwanda'],
    'PIB (millions de $)': [25000, 40000, 15000, 450000, 67000, 60000, 58000, 25000, 32000, 12000],
    'Espérance de vie (années)': [67, 60, 58, 54, 63, 65, 64, 63, 62, 66],
    'Population (millions)': [16.5, 27.2, 20.3, 206.1, 31.1, 58.6, 54.5, 18.4, 45.7, 12.6]
})

# Nuage de points
fig = px.scatter(data, 
                 x='PIB (millions de $)', 
                 y='Espérance de vie (années)', 
                 size='Population (millions)',  # Taille des bulles en fonction de la population
                 color='Pays',                  # Couleur des bulles par pays
                 hover_name='Pays',             # Nom du pays au survol
                 title='PIB vs. Espérance de Vie',
                 labels={
                     'PIB (millions de $)': 'PIB (millions de $)',
                     'Espérance de vie (années)': 'Espérance de vie (années)'
                 },
                 size_max=30                    # Taille de la bulle 
)

# Personnalisation 
fig.update_layout(
    xaxis_title='PIB (millions de $)',
    yaxis_title='Espérance de vie (années)',
    template='plotly_white'
)

# Affichage
fig.show()

### III.2. Graphique à barres groupées

In [20]:
# Données
data = pd.DataFrame({
    'Niveau d\'instruction': ['Primaire', 'Primaire', 'Secondaire', 'Secondaire', 'Supérieur', 'Supérieur'],
    'Situation matrimoniale': ['Célibataire', 'Marié', 'Célibataire', 'Marié', 'Célibataire', 'Marié'],
    'Nombre': [10, 20, 15, 25, 30, 10]
})

# Calculer des pourcentages 
data['Pourcentage'] = (data['Nombre'] / data.groupby('Niveau d\'instruction')['Nombre'].transform('sum') * 100).round(2)

# Graphique à barres groupées
fig = px.bar(data,
             x='Niveau d\'instruction',
             y='Pourcentage',
             color='Situation matrimoniale',
             text='Pourcentage',     
             title='Niveau d\'Instruction et Situation Matrimoniale',
             labels={'Pourcentage': 'Pourcentage (%)'},
             color_discrete_sequence=px.colors.qualitative.Set2)

# Personnalisation
fig.update_traces(
    texttemplate='%{text:.2f}%',     # Format des étiquettes en pourcentage avec deux chiffres après la virgule
    textposition='outside',           # Pourcentages à l'extérieur des barres
    width=0.4 
)


# Ici tu peux aussi configurer la taille du graphique
fig.update_layout(
    yaxis_title='Pourcentage (%)',
    xaxis_title='Niveau d\'instruction',
    barmode='group',  # Utilisation du mode groupé
    template='plotly_white'
)

# Affichage 
fig.show()

### III.2. Graphique à barres empilées verticales 

In [21]:
# Données fictives
data = pd.DataFrame({
    'Niveau d\'instruction': ['Primaire', 'Primaire', 'Secondaire', 'Secondaire', 'Supérieur', 'Supérieur'],
    'Situation matrimoniale': ['Célibataire', 'Marié', 'Célibataire', 'Marié', 'Célibataire', 'Marié'],
    'Nombre': [10, 20, 15, 25, 30, 10]
})

# Calcule des pourcentages
data['Pourcentage'] = (data['Nombre'] / data.groupby('Niveau d\'instruction')['Nombre'].transform('sum') * 100).round(2)

# Création du graphique à barres empilées
fig = px.bar(data,
             x='Niveau d\'instruction',
             y='Pourcentage',
             color='Situation matrimoniale',
             text='Pourcentage',         # Pourcentages sur les barres
             title='Niveau d\'Instruction et Situation Matrimoniale',
             labels={'Pourcentage': 'Pourcentage (%)'},
             color_discrete_sequence=['#4CAF50', '#2196F3'])  # Couleurs

# Personnalisation
fig.update_traces(
    texttemplate='%{text:.2f}%',         # Format des étiquettes
    textposition='inside',               # Pourcentages à l'intérieur des barres
    textfont_color='white',              # Couleur des pourcentages
    width=0.4                            # Largeur des barres réduite
)

# Configuration du layout pour le graphique
fig.update_layout(
    yaxis_title='Pourcentage (%)',
    xaxis_title='Niveau d\'instruction',
    barmode='stack',                     # pour empiler
    template='plotly_white',
    yaxis=dict(gridcolor='LightGray'),   # Couleur de la grille
    xaxis=dict(gridcolor='LightGray')    # Couleur de la grille
)

# Affichage
fig.show()


### III.2. Graphique à barres empilées horizontales 

In [22]:
# Données 
data = pd.DataFrame({
    'Niveau d\'instruction': ['Primaire', 'Primaire', 'Secondaire', 'Secondaire', 'Supérieur', 'Supérieur', 'Doctorat', 'Doctorat'],
    'Situation matrimoniale': ['Célibataire', 'Marié', 'Célibataire', 'Marié', 'Célibataire', 'Marié', 'Célibataire', 'Marié'],
    'Nombre': [10, 20, 15, 25, 30, 10, 5, 5]
})

# Calcule des pourcentages
data['Pourcentage'] = (data['Nombre'] / data.groupby('Niveau d\'instruction')['Nombre'].transform('sum') * 100).round(2)

# Graphique à barres empilées horizontal
fig = px.bar(data,
             y='Niveau d\'instruction',
             x='Pourcentage',
             color='Situation matrimoniale',
             text='Pourcentage',  # Afficher les pourcentages sur les barres
             title='Répartition en Pourcentage par Niveau d\'Instruction et Situation Matrimoniale',
             labels={'Pourcentage': 'Pourcentage (%)'},
             color_discrete_sequence=['purple', '#2196F3'],  # Couleurs personnalisées : rose et bleu
             orientation='h')  # Orientation horizontale

# Personnalisation des étiquettes
fig.update_traces(
    texttemplate='%{text:.2f}%',  # Format des étiquettes en pourcentage
    textposition='inside',        # Pourcentages à l'intérieur des barres
    textfont_color='white'        # Couleur des pourcentages en blanc
)

# Configuration du layout
fig.update_layout(
    xaxis_title='Pourcentage (%)',
    yaxis_title='Niveau d\'instruction',
    barmode='stack',              # Utilisation du mode empilé
    template='plotly_white'
)

# Affichage
fig.show()



### Autre 


---

In [23]:
import plotly.graph_objects as go

# Données factices (chaque valeur est en pourcentage, donc entre 0 et 100)
years = ["2014", "2015", "2016", "2017", "2018", "2019"]
seed_angel = [60, 58, 55, 50, 40, 30]
series_a = [20, 25, 30, 35, 30, 25]
series_b = [10, 8, 7, 6, 5, 10]
series_c = [5, 5, 4, 5, 10, 15]
series_d = [3, 2, 3, 2, 5, 8]
series_e_plus = [1, 1, 1, 2, 5, 8]
other = [1, 1, 0, 0, 5, 4]

# Création du graphique avec des barres empilées
fig = go.Figure()

# Ajout des barres pour chaque étape de financement
fig.add_trace(go.Bar(name='Seed / Angel', x=years, y=[v/100 for v in seed_angel], marker_color='#4CAFDB'))
fig.add_trace(go.Bar(name='Series A', x=years, y=[v/100 for v in series_a], marker_color='#B53FA1'))
fig.add_trace(go.Bar(name='Series B', x=years, y=[v/100 for v in series_b], marker_color='#FF5C38'))
fig.add_trace(go.Bar(name='Series C', x=years, y=[v/100 for v in series_c], marker_color='#264277'))
fig.add_trace(go.Bar(name='Series D', x=years, y=[v/100 for v in series_d], marker_color='#15B399'))
fig.add_trace(go.Bar(name='Series E+', x=years, y=[v/100 for v in series_e_plus], marker_color='#F2935A'))
fig.add_trace(go.Bar(name='Other', x=years, y=[v/100 for v in other], marker_color='#D3D3D3'))

# Paramètres de mise en forme
fig.update_layout(
    barmode='stack',
    title="Part des transactions par niveau",
    xaxis_title="Années",
    yaxis_title="Pourcentage",
    yaxis=dict(tickformat=".0%", range=[0, 1]),  # Mise à jour de l'axe pour un affichage correct en pourcentage
    legend_title="Niveau de financement",
    template="plotly_white"
)

# Affichage du graphique
fig.show()

### Avec deux axes


---

In [24]:
# Données (précipitations, températures minimales et maximales pour chaque mois)
months = ["Jan", "Fév", "Mar", "Avr", "Mai", "Juin", "Juil", "Août", "Sept", "Oct", "Nov", "Déc"]
precipitation = [110, 100, 90, 75, 60, 50, 50, 60, 70, 90, 100, 120]  # en mm
temp_min = [20, 18, 16, 14, 11, 8, 7, 9, 12, 15, 18, 20]  # en °C
temp_max = [30, 28, 26, 23, 20, 18, 17, 20, 23, 26, 28, 30]  # en °C

# Création du graphique à barres pour les précipitations
fig = go.Figure()

fig.add_trace(go.Bar(
    x=months,
    y=precipitation,
    name="Précipitations",
    marker_color="green",
    yaxis="y2"  # On associe  l'axe des ordonnées secondaire pour les précipitations
))

# Ajout de la courbe des températures minimales
fig.add_trace(go.Scatter(
    x=months,
    y=temp_min,
    name="Température Min",
    mode="lines+markers",
    marker_color="blue",
    line=dict(width=2)
))

# Courbe pour des températures maximales
fig.add_trace(go.Scatter(
    x=months,
    y=temp_max,
    name="Température Max",
    mode="lines+markers",
    marker_color="red",
    line=dict(width=2)
))

# Mise en forme 
fig.update_layout(
    title="Graphique climatique",
    xaxis=dict(title="Mois"),
    yaxis=dict(
        title="Température (°C)",
        range=[0, 35]
    ),
    yaxis2=dict(
        title="Précipitations (mm)",
        range=[0, 175],
        overlaying="y",
        side="right"  # Positionne cet axe à droite
    ),
    legend=dict(x=0.1, y=1.1),
    template="plotly_white"
)

# Affichage
fig.show()

### Box-plot

---

In [25]:
# Données
np.random.seed(42)  # Pour la reproductibilité
n_observations = 50

# Classes du collège au lycée
classes = ['6ème', '5ème', '4ème', '3ème', 'Seconde', 'Première', 'Terminale']

# DataFrame 
data = pd.DataFrame({
    'Classe': np.random.choice(classes, n_observations),
    'Âge': np.random.randint(11, 19, n_observations)  # Âges entre 11 et 18
})

# Création du box plot
fig = px.box(data,
             x='Classe',
             y='Âge',
             title='Âges et Classes des élèves',
             labels={'Âge': 'Âge (années)', 'Classe': 'Classe'},
             color='Classe',  # Coloration par classe
             template='plotly_white')  # Utilisation d'un template blanc

# Configuration du layout
fig.update_layout(
    yaxis_title='Âge (années)',
    xaxis_title='Classe'
)

# Affichage
fig.show()

### Nuage de points 

---

In [26]:
# Données
np.random.seed(42)  # Pour la reproductibilité
data = pd.DataFrame({
    'Age': np.random.randint(20, 60, size=50),  # Âge entre 20 et 60 ans
    'Revenu': np.random.randint(20000, 100000, size=50),  # Revenu entre 20 000 et 100 000
    'Situation matrimoniale': np.random.choice(['Célibataire', 'Marié', 'Divorcé'], size=50)  # Situation matrimoniale
})

# Création du nuage de points
fig = px.scatter(data, 
                 x='Age', 
                 y='Revenu', 
                 color='Situation matrimoniale',  # Couleur en fonction de la situation matrimoniale
                 size='Revenu',                   # Taille des points proportionnelle au revenu
                 hover_name=data.index,           # Pour Afficher l'index dans les info-bulles
                 title='Revenu en fonction de l\'Âge',
                 labels={'Age': 'Âge (ans)', 'Revenu': 'Revenu (en milliers de dollars)'},
                 template='plotly_white')

# Affichage 
fig.show()

### Marche aléatoire 

---

In [27]:
import plotly.express as px
import pandas as pd
import numpy as np

# Paramètres de la marche aléatoire
n_steps = 100       # Nombre d'étapes de la marche
step_size = 1       # Taille de chaque étape

# Génération
steps = np.random.choice([-step_size, step_size], size=n_steps)  # -1 ou +1 pour chaque étape
values = np.cumsum(steps)  # Cumule des étapes pour former la marche 

# DataFrame
df = pd.DataFrame({
    "Step": np.arange(n_steps),
    "Value": values
})

# Graphe
fig = px.line(df, x="Step", y="Value", title="Marche aléatoire")

# Layout
fig.update_layout(
    xaxis_title="Etape",
    yaxis_title="Valeur",
    template="plotly_white"
)

# Afficher le graphique
fig.show()

### Courbes empilées

---