# Cr√©ation des graphiques

Imports


In [None]:
import pandas as pd
import numpy as np
import plotly.express as px
from plotly import graph_objects
from scipy import stats

Define global variables

In [None]:
COULEURS_DPE = {
    'A': '#00A651',
    'B': '#50B847',
    'C': '#C8D220',
    'D': '#FDEE00',
    'E': '#FEB700',
    'F': '#F0832A',
    'G': '#ED1C24'
}

SEUILS_ALTITUDE = [600, 1200, 1800, 2500]

LABELS_ALTITUDE = [
    "0-600m (Vall√©e)",           # Zones basses : Annecy, Thonon-les-Bains
    "600-1200m (Colline)",       # Moyenne montagne
    "1200-1800m (Montagne)",     # Haute montagne habit√©e
    "1800-2500m (Haute montagne)",  # Limite des habitations permanentes
    ">2500m (Tr√®s haute montagne)"  # Zones peu habit√©es
]

COULEURS_ALTITUDE = {
    "0-600m (Vall√©e)": '#27ae60',
    "600-1200m (Colline)": '#f39c12',
    "1200-1800m (Montagne)": '#e74c3c',
    "1800-2500m (Haute montagne)": '#9b59b6',
    ">2500m (Tr√®s haute montagne)": '#34495e'
}

TAILLE_ECHANTILLON_SCATTER = 10000

PRIX_ELECTRICITE = 0.20  # ‚Ç¨/kWh
SURFACE_REFERENCE = 70  # m¬≤

## Read data

Loads data

In [None]:
df = pd.read_csv('../web/application/datasets/logements_74.csv')

Select columns

In [None]:
selected_columns = [
    'numero_dpe',                          # Identifiant unique du DPE
    'code_insee_ban',                      # Code commune
    'nom_commune_ban',                     # Nom de la commune
    'etiquette_dpe',                       # Classe √©nerg√©tique (A √† G)
    'conso_5_usages_par_m2_ep',            # Consommation en kWh/m¬≤/an
    'surface_habitable_logement',          # Surface en m¬≤ (pour calculs de co√ªts)
    'type_batiment',                       # Maison ou appartement
    'periode_construction',                # √âpoque de construction
    'periode_categorie',                   # Categorie de periode de construction
    'type_energie_principale_chauffage',   # Type de chauffage utilis√©
    'altitude_moyenne',                    # Altitude moyenne (d√©j√† dans le DPE)
    'classe_altitude',                     # Classe d'altitude
    'categorie_dpe'                        # Categorie DPE simplifi√©es
]

In [None]:
df = df[selected_columns]

## Scatter Plot

In [None]:
df_valide = df[df['altitude_moyenne'].notna()]
df_plot = df_valide.sample(n=TAILLE_ECHANTILLON_SCATTER, random_state=0)

Linear regression

In [None]:
slope, intercept, r_value, p_value, std_err = stats.linregress(
    df_plot['altitude_moyenne'], 
    df_plot['conso_5_usages_par_m2_ep']
)

r_squared = r_value ** 2

altitude_min = df_plot['altitude_moyenne'].min()
altitude_max = df_plot['altitude_moyenne'].max()
x_regression = np.array([altitude_min, altitude_max])
y_regression = slope * x_regression + intercept

Draw plot

In [None]:
fig = px.scatter(
    df_plot,
    x='altitude_moyenne',
    y='conso_5_usages_par_m2_ep',
    color='etiquette_dpe',
    color_discrete_map=COULEURS_DPE,
    category_orders={'etiquette_dpe': ['A', 'B', 'C', 'D', 'E', 'F', 'G']},  # Ordre croissant des √©tiquettes DPE
    opacity=0.6,
    labels={
        'altitude_moyenne': 'Altitude moyenne de la commune (m)',
        'conso_5_usages_par_m2_ep': 'Consommation √©nerg√©tique (kWh/m¬≤/an)',
        'etiquette_dpe': '√âtiquette DPE'
    },
    hover_data={
        'altitude_moyenne': ':.0f',
        'conso_5_usages_par_m2_ep': ':.1f',
        'nom_commune_ban': True,
        'type_batiment': True,
        'periode_construction': True,
        'etiquette_dpe': False  # D√©j√† visible via la couleur
    },
    title=f'<b>Impact de l\'altitude sur la consommation √©nerg√©tique</b><br>'
          f'<sub>Mountain Energy Score - D√©partement Haute-Savoie (74)</sub>'
)

In [None]:
fig.add_trace(
    graph_objects.Scatter(
        x=x_regression,
        y=y_regression,
        mode='lines',
        name=f'R√©gression lin√©aire<br>(+{slope*100:.1f} kWh/m¬≤/an par 100m)',
        line=dict(color='#e74c3c', width=3, dash='dash'),
        hovertemplate='<b>Tendance lin√©aire</b><br>Altitude: %{x:.0f}m<br>Consommation estim√©e: %{y:.1f} kWh/m¬≤/an<extra></extra>'
    )
)

Add altitude zones

In [None]:
zones = [
    (SEUILS_ALTITUDE[0], "lightgreen", "Vall√©e"),
    (SEUILS_ALTITUDE[1], "indigo", "Colline"),
    (SEUILS_ALTITUDE[2], "lightcoral", "Montagne")
]

altitude_debut = altitude_min
for seuil, couleur, nom in zones:
    if altitude_debut < seuil:
        fig.add_vrect(
            x0=altitude_debut, 
            x1=min(seuil, altitude_max),
            fillcolor=couleur, 
            opacity=0.1, 
            line_width=0,
            annotation_text=nom, 
            annotation_position="top left"
        )
        altitude_debut = seuil

Customize layout

In [None]:
fig.update_layout(
    # Dimensions pour une bonne lisibilit√©
    width=1200,
    height=700,
    
    # Style de fond
    plot_bgcolor='white',
    paper_bgcolor='white',
    
    # Configuration du titre
    title={
        'font': {'size': 22, 'family': 'Arial, sans-serif', 'color': '#2c3e50'},
        'x': 0.5,
        'xanchor': 'center'
    },
    
    # Configuration des axes
    xaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='#ecf0f1',
        zeroline=False,
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e')
    ),
    yaxis=dict(
        showgrid=True,
        gridwidth=1,
        gridcolor='#ecf0f1',
        zeroline=False,
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e')
    ),
    
    # Configuration de la l√©gende
    legend=dict(
    title=dict(text='<b>√âtiquette DPE</b>', font=dict(size=12)),
    orientation='v',
    yanchor='top',
    y=0.98,
    xanchor='right',
    x=0.98,
    bgcolor='rgba(255, 255, 255, 0.9)',
    bordercolor='#bdc3c7',
    borderwidth=1,
    font=dict(size=10),
    ),
    
    # Mode d'interaction au survol
    hovermode='closest',
    hoverlabel=dict(
        bgcolor='white',
        font_size=11,
        font_family='Arial, sans-serif'
    ),
    
    # Marges pour l'annotation en bas
    margin=dict(l=80, r=80, t=100, b=140)
)

In [None]:
fig.add_annotation(
    text=f"<b>üìä Insight cl√© :</b> Chaque 100m d'altitude suppl√©mentaire augmente "
         f"la consommation de <b>{slope*100:.1f} kWh/m¬≤/an</b> en moyenne "
         f"<i>(R¬≤ = {r_squared:.3f}, p < 0.001)</i>. "
         f"Cette corr√©lation significative d√©montre l'impact direct de l'altitude sur les besoins √©nerg√©tiques.",
    xref="paper", yref="paper",
    x=0.5, y=-0.17,
    xanchor='center', yanchor='top',
    showarrow=False,
    bgcolor='rgba(255, 243, 205, 0.95)',
    bordercolor='#f39c12',
    borderwidth=2,
    borderpad=10,
    font=dict(size=11, family='Arial, sans-serif', color='#34495e')
)

## Boxplot

In [None]:
df_valide = df[
    (df['altitude_moyenne'].notna()) & 
    (df['classe_altitude'].notna()) &
    (df['conso_5_usages_par_m2_ep'] <= 1000)  # Limite sup√©rieure r√©aliste
]

Classes

In [None]:
ordre_tranches = [label for label in LABELS_ALTITUDE if label in df_valide['classe_altitude'].unique()]

In [None]:
stats_par_tranche = []

for tranche in ordre_tranches:
    donnees_tranche = df_valide[df_valide['classe_altitude'] == tranche]['conso_5_usages_par_m2_ep']
    
    stats = {
        'tranche': tranche,
        'effectif': len(donnees_tranche),
        'mediane': donnees_tranche.median(),
        'moyenne': donnees_tranche.mean(),
        'q1': donnees_tranche.quantile(0.25),
        'q3': donnees_tranche.quantile(0.75),
        'min': donnees_tranche.min(),
        'max': donnees_tranche.max()
    }
    stats_par_tranche.append(stats)

ecart_vallee_montagne = stats_par_tranche[-1]['mediane'] - stats_par_tranche[0]['mediane']
pct_augmentation = (ecart_vallee_montagne / stats_par_tranche[0]['mediane']) * 100

Draw plot

In [None]:
fig = graph_objects.Figure()

# Ajout d'un boxplot pour chaque tranche d'altitude
for tranche in ordre_tranches:
    donnees_tranche = df_valide[df_valide['classe_altitude'] == tranche]['conso_5_usages_par_m2_ep']
    
    fig.add_trace(graph_objects.Box(
        y=donnees_tranche,
        name=tranche,
        marker_color=COULEURS_ALTITUDE.get(tranche, '#95a5a6'),
        boxmean='sd',  # Affiche aussi la moyenne avec √©cart-type
        hovertemplate=(
            '<b>%{fullData.name}</b><br>' +
            'M√©diane: %{median:.0f} kWh/m¬≤/an<br>' +
            'Q1: %{q1:.0f} kWh/m¬≤/an<br>' +
            'Q3: %{q3:.0f} kWh/m¬≤/an<br>' +
            'Min: %{min:.0f} kWh/m¬≤/an<br>' +
            'Max: %{max:.0f} kWh/m¬≤/an<br>' +
            '<extra></extra>'
        )
    ))

Customize layout

In [None]:
fig.update_layout(
    # Titre
    title={
        'text': (
            '<b>Distribution de la consommation √©nerg√©tique par tranche d\'altitude</b><br>'
            '<sub>Mountain Energy Score - D√©partement Haute-Savoie (74)</sub>'
        ),
        'font': {'size': 22, 'family': 'Arial, sans-serif', 'color': '#2c3e50'},
        'x': 0.5,
        'xanchor': 'center'
    },
    
    # Axes
    xaxis=dict(
        title='<b>Tranche d\'altitude</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e'),
        showgrid=False
    ),
    yaxis=dict(
        title='<b>Consommation √©nerg√©tique (kWh/m¬≤/an)</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e'),
        showgrid=True,
        gridwidth=1,
        gridcolor='#ecf0f1',
        zeroline=False
    ),
    
    # Style
    plot_bgcolor='white',
    paper_bgcolor='white',
    showlegend=False,  # Pas de l√©gende n√©cessaire (noms sur l'axe X)
    
    # Dimensions
    width=1200,
    height=700,
    
    # Marges pour l'annotation
    margin=dict(l=80, r=80, t=100, b=160)
)

In [None]:
fig.add_annotation(
    text=(
        f"<b>üìä Insight cl√© :</b> La consommation m√©diane augmente de "
        f"<b>{ecart_vallee_montagne:.0f} kWh/m¬≤/an</b> entre la vall√©e "
        f"({stats_par_tranche[0]['mediane']:.0f} kWh/m¬≤/an) et la haute montagne "
        f"({stats_par_tranche[-1]['mediane']:.0f} kWh/m¬≤/an), soit une hausse de "
        f"<b>{pct_augmentation:.1f}%</b>.<br>"
        f"La dispersion augmente √©galement avec l'altitude, r√©v√©lant une plus grande h√©t√©rog√©n√©it√© des situations en montagne."
        ),
        xref="paper", yref="paper",
        x=0.5, y=-0.19,
        xanchor='center', yanchor='top',
        showarrow=False,
        bgcolor='rgba(255, 243, 205, 0.95)',
        bordercolor='#f39c12',
        borderwidth=2,
        borderpad=10,
        font=dict(size=11, family='Arial, sans-serif', color='#34495e')
    )

## Barplot

In [None]:
df_valide = df[
    (df['altitude_moyenne'].notna()) & 
    (df['classe_altitude'].notna()) &
    (df['conso_5_usages_par_m2_ep'] <= 1000)
]

Classes

In [None]:
ordre_tranches = [label for label in LABELS_ALTITUDE if label in df_valide['classe_altitude'].unique()]

In [None]:
stats_tranches = []

for tranche in ordre_tranches:
    donnees_tranche = df_valide[df_valide['classe_altitude'] == tranche]['conso_5_usages_par_m2_ep']
    
    conso_moyenne = donnees_tranche.mean()
    effectif = len(donnees_tranche)
    
    stats_tranches.append({
        'tranche': tranche,
        'conso_moyenne': conso_moyenne,
        'effectif': effectif
    })

In [None]:
conso_reference = stats_tranches[0]['conso_moyenne']

# Calcul du surco√ªt pour chaque tranche
for stats in stats_tranches:
    # Diff√©rence de consommation par rapport √† la vall√©e (kWh/m¬≤/an)
    ecart_conso = stats['conso_moyenne'] - conso_reference
    
    # Surco√ªt annuel pour un logement de r√©f√©rence (‚Ç¨/an)
    surcout_annuel = ecart_conso * SURFACE_REFERENCE * PRIX_ELECTRICITE
    
    stats['ecart_conso'] = ecart_conso
    stats['surcout_annuel'] = surcout_annuel

In [None]:
montagne = stats_tranches[-2]
haute_montagne = stats_tranches[-1]

Draw plot

In [None]:
# Pr√©paration des donn√©es pour le graphique
tranches_noms = [s['tranche'] for s in stats_tranches]
surcouts = [s['surcout_annuel'] for s in stats_tranches]
consos = [s['conso_moyenne'] for s in stats_tranches]
effectifs = [s['effectif'] for s in stats_tranches]

couleurs_barres = [COULEURS_ALTITUDE.get(t, '#95a5a6') for t in tranches_noms]

In [None]:
fig = graph_objects.Figure()

fig.add_trace(graph_objects.Bar(
    x=tranches_noms,
    y=surcouts,
    marker_color=couleurs_barres,
    text=[f"<b>{s:.0f} ‚Ç¨/an</b><br>({c:.0f} kWh/m¬≤/an)<br>n = {e:,}" 
          for s, c, e in zip(surcouts, consos, effectifs)],
    textposition='inside',  
    textfont=dict(size=12, color='white', family='Arial, sans-serif'),  
    hovertemplate=(
        '<b>%{x}</b><br>' +
        'Surco√ªt annuel: %{y:.0f} ‚Ç¨/an<br>' +
        'Consommation: %{customdata[0]:.0f} kWh/m¬≤/an<br>' +
        'Effectif: %{customdata[1]:,} logements<br>' +
        '<extra></extra>'
    ),
    customdata=[[c, e] for c, e in zip(consos, effectifs)]
))

Customize layout

In [None]:
surcout_max = max(surcouts)
tranche_max = tranches_noms[surcouts.index(surcout_max)]
conso_max = consos[surcouts.index(surcout_max)]

In [None]:
fig.update_layout(
    # Titre
    title={
        'text': (
            '<b>Surco√ªt √©nerg√©tique annuel par tranche d\'altitude</b><br>'
            f'<sub>Mountain Energy Score - D√©partement Haute-Savoie (74) - '
            f'Logement de r√©f√©rence : {SURFACE_REFERENCE}m¬≤, prix √©lectricit√© {PRIX_ELECTRICITE}‚Ç¨/kWh</sub>'
        ),
        'font': {'size': 22, 'family': 'Arial, sans-serif', 'color': '#2c3e50'},
        'x': 0.5,
        'xanchor': 'center'
    },
    
    # Axes
    xaxis=dict(
        title='<b>Tranche d\'altitude</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e'),
        showgrid=False
    ),
    yaxis=dict(
        title='<b>Surco√ªt √©nerg√©tique annuel (‚Ç¨/an)</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e'),
        showgrid=True,
        gridwidth=1,
        gridcolor='#ecf0f1',
        zeroline=True,
        zerolinewidth=2,
        zerolinecolor='#34495e'
    ),
    
    # Style
    plot_bgcolor='white',
    paper_bgcolor='white',
    showlegend=False,
    
    # Dimensions
    width=1200,
    height=700,
    
    # Marges
    margin=dict(l=80, r=80, t=120, b=160)
)

In [None]:
fig.add_annotation(
    text=(
        f"<b>üí∞ Insight cl√© :</b> Vivre en {tranche_max.lower()} co√ªte <b>+{surcout_max:.0f}‚Ç¨/an</b> "
        f"de plus en √©nergie par rapport √† la vall√©e pour un logement de {SURFACE_REFERENCE}m¬≤.<br>"
        f"Cela repr√©sente l'√©quivalent de <b>{surcout_max/12:.0f}‚Ç¨ par mois</b> de facture √©nerg√©tique suppl√©mentaire, "
        f"soit un budget non n√©gligeable pour les m√©nages vivant en altitude."
    ),
    xref="paper", yref="paper",
    x=0.5, y=-0.19,
    xanchor='center', yanchor='top',
    showarrow=False,
    bgcolor='rgba(255, 243, 205, 0.95)',
    bordercolor='#f39c12',
    borderwidth=2,
    borderpad=10,
    font=dict(size=11, family='Arial, sans-serif', color='#34495e')
)

## Barre DPE

In [None]:
df_valide = df[
    (df['altitude_moyenne'].notna()) & 
    (df['classe_altitude'].notna()) &
    (df['etiquette_dpe'].isin(['A', 'B', 'C', 'D', 'E', 'F', 'G']))
]

Classes

In [None]:
ordre_tranches = [label for label in LABELS_ALTITUDE if label in df_valide['classe_altitude'].unique()]

In [None]:
stats_par_tranche = []

for tranche in ordre_tranches:
    donnees_tranche = df_valide[df_valide['classe_altitude'] == tranche]
    total = len(donnees_tranche)
    
    # Comptage par cat√©gorie
    categories = donnees_tranche['categorie_dpe'].value_counts()
    
    stats = {
        'tranche': tranche,
        'total': total,
        'pct_bons': (categories.get('Bons (A-B)', 0) / total * 100),
        'pct_moyens': (categories.get('Moyens (C-D)', 0) / total * 100),
        'pct_mediocres': (categories.get('M√©diocres (E)', 0) / total * 100),
        'pct_passoires': (categories.get('Passoires (F-G)', 0) / total * 100),
        'nb_passoires': categories.get('Passoires (F-G)', 0)
    }
    
    stats_par_tranche.append(stats)

In [None]:
pct_vallee = stats_par_tranche[0]['pct_passoires']
pct_montagne_max = max([s['pct_passoires'] for s in stats_par_tranche])
ratio = pct_montagne_max / pct_vallee if pct_vallee > 0 else 0

Draw plot

In [None]:
tranches_noms = [s['tranche'] for s in stats_par_tranche]

In [None]:
fig = graph_objects.Figure()

# Ordre d'empilement : du meilleur au pire (A-B en bas, F-G en haut)
fig.add_trace(graph_objects.Bar(
    name='Bons DPE (A-B)',
    x=tranches_noms,
    y=[s['pct_bons'] for s in stats_par_tranche],
    marker_color='#27ae60',
    text=[f"{s['pct_bons']:.1f}%" for s in stats_par_tranche],
    textposition='inside',
    textfont=dict(color='white', size=11),
    hovertemplate='<b>%{x}</b><br>Bons DPE (A-B): %{y:.1f}%<extra></extra>'
))

fig.add_trace(graph_objects.Bar(
    name='DPE moyens (C-D)',
    x=tranches_noms,
    y=[s['pct_moyens'] for s in stats_par_tranche],
    marker_color='#f39c12',
    text=[f"{s['pct_moyens']:.1f}%" for s in stats_par_tranche],
    textposition='inside',
    textfont=dict(color='white', size=11),
    hovertemplate='<b>%{x}</b><br>DPE moyens (C-D): %{y:.1f}%<extra></extra>'
))

fig.add_trace(graph_objects.Bar(
    name='DPE m√©diocres (E)',
    x=tranches_noms,
    y=[s['pct_mediocres'] for s in stats_par_tranche],
    marker_color='#e67e22',
    text=[f"{s['pct_mediocres']:.1f}%" for s in stats_par_tranche],
    textposition='inside',
    textfont=dict(color='white', size=11),
    hovertemplate='<b>%{x}</b><br>DPE m√©diocres (E): %{y:.1f}%<extra></extra>'
))

fig.add_trace(graph_objects.Bar(
    name='PASSOIRES THERMIQUES (F-G)',
    x=tranches_noms,
    y=[s['pct_passoires'] for s in stats_par_tranche],
    marker_color='#e74c3c',
    text=[f"<b>{s['pct_passoires']:.1f}%</b><br>({s['nb_passoires']:,})" for s in stats_par_tranche],
    textposition='inside',
    textfont=dict(color='white', size=12, family='Arial, sans-serif'),
    hovertemplate='<b>%{x}</b><br>Passoires (F-G): %{y:.1f}%<extra></extra>'
))

Customize layout

In [None]:
fig.update_layout(
    # Empilement √† 100%
    barmode='stack',
    
    # Titre
    title={
        'text': (
            '<b>Concentration des passoires thermiques selon l\'altitude</b><br>'
            f'<sub>Mountain Energy Score - D√©partement Haute-Savoie (74)</sub>'
        ),
        'font': {'size': 22, 'family': 'Arial, sans-serif', 'color': '#2c3e50'},
        'x': 0.5,
        'xanchor': 'center'
    },
    
    # Axes
    xaxis=dict(
        title='<b>Tranche d\'altitude</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e')
    ),
    yaxis=dict(
        title='<b>R√©partition des DPE (%)</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e'),
        range=[0, 100],
        ticksuffix='%'
    ),
    
    # Style
    plot_bgcolor='white',
    paper_bgcolor='white',
    
    # L√©gende
    legend=dict(
        orientation='h',
        yanchor='bottom',
        y=1.02,
        xanchor='center',
        x=0.5,
        font=dict(size=11)
    ),
    
    # Dimensions
    width=1200,
    height=700,
    
    # Marges
    margin=dict(l=80, r=80, t=140, b=160)
)

In [None]:
fig.add_annotation(
    text=(
        f"<b>üî• Insight cl√© :</b> Les passoires thermiques (F/G) repr√©sentent "
        f"<b>{pct_vallee:.1f}%</b> des logements en vall√©e contre <b>{pct_montagne_max:.1f}%</b> en montagne,<br>"
        f"soit <b>√ó{ratio:.1f}</b> plus de risque d'avoir un logement √©nergivore en altitude. "
        f"Cette concentration r√©v√®le un enjeu majeur de r√©novation √©nerg√©tique en zone de montagne."
    ),
    xref="paper", yref="paper",
    x=0.5, y=-0.19,
    xanchor='center', yanchor='top',
    showarrow=False,
    bgcolor='rgba(255, 243, 205, 0.95)',
    bordercolor='#f39c12',
    borderwidth=2,
    borderpad=10,
    font=dict(size=11, family='Arial, sans-serif', color='#34495e')
)

## Periode de construction

In [None]:
df_valide = df[
    (df['altitude_moyenne'].notna()) & 
    (df['classe_altitude'].notna()) &
    (df['conso_5_usages_par_m2_ep'] <= 1000) &
    (df['periode_categorie'].notna())
]

Compute heatmap

In [None]:
ordre_tranches = [label for label in LABELS_ALTITUDE if label in df_valide['classe_altitude'].unique()]

# Ordre chronologique des p√©riodes
ordre_periodes = ['Avant 1975', '1975-2000', '2001-2012', 'Apr√®s 2012']
ordre_periodes = [p for p in ordre_periodes if p in df_valide['periode_categorie'].unique()]

In [None]:
tableau_conso = pd.DataFrame(index=ordre_periodes, columns=ordre_tranches)
tableau_effectifs = pd.DataFrame(index=ordre_periodes, columns=ordre_tranches)

for periode in ordre_periodes:
    for tranche in ordre_tranches:
        mask = (df_valide['periode_categorie'] == periode) & (df_valide['classe_altitude'] == tranche)
        logements = df_valide[mask]
        
        if len(logements) >= 10:  # Seuil minimum
            conso_moyenne = logements['conso_5_usages_par_m2_ep'].mean()
            effectif = len(logements)
            
            tableau_conso.loc[periode, tranche] = conso_moyenne
            tableau_effectifs.loc[periode, tranche] = effectif

Cross analysis

In [None]:
tableau_conso_numeric = tableau_conso.apply(pd.to_numeric, errors='coerce')
max_conso = tableau_conso_numeric.max().max()
max_position = tableau_conso_numeric.stack().idxmax()

pire_periode = max_position[0]
pire_tranche = max_position[1]

# Comparaison avec le meilleur
min_conso = tableau_conso_numeric.min().min()
min_position = tableau_conso_numeric.stack().idxmin()

meilleur_periode = min_position[0]
meilleur_tranche = min_position[1]

ecart = max_conso - min_conso
pct_ecart = (ecart / max_conso) * 100

Draw plot

In [None]:
z_data = tableau_conso_numeric.values

text_data = []
for i, periode in enumerate(tableau_conso.index):
    row_text = []
    for j, tranche in enumerate(tableau_conso.columns):
        conso = tableau_conso.iloc[i, j]
        effectif = tableau_effectifs.iloc[i, j]
        if pd.notna(conso):
            # Choix de la couleur de texte selon le fond de la cellule pour garantir la lisibilit√©
            # Seuil 220 kWh/m¬≤/an : correspond approximativement √† la limite entre fonds clairs et fonc√©s
            couleur = "black" if conso > 220 else "white"
            row_text.append(
                f"<span style='color:{couleur}'><b>{conso:.0f}</b> kWh/m¬≤/an<br>({int(effectif):,})</span>"
            )
        else:
            row_text.append("")
    text_data.append(row_text)

In [None]:
fig = graph_objects.Figure(data=graph_objects.Heatmap(
    z=z_data,
    x=ordre_tranches,
    y=ordre_periodes,
    text=text_data,
    texttemplate='%{text}',
    textfont={"size": 10, "family": "Arial, sans-serif"},
    colorscale='RdYlGn_r',  # Rouge (mauvais) ‚Üí Jaune ‚Üí Vert (bon), invers√©
    colorbar=dict(
        title=dict(
            text="Consommation<br>(kWh/m¬≤/an)",
            side="right"
        ),
        thickness=15,
        len=0.7
    ),
    hovertemplate=(
        '<b>%{y}</b><br>' +
        '%{x}<br>' +
        'Consommation: <b>%{z:.0f} kWh/m¬≤/an</b><br>' +
        '<extra></extra>'
    )
))

Customize layout

In [None]:
fig.update_layout(
    # Titre
    title={
        'text': (
            '<b>Double peine : anciennet√© du b√¢ti √ó altitude</b><br>'
            '<sub>Mountain Energy Score - D√©partement Haute-Savoie (74)</sub>'
        ),
        'font': {'size': 22, 'family': 'Arial, sans-serif', 'color': '#2c3e50'},
        'x': 0.5,
        'xanchor': 'center'
    },
    
    # Axes
    xaxis=dict(
        title='<b>Tranche d\'altitude</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=10, color='#34495e'),
        side='bottom',
        tickangle=0
    ),
    yaxis=dict(
        title='<b>P√©riode de construction</b>',
        title_font=dict(size=13, color='#34495e'),
        tickfont=dict(size=11, color='#34495e')
    ),
    
    # Style
    plot_bgcolor='white',
    paper_bgcolor='white',
    
    # Dimensions
    width=1200,
    height=700,
    
    # Marges
    margin=dict(l=120, r=150, t=120, b=160)
)

In [None]:
fig.add_annotation(
    text=(
        f"<b>üî• Insight cl√© :</b> Les logements <b>{pire_periode}</b> en <b>{pire_tranche.lower()}</b> "
        f"consomment jusqu'√† <b>{max_conso:.0f} kWh/m¬≤/an</b>, soit <b>{pct_ecart:.0f}% de plus</b> "
        f"que les logements r√©cents en vall√©e ({min_conso:.0f} kWh/m¬≤/an).<br>"
        f"Cette double peine (ancien b√¢ti + altitude) r√©v√®le une priorit√© absolue pour les politiques "
        f"de r√©novation √©nerg√©tique : <b>{int(tableau_effectifs.loc[pire_periode, pire_tranche]):,} logements</b> "
        f"sont concern√©s dans cette seule cat√©gorie."
    ),
    xref="paper", yref="paper",
    x=0.5, y=-0.19,
    xanchor='center', yanchor='top',
    showarrow=False,
    bgcolor='rgba(255, 243, 205, 0.95)',
    bordercolor='#f39c12',
    borderwidth=2,
    borderpad=10,
    font=dict(size=11, family='Arial, sans-serif', color='#34495e')
)