In [37]:
# ============================================================================
# IMPORTS ET CONFIGURATION
# ============================================================================
import pandas as pd
import matplotlib.pyplot as plt
import numpy as np
import ipywidgets as widgets
from IPython.display import display, clear_output

%matplotlib inline
plt.style.use('seaborn-v0_8-darkgrid')
pd.set_option('display.max_columns', None)

# ============================================================================
# IMPORT DES DONN√âES
# ============================================================================
df = pd.read_csv('statistiques_grandes_villes_2020_2024_toutes_colonnes.csv', sep=';')
df.columns = df.columns.str.strip()

def corriger_annee(row):
    annee = row['annee']
    ville = row['ville']
    if pd.isna(annee):
        return None
    annee = int(annee)
    if ville == 'Lyon' and 20200 <= annee <= 20240:
        return 2020 + (annee - 20200) // 10
    if ville == 'Marseille' and 38380 <= annee <= 38460:
        return {38380: 2020, 38399: 2021, 38418: 2022, 38437: 2023, 38456: 2024}.get(annee)
    if ville == 'Paris' and 46460 <= annee <= 46560:
        return {46460: 2020, 46483: 2021, 46506: 2022, 46529: 2023, 46552: 2024}.get(annee)
    if 2020 <= annee <= 2024:
        return annee
    return None

df['annee_corrigee'] = df.apply(corriger_annee, axis=1)
df = df.dropna(subset=['annee_corrigee'])
df['annee'] = df['annee_corrigee'].astype(int)

df['prix_m2_moyen'] = pd.to_numeric(df['prix_m2_moyen'], errors='coerce')
df['nb_transactions'] = pd.to_numeric(df['nb_transactions'], errors='coerce')
df = df.dropna(subset=['prix_m2_moyen', 'ville'])

villes = sorted(df['ville'].unique())
print(f"‚úÖ Donn√©es pr√™tes ({len(df)} lignes). Villes disponibles : {', '.join(villes)}")


‚úÖ Donn√©es pr√™tes (45 lignes). Villes disponibles : Bordeaux, Grenoble, Lille, Lyon, Marseille, Montpellier, Paris, Rennes, Toulouse


In [38]:
# ===========================
# Cellule 1 ‚Äî S√©lection des villes
# ===========================
import ipywidgets as widgets
from IPython.display import display, clear_output

# On part du principe que 'df' existe d√©j√† (charg√© dans la cellule import/traitement).
# Cr√©ez ici les checkboxes ‚Äî variable globale city_checkboxes utilis√©e ensuite.
city_checkboxes = [widgets.Checkbox(value=False, description=v) for v in sorted(df['ville'].unique())]

# Contr√¥les pratiques : S√©lectionner tout / D√©cocher tout
btn_select_all = widgets.Button(description="Tout cocher", button_style='info')
btn_clear_all  = widgets.Button(description="Tout d√©cocher", button_style='warning')

def select_all(b):
    for cb in city_checkboxes:
        cb.value = True

def clear_all(b):
    for cb in city_checkboxes:
        cb.value = False

btn_select_all.on_click(select_all)
btn_clear_all.on_click(clear_all)

# Affichage : titre + boutons + grille de checkboxes
grid = widgets.GridBox(city_checkboxes, layout=widgets.Layout(grid_template_columns="repeat(3, 220px)"))
ui_select = widgets.VBox([
    widgets.HBox([btn_select_all, btn_clear_all]),
    grid,
])

display(ui_select)


VBox(children=(HBox(children=(Button(button_style='info', description='Tout cocher', style=ButtonStyle()), But‚Ä¶

In [None]:
import matplotlib.pyplot as plt
import numpy as np

# R√©cup√©ration dynamique des villes coch√©es
villes_selectionnees = [cb.description for cb in city_checkboxes if cb.value]

# V√©rification
villes_existantes = [v for v in villes_selectionnees if v in df['ville'].unique()]
if not villes_existantes:
    print("‚ö†Ô∏è Aucune ville valide s√©lectionn√©e.")
else:
    print(f"Affichage des donn√©es pour : {', '.join(villes_existantes)}\n")

    # --------------------------------------------------------------------
    # 1Ô∏è‚É£ √âVOLUTION DU PRIX MOYEN AU M¬≤
    # --------------------------------------------------------------------
    plt.figure(figsize=(10, 6))
    for ville in villes_existantes:
        data = df[df['ville'] == ville].sort_values('annee')
        plt.plot(data['annee'], data['prix_m2_moyen'], marker='o', label=ville)
    plt.title("√âvolution du prix moyen au m¬≤ (2020‚Äì2024)")
    plt.xlabel("Ann√©e")
    plt.ylabel("Prix moyen au m¬≤ (‚Ç¨)")
    plt.legend()
    plt.tight_layout()
    plt.show()

    # --------------------------------------------------------------------
    # 2Ô∏è‚É£ TAUX D'√âVOLUTION DU PRIX (2020 ‚Üí 2024)
    # --------------------------------------------------------------------
    evol_prix = []
    for ville in villes_existantes:
        data = df[df['ville'] == ville]
        p2020 = data[data['annee'] == 2020]['prix_m2_moyen']
        p2024 = data[data['annee'] == 2024]['prix_m2_moyen']
        if len(p2020) and len(p2024) and p2020.iloc[0] != 0:
            taux = ((p2024.iloc[0] - p2020.iloc[0]) / p2020.iloc[0]) * 100
            evol_prix.append((ville, taux))
    if evol_prix:
        villes_graph, taux_graph = zip(*evol_prix)
        plt.figure(figsize=(8, 5))
        plt.barh(villes_graph, taux_graph, color=['#388E3C' if x >= 0 else '#D32F2F' for x in taux_graph])
        plt.title("√âvolution du prix moyen au m¬≤ (2020‚Äì2024)")
        plt.xlabel("Taux d'√©volution (%)")
        plt.axvline(x=0, color='black', linestyle='--')
        plt.tight_layout()
        plt.show()

    # --------------------------------------------------------------------
    # 3Ô∏è‚É£ √âVOLUTION DU NOMBRE DE TRANSACTIONS
    # --------------------------------------------------------------------
    evol_trans = []
    for ville in villes_existantes:
        data = df[df['ville'] == ville]
        t2020 = data[data['annee'] == 2020]['nb_transactions']
        t2024 = data[data['annee'] == 2024]['nb_transactions']
        if len(t2020) and len(t2024) and t2020.iloc[0] != 0:
            taux = ((t2024.iloc[0] - t2020.iloc[0]) / t2020.iloc[0]) * 100
            evol_trans.append((ville, taux))

    if evol_trans:
        villes_graph, taux_graph = zip(*evol_trans)
        taux_graph = np.array(taux_graph, dtype=float)
        plt.figure(figsize=(8, 5))
        plt.barh(villes_graph, taux_graph, color=['#388E3C' if x >= 0 else '#D32F2F' for x in taux_graph])
        plt.title("√âvolution du nombre de transactions (2020‚Äì2024)")
        plt.xlabel("Taux d'√©volution (%)")
        plt.axvline(x=0, color='black', linestyle='--')
        plt.tight_layout()
        plt.show()
    else:
        print("‚ö†Ô∏è Pas de donn√©es suffisantes pour afficher les transactions.")


üì• CHARGEMENT DES FICHIERS CSV PAR VILLE

‚ùå [Paris] ERREUR : 'utf-8' codec can't decode byte 0xe9 in position 687: invalid continuation byte

‚ùå [Bordeaux] FICHIER NON TROUV√â : villes/BORDEAUX/Base_OP_2024_B3300.csv

‚ùå [Grenoble] FICHIER NON TROUV√â : villes/GRENOBLE/Base_OP_2024_L3800.csv

‚ùå [Lille] FICHIER NON TROUV√â : villes/LILLE/Base_OP_2024_L5900.csv

‚ùå [Lyon] ERREUR : 'utf-8' codec can't decode byte 0xe8 in position 9518: invalid continuation byte

‚ùå [Marseille] ERREUR : 'utf-8' codec can't decode byte 0xe8 in position 17848: invalid continuation byte

‚ùå [Montpellier] ERREUR : 'utf-8' codec can't decode byte 0xe8 in position 9232: invalid continuation byte

‚ùå [Rennes] ERREUR : 'utf-8' codec can't decode byte 0xe8 in position 9257: invalid continuation byte

‚ùå [Toulouse] ERREUR : 'utf-8' codec can't decode byte 0xe8 in position 8997: invalid continuation byte

‚ùå [Strasbourg] FICHIER NON TROUV√â : villes/STRASBOURG/Base_OP_2024_LXXXX.csv

üìä R√âCAPITULATIF

VBox(children=(HTML(value='<h3>‚úÖ S√©lectionnez les villes √† comparer :</h3>'), VBox(), HBox(children=(Button(bu‚Ä¶


üí° Conseil : Utilisez le widget ci-dessus pour s√©lectionner vos villes.
   Une fois valid√©, 'data_comparaison' sera disponible pour les analyses suivantes !
