# Introduction ‚Äì Contexte  du projet

Dans un march√© immobilier en constante √©volution, prendre une d√©cision d‚Äôinvestissement √©clair√©e repose sur une compr√©hension fine des dynamiques locales : prix au m¬≤, attractivit√© des quartiers, proximit√© des services, ou encore potentiel locatif.
Gr√¢ce aux donn√©es fonci√®res publiques (DVF) mises √† disposition par le gouvernement fran√ßais, il est aujourd‚Äôhui possible d‚Äôanalyser ces tendances de mani√®re pr√©cise et objective.
Cette √©tude a pour objectif de fournir une analyse compl√®te du march√© immobilier afin d‚Äôidentifier les zones les plus attractives et rentables pour un investisseur souhaitant se positionner sur le locatif r√©sidentiel.
Elle s‚Äôappuie sur une approche data-driven, combinant le traitement, la visualisation et l‚Äôinterpr√©tation des donn√©es immobili√®res issues des ventes r√©elles.

## Objectif de l'√©tude 

L‚Äôobjectif est de proposer √† l‚Äôinvestisseur : 
Une vision claire du march√© immobilier dans plusieurs zones urbaines et p√©riurbaines fran√ßaises ;
Une √©valuation de la rentabilit√© potentielle en fonction du prix d‚Äôachat, du type de bien et du profil locatif vis√© ;
Des recommandations pr√©cises sur les zones √† privil√©gier pour maximiser la rentabilit√© et minimiser le risque locatif.




# üë©‚Äçüíº Persona ‚Äì Sara

Sara, 28 ans, souhaite r√©aliser son premier investissement locatif.  
Active et pr√©voyante, elle d√©sire placer son √©pargne dans un projet immobilier **simple, rentable et durable**.  
Son objectif est d‚Äôacqu√©rir un bien **sans travaux**, situ√© √† proximit√© d‚Äôune **grande m√©tropole**, afin de b√©n√©ficier d‚Äôune **forte demande locative** et de limiter les risques de vacance.

Sa **motivation principale** est de r√©aliser un **investissement concret et s√©curis√©**, dans une zone o√π la demande locative est naturellement soutenue.  
Elle privil√©gie la **stabilit√©** et la **rentabilit√© √† long terme**, plut√¥t que la sp√©culation √† court terme.

---

<div style="display:flex; align-items:flex-start; gap:25px; margin-top:15px;">

  <img src="avatar_Sara.jpeg" alt="Avatar Sara" width="170" style="border-radius:50%; box-shadow: 0 0 10px rgba(0,0,0,0.25);">

  <div style="line-height:1.7;">

  ### üë© Informations personnelles
  - **√Çge :** 28 ans  
  - **Situation :** jeune cadre salari√©e dans le secteur tertiaire  
  - **Localisation actuelle :** Lyon  
  - **Statut :** primo-investisseuse  
  - **Revenu mensuel net :** environ 2 500 ‚Ç¨  

  ### üéØ Objectifs d‚Äôinvestissement
  - R√©aliser un **premier placement locatif s√©curis√©**  
  - Cr√©er une **source de revenus compl√©mentaires**  
  - Se constituer un **patrimoine immobilier** sur le long terme  
  - Trouver un bien **cl√© en main**, sans travaux ni gestion complexe  

  ### üí∞ Budget et contraintes
  - **Budget global :** 100 000 √† 150 000 ‚Ç¨ (frais inclus)  
  - Aucun travaux √† pr√©voir (ni r√©novation, ni am√©nagement lourd)  
  - Investissement √† cr√©dit avec un apport mod√©r√© (5 √† 10 %)  
  - Rendement brut minimum recherch√© : **‚â• 5,5 %**

  ### üèôÔ∏è Localisation et crit√®res de recherche
  Sara cible prioritairement les **zones proches de grandes m√©tropoles** o√π la demande locative est forte :  
  - Banlieues √©tudiantes, villes universitaires, quartiers desservis par les transports  
  - Bonne accessibilit√©, commerces √† proximit√©, environnement s√©curis√©  

  ### üè† Typologie de biens recherch√©s
  **1. Investissement √©tudiant :**  
  Studio ou T1 de 20 √† 30 m¬≤, situ√© √† moins de **20 minutes √† pied d‚Äôune universit√© ou d‚Äôune grande √©cole**, meubl√© ou pr√™t √† louer.  
  Objectif : **rentabilit√© √©lev√©e**, avec un **turn-over locatif accept√©**.  

  **2. Investissement jeune couple :**  
  T2 ou petit T3 de 40 √† 55 m¬≤, avec **deux chambres**, dans un environnement calme et familial, proche des √©coles et services.  
  Objectif : **stabilit√© locative sur le long terme**.  

  ### üí¨ Sa demande
  > ‚ÄúJe veux un bien qui se loue facilement, sans avoir √† g√©rer des travaux ou des impr√©vus.  
  > L‚Äôid√©e, c‚Äôest de construire un patrimoine qui me rapporte d√®s aujourd‚Äôhui.‚Äù

  </div>
</div>






### Import

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import glob
import os
from sklearn.neighbors import BallTree

Notebook configuration

In [None]:
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)  

### Data Collect

Toutes les donn√©es viennent de ces liens.

- **Loyers eu m2 pour T1 et T2** : [https://www.data.gouv.fr/datasets/carte-des-loyers-indicateurs-de-loyers-dannonce-par-commune-en-2023/](https://www.data.gouv.fr/datasets/carte-des-loyers-indicateurs-de-loyers-dannonce-par-commune-en-2022/)
- **Arret de transport** : https://www.data.gouv.fr/datasets/arrets-de-transport-en-france/
- **Point culturel** : https://www.data.gouv.fr/datasets/base-des-lieux-et-equipements-culturels-basilic/
- **Etablissements d'enseignement des premier et second degr√©s** : https://data.education.gouv.fr/explore/dataset/fr-en-adresse-et-geolocalisation-etablissements-premier-et-second-degre/export/?disjunctive.numero_uai&disjunctive.code_departement&disjunctive.code_region&disjunctive.code_academie&disjunctive.nature_uai&disjunctive.nature_uai_libe&disjunctive.code_commune&disjunctive.libelle_departement&disjunctive.libelle_region&disjunctive.libelle_academie&disjunctive.secteur_prive_code_type_contrat&disjunctive.secteur_prive_libelle_type_contrat&disjunctive.code_ministere&disjunctive.libelle_ministere
- **Valeurs fonci√®re** : https://www.data.gouv.fr/datasets/demandes-de-valeurs-foncieres-geolocalisees/
- **Prix et indices de prix √† la consommation** (Carburant) : https://www.data.gouv.fr/datasets/prix-des-carburants-en-france-flux-instantane-v2-amelioree/
- d√©tail des loyers et autres par arrondissement de paris
- https://www.data.gouv.fr/datasets/communes-de-france-base-des-codes-postaux

Elles sont r√©cup√©rables via le lien Google Drive suivant : https://drive.google.com/file/d/1YN-JBqsOTZcvSHNrJZWFY7XpdvYqjkUx/view?usp=sharing

### Preprocessing

In [None]:
chunks = pd.read_csv('../Data/Carburant.csv', chunksize=1000000, low_memory=False, sep=";")

chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df1.columns = df1.columns.str.strip().str.lower().str.replace(' ', '_').str.replace('(', '').str.replace(')', '')
    chunk_list.append(df1[['code_postal', 'prix_gazole', 'prix_sp95' , 'prix_e85', 'prix_gplc', 'prix_sp98' , 'prix_e10']])

# Concatenate all chunks into a single DataFrame
df = pd.concat(chunk_list, ignore_index=True)
mean = df.groupby("code_postal").mean().reset_index()
mean['totmean'] = mean[['prix_gazole', 'prix_sp95' , 'prix_e85', 'prix_sp98' , 'prix_e10']].where(mean[['prix_gazole', 'prix_sp95' , 'prix_e85', 'prix_sp98' , 'prix_e10']] > 0).mean(axis=1)
mean['code_postal'] = mean['code_postal'].apply(lambda row: str(row).zfill(5))

# Display basic information about the dataset
print(mean.info())
print(mean.sort_values(by="prix_gazole", ascending=False).head(10))
mean.to_csv('../DataCleaned/Carburant_Cleaned.csv', index=False)

In [None]:
code_postal_ville = [
    #Ile-de-France
    "75000",
    "75001", "75002", "75003", "75004", "75005", "75006", "75007", "75008", "75009", "75010",
    "75011", "75012", "75013", "75014", "75015", "75016", "75017", "75018", "75019", "75020",
    "92100", "92110", "92120", "92130", "92140", "92150", "92160", "92170", "92190",
    "92200", "92210", "92220", "92230", "92240", "92250", "92260", "92270", "92290",
    "92300", "92310", "92320", "92330", "92340", "92350", "92360", "92370", "92380", "92390",   "92400", "92410", "92420", "92430", "92440", "92450", "92460", "92470", "92480", "92490",
    "92500", "92510", "92520", "92530", "92540", "92550", "92560", "92570", "92580", "92590",
    "92600", "92610", "92620", "92630", "92640", "92650", "92660", "92670", "92680", "92690",
    "92700", "92710", "92720", "92730", "92740", "92750", "92760", "92770", "92780", "92790",
    "92800", "92810", "92820", "92830", "92840", "92850", "92860", "92870", "92880", "92890",
    "92900", "92910", "92920", "92930", "92940", "92950", "92960", "92970", "92980", "92990",
    "93000", "93100", "93200", "93300", "93400", "93500", "93600", "93700", "93800", "93900",
    "94000", "94100", "94200", "94300", "94400", "94500", "94600", "94700", "94800", "94900",
    
    #Marseille
    "13000", "13001", "13002", "13003", "13004", "13005", "13006", "13007", "13008", "13009",
    "13010", "13011", "13012", "13013",
    
    #Aix-en-Provence
    "13080", "13100", "13190", "13290", "13540", "13590", "13700", "13800", "13990",
    
    #Lyon
    "69000", "69001", "69002", "69003", "69004", "69005", "69006", "69007", "69008", "69009",
    "69100", "69200", "69300", "69400", "69500", "69600", "69700", "69800", "69900",
    
    #Lille
    "59000", "59100", "59200", "59300", "59400", "59500", "59600", "59700", "59800", "59900",
    
    #Bordeaux
    "33000", "33100", "33200", "33300", "33400", "33500", "33600", "33700", "33800", "33900",
    
    #Toulouse
    "31000", "31100", "31200", "31300", "31400", "31500", "31600", "31700", "31800", "31900",
    
    #Nice
    "06000", "06100", "06200", "06300", "06400", "06500", "06600", "06700", "06800", "06900",
    
    #Nantes
    "44000", "44100", "44200", "44300", "44400", "44500", "44600", "44700", "44800", "44900",
    
    #Strasbourg
    "67000", "67100", "67200", "67300", "67400", "67500", "67600", "67700", "67800", "67900",
    
    #Montpellier
    "34000", "34100", "34200", "34300", "34400", "34500", "34600", "34700", "34800", "34900",
    
    #Rennes
    "35000", "35100", "35200", "35300", "35400", "35500", "35600", "35700", "35800", "35900",
    
    #Grenoble
    "38000", "38100", "38200", "38300", "38400", "38500", "38600", "38700", "38800", "38900",
    
    #Dijon
    "21000", "21100", "21200", "21300", "21400", "21500", "21600", "21700", "21800", "21900",   
    
    #Angers
    "49000", "49100", "49200", "49300", "49400", "49500", "49600", "49700", "49800", "49900",
    
    #Rennes
    "35000", "35100", "35200", "35300", "35400", "35500", "35600", "35700", "35800", "35900",
    
    #Le Havre
    "76000", "76100", "76200", "76300", "76400", "76500", "76600", "76700", "76800", "76900",
    
    #Saint-√âtienne
    "42000", "42100", "42200", "42300", "42400", "42500", "42600", "42700", "42800", "42900",
]

# === 1) Chemins des fichiers ===
communes_path = "../Data/communes-france-2025.csv"
adj_path = "../Data/communes_adjacentes_2022_toutes.csv"

# === 2) Charger les fichiers (en texte) ===
communes = pd.read_csv(communes_path, dtype=str)
adj = pd.read_csv(adj_path, dtype=str)

# === 3) V√©rifier que les colonnes utiles existent ===
# communes: code INSEE, nom de la commune, codes postaux
if not all(c in communes.columns for c in ["code_insee", "nom_standard", "codes_postaux"]):
    raise ValueError("Le fichier communes doit contenir: code_insee, nom_standard, codes_postaux")

# adjacences: code INSEE source, voisins INSEE
if not all(c in adj.columns for c in ["insee", "insee_voisins"]):
    raise ValueError("Le fichier adjacences doit contenir: insee, insee_voisins")

# === 4) Petite fonction pour d√©couper les listes (s√©parateur '|') ===
def split_pipe(value):
    """Retourne une liste en s√©parant par '|' (ou liste vide si NaN)."""
    if pd.isna(value):
        return []
    text = str(value).strip()
    if text == "":
        return []
    return [x.strip() for x in text.split("|") if x.strip()]

# === 5) Pr√©parer la table 'communes' ===
# On garde seulement les colonnes utiles, et on "explose" les codes postaux
communes_simple = communes[["code_insee", "nom_standard", "codes_postaux"]].copy()
communes_simple["liste_cp"] = communes_simple["codes_postaux"].apply(split_pipe)
communes_cp = communes_simple.explode("liste_cp", ignore_index=True)  # une ligne par code postal
communes_cp = communes_cp.rename(columns={
    "nom_standard": "commune",
    "liste_cp": "code_postal"
})

# === 6) Pr√©parer la table 'adjacences' ===
# On "explose" les voisins INSEE (une ligne par voisin)
adj["voisin_insee"] = adj["insee_voisins"].apply(split_pipe)
adj_long = adj.explode("voisin_insee", ignore_index=True)
adj_long = adj_long.dropna(subset=["voisin_insee"])  # garder seulement les lignes avec un voisin

# === 7) Joindre pour r√©cup√©rer les infos de la banlieue (voisine) ===
# On va chercher, pour chaque voisin_insee, son nom et ses codes postaux
banlieue_infos = communes_simple.rename(columns={
    "code_insee": "code_insee_banlieue",
    "nom_standard": "banlieue",
    "codes_postaux": "codes_postaux_banlieue"
})

adj_avec_banlieue = adj_long.merge(
    banlieue_infos,
    left_on="voisin_insee",
    right_on="code_insee_banlieue",
    how="left"
)

# === 8) Joindre pour r√©cup√©rer les infos de la commune source + son code postal (explos√©) ===
# On relie le code INSEE source (adj["insee"]) au code INSEE des communes (communes_cp["code_insee"])
final = adj_avec_banlieue.merge(
    communes_cp[["code_insee", "commune", "code_postal"]],
    left_on="insee",
    right_on="code_insee",
    how="left"
)

# === 9) Ne garder que les colonnes finales, enlever doublons et lignes incompl√®tes ===
banlieues_df = final[[
    "code_postal",           # CP de la commune source
    "commune",               # Nom de la commune source
    "insee",                 # INSEE source
    "banlieue",              # Nom de la commune voisine (banlieue)
    "code_insee_banlieue",   # INSEE de la banlieue
    "codes_postaux_banlieue" # CP(s) de la banlieue (s√©par√©s par '|')
]].rename(columns={"insee": "code_insee_source"})

# On enl√®ve les lignes o√π il manque l'essentiel
banlieues_df = banlieues_df.dropna(subset=["code_postal", "commune", "banlieue"])
banlieues_df = banlieues_df.drop_duplicates()

# === Filtrer une zone, ex. √éle-de-France (75, 92, 93, 94) ===, Paris, Marseille, 
banlieues_df = banlieues_df[banlieues_df["code_postal"].str.match(r"^(75|13|59|49|80|44|38)")]

# ---  Normaliser les codes postaux  ---
banlieues_df["code_postal"] = (
    banlieues_df["code_postal"]
    .astype(str)
    .str.extract(r"(\d{2,5})", expand=False)  # r√©cup√®re les chiffres principaux
    .fillna("")
    .str.zfill(5)
)

# ---  Filtrer : ne garder que les lignes dont le CP SOURCE est dans ta liste ---
cp_set = set(code_postal_ville)
extrait_source = banlieues_df[banlieues_df["code_postal"].isin(cp_set)].copy()

# ---  inclure aussi si la BANLIEUE poss√®de un CP dans ta liste ---
def banlieue_a_cp_dans_liste(cell, cp_set):
    """Retourne True si au moins un CP (s√©par√©s par '|') de la banlieue est dans code_postal_ville."""
    if pd.isna(cell) or str(cell).strip() == "":
        return False
    return any(cp.strip().zfill(5) in cp_set for cp in str(cell).split("|"))

mask_banlieue = banlieues_df["codes_postaux_banlieue"].apply(lambda x: banlieue_a_cp_dans_liste(x, cp_set))
extrait_banlieue = banlieues_df[mask_banlieue].copy()
code_postal_ville.extend(extrait_banlieue["code_postal"].tolist())
dfliste = pd.Series(code_postal_ville)

outfile = "../DataCleaned/metropoleetbanlieues_liste.csv"
dfliste.to_csv(outfile, index=False, encoding="utf-8")


In [None]:
chunks = pd.read_csv('../Data/Culture.csv', chunksize=1000000, low_memory=False, sep=";")


chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df2 = df1[['Code_Postal']].dropna()
    chunk_list.append(df2)

# Concatenate all chunks into a single DataFrame
df = pd.concat(chunk_list, ignore_index=True)

# Display basic information about the dataset
counts = df.groupby("Code_Postal").size().reset_index(name="CultureCount")
print(counts.sort_values(by="CultureCount", ascending=False).head(10))

counts.to_csv('../DataCleaned/Culture_Cleaned.csv', index=False)

In [None]:
# Load the CSV
chunks = pd.read_csv('../Data/ValeurFonciere.csv', chunksize=1000000, low_memory=False, sep=",")

chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df1 = df1[['nature_mutation','valeur_fonciere','code_postal','surface_reelle_bati','nombre_pieces_principales','type_local','longitude','latitude','date_mutation']]
    df1 = df1.dropna(subset=['code_postal'])
    df1['code_postal'] = df1['code_postal'].astype(float).astype(int).astype(str).str.zfill(5)
    df1['date_mutation'] = pd.to_datetime(df1['date_mutation'])
    chunk_list.append(df1)

# Concatenate all chunks into a single DataFrame
dftot = pd.concat(chunk_list, ignore_index=True)

# Display basic information about the dataset
print(dftot.info())
print(dftot.head())

dftot.to_csv('../DataCleaned/DVF_Cleaned.csv', index=False)

In [None]:
# Load the CSV
chunks = pd.read_csv('../Data/Education.csv', chunksize=1000000, low_memory=False, sep=";")

chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df2 = df1[['Adresse : code postal']].dropna().copy()
    df2 = df2.rename(columns={'Adresse : code postal':'CodePostal'})
    df2['CodePostal'] = df2['CodePostal'].apply(lambda value: str(value).zfill(5))
    chunk_list.append(df2)

# Concatenate all chunks into a single DataFrame
df = pd.concat(chunk_list, ignore_index=True)
count = df.groupby("CodePostal").size().reset_index(name="EducationCount")

# Display basic information about the dataset
print(count.info())
print(count.head())
print(count.sort_values(by="EducationCount", ascending=False).head(10))
count.to_csv('../DataCleaned/EducationCount_Cleaned.csv', index=False)

In [None]:
# Load the CSV
chunks = pd.read_csv('../Data/LoyerT1T2.csv', chunksize=1000000, low_memory=False, sep=";", encoding="latin1")

chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df2 = df1[['DEP', 'loypredm2']].dropna().copy()
    df2 = df2.rename(columns={'DEP':'D√©partement','loypredm2':'Loyerm2'})
    df2['Loyerm2'] = df2['Loyerm2'].astype(str).str.replace(',', '.').astype(float)
    chunk_list.append(df2)

# Concatenate all chunks into a single DataFrame
df = pd.concat(chunk_list, ignore_index=True)
df['Loyerm2'] = pd.to_numeric(df['Loyerm2'], errors='coerce')
mean = df.groupby("D√©partement")["Loyerm2"].mean().reset_index(name="Loyerm2Mean")

# Display basic information about the dataset
print(mean.sort_values(by="Loyerm2Mean", ascending=False).head())
mean.to_csv('../DataCleaned/LoyerT1T2_Cleaned.csv', index=False)

In [None]:
# stop_lat,stop_lon

# Load the CSV
df = pd.read_csv("../Data/latlongCP.csv", sep=",",low_memory=False)
chunks = pd.read_csv('../Data/Transport.csv', chunksize=1000000, low_memory=False, sep=",")

# Extract lat/lon as radians (for haversine distance)
df["lat"] = df["latitude"].astype(float)
df["lon"] = df["longitude"].astype(float)
df = df.dropna(subset=["lat", "lon", "code_postal"])
df = df.dropna()
coords_rad = np.radians(df[["lat", "lon"]].to_numpy())

# Build BallTree (fast nearest-neighbor search)
tree = BallTree(coords_rad, metric="haversine")

def latlon_to_zip(lat, lon):
    """Return closest postal code for given latitude, longitude."""
    dist, idx = tree.query(np.radians([[lat, lon]]), k=1)
    postal = df.iloc[idx[0][0]]["code_postal"]
    postal = str(postal).zfill(5)
    return str(postal)

chunk_list = []
for chunk in chunks:
    print("Processing a new chunk...")
    df1 = pd.DataFrame(chunk)
    df2 = df1[['stop_lat','stop_lon']].dropna()
    df3 = pd.DataFrame()
    df3['CodePostal'] = df2.apply(lambda row: latlon_to_zip(row['stop_lat'], row['stop_lon']), axis=1)
    chunk_list.append(df3)

# Concatenate all chunks into a single DataFrame
df = pd.concat(chunk_list, ignore_index=True)

# Display basic information about the dataset
counts = df3.groupby("CodePostal").size().reset_index(name="TransportCount")
print(counts.sort_values(by="TransportCount", ascending=False).head(10))

counts.to_csv('../DataCleaned/TransportCount_Cleaned.csv', index=False)

Les donn√©es sont nettoy√©es.
Un version de tous chaque dataset est dissponible via le lien Google Drive suivant : https://drive.google.com/file/d/1l78W2CqDkuUzNHIQrd7voMC0O00ExEa7/view?usp=sharing

### Data join

In [None]:
df_all_temp = {}
for dataset in ['Culture_Cleaned','Carburant_Cleaned','EducationCount_Cleaned','TransportCount_Cleaned','LoyerT1T2_Cleaned','metropoleetbanlieues_liste','DVF_Cleaned']:
    df_all_temp[dataset] = pd.read_csv('../DataCleaned/'+dataset+'.csv', low_memory=False, sep=",")

df_all = df_all_temp['DVF_Cleaned'].merge(df_all_temp['Carburant_Cleaned'], left_on="code_postal", right_on="code_postal")
df_all_temp.pop('DVF_Cleaned')
df_all_temp.pop('Carburant_Cleaned')
df_all = df_all.merge(df_all_temp['metropoleetbanlieues_liste'], left_on="code_postal", right_on="0", how='left')
df_all_temp.pop('metropoleetbanlieues_liste')
df_all = df_all.merge(df_all_temp['EducationCount_Cleaned'], left_on="code_postal", right_on="CodePostal", how='left')
df_all_temp.pop('EducationCount_Cleaned')
df_all = df_all.merge(df_all_temp['TransportCount_Cleaned'], left_on="code_postal", right_on="CodePostal", how='left')
df_all_temp.pop('TransportCount_Cleaned')
df_all['D√©partement'] = df_all['code_postal'].apply(lambda x : str(x).zfill(5)).str[:2]
df_all = df_all.merge(df_all_temp['LoyerT1T2_Cleaned'], left_on="D√©partement", right_on="D√©partement", how='left')
df_all_temp.pop('LoyerT1T2_Cleaned')
df_all['CodePostal'] = df_all['code_postal'].apply(lambda x : str(x).zfill(5))
df_all = df_all.merge(df_all_temp['Culture_Cleaned'], left_on="CodePostal", right_on="Code_Postal", how='left')
df_all_temp.pop('Culture_Cleaned')

print(df_all.head())

df_all.to_csv('../DataAll/Dataset.csv', index=False)

NameError: name 'pd' is not defined

Une fois les donn√©es rassembl√©e, nous pouvons les utiliser pour faire l'analyse.
Une version de ce dataset join est disponible via le lien Google Drive suivant : https://drive.google.com/file/d/1XiIpsO4sZ9qwRYCcc6EtoccFavcKQEwE/view?usp=sharing