## 🎓 Persona : Léa, jeune investisseuse étudiante

**Profil :**
- 👩 24 ans, diplômée de l'EM Lyon
- 💼 Première expérience professionnelle après 2 ans d'alternance
- 💰 Aide parentale pour le financement + épargne personnelle (~15 000 €)
- 🎯 Objectif : réaliser un **premier investissement locatif** dans une **ville étudiante dynamique**

---

### 💡 Objectif d'investissement
> Trouver le **meilleur investissement locatif étudiant** possible avec un **budget global de 200 000 €**,  
> en analysant la rentabilité brute dans les **principales villes étudiantes françaises** (studios et T1 ≤45m²)

---

### 💰 Hypothèses financières
| Élément | Montant estimé |
|----------|----------------|
| Prix d'achat visé | 160 000 – 180 000 € |
| Apport personnel | 15 000 € |
| Prêt immobilier estimé | 180 000 € sur 20 ans |
| Budget total (frais inclus) | **≈ 200 000 €** |
| Objectif de rentabilité brute | **≥ 5 %** |

---

### 🔍 Besoins data de Léa
- Évaluer le **taux de vacance locative** en France pour anticiper les périodes creuses (notamment l'été où les étudiants quittent les logements)
- Visualiser les **villes à forte concentration étudiante** en France
- Analyser l'**évolution du prix au m² à l'achat et des loyers étudiants** en France
- Etudier **la rentabilité moyenne en France** en 2024
- Analyser la **dynamique du marché immobilier local : croissance ou baisse des prix et loyers sur les 5 dernières années** (entre Rennes et Bordeaux)
- Comparer **les quartiers les plus rentables (rentabilité brute)** à ?
- Analyser la **localisation/nombre des transports en commun** pour identifier les zones les plus attractives pour les étudiants à ?
- Analyser la **localisation des universités/grandes écoles** à ?
- Analyser les **quartiers vivants (nombre de resto, bars, et supermarchés)** à ? 
- Fournir une **recommandation finale : "où investir avec 200k€ ?"**

---

### 🧭 Objectif du notebook
Créer un outil interactif permettant à Léa de :
1. Analyser la **rentabilité locative brute** pour appartements étudiants ≤45m² dans **23 grandes villes françaises**
2. Explorer visuellement les **villes à forte concentration étudiante** et analyser les **taux de vacance locative**
3. Obtenir un **classement des villes** par rentabilité, prix et loyers pour décider où investir avec 200k€

## 📚 Import des bibliothèques ##

In [104]:
import pandas as pd 
import plotly.express as px
import geopandas as gpd
import requests
import os
import osmnx as ox
from shapely.geometry import Point

# 2e vision : Analyse resserrée sur des villes #

### Analyser la **dynamique du marché immobilier local : croissance ou baisse des prix et loyers sur les 5 dernières années** (entre Rennes et Bordeaux) ###

In [105]:
print("Partie Axel")

Partie Axel


### Comparer **les quartiers les plus rentables (rentabilité brute)** à ? ###

In [106]:
print("Partie Lucien")

Partie Lucien


### Analyser la **localisation/nombre des transports en commun** pour identifier les zones les plus attractives pour les étudiants à ?  ###

In [107]:
print("Partie Valentine")

Partie Valentine


### Analyser la **localisation des universités/grandes écoles** à ? ###

In [108]:
url_df_enseignement_sup = "https://huggingface.co/datasets/analysedonneesfoncieresdata/analyse_fonciere_data/resolve/main/fr-esr-atlas_regional-effectifs-d-etudiants-inscrits-detail_etablissements.csv"

df_enseignement_sup = pd.read_csv(url_df_enseignement_sup, delimiter=';')

df_enseignement_sup.head()

Unnamed: 0,Rentrée universitaire,catégorie d'établissement,secteur d'établissement,code UAI de l'établissement,sigle de l'établissement,libellé de l'établissement,libellé complémentaire de l'établissement,Code UAI de la composante,sigle de la composante,libellé de la composante,...,id unité urbaine,unité urbaine,code commune,Commune,gps,degetu,degre_etudes,nombre total d’étudiants inscrits hors doubles inscriptions université/CPGE,dont femmes,dont hommes
0,2023,"Écoles de commerce, gestion et vente",Privé,0562044T,EC TECH SUP PR,GROUPE AFTEC,IPAC BACHELOR FACTORY VANNES,0562044T,EC TECH SUP PR,GROUPE AFTEC,...,UU56501,Vannes,56158,Plescop,"47.67764394859038, -2.80211043128016",3.0,BAC + 3,112,96,16
1,2023,"Écoles de commerce, gestion et vente",Privé,0590346F,SKEMA LILLE,SKEMA BUSINESS SCHOOL LILLE,,0060656F,E.COM,ECOLE DE COMMERCE,...,UU06701,Nice,6152,Valbonne,"43.61328883276337, 7.056290282560445",6.0,BAC + 6 et plus,19,9,10
2,2023,"Écoles de commerce, gestion et vente",Privé,0590346F,SKEMA LILLE,SKEMA BUSINESS SCHOOL LILLE,,216P0001,SKEMA CHINE,SKEMA BUSINESS SCHOOL,...,CHI99216,Suzhou,99216,Suzhou,,4.0,BAC + 4,389,67,322
3,2023,"Écoles de commerce, gestion et vente",Privé,0590350K,EDHEC LILLE,EDHEC BUSINESS SCHOOL,MEMBRE FUPL,0755719J,EDHEC,CENTRE DE FORMATION CONTINUE,...,UU00851,Paris,75102,Paris 2e,,5.0,BAC + 5,387,162,225
4,2023,"Écoles de commerce, gestion et vente",Privé,0593202K,IESEG LILLE,INST ECO SCIENT GESTION LILLE,MEMBRE FUPL,0593202K,IESEG LILLE,INST ECO SCIENT GESTION LILLE,...,UU59702,Lille,59350,Lille,"50.63553116922688, 3.044909976114497",2.0,BAC + 2,739,285,454


In [109]:
df_rennes = df_enseignement_sup[df_enseignement_sup['Commune'] == 'Rennes']

print(f"Nombre de lignes à Rennes :", df_rennes.shape[0])
print(f"Nombres de lignes avec gps à Rennes :", (df_rennes['gps'].isnull() == False).sum())
print(f"Nombres de lignes sans gps à Rennes avant drop:", df_rennes['gps'].isnull().sum())

df_rennes = df_rennes.dropna(subset=['gps'])

print(f"Nombres de lignes sans gps à Rennes après drop:", df_rennes['gps'].isnull().sum())
df_rennes.head()

Nombre de lignes à Rennes : 1531
Nombres de lignes avec gps à Rennes : 1461
Nombres de lignes sans gps à Rennes avant drop: 70
Nombres de lignes sans gps à Rennes après drop: 0


Unnamed: 0,Rentrée universitaire,catégorie d'établissement,secteur d'établissement,code UAI de l'établissement,sigle de l'établissement,libellé de l'établissement,libellé complémentaire de l'établissement,Code UAI de la composante,sigle de la composante,libellé de la composante,...,id unité urbaine,unité urbaine,code commune,Commune,gps,degetu,degre_etudes,nombre total d’étudiants inscrits hors doubles inscriptions université/CPGE,dont femmes,dont hommes
322,2022,Lycées,Privé,0352267Z,ECP PR,ECOLE PRIVEE COIF ESTHETIQUE,L'ACADEMY - SILVYA TERRADE REN,0352267Z,ECP PR,ECOLE PRIVEE COIF ESTHETIQUE,...,UU35701,Rennes,35238,Rennes,"48.10427073898263, -1.6691603554365282",2.0,BAC + 2,9,8,1
583,2023,Universités,Public,0353074B,UR (EPE),UNIVERSITE,DE RENNES (EPE),0352076S,UFR SC VIE ENV,UFR SCIENCES VIE ENVIRONNEMENT,...,UU35701,Rennes,35238,Rennes,"48.11412271889446, -1.6376903820335271",6.0,BAC + 6 et plus,61,35,26
820,2021,Écoles d'ingénieurs,Public,0350097R,INSA RENNES,INST NAT SC APPLIQ RENNES,,0350097R,INSA RENNES,INST NAT SC APPLIQ RENNES,...,UU35701,Rennes,35238,Rennes,"48.1215800418907, -1.6329696980490491",4.0,BAC + 4,411,126,285
878,2019,Universités,Public,0290346U,U BREST,UNIVERSITE BREST,BRETAGNE OCCIDENTALE,0352076S,UFR SC VIE ENV,UFR SCIENCES VIE ENVIRONNEMENT,...,UU35701,Rennes,35238,Rennes,"48.11412271889446, -1.6376903820335271",,,48,27,21
1196,2015,Universités,Public,0350936C,U RENNES 1,UNIVERSITE RENNES 1,UNIVERSITE RENNES 1,0350075S,IG RENNES 1,INSTITUT DE GESTION RENNES 1,...,UU35701,Rennes,35238,Rennes,"48.11728104154247, -1.6723406266225596",,,1339,753,586


In [110]:
# Nettoyage des coordonnées
df_rennes[['lat', 'lon']] = df_rennes['gps'].str.split(',', expand=True)
df_rennes['lat'] = df_rennes['lat'].astype(float)
df_rennes['lon'] = df_rennes['lon'].astype(float)

print(f"Nombre de lignes à Rennes :", df_rennes[['lat', 'lon']].shape[0])
print(f"Nombres de lignes avec lat et lon à Rennes :", ((df_rennes['lat'].isnull() == False) & (df_rennes['lon'].isnull() == False)).sum())
print(f"Nombres de lignes sans lat et lon à Rennes avant drop:", ((df_rennes['lat'].isnull()) & (df_rennes['lon'].isnull())).sum())

# On enlève les lignes sans coordonnées
df_rennes = df_rennes.dropna(subset=['lat', 'lon'])

print(f"Nombres de lignes sans lat et lon à Rennes après drop:", ((df_rennes['lat'].isnull()) & (df_rennes['lon'].isnull())).sum())

Nombre de lignes à Rennes : 1461
Nombres de lignes avec lat et lon à Rennes : 1461
Nombres de lignes sans lat et lon à Rennes avant drop: 0
Nombres de lignes sans lat et lon à Rennes après drop: 0


In [111]:
# Transformation en GeoDataFrame 
df_rennes = gpd.GeoDataFrame(
    df_rennes,
    geometry=gpd.points_from_xy(df_rennes.lon, df_rennes.lat),
    crs="EPSG:4326"  # WGS84
)

In [112]:
df_bordeaux = df_enseignement_sup[df_enseignement_sup['Commune'] == 'Bordeaux']

print(f"Nombre de lignes à Bordeaux :", df_bordeaux.shape[0])
print(f"Nombres de lignes avec gps à Bordeaux :", (df_bordeaux['gps'].isnull() == False).sum())
print(f"Nombres de lignes sans gps à Bordeaux avant drop:", df_bordeaux['gps'].isnull().sum())

df_bordeaux = df_bordeaux.dropna(subset=['gps'])

print(f"Nombres de lignes sans gps à Bordeaux après drop:", df_bordeaux['gps'].isnull().sum())
df_bordeaux.head()

Nombre de lignes à Bordeaux : 1611
Nombres de lignes avec gps à Bordeaux : 1455
Nombres de lignes sans gps à Bordeaux avant drop: 156
Nombres de lignes sans gps à Bordeaux après drop: 0


Unnamed: 0,Rentrée universitaire,catégorie d'établissement,secteur d'établissement,code UAI de l'établissement,sigle de l'établissement,libellé de l'établissement,libellé complémentaire de l'établissement,Code UAI de la composante,sigle de la composante,libellé de la composante,...,id unité urbaine,unité urbaine,code commune,Commune,gps,degetu,degre_etudes,nombre total d’étudiants inscrits hors doubles inscriptions université/CPGE,dont femmes,dont hommes
25,2023,Écoles d'ingénieurs,Privé,0922455U,CESI EI NANTER,CESI ECOLE INGENIEURS NANTERRE,CESI PARIS,0332984P,CESI EI BDEAUX,CESI ECOLE INGENIEURS BORDEAUX,...,UU33701,Bordeaux,33063,Bordeaux,"44.864981775219746, -0.5775733061462319",2.0,BAC + 2,15,5,10
110,2023,Lycées,Public,0330023W,LGT,LYCEE GENERAL ET TECHNOLOGIQUE,CAMILLE JULLIAN,0330023W,LGT,LYCEE GENERAL ET TECHNOLOGIQUE,...,UU33701,Bordeaux,33063,Bordeaux,"44.844623375958385, -0.5902035283353784",1.0,BAC + 1,204,112,92
367,2022,Lycées,Public,0332468D,LT LYC METIER,LT LYCEE DES METIERS,BIOLOGIE ET CHIMIE ST LOUIS,0332468D,LT LYC METIER,LT LYCEE DES METIERS,...,UU33701,Bordeaux,33063,Bordeaux,"44.866484243847566, -0.5674100961785374",1.0,BAC + 1,137,99,38
565,2023,"Écoles de commerce, gestion et vente",Privé,0332524P,INSEEC BORDX,INST HTES ETUDES ECO COM BORDX,GROUPE OMNES EDUCATION,0332524P,INSEEC BORDX,INST HTES ETUDES ECO COM BORDX,...,UU33701,Bordeaux,33063,Bordeaux,"44.859124286097206, -0.5557964100719849",3.0,BAC + 3,29,14,15
567,2023,"Écoles de commerce, gestion et vente",Privé,0332818J,ECE BORDEAUX,ECOLE COMMERCE EUROP BORDEAUX,GROUPE OMNES EDUCATION,0332818J,ECE BORDEAUX,ECOLE COMMERCE EUROP BORDEAUX,...,UU33701,Bordeaux,33063,Bordeaux,"44.85182005849977, -0.5705147414347582",2.0,BAC + 2,346,157,189


In [113]:
# Nettoyage des coordonnées
df_bordeaux[['lat', 'lon']] = df_bordeaux['gps'].str.split(',', expand=True)
df_bordeaux['lat'] = df_bordeaux['lat'].astype(float)
df_bordeaux['lon'] = df_bordeaux['lon'].astype(float)

print(f"Nombre de lignes à Bordeaux :", df_bordeaux[['lat', 'lon']].shape[0])
print(f"Nombres de lignes avec lat et lon à Bordeaux :", ((df_bordeaux['lat'].isnull() == False) & (df_bordeaux['lon'].isnull() == False)).sum())
print(f"Nombres de lignes sans lat et lon à Bordeaux avant drop:", ((df_bordeaux['lat'].isnull()) & (df_bordeaux['lon'].isnull())).sum())

# On enlève les lignes sans coordonnées
df_bordeaux = df_bordeaux.dropna(subset=['lat', 'lon'])

print(f"Nombres de lignes sans lat et lon à Bordeaux après drop:", ((df_bordeaux['lat'].isnull()) & (df_bordeaux['lon'].isnull())).sum())

Nombre de lignes à Bordeaux : 1455
Nombres de lignes avec lat et lon à Bordeaux : 1455
Nombres de lignes sans lat et lon à Bordeaux avant drop: 0
Nombres de lignes sans lat et lon à Bordeaux après drop: 0


In [114]:
# Transformation en GeoDataFrame 
df_bordeaux = gpd.GeoDataFrame(
    df_bordeaux,
    geometry=gpd.points_from_xy(df_bordeaux.lon, df_bordeaux.lat),
    crs="EPSG:4326"  # WGS84
)

In [115]:
url_iris = "https://huggingface.co/datasets/analysedonneesfoncieresdata/analyse_fonciere_data/resolve/main/contours-iris-pe.gpkg"
local_path = "contours-iris-pe.gpkg"

# Télécharger une seule fois
if not os.path.exists(local_path):
    print("Téléchargement du fichier...")
    r = requests.get(url_iris)
    with open(local_path, "wb") as f:
        f.write(r.content)

# Lister les couches avec fiona
from fiona import listlayers
layers = listlayers(local_path)
print("Couches disponibles:", layers)

# Charger la couche principale
iris = gpd.read_file(local_path, layer=layers[0])
iris.head()


Couches disponibles: ['contours_iris_pe']


Unnamed: 0,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,geometry
0,IRIS____0000000670430101,67043,Bischheim,101,670430101,Bischheim,A,"MULTIPOLYGON (((1052052.5 6848302.2, 1052346.7..."
1,IRIS____0000000132020101,13202,Marseille 2e Arrondissement,101,132020101,Marseille 2e Arrondissement,A,"MULTIPOLYGON (((892392.4 6249040.5, 892189 624..."
2,IRIS____0000000561850101,56185,Quéven,101,561850101,Quéven,A,"MULTIPOLYGON (((217035.9 6759952.7, 216941.9 6..."
3,IRIS____0000000930630101,93063,Romainville,101,930630101,Romainville,A,"MULTIPOLYGON (((659020 6865990.2, 658978.6 686..."
4,IRIS____0000000940480101,94048,Marolles-en-Brie,101,940480101,Marolles-en-Brie,A,"MULTIPOLYGON (((667454 6850589.8, 667714.1 685..."


In [116]:
url_ref_iris = "https://huggingface.co/datasets/analysedonneesfoncieresdata/analyse_fonciere_data/resolve/main/reference_IRIS_geo2025.xlsx"

iris_noms = pd.read_excel(url_ref_iris)

iris_noms = iris_noms.rename(columns={'CODE_IRIS': 'code_iris'})

# fusion avec ton GeoDataFrame (qui contient les codes IRIS)
iris = iris.merge(iris_noms[['code_iris', 'LIB_IRIS', 'LIBCOM']], on='code_iris', how='left')

iris.head()


Unnamed: 0,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,geometry,LIB_IRIS,LIBCOM
0,IRIS____0000000670430101,67043,Bischheim,101,670430101,Bischheim,A,"MULTIPOLYGON (((1052052.5 6848302.2, 1052346.7...",Annexe,Bischheim
1,IRIS____0000000132020101,13202,Marseille 2e Arrondissement,101,132020101,Marseille 2e Arrondissement,A,"MULTIPOLYGON (((892392.4 6249040.5, 892189 624...",Arenc,Marseille 2e Arrondissement
2,IRIS____0000000561850101,56185,Quéven,101,561850101,Quéven,A,"MULTIPOLYGON (((217035.9 6759952.7, 216941.9 6...",B.A.N. Lann Bihoué,Quéven
3,IRIS____0000000930630101,93063,Romainville,101,930630101,Romainville,A,"MULTIPOLYGON (((659020 6865990.2, 658978.6 686...",Bas Pays,Romainville
4,IRIS____0000000940480101,94048,Marolles-en-Brie,101,940480101,Marolles-en-Brie,A,"MULTIPOLYGON (((667454 6850589.8, 667714.1 685...",Bois de Notre-Dame,Marolles-en-Brie


In [117]:
# Filtrer
iris_rennes = iris[iris['nom_commune'].str.contains("Rennes", case=False, na=False)].copy()

print(f"Rennes contient", len(iris_rennes), "IRIS")

iris_rennes.head()

Rennes contient 146 IRIS


Unnamed: 0,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,geometry,LIB_IRIS,LIBCOM
489,IRIS____0000000352380308,35238,Rennes,308,352380308,Rennes,A,"MULTIPOLYGON (((349041.8 6789540.4, 349108.7 6...",Z.A. Ouest,Rennes
516,IRIS____0000000352380403,35238,Rennes,403,352380403,Rennes,A,"MULTIPOLYGON (((352060.5 6791899.6, 351994.9 6...",Z.A. Nord,Rennes
575,IRIS____0000000352380607,35238,Rennes,607,352380607,Rennes,A,"MULTIPOLYGON (((355296.3 6788725.3, 354873.5 6...",Plaine de Baud,Rennes
597,IRIS____0000000352380704,35238,Rennes,704,352380704,Rennes,A,"MULTIPOLYGON (((354457.9 6788601.8, 354873.5 6...",Z.A. Sud Est,Rennes
1032,IRIS____0000000352380307,35238,Rennes,307,352380307,Rennes,D,"MULTIPOLYGON (((348304.3 6789477.5, 348125.4 6...",Champeaux,Rennes


In [118]:
# On met tout dans la même CRS projetée (ex: EPSG:2154 ou utiliser EPSG:4326 par la suite)
iris_rennes = iris_rennes.to_crs(epsg=4326)
df_rennes = df_rennes.to_crs(epsg=4326)


In [119]:
# spatial join : chaque établissement rattaché à un IRIS
etabs_par_iris_rennes = gpd.sjoin(df_rennes, iris_rennes, how="inner", predicate="within")
etabs_par_iris_rennes.head()

Unnamed: 0,Rentrée universitaire,catégorie d'établissement,secteur d'établissement,code UAI de l'établissement,sigle de l'établissement,libellé de l'établissement,libellé complémentaire de l'établissement,Code UAI de la composante,sigle de la composante,libellé de la composante,...,index_right,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,LIB_IRIS,LIBCOM
322,2022,Lycées,Privé,0352267Z,ECP PR,ECOLE PRIVEE COIF ESTHETIQUE,L'ACADEMY - SILVYA TERRADE REN,0352267Z,ECP PR,ECOLE PRIVEE COIF ESTHETIQUE,...,10225,IRIS____0000000352380207,35238,Rennes,207,352380207,Rennes,H,Saint-Hélier,Rennes
583,2023,Universités,Public,0353074B,UR (EPE),UNIVERSITE,DE RENNES (EPE),0352076S,UFR SC VIE ENV,UFR SCIENCES VIE ENVIRONNEMENT,...,12606,IRIS____0000000352380605,35238,Rennes,605,352380605,Rennes,H,Campus de Beaulieu,Rennes
820,2021,Écoles d'ingénieurs,Public,0350097R,INSA RENNES,INST NAT SC APPLIQ RENNES,,0350097R,INSA RENNES,INST NAT SC APPLIQ RENNES,...,12606,IRIS____0000000352380605,35238,Rennes,605,352380605,Rennes,H,Campus de Beaulieu,Rennes
878,2019,Universités,Public,0290346U,U BREST,UNIVERSITE BREST,BRETAGNE OCCIDENTALE,0352076S,UFR SC VIE ENV,UFR SCIENCES VIE ENVIRONNEMENT,...,12606,IRIS____0000000352380605,35238,Rennes,605,352380605,Rennes,H,Campus de Beaulieu,Rennes
1196,2015,Universités,Public,0350936C,U RENNES 1,UNIVERSITE RENNES 1,UNIVERSITE RENNES 1,0350075S,IG RENNES 1,INSTITUT DE GESTION RENNES 1,...,9919,IRIS____0000000352380203,35238,Rennes,203,352380203,Rennes,H,Jean Macé,Rennes


In [120]:
iris_rennes_stats = iris_rennes.copy()

# Nombre d'établissements
iris_rennes_stats = iris_rennes_stats.merge(
    etabs_par_iris_rennes.groupby('LIB_IRIS').size().reset_index(name='nb_etabs'),
    on='LIB_IRIS', how='left'
).fillna({'nb_etabs':0})
iris_rennes_stats['nb_etabs'] = iris_rennes_stats['nb_etabs'].astype(int)

# Nombre total d'étudiants
iris_rennes_stats = iris_rennes_stats.merge(
    etabs_par_iris_rennes.groupby('LIB_IRIS')['nombre total d’étudiants inscrits hors doubles inscriptions université/CPGE'].sum().reset_index(name='nb_etudiants'),
    on='LIB_IRIS', how='left'
).fillna({'nb_etudiants':0})
iris_rennes_stats['nb_etudiants'] = iris_rennes_stats['nb_etudiants'].astype(int)

iris_rennes_stats = iris_rennes_stats.to_crs(epsg=2154)  # crs projetée pour calculer surface en m²
iris_rennes_stats['area_m2'] = iris_rennes_stats.geometry.area
iris_rennes_stats['etabs_per_m2'] = iris_rennes_stats['nb_etabs'] / iris_rennes_stats['area_m2']
iris_rennes_stats['students_per_m2'] = iris_rennes_stats['nb_etudiants'] / iris_rennes_stats['area_m2']

In [121]:
# reconvertir en 4326
iris_plot = iris_rennes_stats.to_crs(epsg=4326)

colorscale = "YlOrRd"  # jaune = faible, rouge = élevé

# Carte initiale avec coloraxis défini
fig = px.choropleth_mapbox(
    iris_plot,
    geojson=iris_plot.__geo_interface__,
    locations=iris_plot.index,
    color='students_per_m2',  # initial color
    hover_name='LIB_IRIS',
    hover_data=['nb_etabs','area_m2','nb_etudiants'],
    mapbox_style="carto-positron",
    center={"lat":48.117, "lon":-1.677},
    zoom=12,
    opacity=0.6,
)

# On associe explicitement la trace à coloraxis et fixe les limites
fig.update_traces(
    coloraxis="coloraxis"
)

# Définition globale de coloraxis
fig.update_layout(
    coloraxis=dict(
        colorscale=colorscale,
        cmin=iris_plot['students_per_m2'].min(),
        cmax=iris_plot['students_per_m2'].max(),
        colorbar=dict(title="Étudiants/m²")
    )
)

# Points établissements
fig.add_scattermapbox(
    lat=df_rennes['lat'],
    lon=df_rennes['lon'],
    mode='markers',
    marker=dict(size=6, color='blue'),
    text=etabs_par_iris_rennes["libellé de l'établissement"],
    name='Établissements OSM'
)

# Boutons interactifs : on ne touche qu'à z, zmin, zmax
fig.update_layout(
    updatemenus=[
        dict(
            type="buttons",
            x=0.0, y=1.05, showactive=True,
            buttons=[
                dict(
                    label="Densité",
                    method="update",
                    args=[
                        {"z": [iris_plot['students_per_m2']]},
                        {"coloraxis.cmin": iris_plot['students_per_m2'].min(),
                         "coloraxis.cmax": iris_plot['students_per_m2'].max(),
                         "coloraxis.colorbar.title": "Étudiants/m²"}
                    ]
                ),
                dict(
                    label="Nombre d'étudiants",
                    method="update",
                    args=[
                        {"z": [iris_plot['nb_etudiants']]},
                        {"coloraxis.cmin": iris_plot['nb_etudiants'].min(),
                         "coloraxis.cmax": iris_plot['nb_etudiants'].max(),
                         "coloraxis.colorbar.title": "Nombre d'étudiants"}
                    ]
                ),
            ]
        )
    ]
)

fig.update_layout(margin={"r":0,"t":50,"l":0,"b":0}, title="Étudiants sup. par IRIS - Rennes")
fig.show()



*choropleth_mapbox* is deprecated! Use *choropleth_map* instead. Learn more at: https://plotly.com/python/mapbox-to-maplibre/



In [122]:
top10_iris_rennes = iris_rennes_stats.sort_values(by='students_per_m2', ascending=False).head(10)

fig = px.bar(
    top10_iris_rennes,
    x='LIB_IRIS',
    y='students_per_m2',
    hover_data=['nb_etudiants','area_m2','nb_etabs'],
    color='students_per_m2',
    color_continuous_scale='YlOrRd',
    title="Top 10 IRIS les plus denses en étudiants - Rennes"
)

fig.update_layout(xaxis_title="Quartier (IRIS)", yaxis_title="Étudiants / m²")
fig.show()


## A RETRAVAILLER LE BLOC EN DESSOUS, POUR NE GARDER QUE LUI ET FAIRE PAREIL A BORDEAUX ##

In [130]:
colorscale = "YlOrRd"  # jaune = faible, rouge = élevé

# Top 10 IRIS par densité (par défaut)
top10_iris_rennes = iris_rennes_stats.sort_values(by='students_per_m2', ascending=False).head(10)

fig = px.bar(
    top10_iris_rennes,
    x='LIB_IRIS',
    y='students_per_m2',
    hover_data=['nb_etudiants','area_m2','nb_etabs'],
    color='students_per_m2',
    color_continuous_scale=colorscale,
    title="Top 10 IRIS les plus denses en étudiants - Rennes"
)

# Forcer l'usage d'une coloraxis pour pouvoir la mettre à jour
fig.update_traces(marker_color=top10_iris_rennes['students_per_m2'], marker_colorscale=colorscale, marker_showscale=True)

# Boutons interactifs : densité vs nombre d'étudiants
fig.update_layout(
    updatemenus=[
        dict(
            type="buttons",
            x=0.0, y=1.05, showactive=True,
            buttons=[
                dict(
                    label="Densité",
                    method="update",
                    args=[
                        {"y": [top10_iris_rennes['students_per_m2']],
                         "marker.color": top10_iris_rennes['students_per_m2']},
                        {"coloraxis": dict(cmin=top10_iris_rennes['students_per_m2'].min(),
                                           cmax=top10_iris_rennes['students_per_m2'].max(),
                                           colorscale=colorscale,
                                           colorbar=dict(title="Étudiants/m²"))}
                    ]
                ),
                dict(
                    label="Nombre d'étudiants",
                    method="update",
                    args=[
                        {"y": [top10_iris_rennes['nb_etudiants']],
                         "marker.color": top10_iris_rennes['nb_etudiants']},
                        {"coloraxis": dict(cmin=top10_iris_rennes['nb_etudiants'].min(),
                                           cmax=top10_iris_rennes['nb_etudiants'].max(),
                                           colorscale=colorscale,
                                           colorbar=dict(title="Nombre d'étudiants"))}
                    ]
                ),
            ]
        )
    ]
)

fig.update_layout(xaxis_title="Quartier (IRIS)", yaxis_title="Étudiants / m²")
fig.show()


In [123]:
# Filtrer
iris_bordeaux = iris[iris['nom_commune'].str.contains("Bordeaux", case=False, na=False)].copy()

print(f"Bordeaux contient", len(iris_bordeaux), "IRIS")

iris_bordeaux.head()

Bordeaux contient 95 IRIS


Unnamed: 0,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,geometry,LIB_IRIS,LIBCOM
20,IRIS____0000000330630101,33063,Bordeaux,101,330630101,Bordeaux,A,"MULTIPOLYGON (((417619.6 6426179.6, 417619.3 6...",Le Lac 1,Bordeaux
405,IRIS____0000000330630201,33063,Bordeaux,201,330630201,Bordeaux,A,"MULTIPOLYGON (((418606.2 6425087.8, 418382.6 6...",Bacalan 1,Bordeaux
639,IRIS____0000000330631002,33063,Bordeaux,1002,330631002,Bordeaux,A,"MULTIPOLYGON (((416987.2 6422238.3, 417087.3 6...",Saint-Bruno-Saint-Victor 2,Bordeaux
2167,IRIS____0000000330130101,33013,Artigues-près-Bordeaux,101,330130101,Artigues-près-Bordeaux,H,"MULTIPOLYGON (((423289 6425075.8, 423550.3 642...",Nord,Artigues-près-Bordeaux
5098,IRIS____0000000330630103,33063,Bordeaux,103,330630103,Bordeaux,H,"MULTIPOLYGON (((417647.5 6425295, 417619.6 642...",Le Lac 3,Bordeaux


In [124]:
# On met tout dans la même CRS projetée (ex: EPSG:2154 ou utiliser EPSG:4326 par la suite)
iris_bordeaux = iris_bordeaux.to_crs(epsg=4326)
df_bordeaux = df_bordeaux.to_crs(epsg=4326)


In [125]:
# spatial join : chaque établissement rattaché à un IRIS
etabs_par_iris_bordeaux = gpd.sjoin(df_bordeaux, iris_bordeaux, how="inner", predicate="within")
etabs_par_iris_bordeaux.head()

Unnamed: 0,Rentrée universitaire,catégorie d'établissement,secteur d'établissement,code UAI de l'établissement,sigle de l'établissement,libellé de l'établissement,libellé complémentaire de l'établissement,Code UAI de la composante,sigle de la composante,libellé de la composante,...,index_right,cleabs,code_insee,nom_commune,iris,code_iris,nom_iris,type_iris,LIB_IRIS,LIBCOM
25,2023,Écoles d'ingénieurs,Privé,0922455U,CESI EI NANTER,CESI ECOLE INGENIEURS NANTERRE,CESI PARIS,0332984P,CESI EI BDEAUX,CESI ECOLE INGENIEURS BORDEAUX,...,10993,IRIS____0000000330630305,33063,Bordeaux,305,330630305,Bordeaux,H,Chartrons-Grand Parc 5,Bordeaux
110,2023,Lycées,Public,0330023W,LGT,LYCEE GENERAL ET TECHNOLOGIQUE,CAMILLE JULLIAN,0330023W,LGT,LYCEE GENERAL ET TECHNOLOGIQUE,...,12601,IRIS____0000000330630604,33063,Bordeaux,604,330630604,Bordeaux,H,Saint-Seurin-Fondaudège 4,Bordeaux
367,2022,Lycées,Public,0332468D,LT LYC METIER,LT LYCEE DES METIERS,BIOLOGIE ET CHIMIE ST LOUIS,0332468D,LT LYC METIER,LT LYCEE DES METIERS,...,11089,IRIS____0000000330630313,33063,Bordeaux,313,330630313,Bordeaux,H,Chartrons-Grand Parc 13,Bordeaux
565,2023,"Écoles de commerce, gestion et vente",Privé,0332524P,INSEEC BORDX,INST HTES ETUDES ECO COM BORDX,GROUPE OMNES EDUCATION,0332524P,INSEEC BORDX,INST HTES ETUDES ECO COM BORDX,...,10331,IRIS____0000000330630301,33063,Bordeaux,301,330630301,Bordeaux,H,Chartrons-Grand Parc 1,Bordeaux
567,2023,"Écoles de commerce, gestion et vente",Privé,0332818J,ECE BORDEAUX,ECOLE COMMERCE EUROP BORDEAUX,GROUPE OMNES EDUCATION,0332818J,ECE BORDEAUX,ECOLE COMMERCE EUROP BORDEAUX,...,11070,IRIS____0000000330630309,33063,Bordeaux,309,330630309,Bordeaux,H,Chartrons-Grand Parc 9,Bordeaux


In [126]:
iris_bordeaux_stats = iris_bordeaux.copy()

# Nombre d'établissements
iris_bordeaux_stats = iris_bordeaux_stats.merge(
    etabs_par_iris_bordeaux.groupby('LIB_IRIS').size().reset_index(name='nb_etabs'),
    on='LIB_IRIS', how='left'
).fillna({'nb_etabs':0})
iris_bordeaux_stats['nb_etabs'] = iris_bordeaux_stats['nb_etabs'].astype(int)

# Nombre total d'étudiants
iris_bordeaux_stats = iris_bordeaux_stats.merge(
    etabs_par_iris_bordeaux.groupby('LIB_IRIS')['nombre total d’étudiants inscrits hors doubles inscriptions université/CPGE'].sum().reset_index(name='nb_etudiants'),
    on='LIB_IRIS', how='left'
).fillna({'nb_etudiants':0})
iris_bordeaux_stats['nb_etudiants'] = iris_bordeaux_stats['nb_etudiants'].astype(int)

iris_bordeaux_stats = iris_bordeaux_stats.to_crs(epsg=2154)  # crs projetée pour calculer surface en m²
iris_bordeaux_stats['area_m2'] = iris_bordeaux_stats.geometry.area
iris_bordeaux_stats['etabs_per_m2'] = iris_bordeaux_stats['nb_etabs'] / iris_bordeaux_stats['area_m2']
iris_bordeaux_stats['students_per_m2'] = iris_bordeaux_stats['nb_etudiants'] / iris_bordeaux_stats['area_m2']



In [127]:
# reconvertir en 4326
iris_plot = iris_bordeaux_stats.to_crs(epsg=4326)

colorscale = "YlOrRd"  # jaune = faible, rouge = élevé

# Carte initiale avec coloraxis défini
fig = px.choropleth_mapbox(
    iris_plot,
    geojson=iris_plot.__geo_interface__,
    locations=iris_plot.index,
    color='students_per_m2',  # initial color
    hover_name='LIB_IRIS',
    hover_data=['nb_etabs','area_m2','nb_etudiants'],
    mapbox_style="carto-positron",
    center={"lat":44.8378, "lon":-0.5792},
    zoom=12,
    opacity=0.6,
)

# On associe explicitement la trace à coloraxis et fixe les limites
fig.update_traces(
    coloraxis="coloraxis"
)

# Définition globale de coloraxis
fig.update_layout(
    coloraxis=dict(
        colorscale=colorscale,
        cmin=iris_plot['students_per_m2'].min(),
        cmax=iris_plot['students_per_m2'].max(),
        colorbar=dict(title="Étudiants/m²")
    )
)

# Points établissements
fig.add_scattermapbox(
    lat=df_bordeaux['lat'],
    lon=df_bordeaux['lon'],
    mode='markers',
    marker=dict(size=6, color='blue'),
    text=etabs_par_iris_bordeaux["libellé de l'établissement"],
    name='Établissements OSM'
)

# Boutons interactifs : on ne touche qu'à z, zmin, zmax
fig.update_layout(
    updatemenus=[
        dict(
            type="buttons",
            x=0.0, y=1.05, showactive=True,
            buttons=[
                dict(
                    label="Densité",
                    method="update",
                    args=[
                        {"z": [iris_plot['students_per_m2']]},
                        {"coloraxis.cmin": iris_plot['students_per_m2'].min(),
                         "coloraxis.cmax": iris_plot['students_per_m2'].max(),
                         "coloraxis.colorbar.title": "Étudiants/m²"}
                    ]
                ),
                dict(
                    label="Nombre d'étudiants",
                    method="update",
                    args=[
                        {"z": [iris_plot['nb_etudiants']]},
                        {"coloraxis.cmin": iris_plot['nb_etudiants'].min(),
                         "coloraxis.cmax": iris_plot['nb_etudiants'].max(),
                         "coloraxis.colorbar.title": "Nombre d'étudiants"}
                    ]
                ),
            ]
        )
    ]
)

fig.update_layout(margin={"r":0,"t":50,"l":0,"b":0}, title="Étudiants sup. par IRIS - Bordeaux")
fig.show()



*choropleth_mapbox* is deprecated! Use *choropleth_map* instead. Learn more at: https://plotly.com/python/mapbox-to-maplibre/



In [128]:
top10_iris_bordeaux = iris_bordeaux_stats.sort_values(by='students_per_m2', ascending=False).head(10)

fig = px.bar(
    top10_iris_bordeaux,
    x='LIB_IRIS',
    y='students_per_m2',
    hover_data=['nb_etudiants','area_m2','nb_etabs'],
    color='students_per_m2',
    color_continuous_scale='YlOrRd',
    title="Top 10 IRIS les plus denses en étudiants - Rennes"
)

fig.update_layout(xaxis_title="Quartier (IRIS)", yaxis_title="Étudiants / m²")
fig.show()


### Analyser les **quartiers vivants (nombre de resto, bars, et supermarchés)** à ? ###

In [129]:
print("Partie Adam et Valentine")

Partie Adam et Valentine
