# üè† **Projet Data Science ‚Äì Outil d‚ÄôAide √† la D√©cision pour Investisseurs Immobiliers**

---

### üë• **√âquipe Projet**

**Classe :** ECE ‚Äì Data Science  

**Membres :**  
- Alan LATEB  
- Bassel ALEIAN  
- Jean-Charles MCHANGAMA
- Ayoub Fetah

---

---

## üß© **I. Persona ‚ÄìMarc DUBOIS**

### üë§ **Profil**

**Nom :** Marc DUBOIS
**√Çge :** 42 ans  
**Profession :** Chef d‚Äôentreprise dans le b√¢timent (r√©novation)  
**Localisation :** R√©gion Parisienne (Essonne)  
**Exp√©rience :** 12 projets achat‚Äìr√©novation‚Äìrevente r√©alis√©s  
**Capital disponible :** 80 000 ‚Ç¨ √† 150 000 ‚Ç¨ par projet  
**Strat√©gie :** Ach√®te 2‚Äì3 biens/an, r√©nove en 3‚Äì6 mois, revend avec une marge de 20‚Äì30 %

---

### üéØ **Besoins Principaux**

1. Identifier les biens **sous-√©valu√©s** par rapport au march√©  
2. √âvaluer le **potentiel de plus-value** apr√®s r√©novation  
3. Rep√©rer les **zones en gentrification** ou valorisation  
4. Trouver les **biens anciens avec bon ratio surface/prix**  
5. Analyser l‚Äô**√©cart de prix entre ancien et neuf** par secteur  
6. √âvaluer la **liquidit√© du march√© local**  
7. Identifier les **biens √©ligibles aux aides √† la r√©novation**  
8. D√©tecter les **biens avec terrain exploitable**  
9. Comparer plusieurs **communes selon crit√®res multiples**  
10. Obtenir un **classement automatique** des meilleures opportunit√©s d‚Äôinvestissement

---


### Imports n√©cessaires

In [10]:
# Import des biblioth√®ques
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import folium
from folium.plugins import HeatMap
import ipywidgets as widgets
from IPython.display import display, clear_output
import webbrowser
import os
import warnings
warnings.filterwarnings('ignore')

plt.style.use('seaborn-v0_8-darkgrid')
%matplotlib inline

### Chargement et nettoyage global du fichier DVF

Dans cette cellule, on charge le fichier **`data/dvf.csv`** (France enti√®re)  
et on effectue un premier nettoyage :
- Filtrage sur les **ventes** de **maisons et appartements** en **√éle-de-France**  
- Suppression des valeurs aberrantes  
- Calcul du **prix au m¬≤** et extraction de l‚Äô**ann√©e de mutation**

Cette base propre servira ensuite √† cr√©er les fichiers sp√©cifiques pour les widgets.


In [None]:
"""
# ===============================================================
# üßπ √âtape 1 : Chargement et nettoyage global du fichier DVF
# ---------------------------------------------------------------
# Objectif : Cr√©er une base propre (ventes, maisons/appartements, IDF)
#             qui servira aux extractions suivantes.
# Fichier source : data/dvf.csv
# ===============================================================

import pandas as pd
import numpy as np

# --- Lecture du fichier brut DVF ---
cols = [
    'date_mutation', 'nature_mutation', 'valeur_fonciere',
    'surface_reelle_bati', 'type_local', 'code_postal',
    'code_commune', 'code_departement'
]

print("‚è≥ Chargement du fichier DVF brut...")
df = pd.read_csv("data/dvf.csv", usecols=cols, low_memory=False)
print(f"Fichier brut charg√© : {df.shape[0]:,} lignes")

# --- Nettoyage de base ---
df['valeur_fonciere'] = pd.to_numeric(df['valeur_fonciere'], errors='coerce')
df['surface_reelle_bati'] = pd.to_numeric(df['surface_reelle_bati'], errors='coerce')
df['date_mutation'] = pd.to_datetime(df['date_mutation'], errors='coerce')

# Codes d√©partements √éle-de-France
deps_idf = ['75','77','78','91','92','93','94','95']
df['code_departement'] = df['code_departement'].astype(str).str.zfill(2)

# --- Filtrage ---
mask = (
    (df['nature_mutation'] == 'Vente') &
    (df['type_local'].isin(['Maison', 'Appartement'])) &
    (df['surface_reelle_bati'] > 10) &
    (df['valeur_fonciere'] > 1000) &
    (df['code_departement'].isin(deps_idf))
)
df = df.loc[mask].copy()

print(f"‚úÖ Apr√®s filtrage : {df.shape[0]:,} ventes en IDF (maisons/appartements)")

# --- Calcul du prix au m¬≤ ---
df['prix_m2'] = df['valeur_fonciere'] / df['surface_reelle_bati']

# Suppression des extr√™mes (1 % les plus bas et les plus hauts)
q1, q99 = df['prix_m2'].quantile([0.01, 0.99])
df = df[(df['prix_m2'] >= q1) & (df['prix_m2'] <= q99)]

# --- Ajout de l'ann√©e ---
df['annee'] = df['date_mutation'].dt.year

print("‚úÖ Base DVF propre pr√™te √† √™tre utilis√©e pour les extractions.")
"""

### Extraction pour le Widget 1 (2022‚Äì2024)

On extrait uniquement les **ventes r√©centes (2022‚Äì2024)**  
et les colonnes n√©cessaires pour le **Widget 1 : Distribution du prix au m¬≤**.  
Ce fichier sera plus l√©ger et repr√©sentatif du **march√© actuel**.


In [None]:
"""
# ===============================================================
# üìÅ √âtape 2 : Cr√©ation du fichier pour le Widget 1
# ---------------------------------------------------------------
# Widget 1 : Distribution du prix au m¬≤
# P√©riode : 2022‚Äì2024
# Objectif : Visualiser la r√©partition des prix au m¬≤
# ===============================================================

df_22_24 = df[(df['annee'] >= 2022) & (df['annee'] <= 2024)].copy()

cols_widget1 = [
    'date_mutation', 'annee', 'valeur_fonciere',
    'surface_reelle_bati', 'prix_m2',
    'type_local', 'code_postal', 'code_departement'
]
df_22_24 = df_22_24[cols_widget1]

# Sauvegarde
output_path_1 = "data/dvf_idf_2022_2024_clean.csv"
df_22_24.to_csv(output_path_1, index=False)

print(f"üì¶ Fichier Widget 1 sauvegard√© : {output_path_1}")
print(f"‚û°Ô∏è Lignes : {df_22_24.shape[0]:,} | Colonnes : {len(df_22_24.columns)}")
"""

### Extraction pour le Widget 3 (2019‚Äì2024)

On extrait les **ventes entre 2019 et 2024** pour analyser  
l‚Äô**√©volution temporelle du prix au m¬≤** dans le **Widget 3**.  
Cette p√©riode de 5 ans permet de visualiser les **tendances du march√©**  
et de rep√©rer les **zones en gentrification**.


In [None]:
"""
# ===============================================================
# üìÅ √âtape 3 : Cr√©ation du fichier pour le Widget 3
# ---------------------------------------------------------------
# Widget 3 : √âvolution temporelle du prix au m¬≤
# P√©riode : 2019‚Äì2024
# Objectif : Analyser les tendances de prix par commune
# ===============================================================

df_19_24 = df[(df['annee'] >= 2019) & (df['annee'] <= 2024)].copy()

cols_widget3 = [
    'date_mutation', 'annee', 'valeur_fonciere',
    'surface_reelle_bati', 'prix_m2',
    'type_local', 'code_commune', 'code_departement'
]
df_19_24 = df_19_24[cols_widget3]

# Sauvegarde
output_path_2 = "data/dvf_idf_2019_2024_clean.csv"
df_19_24.to_csv(output_path_2, index=False)

print(f"üì¶ Fichier Widget 3 sauvegard√© : {output_path_2}")
print(f"‚û°Ô∏è Lignes : {df_19_24.shape[0]:,} | Colonnes : {len(df_19_24.columns)}")
print("\n‚úÖ Nettoyage termin√© avec succ√®s !")
"""

---

## üß© Widget 1 ‚Äî Distribution du prix au m¬≤ (2022 ‚Äì 2024)

### üéØ Objectif
Ce widget permet √† **Marc Dubois**, investisseur en r√©habilitation immobili√®re,  
de **visualiser la r√©partition du prix au m¬≤** sur le march√© actuel de l‚Äô√éle-de-France.  
L‚Äôobjectif est d‚Äôidentifier rapidement les **zones accessibles** et les **biens potentiellement sous-√©valu√©s**.

---

### ‚öôÔ∏è Donn√©es utilis√©es
Fichier : `data/dvf_idf_2022_2024_clean.csv`  
Colonnes exploit√©es :
- `annee` ‚Äî Ann√©e de mutation  
- `code_departement` ‚Äî D√©partement du bien  
- `type_local` ‚Äî Type de bien (Maison / Appartement)  
- `prix_m2` ‚Äî Prix de vente au m¬≤ calcul√©

---

### üß∞ Param√®tres interactifs
| Param√®tre | Type | Description |
|------------|------|-------------|
| **D√©partement(s)** | S√©lecteur multiple | Filtrer un ou plusieurs d√©partements d‚Äô√éle-de-France |
| **Type de bien** | S√©lecteur multiple | Choisir entre *Maisons* et/ou *Appartements* |
| **Ann√©e** | Slider | S√©lectionner l‚Äôann√©e de transaction (2022‚Äì2024) |
| **√âchelle logarithmique** | Checkbox | Lisse l‚Äôeffet des valeurs extr√™mes sur l‚Äôhistogramme |

---

### üìä Sortie du widget
- **Histogramme interactif** du prix au m¬≤ selon les filtres s√©lectionn√©s  
  - Couleurs et style adapt√©s au th√®me du notebook (*clair ou sombre*)  
  - Ligne verticale indiquant la **m√©diane**  
- **Statistiques cl√©s** calcul√©es dynamiquement :
  - Nombre de ventes  
  - M√©diane du prix au m¬≤  
  - Quartiles (Q1 ‚Äì Q3)

---

### üß† Interpr√©tation attendue
Ce graphique aide √† :
- Comprendre la **r√©partition des ventes** selon les gammes de prix  
- Rep√©rer les **zones abordables** par rapport √† la moyenne r√©gionale  
- Estimer la **capacit√© d‚Äôachat** de Marc en fonction de son budget (80‚Äì150 k‚Ç¨)  
- Servir de **base comparative** avant d‚Äôapprofondir par commune

---

### üí∂ Ordres de grandeur observ√©s (r√©alit√© 2024-2025)
| D√©partement | Code | Prix moyen ‚Ç¨/m¬≤ |
|--------------|------|----------------|
| Paris | 75 | ~9 700 ‚Ç¨ |
| Hauts-de-Seine | 92 | ~6 600 ‚Ç¨ |
| Val-de-Marne | 94 | ~5 200 ‚Ç¨ |
| Yvelines | 78 | ~4 600 ‚Ç¨ |
| Seine-Saint-Denis | 93 | ~3 900 ‚Ç¨ |
| Essonne | 91 | ~3 000 ‚Ç¨ |
| Val-d‚ÄôOise | 95 | ~3 700 ‚Ç¨ |
| Seine-et-Marne | 77 | ~3 200 ‚Ç¨ |

*(Sources : MeilleursAgents, PAP, IMOP ‚Äî 2024-2025)*

---

### üß© Valeur ajout√©e pour le persona
> Ce widget offre √† Marc Dubois une **vision imm√©diate et contextualis√©e** du march√© foncier  
> et lui permet de cibler les **d√©partements pr√©sentant le meilleur potentiel de rentabilit√©**  
> selon ses crit√®res de budget et de type de bien.

---


In [1]:
%run widget_1.py

afficher_widget_prix_m2(luminosite="sombre")

  from pandas.core.computation.check import NUMEXPR_INSTALLED


VBox(children=(HBox(children=(SelectMultiple(description='D√©pt:', index=(0,), layout=Layout(width='200px'), op‚Ä¶

Output()

---

## üß© Widget 2 ‚Äî √âvolution temporelle du prix au m¬≤ (2019 ‚Äì 2024)

### üéØ Objectif
Ce widget permet √† **Marc Dubois**, investisseur sp√©cialis√© dans la r√©habilitation de biens anciens,  
d‚Äôanalyser **l‚Äô√©volution du prix m√©dian au m¬≤ sur les 5 derni√®res ann√©es**.  
L‚Äôobjectif est d‚Äôidentifier les **communes en gentrification** (forte revalorisation)  
et les **zones en stagnation ou en baisse** afin d‚Äôorienter ses investissements vers  
les march√©s les plus dynamiques et prometteurs.

---

### ‚öôÔ∏è Donn√©es utilis√©es
Fichier : `data/dvf_idf_2019_2024_clean.csv`  
Colonnes exploit√©es :
- `annee` ‚Üí Ann√©e de mutation (2019 √† 2024)  
- `code_commune` ‚Üí Code INSEE de la commune  
- `code_departement` ‚Üí D√©partement du bien (75 √† 95)  
- `type_local` ‚Üí Type de bien (*Maison* / *Appartement*)  
- `prix_m2` ‚Üí Prix m√©dian au m¬≤ (calcul√© √† partir du DVF)

---

### üß∞ Param√®tres interactifs
| Param√®tre | Type | Description |
|------------|------|-------------|
| **D√©partement** | Liste d√©roulante | S√©lection du d√©partement d‚Äôanalyse |
| **Commune(s)** | S√©lecteur multiple | Choix d‚Äôune ou plusieurs communes √† comparer |
| **Type de bien** | Liste d√©roulante | Filtre entre *Maisons* et *Appartements* |
| **Afficher tendance** | Case √† cocher | Ajoute une droite de r√©gression lin√©aire pour visualiser la tendance |

---

### üìä Sortie du widget
- **Graphique en courbes** montrant l‚Äô√©volution du **prix m√©dian au m¬≤** (2019 ‚Üí 2024)  
  - Une ligne par commune s√©lectionn√©e  
  - Option d‚Äôaffichage d‚Äôune **tendance lin√©aire** pour chaque courbe  
  - Couleurs et styles adapt√©s automatiquement au mode **clair / sombre**
- **Tableau r√©capitulatif** indiquant :
  - Le prix m√©dian en 2019 et 2024  
  - La **variation en pourcentage (%)** sur la p√©riode  
  - Un classement automatique des communes selon la plus forte croissance

---

### üß† Interpr√©tation attendue
Ce widget aide Marc √† :
- D√©terminer les **zones en revalorisation rapide** (potentiel de plus-value)  
- √âviter les **zones √† stagnation ou d√©croissance** du march√©  
- Comparer facilement plusieurs communes d‚Äôun m√™me d√©partement  
- Identifier les **tendances structurelles** √† moyen terme

---

### üí¨ Exemple d‚Äôinterpr√©tation
> Entre 2019 et 2024, les prix m√©dians au m¬≤ ont augment√© de **+24 % √† Montreuil (93)**  
> tandis qu‚Äôils n‚Äôont progress√© que de **+4 % √† Melun (77)**.  
> Marc peut ainsi prioriser ses investissements dans des communes o√π la dynamique  
> du march√© est confirm√©e par la tendance.

---

### üß© Valeur ajout√©e pour le persona
> Cet outil donne √† Marc Dubois une **vision temporelle claire et fiable du march√© immobilier**.  
> Il lui permet de **rep√©rer les zones √† forte plus-value**, de **mesurer la dynamique locale**  
> et d‚Äô**appuyer ses choix d‚Äôachat-r√©novation sur des tendances r√©elles et mesur√©es**.  

---


In [None]:
%run widget_2.py

afficher_widget_evolution_prix(luminosite="sombre")

---

## üß© Widget 3 ‚Äî Carte de chaleur du prix au m¬≤ (Heatmap g√©ographique)

### üéØ Objectif

Ce widget permet √† Marc DUBOIS, analyste immobilier,
de visualiser la r√©partition spatiale du prix au m¬≤ sur une carte interactive.
L‚Äôobjectif est d‚Äôidentifier les zones les plus ch√®res, les secteurs abordables
et les opportunit√©s d‚Äôinvestissement en fonction de la localisation,
du type de bien et du d√©partement s√©lectionn√©.

In [7]:
%run widget_3.py
widget_carte = CarteChaleursImmobilier('data/donnees_immobilieres.csv')
widget_carte.afficher_widget()

‚úÖ Donn√©es charg√©es (50,000 lignes)


VBox(children=(HTML(value='<h2>üó∫Ô∏è Carte Interactive des Opportunit√©s Immobili√®res</h2>'), Dropdown(description‚Ä¶

---

## üß© Widget 4 : Alan

### üéØ Objectif


In [17]:
%run widget_4.py

VBox(children=(HTML(value='<h2>üèóÔ∏è Simulateur de Rentabilit√©</h2>'), Checkbox(value=False, description='Mode Lo‚Ä¶

---

## üß© Widget 5 : Ayoub

### üéØ Objectif


---

## üß© Widget 6 : Ayoub

### üéØ Objectif
