# Notebook 2: Application d'analyse immobili√®re
---
## Table des mati√®res

1. [Pr√©sentation du projet](#Pr√©sentation-du-projet)
2. [Objectifs de l'application](#Objectifs-de-l'application)
3. [Sources de donn√©es](#Sources-de-donn√©es)
4. [Import des biblioth√®ques](#Import-des-biblioth√®ques)
5. [Chargement des donn√©es](#Chargement-des-donn√©es)
6. [Vue d'ensemble du march√©](#Vue-d'ensemble-du-march√©)
7. [Exploration interactive par budget](#Exploration-interactive-par-budget)
8. [Analyse g√©ographique](#Analyse-g√©ographique)
9. [Syst√®me de recommandation](#Syst√®me-de-recommandation)
10. [Analyse pr√©dictive](#Analyse-pr√©dictive)
11. [Tableaux de bord personnalis√©s](#Tableaux-de-bord-personnalis√©s)
12. [Conclusions et recommandations](#Conclusions-et-recommandations)
13. [Annexes](#Annexes)
14. [Guide d'utilisation](#Guide-d'utilisation)

---

## Pr√©sentation du projet
### Persona cibl√©

#### Profil
**Nom**: Marie
**Age**: 40 ans
**Occupation**: cadre sup√©rieur √† Paris

**Budget**: 300-500k‚Ç¨

**Objectif**: Acheter son premier bien locatif pour g√©n√©rer des revenus passifs


#### Besoins sp√©cifiques
1. Identifier les villes avec le meilleur rendement locatif dans IDF
2. Comprendre quels types de biens sont les plus rentables (studio vs T3 pour coloc)
3. Calculer la rentabilit√© brute et nette
4. Comparer le potentiel de location simple vs coloc
5. Analyser les proximit√© des transport en commun
6. Trouver des biens accessibles avec son budget
7. Avoir un aper√ßu clair du march√© (prix au m2,tendances)
8. Observer l‚Äô√©volution des prix sur 5‚Äì10 ans pour anticiper une plus-value
9. √âvaluer la liquidit√© du march√©
10. Obtenir un classement des Top 10 opportunit√©s actuelles (un tableau ou score automatique).
11. Analyser les charges moyennes par type de logement
12. V√©rifier la s√©curit√© et l‚Äôattractivit√© du quartier


---

## Objectifs de l'application
<!-- COMPL√âTEZ ICI: Listez les objectifs principaux de votre application -->
<!-- Exemple: -->
<!-- - Identifier les zones √† fort potentiel de rentabilit√© -->
<!-- - Calculer le ROI d'un investissement immobilier -->
<!-- - etc. -->
Identifier des territoires prometteurs pour un premier investissement locatif

---

## Sources de donn√©es
<!-- COMPL√âTEZ ICI: D√©crivez vos sources de donn√©es -->
<!-- - Donn√©es principales (DVF, etc.) -->
<!-- - Donn√©es compl√©mentaires (INSEE, API, etc.) -->
<!-- - P√©riode couverte -->
<!-- - Nombre de transactions analys√©es -->

---

## Import des biblioth√®ques

In [None]:
# Importation des biblioth√®ques n√©cessaires
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Pour les visualisations interactives
import plotly.express as px
# import plotly.graph_objects as go 
import ipywidgets as widgets
# import folium

# CODEZ ICI: Configuration suppl√©mentaire si n√©cessaire

---

## Chargement des donn√©es

In [None]:
## Cr√©ez des fonctions pour chaque √©tape, c'est plus net que du code qui tra√Æne partout !

# Chargement des donn√©es nettoy√©es (pr√©par√©es dans le Notebook 1)
# df = pd.read_csv('donnees_nettoyees.csv')
df = pd.read_csv('full_2024.csv')

# Conversion de la date si n√©cessaire
# df['date_mutation'] = pd.to_datetime(df['date_mutation'])

# Affichage des premi√®res lignes
# print(f"Donn√©es charg√©es : {df.shape[0]} lignes, {df.shape[1]} colonnes")
# df.head()

---

## Vue d'ensemble du march√©

### Widget 1.1 : Statistiques globales (simple/statique)
<!-- COMPL√âTEZ ICI: D√©crivez ce que ce widget doit montrer -->
<!-- Exemple: Nombre total de transactions, prix moyen national, etc. -->


In [None]:
def nature_transaction(df):
    """Affiche la distribution des types de transactions du march√© immobilier."""
    nature_mutation_counts = df["nature_mutation"].value_counts().reset_index()
    nature_mutation_counts.columns = ['Nature', 'Count']

    fig = px.bar(nature_mutation_counts,
                 x='Nature', 
                 y='Count',
                 title='Distribution des types de transactions',
                 text='Count')
    
    fig.show()
    return

nature_transaction(df)


### Widget 1.2 
<!-- COMPL√âTEZ ICI: D√©crivez la visualisation attendue -->
<!-- Exemple: Graphique lin√©aire montrant l'√©volution des prix moyens par ann√©e -->


In [None]:
def prix_moyen_par_type(df):
    """Afficher le prix moyen par type de bien immobilier."""
    avg_price_by_type = df.groupby("type_local")["valeur_fonciere"].mean().reset_index()
    # print(avg_price_by_type)
    print(avg_price_by_type.dtypes)
    avg_price_by_type.columns = ["Type", "Avg price"]

    fig = px.bar(avg_price_by_type,
                 x="Type",
                 y="Avg price",
                 title="Prix moyen par type de bien immobilier",
                 text="Avg price")
    fig.update_traces(
        texttemplate='%{text:.2f} ‚Ç¨',
        hovertemplate='Type: %{x}<br>Prix moyen: %{y:.2f} ‚Ç¨'
    )
    fig.show()

prix_moyen_par_type(df)

### Widget 1.3
<!-- COMPL√âTEZ ICI: D√©crivez le type de graphique et les insights attendus -->


In [None]:
# Distribution par d√©partement
def distribution_par_departement(df, sort=False):
    df['code_departement'] = df['code_departement'].astype(str)
    
    # Filter departments where numeric code is less than 100
    df_filtered = df[pd.to_numeric(df['code_departement'], errors='coerce') < 100]
    
    dept_counts = df_filtered['code_departement'].value_counts(sort=sort).reset_index()
    dept_counts.columns = ['D√©partement', 'Count']
    
    # Department names mapping
    dept_names = {
        '01': 'Ain', '02': 'Aisne', '03': 'Allier', '04': 'Alpes-de-Haute-Provence',
        '05': 'Hautes-Alpes', '06': 'Alpes-Maritimes', '07': 'Ard√®che', '08': 'Ardennes',
        '09': 'Ari√®ge', '10': 'Aube', '11': 'Aude', '12': 'Aveyron',
        '13': 'Bouches-du-Rh√¥ne', '14': 'Calvados', '15': 'Cantal', '16': 'Charente',
        '17': 'Charente-Maritime', '18': 'Cher', '19': 'Corr√®ze', '21': "C√¥te-d'Or",
        '22': "C√¥tes-d'Armor", '23': 'Creuse', '24': 'Dordogne', '25': 'Doubs',
        '26': 'Dr√¥me', '27': 'Eure', '28': 'Eure-et-Loir', '29': 'Finist√®re',
        '2A': 'Corse-du-Sud', '2B': 'Haute-Corse', '30': 'Gard', '31': 'Haute-Garonne',
        '32': 'Gers', '33': 'Gironde', '34': 'H√©rault', '35': 'Ille-et-Vilaine',
        '36': 'Indre', '37': 'Indre-et-Loire', '38': 'Is√®re', '39': 'Jura',
        '40': 'Landes', '41': 'Loir-et-Cher', '42': 'Loire', '43': 'Haute-Loire',
        '44': 'Loire-Atlantique', '45': 'Loiret', '46': 'Lot', '47': 'Lot-et-Garonne',
        '48': 'Loz√®re', '49': 'Maine-et-Loire', '50': 'Manche', '51': 'Marne',
        '52': 'Haute-Marne', '53': 'Mayenne', '54': 'Meurthe-et-Moselle', '55': 'Meuse',
        '56': 'Morbihan', '57': 'Moselle', '58': 'Ni√®vre', '59': 'Nord',
        '60': 'Oise', '61': 'Orne', '62': 'Pas-de-Calais', '63': 'Puy-de-D√¥me',
        '64': 'Pyr√©n√©es-Atlantiques', '65': 'Hautes-Pyr√©n√©es', '66': 'Pyr√©n√©es-Orientales',
        '67': 'Bas-Rhin', '68': 'Haut-Rhin', '69': 'Rh√¥ne', '70': 'Haute-Sa√¥ne',
        '71': 'Sa√¥ne-et-Loire', '72': 'Sarthe', '73': 'Savoie', '74': 'Haute-Savoie',
        '75': 'Paris', '76': 'Seine-Maritime', '77': 'Seine-et-Marne', '78': 'Yvelines',
        '79': 'Deux-S√®vres', '80': 'Somme', '81': 'Tarn', '82': 'Tarn-et-Garonne',
        '83': 'Var', '84': 'Vaucluse', '85': 'Vend√©e', '86': 'Vienne',
        '87': 'Haute-Vienne', '88': 'Vosges', '89': 'Yonne', '90': 'Territoire de Belfort',
        '91': 'Essonne', '92': 'Hauts-de-Seine', '93': 'Seine-Saint-Denis', '94': 'Val-de-Marne',
        '95': "Val-d'Oise"
    }
    
    # Ensure D√©partement column is string type
    dept_counts['D√©partement'] = dept_counts['D√©partement'].astype(str)
    dept_counts['Nom'] = dept_counts['D√©partement'].map(dept_names)
    
    fig = px.bar(dept_counts,
                 x='D√©partement',
                 y='Count',
                 title='Distribution par d√©partement (code < 100)',
                 text='Count',
                 hover_data=['Nom'])
    fig.show()

distribution_par_departement(df, sort=True)

## Exploration interactive par budget

### Widget 2.1 : Explorateur de budget (interactif - 1 √† 3 param√®tres)
<!-- COMPL√âTEZ ICI: D√©crivez les param√®tres interactifs -->
<!-- Exemple: -->
<!-- - Slider pour le budget (min-max) -->
<!-- - Menu d√©roulant pour le type de bien -->
<!-- - Slider pour la surface minimale -->

In [None]:
# CODEZ ICI: Cr√©er les widgets interactifs (sliders, dropdowns, etc.)

# CODEZ ICI: Fonction de filtrage bas√©e sur les param√®tres

# CODEZ ICI: Affichage des r√©sultats (tableau + graphique)

### Widget 2.2 : Calculateur de rentabilit√© locative (interactif - 1 √† 3 param√®tres)
<!-- COMPL√âTEZ ICI: D√©crivez les param√®tres -->
<!-- Exemple: Prix d'achat, loyer mensuel estim√©, charges, etc. -->


In [None]:
# CODEZ ICI: Cr√©er les inputs interactifs

# CODEZ ICI: Fonction de calcul du ROI, rendement brut, rendement net

# CODEZ ICI: Affichage des r√©sultats avec visualisation

---

## Analyse g√©ographique

### Widget 3.1 : Comparaison r√©gionale (interactif - 1 √† 3 param√®tres)

<!-- COMPL√âTEZ ICI: D√©crivez la comparaison attendue -->
<!-- Exemple: Comparer 2-3 r√©gions/villes sur plusieurs crit√®res -->


In [None]:
# CODEZ ICI: S√©lecteur de r√©gions/villes √† comparer

# CODEZ ICI: Calcul des m√©triques de comparaison

# CODEZ ICI: Visualisation comparative (barres, radar chart, etc.)

### Widget 3.2 : Carte interactive des prix (complexe - carte + param√®tres)

<!-- COMPL√âTEZ ICI: D√©crivez les fonctionnalit√©s de la carte -->
<!-- Exemple: -->
<!-- - Carte choropl√®the des prix moyens -->
<!-- - Filtres par type de bien -->
<!-- - Pop-up avec d√©tails au clic -->
<!-- - Layers pour diff√©rentes m√©triques -->

In [None]:
# CODEZ ICI: Cr√©er la carte interactive avec Folium ou Plotly

# CODEZ ICI: Ajouter les param√®tres de filtrage

# CODEZ ICI: Afficher la carte


### Widget 3.3 : Carte interactive (transports et prix moyens)

In [1]:
import folium
import geopandas as gpd
from folium.plugins import MarkerCluster

# --- Chargement des donn√©es ---
transports_gdf = gpd.read_file("data/transports_nettoyes.geojson")

# --- Cr√©ation de la carte ---
m = folium.Map(
    location=[48.8566, 2.3522],  # centre de Paris
    zoom_start=9,
    tiles="CartoDB positron"
)

# --- Couleurs par type de transport ---
couleurs = {
    "METRO": "#800080",   # violet
    "RER": "#E41A1C",     # rouge
    "TRAIN": "#377EB8",   # bleu
    "TRAM": "#4DAF4A",    # vert
}

# --- Cr√©ation d'un cluster par type ---
for t, couleur in couleurs.items():
    # Sous-ensemble du type
    subset = transports_gdf[transports_gdf["type"] == t]

    # Cr√©ation d‚Äôun cluster pour ce type
    cluster_type = MarkerCluster(name=f"{t}").add_to(m)

    # Boucle sur les lignes correspondantes
    for _, row in subset.iterrows():
        picto = row["picto_url"]

        popup_html = f"""
        <div style='font-size:13px; line-height:1.4'>
            <b>{row['nom']}</b><br>
            üöà Type : {t}<br>
            üß≠ Ligne : {row['ligne']}<br>
            üè¢ Exploitant : {row['exploitant']}<br>
            <img src="{picto}" width="50"><br>
            <i>Coordonn√©es : {round(row['longitude'], 3)}, {round(row['latitude'], 3)}</i>
        </div>
        """

        try:
            icon = folium.CustomIcon(
                icon_image=picto,
                icon_size=(30, 30),
                icon_anchor=(15, 15)
            )

            folium.Marker(
                location=[row.geometry.y, row.geometry.x],
                popup=folium.Popup(popup_html, max_width=300),
                icon=icon
            ).add_to(cluster_type)

        except Exception as e:
            print(f"‚ö†Ô∏è Erreur sur {row['nom']}: {e}")

# --- L√©gende ---
legend_html = """
<div style="position: fixed; 
            bottom: 40px; left: 40px; width: 220px; height: 150px; 
            background-color: white; border:2px solid grey; 
            z-index:9999; font-size:13px; padding:10px;">
<b>üó∫Ô∏è Types de transport</b><br>
<span style="color:#800080;">‚¨§</span> M√©tro<br>
<span style="color:#E41A1C;">‚¨§</span> RER<br>
<span style="color:#377EB8;">‚¨§</span> Train<br>
<span style="color:#4DAF4A;">‚¨§</span> Tramway<br>
</div>
"""
m.get_root().html.add_child(folium.Element(legend_html))

# --- Contr√¥le des couches ---
folium.LayerControl(collapsed=False).add_to(m)

# --- Sauvegarde ---
m.save("data/carte_transports_avec_icones.html")

m



---

## Syst√®me de recommandation

### Widget 4.1 : D√©tecteur d'opportunit√©s (complexe - plus de 3 param√®tres)

<!-- COMPL√âTEZ ICI: D√©crivez tous les param√®tres du syst√®me de recommandation -->
<!-- Exemple: -->
<!-- - Budget min/max -->
<!-- - Type(s) de bien souhait√©(s) -->
<!-- - Rendement minimum attendu -->
<!-- - R√©gion(s) pr√©f√©r√©e(s) -->
<!-- - Niveau de risque acceptable -->
<!-- - etc. -->

In [None]:
# CODEZ ICI: Cr√©er tous les widgets de param√©trage

# CODEZ ICI: Fonction de scoring/recommandation

# CODEZ ICI: Affichage des Top N opportunit√©s recommand√©es

# CODEZ ICI: Visualisation des recommandations (tableau + carte/graphique)

---

## Tableaux de bord personnalis√©s

### Widget 6.1 : Dashboard personnalis√©

<!-- COMPL√âTEZ ICI: D√©crivez les √©l√©ments du dashboard -->
<!-- Un dashboard qui combine plusieurs m√©triques importantes pour le persona -->


In [None]:
# CODEZ ICI: Cr√©er un dashboard multi-graphiques

# CODEZ ICI: Possibilit√© de personnaliser les m√©triques affich√©es

---

## Conclusions et recommandations

### Synth√®se des analyses
<!-- COMPL√âTEZ ICI: R√©digez les conclusions principales -->
<!-- Bas√©es sur les analyses effectu√©es dans les sections pr√©c√©dentes -->

### Recommandations pour l'investisseur
<!-- COMPL√âTEZ ICI: Listez les recommandations concr√®tes -->
<!-- Exemple: -->
<!-- 1. Les 3 meilleures zones identifi√©es -->
<!-- 2. Le type de bien optimal -->
<!-- 3. Les zones √† √©viter -->
<!-- 4. Conseils strat√©giques -->

### Points d'attention
<!-- COMPL√âTEZ ICI: Listez les limites et pr√©cautions -->
<!-- Exemple: Limites des donn√©es, facteurs non pris en compte, etc. -->

---

## Annexes

### M√©thodologie
<!-- COMPL√âTEZ ICI: Expliquez votre m√©thodologie -->
<!-- - Comment les donn√©es ont √©t√© nettoy√©es -->
<!-- - Formules de calcul utilis√©es -->
<!-- - Choix techniques justifi√©s -->

### Sources et r√©f√©rences
<!-- COMPL√âTEZ ICI: Listez toutes vos sources -->
<!-- - Liens vers les datasets -->
<!-- - Documentation des APIs utilis√©es -->
<!-- - R√©f√©rences bibliographiques si applicable -->

---

## Guide d'utilisation

### Comment utiliser ce notebook
<!-- COMPL√âTEZ ICI: Instructions pour l'utilisateur final -->
<!-- 1. Ex√©cuter les cellules dans l'ordre -->
<!-- 2. Comment interagir avec les widgets -->
<!-- 3. Comment interpr√©ter les r√©sultats -->
<!-- etc. -->

### D√©pendances requises

In [None]:
# Liste des biblioth√®ques n√©cessaires
# COMPL√âTEZ ICI: Listez toutes les biblioth√®ques et leurs versions
# pandas==X.X.X
# matplotlib==X.X.X
# etc.

---

**Projet d√©velopp√© par :**
- Ashley OHNONA
- Harisoa RANDRIANASOLO
- Fairouz YOUDARENE
- Jennifer ZAHORA

**Date :** <!-- COMPL√âTEZ ICI: Date -->

**Version :** 1.0