# Notebook 2: Application d'analyse immobilière
---
## Table des matières

1. [Présentation du projet](#Présentation-du-projet)
2. [Objectifs de l'application](#Objectifs-de-l'application)
3. [Sources de données](#Sources-de-données)
4. [Import des bibliothèques](#Import-des-bibliothèques)
5. [Chargement des données](#Chargement-des-données)
6. [Vue d'ensemble du marché](#Vue-d'ensemble-du-marché)
7. [Exploration interactive par budget](#Exploration-interactive-par-budget)
8. [Analyse géographique](#Analyse-géographique)
9. [Système de recommandation](#Système-de-recommandation)
10. [Analyse prédictive](#Analyse-prédictive)
11. [Tableaux de bord personnalisés](#Tableaux-de-bord-personnalisés)
12. [Conclusions et recommandations](#Conclusions-et-recommandations)
13. [Annexes](#Annexes)
14. [Guide d'utilisation](#Guide-d'utilisation)

---

## Présentation du projet
### Persona ciblé

#### Profil
**Nom**: Marie
**Age**: 40 ans
**Occupation**: cadre supérieur à Paris

**Budget**: 300-500k€

**Objectif**: Acheter son premier bien locatif pour générer des revenus passifs


#### Besoins spécifiques
1. Identifier les villes avec le meilleur rendement locatif dans IDF
2. Comprendre quels types de biens sont les plus rentables (studio vs T3 pour coloc)
3. Calculer la rentabilité brute et nette
4. Comparer le potentiel de location simple vs coloc
5. Analyser les proximité des transport en commun
6. Trouver des biens accessibles avec son budget
7. Avoir un aperçu clair du marché (prix au m2,tendances)
8. Observer l’évolution des prix sur 5–10 ans pour anticiper une plus-value
9. Évaluer la liquidité du marché
10. Obtenir un classement des Top 10 opportunités actuelles (un tableau ou score automatique).
11. Analyser les charges moyennes par type de logement
12. Vérifier la sécurité et l’attractivité du quartier


---

## Objectifs de l'application
<!-- COMPLÉTEZ ICI: Listez les objectifs principaux de votre application -->
<!-- Exemple: -->
<!-- - Identifier les zones à fort potentiel de rentabilité -->
<!-- - Calculer le ROI d'un investissement immobilier -->
<!-- - etc. -->
Identifier des territoires prometteurs pour un premier investissement locatif

---

## Sources de données
<!-- COMPLÉTEZ ICI: Décrivez vos sources de données -->
<!-- - Données principales (DVF, etc.) -->
<!-- - Données complémentaires (INSEE, API, etc.) -->
<!-- - Période couverte -->
<!-- - Nombre de transactions analysées -->

---

## Import des bibliothèques

In [None]:
# Importation des bibliothèques nécessaires
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

# Pour les visualisations interactives
import plotly.express as px
# import plotly.graph_objects as go 
import ipywidgets as widgets
# import folium

# CODEZ ICI: Configuration supplémentaire si nécessaire

---

## Chargement des données

In [None]:
## Créez des fonctions pour chaque étape, c'est plus net que du code qui traîne partout !

# Chargement des données nettoyées (préparées dans le Notebook 1)
# df = pd.read_csv('donnees_nettoyees.csv')
df = pd.read_csv('full_2024.csv')

# Conversion de la date si nécessaire
# df['date_mutation'] = pd.to_datetime(df['date_mutation'])

# Affichage des premières lignes
# print(f"Données chargées : {df.shape[0]} lignes, {df.shape[1]} colonnes")
# df.head()

---

## Vue d'ensemble du marché

### Widget 1.1 : Statistiques globales (simple/statique)
<!-- COMPLÉTEZ ICI: Décrivez ce que ce widget doit montrer -->
<!-- Exemple: Nombre total de transactions, prix moyen national, etc. -->


In [None]:
def nature_transaction(df):
    """Affiche la distribution des types de transactions du marché immobilier."""
    nature_mutation_counts = df["nature_mutation"].value_counts().reset_index()
    nature_mutation_counts.columns = ['Nature', 'Count']

    fig = px.bar(nature_mutation_counts,
                 x='Nature', 
                 y='Count',
                 title='Distribution des types de transactions',
                 text='Count')
    
    fig.show()
    return

nature_transaction(df)


### Widget 1.2 
<!-- COMPLÉTEZ ICI: Décrivez la visualisation attendue -->
<!-- Exemple: Graphique linéaire montrant l'évolution des prix moyens par année -->


In [None]:
def prix_moyen_par_type(df):
    """Afficher le prix moyen par type de bien immobilier."""
    avg_price_by_type = df.groupby("type_local")["valeur_fonciere"].mean().reset_index()
    # print(avg_price_by_type)
    print(avg_price_by_type.dtypes)
    avg_price_by_type.columns = ["Type", "Avg price"]

    fig = px.bar(avg_price_by_type,
                 x="Type",
                 y="Avg price",
                 title="Prix moyen par type de bien immobilier",
                 text="Avg price")
    fig.update_traces(
        texttemplate='%{text:.2f} €',
        hovertemplate='Type: %{x}<br>Prix moyen: %{y:.2f} €'
    )
    fig.show()

prix_moyen_par_type(df)

### Widget 1.3
<!-- COMPLÉTEZ ICI: Décrivez le type de graphique et les insights attendus -->


In [None]:
# Distribution par département
def distribution_par_departement(df, sort=False):
    df['code_departement'] = df['code_departement'].astype(str)
    
    # Filter departments where numeric code is less than 100
    df_filtered = df[pd.to_numeric(df['code_departement'], errors='coerce') < 100]
    
    dept_counts = df_filtered['code_departement'].value_counts(sort=sort).reset_index()
    dept_counts.columns = ['Département', 'Count']
    
    # Department names mapping
    dept_names = {
        '01': 'Ain', '02': 'Aisne', '03': 'Allier', '04': 'Alpes-de-Haute-Provence',
        '05': 'Hautes-Alpes', '06': 'Alpes-Maritimes', '07': 'Ardèche', '08': 'Ardennes',
        '09': 'Ariège', '10': 'Aube', '11': 'Aude', '12': 'Aveyron',
        '13': 'Bouches-du-Rhône', '14': 'Calvados', '15': 'Cantal', '16': 'Charente',
        '17': 'Charente-Maritime', '18': 'Cher', '19': 'Corrèze', '21': "Côte-d'Or",
        '22': "Côtes-d'Armor", '23': 'Creuse', '24': 'Dordogne', '25': 'Doubs',
        '26': 'Drôme', '27': 'Eure', '28': 'Eure-et-Loir', '29': 'Finistère',
        '2A': 'Corse-du-Sud', '2B': 'Haute-Corse', '30': 'Gard', '31': 'Haute-Garonne',
        '32': 'Gers', '33': 'Gironde', '34': 'Hérault', '35': 'Ille-et-Vilaine',
        '36': 'Indre', '37': 'Indre-et-Loire', '38': 'Isère', '39': 'Jura',
        '40': 'Landes', '41': 'Loir-et-Cher', '42': 'Loire', '43': 'Haute-Loire',
        '44': 'Loire-Atlantique', '45': 'Loiret', '46': 'Lot', '47': 'Lot-et-Garonne',
        '48': 'Lozère', '49': 'Maine-et-Loire', '50': 'Manche', '51': 'Marne',
        '52': 'Haute-Marne', '53': 'Mayenne', '54': 'Meurthe-et-Moselle', '55': 'Meuse',
        '56': 'Morbihan', '57': 'Moselle', '58': 'Nièvre', '59': 'Nord',
        '60': 'Oise', '61': 'Orne', '62': 'Pas-de-Calais', '63': 'Puy-de-Dôme',
        '64': 'Pyrénées-Atlantiques', '65': 'Hautes-Pyrénées', '66': 'Pyrénées-Orientales',
        '67': 'Bas-Rhin', '68': 'Haut-Rhin', '69': 'Rhône', '70': 'Haute-Saône',
        '71': 'Saône-et-Loire', '72': 'Sarthe', '73': 'Savoie', '74': 'Haute-Savoie',
        '75': 'Paris', '76': 'Seine-Maritime', '77': 'Seine-et-Marne', '78': 'Yvelines',
        '79': 'Deux-Sèvres', '80': 'Somme', '81': 'Tarn', '82': 'Tarn-et-Garonne',
        '83': 'Var', '84': 'Vaucluse', '85': 'Vendée', '86': 'Vienne',
        '87': 'Haute-Vienne', '88': 'Vosges', '89': 'Yonne', '90': 'Territoire de Belfort',
        '91': 'Essonne', '92': 'Hauts-de-Seine', '93': 'Seine-Saint-Denis', '94': 'Val-de-Marne',
        '95': "Val-d'Oise"
    }
    
    # Ensure Département column is string type
    dept_counts['Département'] = dept_counts['Département'].astype(str)
    dept_counts['Nom'] = dept_counts['Département'].map(dept_names)
    
    fig = px.bar(dept_counts,
                 x='Département',
                 y='Count',
                 title='Distribution par département (code < 100)',
                 text='Count',
                 hover_data=['Nom'])
    fig.show()

distribution_par_departement(df, sort=True)

## Exploration interactive par budget

### Widget 2.1 : Explorateur de budget (interactif - 1 à 3 paramètres)
<!-- COMPLÉTEZ ICI: Décrivez les paramètres interactifs -->
<!-- Exemple: -->
<!-- - Slider pour le budget (min-max) -->
<!-- - Menu déroulant pour le type de bien -->
<!-- - Slider pour la surface minimale -->

In [None]:
# CODEZ ICI: Créer les widgets interactifs (sliders, dropdowns, etc.)

# CODEZ ICI: Fonction de filtrage basée sur les paramètres

# CODEZ ICI: Affichage des résultats (tableau + graphique)

### Widget 2.2 : Calculateur de rentabilité locative (interactif - 1 à 3 paramètres)
<!-- COMPLÉTEZ ICI: Décrivez les paramètres -->
<!-- Exemple: Prix d'achat, loyer mensuel estimé, charges, etc. -->


In [None]:
# CODEZ ICI: Créer les inputs interactifs

# CODEZ ICI: Fonction de calcul du ROI, rendement brut, rendement net

# CODEZ ICI: Affichage des résultats avec visualisation

---

## Analyse géographique

### Widget 3.1 : Comparaison régionale (interactif - 1 à 3 paramètres)

<!-- COMPLÉTEZ ICI: Décrivez la comparaison attendue -->
<!-- Exemple: Comparer 2-3 régions/villes sur plusieurs critères -->


In [None]:
# CODEZ ICI: Sélecteur de régions/villes à comparer

# CODEZ ICI: Calcul des métriques de comparaison

# CODEZ ICI: Visualisation comparative (barres, radar chart, etc.)

### Widget 3.2 : Carte interactive des prix (complexe - carte + paramètres)

<!-- COMPLÉTEZ ICI: Décrivez les fonctionnalités de la carte -->
<!-- Exemple: -->
<!-- - Carte choroplèthe des prix moyens -->
<!-- - Filtres par type de bien -->
<!-- - Pop-up avec détails au clic -->
<!-- - Layers pour différentes métriques -->

In [None]:
# CODEZ ICI: Créer la carte interactive avec Folium ou Plotly

# CODEZ ICI: Ajouter les paramètres de filtrage

# CODEZ ICI: Afficher la carte


### Widget 3.3 : Carte interactive (transports et prix moyens)

In [4]:
import folium
import geopandas as gpd
from folium.plugins import MarkerCluster

# --- Chargement des données ---
transports_gdf = gpd.read_file("data/transports_nettoyes.geojson")

# --- Création de la carte ---
m = folium.Map(
    location=[48.8566, 2.3522],  # centre de Paris
    zoom_start=9,
    tiles="CartoDB positron"
)

# --- Couleurs par type de transport (pour organisation) ---
couleurs = {
    "METRO": "#800080",   # violet
    "RER": "#E41A1C",     # rouge
    "TRAIN": "#377EB8",   # bleu
    "TRAM": "#4DAF4A",    # vert
}

# --- Création d'un cluster par type ---
for t in couleurs.keys():
    subset = transports_gdf[transports_gdf["type"] == t]
    cluster_type = MarkerCluster(name=f"{t}").add_to(m)

    for _, row in subset.iterrows():
        picto = row["picto_url"]

        popup_html = f"""
        <div style='font-size:13px; line-height:1.4'>
            <b>{row['nom']}</b><br>
            🚈 Type : {t}<br>
            🧭 Ligne : {row['ligne']}<br>
            🏢 Exploitant : {row['exploitant']}<br>
            <img src="{picto}" width="50"><br>
            <i>Coordonnées : {round(row['longitude'], 3)}, {round(row['latitude'], 3)}</i>
        </div>
        """

        try:
            icon = folium.CustomIcon(
                icon_image=picto,
                icon_size=(30, 30),
                icon_anchor=(15, 15)
            )

            folium.Marker(
                location=[row.geometry.y, row.geometry.x],
                popup=folium.Popup(popup_html, max_width=300),
                icon=icon
            ).add_to(cluster_type)

        except Exception as e:
            print(f"⚠️ Erreur sur {row['nom']}: {e}")

# --- Contrôle des couches ---
folium.LayerControl(collapsed=False).add_to(m)

# --- Sauvegarde ---
m.save("data/carte_transports_avec_icones.html")

m


---

## Système de recommandation

### Widget 4.1 : Détecteur d'opportunités (complexe - plus de 3 paramètres)

<!-- COMPLÉTEZ ICI: Décrivez tous les paramètres du système de recommandation -->
<!-- Exemple: -->
<!-- - Budget min/max -->
<!-- - Type(s) de bien souhaité(s) -->
<!-- - Rendement minimum attendu -->
<!-- - Région(s) préférée(s) -->
<!-- - Niveau de risque acceptable -->
<!-- - etc. -->

In [None]:
# CODEZ ICI: Créer tous les widgets de paramétrage

# CODEZ ICI: Fonction de scoring/recommandation

# CODEZ ICI: Affichage des Top N opportunités recommandées

# CODEZ ICI: Visualisation des recommandations (tableau + carte/graphique)

---

## Tableaux de bord personnalisés

### Widget 6.1 : Dashboard personnalisé

<!-- COMPLÉTEZ ICI: Décrivez les éléments du dashboard -->
<!-- Un dashboard qui combine plusieurs métriques importantes pour le persona -->


In [None]:
# CODEZ ICI: Créer un dashboard multi-graphiques

# CODEZ ICI: Possibilité de personnaliser les métriques affichées

---

## Conclusions et recommandations

### Synthèse des analyses
<!-- COMPLÉTEZ ICI: Rédigez les conclusions principales -->
<!-- Basées sur les analyses effectuées dans les sections précédentes -->

### Recommandations pour l'investisseur
<!-- COMPLÉTEZ ICI: Listez les recommandations concrètes -->
<!-- Exemple: -->
<!-- 1. Les 3 meilleures zones identifiées -->
<!-- 2. Le type de bien optimal -->
<!-- 3. Les zones à éviter -->
<!-- 4. Conseils stratégiques -->

### Points d'attention
<!-- COMPLÉTEZ ICI: Listez les limites et précautions -->
<!-- Exemple: Limites des données, facteurs non pris en compte, etc. -->

---

## Annexes

### Méthodologie
<!-- COMPLÉTEZ ICI: Expliquez votre méthodologie -->
<!-- - Comment les données ont été nettoyées -->
<!-- - Formules de calcul utilisées -->
<!-- - Choix techniques justifiés -->

### Sources et références
<!-- COMPLÉTEZ ICI: Listez toutes vos sources -->
<!-- - Liens vers les datasets -->
<!-- - Documentation des APIs utilisées -->
<!-- - Références bibliographiques si applicable -->

---

## Guide d'utilisation

### Comment utiliser ce notebook
<!-- COMPLÉTEZ ICI: Instructions pour l'utilisateur final -->
<!-- 1. Exécuter les cellules dans l'ordre -->
<!-- 2. Comment interagir avec les widgets -->
<!-- 3. Comment interpréter les résultats -->
<!-- etc. -->

### Dépendances requises

In [None]:
# Liste des bibliothèques nécessaires
# COMPLÉTEZ ICI: Listez toutes les bibliothèques et leurs versions
# pandas==X.X.X
# matplotlib==X.X.X
# etc.

---

**Projet développé par :**
- Ashley OHNONA
- Harisoa RANDRIANASOLO
- Fairouz YOUDARENE
- Jennifer ZAHORA

**Date :** <!-- COMPLÉTEZ ICI: Date -->

**Version :** 1.0