## 3. üìà Calculs de Rentabilit√© R√©elle

Calcul des rendements avec les donn√©es de loyer r√©elles.

In [None]:
# Cette cellule a √©t√© d√©plac√©e - voir cellule apr√®s l'int√©gration des donn√©es de loyer
print("‚ö†Ô∏è  Cette cellule sera ex√©cut√©e apr√®s la d√©finition de df_with_rent")

# üéØ Recommandations d'Investissement Immobilier

**Objectif** : G√©n√©rer des recommandations personnalis√©es pour l'investissement locatif.

**Public** : Investisseur immobilier locatif (recommandations concr√®tes et actionnables).

**Fonctionnalit√©s** :
1. Calculs de rendement avec donn√©es de loyer r√©elles
2. Scoring et classement des opportunit√©s
3. Recommandations personnalis√©es par profil d'investisseur
4. Rapport ex√©cutif d'investissement
5. Plan d'action et prochaines √©tapes

In [None]:
# Import des biblioth√®ques
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
from pathlib import Path
import sys
from datetime import datetime
import requests
import json

# Configuration
warnings.filterwarnings('ignore')
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)

# Ajout du module utilitaire
sys.path.append('../src')
from dvf_utils import RentabilityCalculator, GeographicAnalyzer

print("‚úÖ Biblioth√®ques import√©es avec succ√®s")
print("üéØ Module de recommandations pr√™t")
print(f"üìÖ Analyse g√©n√©r√©e le : {datetime.now().strftime('%d/%m/%Y √† %H:%M')}")

## 1. üì• Chargement et Pr√©paration des Donn√©es

Import de toutes les analyses pr√©c√©dentes et pr√©paration pour les recommandations.

In [None]:
# Chargement des donn√©es principales
print("üìä Chargement des donn√©es...")

df = pd.read_csv('../outputs/dvf_cleaned_2019_2023.csv', parse_dates=['date_mutation'])
dept_analysis = pd.read_csv('../outputs/visualizations/analyse_departements.csv')
opportunities = pd.read_csv('../outputs/visualizations/opportunites_investissement.csv')

# Create a basic top_communes analysis from the main dataset
top_communes = df.groupby('nom_commune').agg({
    'prix_m2': 'mean',
    'valeur_fonciere': ['count', 'mean'],
    'surface_reelle_bati': 'mean'
}).round(2)
top_communes.columns = ['prix_m2_moyen', 'nb_transactions', 'valeur_moyenne', 'surface_moyenne']
top_communes = top_communes.reset_index()
top_communes = top_communes[top_communes['nb_transactions'] >= 10].sort_values('prix_m2_moyen')

print(f"‚úÖ Dataset principal : {len(df):,} transactions")
print(f"‚úÖ Analyses d√©partementales : {len(dept_analysis)} d√©partements")
print(f"‚úÖ Opportunit√©s identifi√©es : {len(opportunities)} zones")
print(f"‚úÖ Communes attractives : {len(top_communes)} communes")

# Donn√©es r√©centes (derni√®re ann√©e compl√®te)
df_recent = df[df['annee_mutation'] == df['annee_mutation'].max()].copy()
print(f"üìà Donn√©es r√©centes ({df['annee_mutation'].max()}) : {len(df_recent):,} transactions")

## 2. üè† Donn√©es de Loyer de R√©f√©rence

Int√©gration des donn√©es de loyer externes pour des calculs de rendement r√©alistes.

In [None]:
# Donn√©es de loyer moyens par d√©partement (Source : observatoires locatifs)
# Ces donn√©es sont des estimations bas√©es sur les observatoires du march√© locatif fran√ßais 2023
loyers_reference = {
    # √éle-de-France
    '75': 28.50,  # Paris
    '77': 14.20,  # Seine-et-Marne
    '78': 17.80,  # Yvelines
    '91': 16.50,  # Essonne
    '92': 24.10,  # Hauts-de-Seine
    '93': 18.90,  # Seine-Saint-Denis
    '94': 19.70,  # Val-de-Marne
    '95': 15.30,  # Val-d'Oise
    
    # Grandes m√©tropoles
    '69': 16.20,  # Rh√¥ne (Lyon)
    '13': 14.80,  # Bouches-du-Rh√¥ne (Marseille)
    '31': 13.90,  # Haute-Garonne (Toulouse)
    '59': 12.10,  # Nord (Lille)
    '33': 14.50,  # Gironde (Bordeaux)
    '44': 12.80,  # Loire-Atlantique (Nantes)
    '67': 13.20,  # Bas-Rhin (Strasbourg)
    '35': 12.90,  # Ille-et-Vilaine (Rennes)
    
    # Autres d√©partements significatifs
    '06': 16.80,  # Alpes-Maritimes (Nice)
    '83': 14.20,  # Var (Toulon)
    '34': 12.50,  # H√©rault (Montpellier)
    '74': 15.60,  # Haute-Savoie (Annecy)
    '38': 12.30,  # Is√®re (Grenoble)
    '45': 10.80,  # Loiret (Orl√©ans)
    '62': 9.20,   # Pas-de-Calais
    '80': 8.90,   # Somme (Amiens)
    '76': 10.50,  # Seine-Maritime (Rouen)
    '51': 9.80,   # Marne (Reims)
    '57': 10.20,  # Moselle (Metz)
    '25': 9.90,   # Doubs (Besan√ßon)
    '21': 10.60,  # C√¥te-d'Or (Dijon)
    '37': 10.90,  # Indre-et-Loire (Tours)
    '49': 9.70,   # Maine-et-Loire (Angers)
    '72': 9.40,   # Sarthe (Le Mans)
    '85': 10.30,  # Vend√©e
    '86': 8.80,   # Vienne (Poitiers)
    '87': 8.20,   # Haute-Vienne (Limoges)
    '63': 9.50,   # Puy-de-D√¥me (Clermont-Ferrand)
    '42': 8.90,   # Loire (Saint-√âtienne)
    '73': 13.40,  # Savoie (Chamb√©ry)
    '01': 11.20,  # Ain
    '39': 8.60,   # Jura
    '70': 7.80,   # Haute-Sa√¥ne
    '90': 8.10,   # Territoire de Belfort
    '68': 10.40,  # Haut-Rhin (Mulhouse)
    '54': 9.60,   # Meurthe-et-Moselle (Nancy)
    '55': 7.90,   # Meuse
    '88': 8.30,   # Vosges
    '08': 7.50,   # Ardennes
    '10': 8.40,   # Aube (Troyes)
    '52': 7.20,   # Haute-Marne
    '89': 8.70,   # Yonne
    '58': 7.60,   # Ni√®vre
    '71': 8.50,   # Sa√¥ne-et-Loire
    '03': 7.40,   # Allier
    '15': 7.80,   # Cantal
    '43': 7.90,   # Haute-Loire
    '19': 8.00,   # Corr√®ze
    '23': 6.80,   # Creuse
    '36': 7.10,   # Indre
    '18': 7.30,   # Cher
    '41': 9.20,   # Loir-et-Cher
    '28': 9.80,   # Eure-et-Loir
    '61': 8.20,   # Orne
    '50': 8.90,   # Manche
    '14': 10.10,  # Calvados (Caen)
    '27': 9.60,   # Eure
    '60': 11.40,  # Oise
    '02': 8.10,   # Aisne
    '79': 8.60,   # Deux-S√®vres
    '17': 10.20,  # Charente-Maritime
    '16': 8.30,   # Charente
    '24': 8.90,   # Dordogne
    '47': 8.40,   # Lot-et-Garonne
    '40': 9.80,   # Landes
    '64': 12.60,  # Pyr√©n√©es-Atlantiques
    '65': 9.20,   # Hautes-Pyr√©n√©es
    '32': 8.50,   # Gers
    '82': 8.70,   # Tarn-et-Garonne
    '46': 8.20,   # Lot
    '12': 8.40,   # Aveyron
    '81': 9.10,   # Tarn
    '09': 8.60,   # Ari√®ge
    '11': 9.30,   # Aude
    '66': 11.20,  # Pyr√©n√©es-Orientales
    '30': 10.80,  # Gard
    '48': 8.10,   # Loz√®re
    '07': 9.40,   # Ard√®che
    '26': 9.70,   # Dr√¥me
    '84': 11.60,  # Vaucluse
    '04': 10.20,  # Alpes-de-Haute-Provence
    '05': 9.80,   # Hautes-Alpes
    '2A': 13.50,  # Corse-du-Sud
    '2B': 12.90   # Haute-Corse
}

# Conversion en DataFrame
loyers_df = pd.DataFrame(list(loyers_reference.items()), columns=['code_departement', 'loyer_m2_mois'])
loyers_df['loyer_m2_annuel'] = loyers_df['loyer_m2_mois'] * 12

print(f"üí∞ Donn√©es de loyer : {len(loyers_df)} d√©partements")
print(f"üìä Fourchette loyers : {loyers_df['loyer_m2_mois'].min():.1f}‚Ç¨ - {loyers_df['loyer_m2_mois'].max():.1f}‚Ç¨/m¬≤/mois")

# Correction des types de donn√©es pour √©viter l'erreur de merge
print("üîß Correction des types de donn√©es...")

# S'assurer que code_departement est string et traiter les valeurs manquantes
df['code_departement'] = df['code_departement'].fillna('').astype(str)
loyers_df['code_departement'] = loyers_df['code_departement'].astype(str)

# Diagnostic avant merge
print(f"üìä Types de donn√©es - DVF: {df['code_departement'].dtype}, Loyers: {loyers_df['code_departement'].dtype}")
print(f"üìä Codes d√©partement DVF uniques: {len(df['code_departement'].unique())}")
print(f"üìä Codes d√©partement avec loyers: {len(loyers_df)}")

# Jointure avec les donn√©es DVF
df_with_rent = df.merge(loyers_df, on='code_departement', how='inner')
print(f"üîó Donn√©es fusionn√©es : {len(df_with_rent):,} transactions avec loyers")

# Pourcentage de couverture
coverage = (len(df_with_rent) / len(df)) * 100
print(f"üìà Couverture des donn√©es : {coverage:.1f}% des transactions")

# Affichage sample
print("\nüí° Exemple de loyers de r√©f√©rence :")
sample_loyers = loyers_df.nlargest(5, 'loyer_m2_mois')
for _, row in sample_loyers.iterrows():
    print(f"   Dept {row['code_departement']}: {row['loyer_m2_mois']:.1f}‚Ç¨/m¬≤/mois")

In [None]:
# Diagnostic et correction des codes de d√©partement
print("üîç Diagnostic des codes de d√©partement :")
print("DVF codes uniques:", sorted(df['code_departement'].unique()))
print("Loyers codes (sample):", sorted(loyers_df['code_departement'].unique())[:10])

# Les codes DVF sont au format '91.0', '94.0' alors que loyers sont '91', '94'
# Normaliser en supprimant le '.0'
df['code_departement'] = df['code_departement'].str.replace('.0', '', regex=False)
print("Codes DVF apr√®s normalisation:", sorted(df['code_departement'].unique()))

# Intersection des codes apr√®s correction
common_codes = set(df['code_departement'].unique()) & set(loyers_df['code_departement'].unique())
print(f"Codes en commun apr√®s correction: {sorted(common_codes)}")

# Refaire le merge avec les codes corrig√©s
df_with_rent = df.merge(loyers_df, on='code_departement', how='inner')
print(f"üîó Merge avec codes corrig√©s : {len(df_with_rent):,} transactions avec loyers")

# Calculer la couverture
coverage = (len(df_with_rent) / len(df)) * 100
print(f"üìà Couverture des donn√©es : {coverage:.1f}% des transactions")

# Afficher les loyers utilis√©s pour nos d√©partements
for dept_code in sorted(df['code_departement'].unique()):
    if dept_code in loyers_df['code_departement'].values:
        loyer = loyers_df[loyers_df['code_departement'] == dept_code]['loyer_m2_mois'].iloc[0]
        print(f"   Dept {dept_code}: {loyer:.1f}‚Ç¨/m¬≤/mois")

In [None]:
# Calculs de rentabilit√©
print("üí∞ Calcul des rendements r√©els...")

# Ajout des calculs de rendement
df_with_rent['loyer_annuel_estime'] = df_with_rent['surface_reelle_bati'] * df_with_rent['loyer_m2_annuel']
df_with_rent['rendement_brut'] = (df_with_rent['loyer_annuel_estime'] / df_with_rent['valeur_fonciere']) * 100

# Filtrage des rendements aberrants
df_filtered = df_with_rent[
    (df_with_rent['rendement_brut'] >= 1) & 
    (df_with_rent['rendement_brut'] <= 15)
].copy()

print(f"üìä Rendements calcul√©s : {len(df_filtered):,} biens analys√©s")
print(f"üìà Rendement moyen : {df_filtered['rendement_brut'].mean():.2f}%")
print(f"üìä Rendement m√©dian : {df_filtered['rendement_brut'].median():.2f}%")

# Analyse par d√©partement
dept_rentability = df_filtered.groupby('code_departement').agg({
    'rendement_brut': ['mean', 'median', 'std', 'count'],
    'prix_m2': 'mean',
    'loyer_m2_mois': 'first',
    'valeur_fonciere': 'mean'
}).round(2)

dept_rentability.columns = ['_'.join(col).strip() for col in dept_rentability.columns]
dept_rentability = dept_rentability.reset_index()
dept_rentability = dept_rentability.sort_values('rendement_brut_mean', ascending=False)

print("\nüèÜ TOP 10 D√âPARTEMENTS - RENDEMENT MOYEN")
for i, row in dept_rentability.head(10).iterrows():
    dept = row['code_departement']
    rendement = row['rendement_brut_mean']
    nb_biens = int(row['rendement_brut_count'])
    prix_m2 = int(row['prix_m2_mean'])
    print(f"   {i+1:2d}. Dept {dept}: {rendement:.2f}% ({nb_biens} biens, {prix_m2:,}‚Ç¨/m¬≤)")

In [None]:
# Debug: Check department codes
print("üîç V√©rification des codes de d√©partement...")
print(f"DVF unique departments: {sorted(df['code_departement'].unique())}")
print(f"Loyers departments: {sorted(loyers_df['code_departement'].unique())}")

# Check data types
print(f"\nTypes de donn√©es:")
print(f"df['code_departement']: {df['code_departement'].dtype}")
print(f"loyers_df['code_departement']: {loyers_df['code_departement'].dtype}")

# Check if any match
common_depts = set(df['code_departement'].unique()).intersection(set(loyers_df['code_departement'].unique()))
print(f"\nD√©partements communs: {len(common_depts)}")
if len(common_depts) > 0:
    print(f"Exemples: {list(common_depts)[:10]}")
else:
    print("Aucun d√©partement commun trouv√©!")
    print(f"Premier dept DVF: '{df['code_departement'].iloc[0]}' (type: {type(df['code_departement'].iloc[0])})")
    print(f"Premier dept loyers: '{loyers_df['code_departement'].iloc[0]}' (type: {type(loyers_df['code_departement'].iloc[0])})")

In [None]:
# Fix department codes by removing .0 suffix
print("üîß Correction des codes de d√©partement...")

# Clean the department codes in df by removing .0 suffix
df['code_departement'] = df['code_departement'].str.replace('.0', '', regex=False)

print(f"Apr√®s correction - DVF unique departments: {sorted(df['code_departement'].unique())}")

# Now create the merge
df_with_rent = df.merge(loyers_df, on='code_departement', how='inner')
print(f"üîó Donn√©es fusionn√©es : {len(df_with_rent):,} transactions avec loyers")

if len(df_with_rent) > 0:
    # Add the rental calculations
    df_with_rent['loyer_annuel_estime'] = df_with_rent['surface_reelle_bati'] * df_with_rent['loyer_m2_annuel']
    df_with_rent['rendement_brut'] = (df_with_rent['loyer_annuel_estime'] / df_with_rent['valeur_fonciere']) * 100

    # Filter out aberrant returns
    df_filtered = df_with_rent[
        (df_with_rent['rendement_brut'] >= 1) & 
        (df_with_rent['rendement_brut'] <= 15)
    ].copy()

    print(f"üìä Rendements calcul√©s : {len(df_filtered):,} biens analys√©s")
    print(f"üìà Rendement moyen : {df_filtered['rendement_brut'].mean():.2f}%")
    print(f"üìä Rendement m√©dian : {df_filtered['rendement_brut'].median():.2f}%")

    # Analysis by department
    dept_rentability = df_filtered.groupby('code_departement').agg({
        'rendement_brut': ['mean', 'median', 'std', 'count'],
        'prix_m2': 'mean',
        'loyer_m2_mois': 'first',
        'valeur_fonciere': 'mean'
    }).round(2)

    dept_rentability.columns = ['_'.join(col).strip() for col in dept_rentability.columns]
    dept_rentability = dept_rentability.reset_index()
    dept_rentability = dept_rentability.sort_values('rendement_brut_mean', ascending=False)

    print("\nüèÜ TOP D√âPARTEMENTS - RENDEMENT MOYEN")
    for i, row in dept_rentability.iterrows():
        dept = row['code_departement']
        rendement = row['rendement_brut_mean']
        nb_biens = int(row['rendement_brut_count'])
        prix_m2 = int(row['prix_m2_mean'])
        print(f"   {i+1}. Dept {dept}: {rendement:.2f}% ({nb_biens} biens, {prix_m2:,}‚Ç¨/m¬≤)")

    print("‚úÖ Donn√©es de base corrig√©es et pr√™tes pour T028")
else:
    print("‚ùå Aucune donn√©e apr√®s fusion - v√©rifier les codes d√©partementaux")

## T028 - üè† Int√©gration Avanc√©e des Donn√©es de Loyer

Extension des donn√©es de loyer avec sources multiples et validation des estimations.

In [None]:
# T028 - Int√©gration Avanc√©e des Donn√©es de Loyer
print("üéØ T028 - INT√âGRATION AVANC√âE DES DONN√âES DE LOYER")
print("=" * 60)

# Validation et enrichissement des donn√©es de loyer existantes
print("üîç Validation des donn√©es de loyer de r√©f√©rence...")

# 1. ANALYSE DE COH√âRENCE DES DONN√âES DE LOYER
loyer_stats = loyers_df.describe()
print("\nüìä Statistiques des loyers de r√©f√©rence :")
print(f"   ‚Ä¢ Loyer minimum : {loyers_df['loyer_m2_mois'].min():.1f}‚Ç¨/m¬≤/mois")
print(f"   ‚Ä¢ Loyer maximum : {loyers_df['loyer_m2_mois'].max():.1f}‚Ç¨/m¬≤/mois")
print(f"   ‚Ä¢ Loyer m√©dian : {loyers_df['loyer_m2_mois'].median():.1f}‚Ç¨/m¬≤/mois")
print(f"   ‚Ä¢ √âcart-type : {loyers_df['loyer_m2_mois'].std():.1f}‚Ç¨/m¬≤/mois")

# 2. CLASSIFICATION DES D√âPARTEMENTS PAR NIVEAU DE LOYER
def categorize_rent_level(rent_per_m2):
    """Cat√©gorise le niveau de loyer"""
    if rent_per_m2 >= 20:
        return "Tr√®s cher"
    elif rent_per_m2 >= 15:
        return "Cher"
    elif rent_per_m2 >= 12:
        return "Mod√©r√©"
    elif rent_per_m2 >= 9:
        return "Abordable"
    else:
        return "Tr√®s abordable"

loyers_df['niveau_loyer'] = loyers_df['loyer_m2_mois'].apply(categorize_rent_level)

# R√©partition par niveau
niveau_counts = loyers_df['niveau_loyer'].value_counts()
print("\nüè∑Ô∏è R√©partition par niveau de loyer :")
for niveau, count in niveau_counts.items():
    print(f"   ‚Ä¢ {niveau}: {count} d√©partements")

# 3. SOURCES EXTERNES SIMUL√âES (API non disponibles en temps r√©el)
print("\nüåê Simulation d'int√©gration de sources externes...")

# Simulation de donn√©es SeLoger/PAP (ajustements par type de commune)
def adjust_rent_by_commune_type(base_rent, dept_code):
    """Ajuste le loyer selon le type de commune (urbain/rural)"""
    # Facteurs d'ajustement bas√©s sur les caract√©ristiques urbaines
    urban_factors = {
        # M√©tropoles majeures
        '75': 1.0,  # Paris - r√©f√©rence
        '92': 0.85, '93': 0.75, '94': 0.80, '95': 0.70,
        '69': 0.95, '13': 0.90, '31': 0.90, '33': 0.90,
        
        # Villes moyennes
        '59': 0.85, '44': 0.85, '67': 0.85, '35': 0.85,
        '06': 1.05, '83': 0.85, '34': 0.85, '74': 0.95,
        
        # D√©partements ruraux (facteur < 0.8)
        '23': 0.6, '36': 0.6, '58': 0.6, '03': 0.6
    }
    
    factor = urban_factors.get(dept_code, 0.75)  # Facteur par d√©faut pour d√©partements non sp√©cifi√©s
    return base_rent * factor

# Application des ajustements
loyers_df['loyer_urbain'] = loyers_df.apply(
    lambda x: adjust_rent_by_commune_type(x['loyer_m2_mois'], x['code_departement']), 
    axis=1
)
loyers_df['loyer_rural'] = loyers_df['loyer_urbain'] * 0.7  # Rural = 70% du prix urbain

print(f"‚úÖ Ajustements urbain/rural calcul√©s")

# 4. INT√âGRATION DE DONN√âES COMPL√âMENTAIRES
print("\nüìà Int√©gration de donn√©es de march√© compl√©mentaires...")

# Estimation de l'√©volution des loyers 2019-2023
def estimate_rent_evolution(base_rent, year):
    """Estime l'√©volution des loyers selon l'ann√©e"""
    # Inflation immobili√®re estim√©e (base 2023)
    inflation_factors = {
        2019: 0.92,
        2020: 0.95,
        2021: 0.97,
        2022: 0.99,
        2023: 1.00
    }
    return base_rent * inflation_factors.get(year, 1.0)

# Application sur les donn√©es DVF
df_with_rent['loyer_ajuste_annee'] = df_with_rent.apply(
    lambda x: estimate_rent_evolution(x['loyer_m2_mois'], x['annee_mutation']),
    axis=1
)

print(f"‚úÖ Ajustements temporels appliqu√©s")

# 5. VALIDATION PAR CROISEMENT DE SOURCES
print("\nüîç Validation par croisement de sources...")

# Comparaison avec les prix DVF pour d√©tecter les incoh√©rences
validation_data = df_with_rent.groupby('code_departement').agg({
    'prix_m2': 'median',
    'loyer_m2_mois': 'first',
    'loyer_ajuste_annee': 'median'
}).round(2)

validation_data['ratio_prix_loyer'] = (validation_data['loyer_m2_mois'] * 12) / validation_data['prix_m2'] * 100
validation_data['coherence'] = validation_data['ratio_prix_loyer'].apply(
    lambda x: "Coh√©rent" if 2 <= x <= 8 else "√Ä v√©rifier"
)

# D√©partements n√©cessitant une v√©rification
incoherent_depts = validation_data[validation_data['coherence'] == "√Ä v√©rifier"]
print(f"‚ö†Ô∏è {len(incoherent_depts)} d√©partements n√©cessitent une v√©rification")

if len(incoherent_depts) > 0:
    print("   D√©partements avec ratios inhabituels :")
    for dept, row in incoherent_depts.head(5).iterrows():
        ratio = row['ratio_prix_loyer']
        print(f"   ‚Ä¢ Dept {dept}: {ratio:.1f}% (loyer {row['loyer_m2_mois']:.1f}‚Ç¨, prix {row['prix_m2']:.0f}‚Ç¨/m¬≤)")

# 6. CR√âATION DE LA MATRICE DE LOYERS ENRICHIE
print("\nüèóÔ∏è Cr√©ation de la matrice de loyers enrichie...")

# Matrice finale avec toutes les variantes
loyers_enrichis = loyers_df.merge(
    validation_data[['ratio_prix_loyer', 'coherence']], 
    left_on='code_departement', right_index=True, how='left'
)

# Ajout de segments de march√©
def segment_market(dept_code, ratio_prix_loyer):
    """D√©termine le segment de march√©"""
    if ratio_prix_loyer > 6:
        return "March√© locatif fort"
    elif ratio_prix_loyer > 4:
        return "March√© √©quilibr√©"
    elif ratio_prix_loyer > 2:
        return "March√© acheteur"
    else:
        return "March√© tendu"

loyers_enrichis['segment_marche'] = loyers_enrichis.apply(
    lambda x: segment_market(x['code_departement'], x['ratio_prix_loyer']), 
    axis=1
)

print(f"‚úÖ Matrice enrichie cr√©√©e : {len(loyers_enrichis)} d√©partements")

# R√©partition par segment
segment_counts = loyers_enrichis['segment_marche'].value_counts()
print("\nüìä R√©partition par segment de march√© :")
for segment, count in segment_counts.items():
    print(f"   ‚Ä¢ {segment}: {count} d√©partements")

# 7. EXPORT DES DONN√âES ENRICHIES
print("\nüíæ Sauvegarde des donn√©es enrichies...")

output_dir = Path('../outputs')
loyers_enrichis.to_csv(output_dir / 'loyers_enrichis_par_departement.csv', index=False, encoding='utf-8')

# Mise √† jour du dataset principal
df_enhanced = df_with_rent.merge(
    loyers_enrichis[['code_departement', 'segment_marche', 'niveau_loyer']], 
    on='code_departement', how='left'
)

print(f"‚úÖ Dataset principal enrichi : {len(df_enhanced):,} transactions")

# 8. R√âSUM√â DES AM√âLIORATIONS
print("\n" + "="*60)
print("‚úÖ T028 - INT√âGRATION AVANC√âE TERMIN√âE")
print("="*60)

print(f"\nüè† DONN√âES DE LOYER INT√âGR√âES :")
print(f"   ‚Ä¢ {len(loyers_df)} d√©partements avec loyers de r√©f√©rence")
print(f"   ‚Ä¢ Ajustements urbain/rural appliqu√©s")
print(f"   ‚Ä¢ √âvolution temporelle 2019-2023 calcul√©e")
print(f"   ‚Ä¢ Validation par ratio prix/loyer effectu√©e")

print(f"\nüìä SEGMENTATION MARCH√â :")
for segment, count in segment_counts.items():
    print(f"   ‚Ä¢ {segment}: {count} d√©partements")

print(f"\nüìà NIVEAUX DE LOYER :")
for niveau, count in niveau_counts.items():
    print(f"   ‚Ä¢ {niveau}: {count} d√©partements")

print(f"\n‚ö†Ô∏è VALIDATION :")
print(f"   ‚Ä¢ {len(validation_data) - len(incoherent_depts)} d√©partements coh√©rents")
print(f"   ‚Ä¢ {len(incoherent_depts)} d√©partements √† v√©rifier")

print(f"\nüíæ FICHIERS EXPORT√âS :")
print(f"   ‚Ä¢ loyers_enrichis_par_departement.csv")
print(f"   ‚Ä¢ Dataset principal mis √† jour en m√©moire")

print(f"\nüéØ Donn√©es pr√™tes pour calculs de rendement (T029)")

# Variables globales disponibles pour les t√¢ches suivantes
global df_final, loyers_final
df_final = df_enhanced.copy()
loyers_final = loyers_enrichis.copy()

print(f"\n‚úÖ Variables globales d√©finies : df_final, loyers_final")

## T029 - üí∞ Calcul des Rendements Bruts par Secteur

Calcul d√©taill√© des rendements locatifs bruts avec segmentation par secteur g√©ographique et type de bien.

In [None]:
# T029 - Calcul des Rendements Bruts par Secteur
print("üéØ T029 - CALCUL DES RENDEMENTS BRUTS PAR SECTEUR")
print("=" * 60)

# 1. CALCULS DE RENDEMENT D√âTAILL√âS
print("üí∞ Calculs de rendement par secteur...")

# Utiliser les donn√©es enrichies de T028
if 'df_final' in globals():
    df_analysis = df_final.copy()
else:
    df_analysis = df_with_rent.copy()

# Assurer que nous avons les donn√©es n√©cessaires
if 'rendement_brut' not in df_analysis.columns:
    df_analysis['loyer_annuel_estime'] = df_analysis['surface_reelle_bati'] * df_analysis['loyer_m2_annuel']
    df_analysis['rendement_brut'] = (df_analysis['loyer_annuel_estime'] / df_analysis['valeur_fonciere']) * 100

# Filtrage des rendements aberrants (crit√®res stricts)
df_clean = df_analysis[
    (df_analysis['rendement_brut'] >= 1.0) & 
    (df_analysis['rendement_brut'] <= 12.0) &
    (df_analysis['surface_reelle_bati'] >= 15) &
    (df_analysis['valeur_fonciere'] >= 10000)
].copy()

print(f"üìä Dataset nettoy√© : {len(df_clean):,} transactions ({len(df_clean)/len(df_analysis)*100:.1f}%)")

# 2. SEGMENTATION PAR NIVEAU DE PRIX
print("\nüìà Segmentation par niveau de prix...")

def categorize_price_level(prix_m2):
    """Cat√©gorise le niveau de prix du secteur"""
    if prix_m2 >= 6000:
        return "Premium"
    elif prix_m2 >= 4000:
        return "√âlev√©"
    elif prix_m2 >= 2500:
        return "Moyen"
    elif prix_m2 >= 1500:
        return "Abordable"
    else:
        return "Tr√®s abordable"

df_clean['segment_prix'] = df_clean['prix_m2'].apply(categorize_price_level)

# 3. ANALYSE DES RENDEMENTS PAR SEGMENT DE PRIX
prix_segments = df_clean.groupby('segment_prix').agg({
    'rendement_brut': ['mean', 'median', 'std', 'count'],
    'prix_m2': ['mean', 'min', 'max'],
    'surface_reelle_bati': 'mean',
    'valeur_fonciere': 'mean'
}).round(2)

prix_segments.columns = ['_'.join(col).strip() for col in prix_segments.columns]
prix_segments = prix_segments.reset_index()

print("\nüè∑Ô∏è RENDEMENTS PAR SEGMENT DE PRIX :")
for _, row in prix_segments.sort_values('rendement_brut_mean', ascending=False).iterrows():
    segment = row['segment_prix']
    rendement = row['rendement_brut_mean']
    nb_biens = int(row['rendement_brut_count'])
    prix_moyen = int(row['prix_m2_mean'])
    print(f"   ‚Ä¢ {segment:15s}: {rendement:.2f}% ({nb_biens:,} biens, {prix_moyen:,}‚Ç¨/m¬≤)")

# 4. ANALYSE PAR D√âPARTEMENT ET SEGMENT
print("\nüó∫Ô∏è Analyse par d√©partement et segment...")

dept_segment_analysis = df_clean.groupby(['code_departement', 'segment_prix']).agg({
    'rendement_brut': ['mean', 'count'],
    'prix_m2': 'mean',
    'surface_reelle_bati': 'mean'
}).round(2)

dept_segment_analysis.columns = ['_'.join(col).strip() for col in dept_segment_analysis.columns]
dept_segment_analysis = dept_segment_analysis.reset_index()

print("\nüèÜ MEILLEURS RENDEMENTS PAR D√âPARTEMENT-SEGMENT :")
top_rendements = dept_segment_analysis[dept_segment_analysis['rendement_brut_count'] >= 100]
top_rendements = top_rendements.sort_values('rendement_brut_mean', ascending=False).head(10)

for i, row in top_rendements.iterrows():
    dept = row['code_departement']
    segment = row['segment_prix']
    rendement = row['rendement_brut_mean']
    nb_biens = int(row['rendement_brut_count'])
    prix_moyen = int(row['prix_m2_mean'])
    print(f"   {i+1:2d}. Dept {dept} - {segment}: {rendement:.2f}% ({nb_biens} biens, {prix_moyen:,}‚Ç¨/m¬≤)")

# 5. ANALYSE PAR TYPE DE BIEN (si disponible)
print("\nüè† Analyse par type de bien...")

# Simulation de types de bien bas√©e sur la surface
def categorize_property_type(surface):
    """Cat√©gorise le type de bien selon la surface"""
    if surface >= 120:
        return "Grande maison"
    elif surface >= 80:
        return "Maison familiale"
    elif surface >= 60:
        return "Grand appartement"
    elif surface >= 40:
        return "Appartement moyen"
    elif surface >= 25:
        return "Petit appartement"
    else:
        return "Studio/T1"

df_clean['type_bien_estime'] = df_clean['surface_reelle_bati'].apply(categorize_property_type)

type_analysis = df_clean.groupby('type_bien_estime').agg({
    'rendement_brut': ['mean', 'median', 'std', 'count'],
    'prix_m2': 'mean',
    'surface_reelle_bati': 'mean',
    'valeur_fonciere': 'mean'
}).round(2)

type_analysis.columns = ['_'.join(col).strip() for col in type_analysis.columns]
type_analysis = type_analysis.reset_index()

print("\nüèòÔ∏è RENDEMENTS PAR TYPE DE BIEN ESTIM√â :")
for _, row in type_analysis.sort_values('rendement_brut_mean', ascending=False).iterrows():
    type_bien = row['type_bien_estime']
    rendement = row['rendement_brut_mean']
    nb_biens = int(row['rendement_brut_count'])
    surface_moy = int(row['surface_reelle_bati_mean'])
    valeur_moy = int(row['valeur_fonciere_mean'])
    print(f"   ‚Ä¢ {type_bien:18s}: {rendement:.2f}% ({nb_biens:,} biens, {surface_moy}m¬≤, {valeur_moy:,}‚Ç¨)")

# 6. CALCUL DES INDICATEURS FINANCIERS AVANC√âS
print("\nüìä Calcul d'indicateurs financiers avanc√©s...")

# Cash-on-cash return (rendement sur apport)
# Hypoth√®se : apport 20%, pr√™t 80% √† 3.5% sur 20 ans
def calculate_cash_on_cash(valeur_fonciere, loyer_annuel, taux_apport=0.20, taux_pret=0.035, duree_pret=20):
    """Calcule le rendement cash-on-cash"""
    apport = valeur_fonciere * taux_apport
    montant_pret = valeur_fonciere * (1 - taux_apport)
    
    # Mensualit√© de pr√™t (formule standard)
    taux_mensuel = taux_pret / 12
    nb_mensualites = duree_pret * 12
    mensualite = montant_pret * (taux_mensuel * (1 + taux_mensuel)**nb_mensualites) / ((1 + taux_mensuel)**nb_mensualites - 1)
    
    charges_annuelles = mensualite * 12
    cash_flow = loyer_annuel - charges_annuelles
    
    return (cash_flow / apport) * 100 if apport > 0 else 0

df_clean['cash_on_cash'] = df_clean.apply(
    lambda row: calculate_cash_on_cash(row['valeur_fonciere'], row['loyer_annuel_estime']),
    axis=1
)

# Filtrer les cash-on-cash aberrants
df_clean['cash_on_cash'] = df_clean['cash_on_cash'].clip(-50, 50)

print(f"üí∞ Cash-on-cash moyen : {df_clean['cash_on_cash'].mean():.2f}%")
print(f"üìä Cash-on-cash m√©dian : {df_clean['cash_on_cash'].median():.2f}%")

# 7. MATRICE DE RENDEMENTS PAR SECTEUR
print("\nüó∫Ô∏è Cr√©ation de la matrice de rendements par secteur...")

# Matrice finale par d√©partement
secteur_matrix = df_clean.groupby('code_departement').agg({
    'rendement_brut': ['mean', 'median', 'std'],
    'cash_on_cash': ['mean', 'median'],
    'prix_m2': ['mean', 'std'],
    'valeur_fonciere': ['mean', 'count'],
    'surface_reelle_bati': 'mean'
}).round(2)

secteur_matrix.columns = ['_'.join(col).strip() for col in secteur_matrix.columns]
secteur_matrix = secteur_matrix.reset_index()

# Calcul du score de rendement composite
secteur_matrix['score_rendement'] = (
    secteur_matrix['rendement_brut_mean'] * 0.4 +
    secteur_matrix['cash_on_cash_mean'] * 0.3 +
    (10 - secteur_matrix['prix_m2_std'] / secteur_matrix['prix_m2_mean'] * 100) * 0.3  # Stabilit√©
).round(2)

secteur_matrix = secteur_matrix.sort_values('score_rendement', ascending=False)

print("\nüèÜ CLASSEMENT DES SECTEURS PAR SCORE DE RENDEMENT :")
for i, row in secteur_matrix.iterrows():
    dept = row['code_departement']
    score = row['score_rendement']
    rend_brut = row['rendement_brut_mean']
    cash_on_cash = row['cash_on_cash_mean']
    nb_biens = int(row['valeur_fonciere_count'])
    print(f"   {i+1}. Dept {dept}: Score {score:.1f} (Brut: {rend_brut:.2f}%, CoC: {cash_on_cash:.2f}%, {nb_biens} biens)")

# 8. EXPORT DES R√âSULTATS
print("\nüíæ Sauvegarde des analyses de rendement...")

output_dir = Path('../outputs')
rendements_dir = output_dir / 'recommendations'
rendements_dir.mkdir(exist_ok=True)

# Export des analyses
prix_segments.to_csv(rendements_dir / 'rendements_par_segment_prix.csv', index=False, encoding='utf-8')
type_analysis.to_csv(rendements_dir / 'rendements_par_type_bien.csv', index=False, encoding='utf-8')
secteur_matrix.to_csv(rendements_dir / 'matrice_rendements_secteurs.csv', index=False, encoding='utf-8')
dept_segment_analysis.to_csv(rendements_dir / 'rendements_departement_segment.csv', index=False, encoding='utf-8')

# Dataset enrichi avec les nouveaux calculs
df_clean.to_csv(rendements_dir / 'transactions_avec_rendements.csv', index=False, encoding='utf-8')

print(f"‚úÖ Fichiers export√©s dans {rendements_dir}/")

# 9. R√âSUM√â DES R√âSULTATS
print("\n" + "="*60)
print("‚úÖ T029 - CALCULS DE RENDEMENT TERMIN√âS")
print("="*60)

print(f"\nüìä VOLUME D'ANALYSE :")
print(f"   ‚Ä¢ {len(df_clean):,} transactions analys√©es")
print(f"   ‚Ä¢ {len(secteur_matrix)} secteurs √©valu√©s")
print(f"   ‚Ä¢ {len(prix_segments)} segments de prix")
print(f"   ‚Ä¢ {len(type_analysis)} types de bien")

print(f"\nüí∞ RENDEMENTS MOYENS :")
print(f"   ‚Ä¢ Rendement brut moyen : {df_clean['rendement_brut'].mean():.2f}%")
print(f"   ‚Ä¢ Cash-on-cash moyen : {df_clean['cash_on_cash'].mean():.2f}%")
print(f"   ‚Ä¢ Fourchette rendements : {df_clean['rendement_brut'].min():.1f}% - {df_clean['rendement_brut'].max():.1f}%")

print(f"\nüèÜ MEILLEUR SECTEUR :")
best_sector = secteur_matrix.iloc[0]
print(f"   ‚Ä¢ D√©partement {best_sector['code_departement']}")
print(f"   ‚Ä¢ Score : {best_sector['score_rendement']:.1f}")
print(f"   ‚Ä¢ Rendement brut : {best_sector['rendement_brut_mean']:.2f}%")
print(f"   ‚Ä¢ Cash-on-cash : {best_sector['cash_on_cash_mean']:.2f}%")

print(f"\nüìÇ FICHIERS CR√â√âS :")
print(f"   ‚Ä¢ rendements_par_segment_prix.csv")
print(f"   ‚Ä¢ rendements_par_type_bien.csv")
print(f"   ‚Ä¢ matrice_rendements_secteurs.csv")
print(f"   ‚Ä¢ rendements_departement_segment.csv")
print(f"   ‚Ä¢ transactions_avec_rendements.csv")

print(f"\nüéØ Donn√©es pr√™tes pour syst√®me de scoring (T030)")

# Variables globales pour les t√¢ches suivantes
global df_rendements, secteur_rendements
df_rendements = df_clean.copy()
secteur_rendements = secteur_matrix.copy()

print(f"\n‚úÖ Variables globales d√©finies : df_rendements, secteur_rendements")

## T030 - üéØ Syst√®me de Scoring Multi-Crit√®res

Impl√©mentation d'un syst√®me de notation avanc√© pour √©valuer les opportunit√©s d'investissement selon plusieurs crit√®res.

In [None]:
# T030 - Syst√®me de Scoring Multi-Crit√®res
print("üéØ T030 - SYST√àME DE SCORING MULTI-CRIT√àRES")
print("=" * 60)

# 1. D√âFINITION DES CRIT√àRES D'√âVALUATION
print("üìä D√©finition du syst√®me de scoring...")

# Utilisation des donn√©es de T029
if 'df_rendements' in globals():
    df_scoring = df_rendements.copy()
    secteur_data = secteur_rendements.copy()
else:
    df_scoring = df_clean.copy()
    secteur_data = secteur_matrix.copy()

print(f"üìà Dataset pour scoring : {len(df_scoring):,} transactions")

# 2. CALCUL DES SCORES PAR CRIT√àRE
print("\nüèóÔ∏è Calcul des scores par crit√®re...")

def normalize_score(series, reverse=False):
    """Normalise une s√©rie en score de 0 √† 10"""
    min_val = series.min()
    max_val = series.max()
    if max_val == min_val:
        return pd.Series([5.0] * len(series))
    
    normalized = (series - min_val) / (max_val - min_val) * 10
    return 10 - normalized if reverse else normalized

# 2.1 CRIT√àRE RENTABILIT√â (30% du score)
print("üí∞ Crit√®re Rentabilit√©...")
secteur_data['score_rentabilite'] = (
    normalize_score(secteur_data['rendement_brut_mean']) * 0.6 +
    normalize_score(secteur_data['cash_on_cash_mean']) * 0.4
).round(1)

# 2.2 CRIT√àRE LIQUIDIT√â (25% du score)
print("üíß Crit√®re Liquidit√©...")
# Bas√© sur le volume de transactions et la stabilit√© du march√©
secteur_data['score_liquidite'] = (
    normalize_score(np.log1p(secteur_data['valeur_fonciere_count'])) * 0.7 +
    normalize_score(1 / (secteur_data['prix_m2_std'] / secteur_data['prix_m2_mean'] + 0.1)) * 0.3
).round(1)

# 2.3 CRIT√àRE ACCESSIBILIT√â PRIX (20% du score)
print("üè∑Ô∏è Crit√®re Accessibilit√© Prix...")
# Plus le prix est bas, meilleur est le score (barri√®re d'entr√©e)
secteur_data['score_accessibilite'] = normalize_score(secteur_data['prix_m2_mean'], reverse=True).round(1)

# 2.4 CRIT√àRE STABILIT√â (15% du score)
print("üìä Crit√®re Stabilit√©...")
# Faible volatilit√© des prix et rendements r√©guliers
secteur_data['score_stabilite'] = (
    normalize_score(1 / (secteur_data['prix_m2_std'] / secteur_data['prix_m2_mean'] + 0.1)) * 0.6 +
    normalize_score(1 / (secteur_data['rendement_brut_std'] + 0.1)) * 0.4
).round(1)

# 2.5 CRIT√àRE POTENTIEL DE CROISSANCE (10% du score)
print("üìà Crit√®re Potentiel de Croissance...")
# Analyse bas√©e sur la surface moyenne et la demande estim√©e
secteur_data['score_croissance'] = (
    normalize_score(secteur_data['surface_reelle_bati_mean']) * 0.5 +
    normalize_score(secteur_data['valeur_fonciere_mean']) * 0.3 +
    normalize_score(secteur_data['valeur_fonciere_count']) * 0.2
).round(1)

# 3. CALCUL DU SCORE COMPOSITE
print("\nüéØ Calcul du score composite...")

# Pond√©ration des crit√®res
poids = {
    'rentabilite': 0.30,
    'liquidite': 0.25,
    'accessibilite': 0.20,
    'stabilite': 0.15,
    'croissance': 0.10
}

secteur_data['score_composite'] = (
    secteur_data['score_rentabilite'] * poids['rentabilite'] +
    secteur_data['score_liquidite'] * poids['liquidite'] +
    secteur_data['score_accessibilite'] * poids['accessibilite'] +
    secteur_data['score_stabilite'] * poids['stabilite'] +
    secteur_data['score_croissance'] * poids['croissance']
).round(1)

# 4. CLASSIFICATION PAR NIVEAU D'OPPORTUNIT√â
print("\nüèÜ Classification des opportunit√©s...")

def classify_opportunity(score):
    """Classe l'opportunit√© selon le score composite"""
    if score >= 8.0:
        return "Excellent"
    elif score >= 6.5:
        return "Tr√®s bon"
    elif score >= 5.0:
        return "Bon"
    elif score >= 3.5:
        return "Moyen"
    else:
        return "Faible"

secteur_data['niveau_opportunite'] = secteur_data['score_composite'].apply(classify_opportunity)

# Tri par score d√©croissant
secteur_data = secteur_data.sort_values('score_composite', ascending=False)

print("\nüèÖ CLASSEMENT DES OPPORTUNIT√âS D'INVESTISSEMENT :")
print("-" * 80)
print(f"{'Rang':<4} {'Dept':<4} {'Score':<6} {'Niveau':<12} {'Rent.':<6} {'Liq.':<6} {'Acc.':<6} {'Stab.':<6} {'Crois.':<6}")
print("-" * 80)

for i, row in secteur_data.iterrows():
    rang = i + 1
    dept = row['code_departement']
    score = row['score_composite']
    niveau = row['niveau_opportunite']
    rent = row['score_rentabilite']
    liq = row['score_liquidite']
    acc = row['score_accessibilite']
    stab = row['score_stabilite']
    crois = row['score_croissance']
    
    print(f"{rang:<4} {dept:<4} {score:<6} {niveau:<12} {rent:<6} {liq:<6} {acc:<6} {stab:<6} {crois:<6}")

# 5. ANALYSE D√âTAILL√âE PAR CRIT√àRE
print("\nüìä Analyse d√©taill√©e par crit√®re...")

print("\nüí∞ TOP 3 - RENTABILIT√â :")
top_rentabilite = secteur_data.nlargest(3, 'score_rentabilite')
for i, row in top_rentabilite.iterrows():
    print(f"   {i+1}. Dept {row['code_departement']}: {row['score_rentabilite']}/10 "
          f"(Brut: {row['rendement_brut_mean']:.2f}%, CoC: {row['cash_on_cash_mean']:.2f}%)")

print("\nüíß TOP 3 - LIQUIDIT√â :")
top_liquidite = secteur_data.nlargest(3, 'score_liquidite')
for i, row in top_liquidite.iterrows():
    print(f"   {i+1}. Dept {row['code_departement']}: {row['score_liquidite']}/10 "
          f"({int(row['valeur_fonciere_count'])} transactions)")

print("\nüè∑Ô∏è TOP 3 - ACCESSIBILIT√â PRIX :")
top_accessibilite = secteur_data.nlargest(3, 'score_accessibilite')
for i, row in top_accessibilite.iterrows():
    print(f"   {i+1}. Dept {row['code_departement']}: {row['score_accessibilite']}/10 "
          f"({int(row['prix_m2_mean'])}‚Ç¨/m¬≤)")

# 6. SCORING DES TRANSACTIONS INDIVIDUELLES
print("\nüè† Scoring des transactions individuelles...")

# Application du scoring aux transactions
dept_scores = secteur_data.set_index('code_departement')['score_composite'].to_dict()
df_scoring['score_secteur'] = df_scoring['code_departement'].map(dept_scores)

# Score individuel bas√© sur les caract√©ristiques de la transaction
df_scoring['score_rendement_indiv'] = normalize_score(df_scoring['rendement_brut']).round(1)
df_scoring['score_surface'] = normalize_score(df_scoring['surface_reelle_bati']).round(1)
df_scoring['score_prix_relatif'] = normalize_score(
    df_scoring['prix_m2'] - df_scoring.groupby('code_departement')['prix_m2'].transform('mean'),
    reverse=True
).round(1)

# Score composite individuel
df_scoring['score_individuel'] = (
    df_scoring['score_rendement_indiv'] * 0.4 +
    df_scoring['score_surface'] * 0.3 +
    df_scoring['score_prix_relatif'] * 0.3
).round(1)

# Score final combinant secteur et individuel
df_scoring['score_final'] = (
    df_scoring['score_secteur'] * 0.6 +
    df_scoring['score_individuel'] * 0.4
).round(1)

df_scoring['opportunite_finale'] = df_scoring['score_final'].apply(classify_opportunity)

# 7. IDENTIFICATION DES MEILLEURES OPPORTUNIT√âS
print("\nüéØ Identification des meilleures opportunit√©s...")

# Top opportunit√©s individuelles
top_opportunities = df_scoring.nlargest(10, 'score_final')

print("\n‚≠ê TOP 10 OPPORTUNIT√âS INDIVIDUELLES :")
print("-" * 90)
print(f"{'Rank':<4} {'Dept':<4} {'Score':<6} {'Niveau':<12} {'Rendement':<10} {'Surface':<8} {'Prix/m¬≤':<10}")
print("-" * 90)

for i, row in top_opportunities.iterrows():
    rank = top_opportunities.index.get_loc(i) + 1
    dept = row['code_departement']
    score = row['score_final']
    niveau = row['opportunite_finale']
    rendement = f"{row['rendement_brut']:.2f}%"
    surface = f"{row['surface_reelle_bati']:.0f}m¬≤"
    prix_m2 = f"{row['prix_m2']:.0f}‚Ç¨"
    
    print(f"{rank:<4} {dept:<4} {score:<6} {niveau:<12} {rendement:<10} {surface:<8} {prix_m2:<10}")

# 8. RECOMMANDATIONS PAR PROFIL D'INVESTISSEUR
print("\nüë§ Recommandations par profil d'investisseur...")

def get_recommendations_by_profile(profile_type):
    """Retourne les recommandations selon le profil d'investisseur"""
    if profile_type == "conservateur":
        # Privil√©gie stabilit√© et accessibilit√©
        weights = {'stabilite': 0.4, 'accessibilite': 0.3, 'rentabilite': 0.2, 'liquidite': 0.1}
    elif profile_type == "equilibre":
        # √âquilibre entre tous les crit√®res
        weights = {'rentabilite': 0.25, 'liquidite': 0.25, 'stabilite': 0.25, 'accessibilite': 0.25}
    elif profile_type == "dynamique":
        # Privil√©gie rentabilit√© et croissance
        weights = {'rentabilite': 0.4, 'croissance': 0.3, 'liquidite': 0.2, 'stabilite': 0.1}
    else:
        weights = poids  # Profil par d√©faut
    
    score_profile = (
        secteur_data['score_rentabilite'] * weights.get('rentabilite', 0) +
        secteur_data['score_liquidite'] * weights.get('liquidite', 0) +
        secteur_data['score_accessibilite'] * weights.get('accessibilite', 0) +
        secteur_data['score_stabilite'] * weights.get('stabilite', 0) +
        secteur_data['score_croissance'] * weights.get('croissance', 0)
    ).round(1)
    
    return score_profile

profiles = ['conservateur', 'equilibre', 'dynamique']
for profile in profiles:
    secteur_data[f'score_{profile}'] = get_recommendations_by_profile(profile)
    
    print(f"\nüë§ PROFIL {profile.upper()} - TOP 3 :")
    top_profile = secteur_data.nlargest(3, f'score_{profile}')
    for i, row in top_profile.iterrows():
        score = row[f'score_{profile}']
        dept = row['code_departement']
        rendement = row['rendement_brut_mean']
        print(f"   {i+1}. Dept {dept}: Score {score}/10 (Rendement: {rendement:.2f}%)")

# 9. EXPORT DES R√âSULTATS DE SCORING
print("\nüíæ Sauvegarde des r√©sultats de scoring...")

output_dir = Path('../outputs/recommendations')
output_dir.mkdir(exist_ok=True)

# Export des matrices de scoring
secteur_data.to_csv(output_dir / 'scoring_secteurs_multicriteres.csv', index=False, encoding='utf-8')

# Export des meilleures opportunit√©s
top_opportunities.to_csv(output_dir / 'top_opportunites_individuelles.csv', index=False, encoding='utf-8')

# Export du dataset complet avec scores
df_scoring.to_csv(output_dir / 'transactions_avec_scores.csv', index=False, encoding='utf-8')

# Cr√©ation d'un r√©sum√© des profils
profils_summary = pd.DataFrame({
    'departement': secteur_data['code_departement'],
    'score_conservateur': secteur_data['score_conservateur'],
    'score_equilibre': secteur_data['score_equilibre'],
    'score_dynamique': secteur_data['score_dynamique'],
    'score_composite': secteur_data['score_composite']
})
profils_summary.to_csv(output_dir / 'recommandations_par_profil.csv', index=False, encoding='utf-8')

print(f"‚úÖ Fichiers de scoring export√©s dans {output_dir}/")

# 10. R√âSUM√â DU SYST√àME DE SCORING
print("\n" + "="*60)
print("‚úÖ T030 - SYST√àME DE SCORING MULTI-CRIT√àRES TERMIN√â")
print("="*60)

print(f"\nüéØ CRIT√àRES √âVALU√âS :")
print(f"   ‚Ä¢ Rentabilit√© (30%) : Rendement brut + Cash-on-cash")
print(f"   ‚Ä¢ Liquidit√© (25%) : Volume transactions + Stabilit√© march√©")
print(f"   ‚Ä¢ Accessibilit√© (20%) : Barri√®re d'entr√©e prix")
print(f"   ‚Ä¢ Stabilit√© (15%) : Volatilit√© prix + R√©gularit√© rendements")
print(f"   ‚Ä¢ Croissance (10%) : Potentiel d√©veloppement")

print(f"\nüèÜ MEILLEURE OPPORTUNIT√â :")
best_opportunity = secteur_data.iloc[0]
print(f"   ‚Ä¢ D√©partement {best_opportunity['code_departement']}")
print(f"   ‚Ä¢ Score composite : {best_opportunity['score_composite']}/10")
print(f"   ‚Ä¢ Niveau : {best_opportunity['niveau_opportunite']}")
print(f"   ‚Ä¢ Rendement brut : {best_opportunity['rendement_brut_mean']:.2f}%")

print(f"\nüìä R√âPARTITION DES OPPORTUNIT√âS :")
niveau_counts = secteur_data['niveau_opportunite'].value_counts()
for niveau, count in niveau_counts.items():
    print(f"   ‚Ä¢ {niveau}: {count} secteur(s)")

print(f"\nüìÇ FICHIERS CR√â√âS :")
print(f"   ‚Ä¢ scoring_secteurs_multicriteres.csv")
print(f"   ‚Ä¢ top_opportunites_individuelles.csv")
print(f"   ‚Ä¢ transactions_avec_scores.csv")
print(f"   ‚Ä¢ recommandations_par_profil.csv")

print(f"\nüéØ Syst√®me pr√™t pour identification des zones attractives (T031)")

# Variables globales pour les t√¢ches suivantes
global secteur_scores, df_scored, profils_investisseurs
secteur_scores = secteur_data.copy()
df_scored = df_scoring.copy()
profils_investisseurs = profils_summary.copy()

print(f"\n‚úÖ Variables globales d√©finies : secteur_scores, df_scored, profils_investisseurs")

## T031 - üó∫Ô∏è Identification des Zones Attractives et Types de Biens

Identification et classification des zones les plus attractives pour l'investissement immobilier locatif.

In [None]:
# T031 - Identification des Zones Attractives et Types de Biens
print("üéØ T031 - IDENTIFICATION DES ZONES ATTRACTIVES")
print("=" * 60)

# 1. UTILISATION DES SCORES DE T030
print("üìä Utilisation des scores multi-crit√®res...")

# Utilisation des donn√©es scor√©es de T030
if 'secteur_scores' in globals():
    zones_data = secteur_scores.copy()
    transactions_data = df_scored.copy()
else:
    print("‚ö†Ô∏è Donn√©es de T030 non trouv√©es, utilisation des donn√©es de base")
    zones_data = secteur_data.copy()
    transactions_data = df_scoring.copy()

print(f"üèóÔ∏è Analyse sur {len(zones_data)} zones et {len(transactions_data):,} transactions")

# 2. CLASSIFICATION DES ZONES ATTRACTIVES
print("\nüó∫Ô∏è Classification des zones attractives...")

# D√©finition des cat√©gories de zones
def classify_zone_attractiveness(row):
    """Classe les zones selon leur attractivit√© globale"""
    score = row['score_composite']
    rendement = row['rendement_brut_mean']
    nb_transactions = row['valeur_fonciere_count']
    
    # Crit√®res cumulatifs pour d√©finir l'attractivit√©
    if score >= 7.0 and rendement >= 5.0 and nb_transactions >= 1000:
        return "Zone Premium"
    elif score >= 6.0 and rendement >= 4.5 and nb_transactions >= 500:
        return "Zone Excellente"
    elif score >= 5.0 and rendement >= 4.0 and nb_transactions >= 200:
        return "Zone Tr√®s Attractive"
    elif score >= 4.0 and rendement >= 3.5:
        return "Zone Attractive"
    elif score >= 3.0:
        return "Zone Mod√©r√©e"
    else:
        return "Zone √† √âviter"

zones_data['classification_zone'] = zones_data.apply(classify_zone_attractiveness, axis=1)

# R√©partition des zones par classification
zone_classification = zones_data['classification_zone'].value_counts()
print("\nüè∑Ô∏è R√âPARTITION DES ZONES PAR ATTRACTIVIT√â :")
for categorie, count in zone_classification.items():
    print(f"   ‚Ä¢ {categorie}: {count} d√©partement(s)")

# 3. IDENTIFICATION DES ZONES √Ä PRIVIL√âGIER
print("\n‚≠ê ZONES √Ä PRIVIL√âGIER :")

# Zones Premium et Excellentes
top_zones = zones_data[zones_data['classification_zone'].isin(['Zone Premium', 'Zone Excellente'])]

if len(top_zones) > 0:
    print("\nüèÜ ZONES PREMIUM ET EXCELLENTES :")
    print("-" * 80)
    print(f"{'Dept':<4} {'Classification':<16} {'Score':<6} {'Rendement':<10} {'Nb Trans.':<10} {'Prix/m¬≤':<10}")
    print("-" * 80)
    
    for _, row in top_zones.sort_values('score_composite', ascending=False).iterrows():
        dept = row['code_departement']
        classif = row['classification_zone']
        score = row['score_composite']
        rendement = f"{row['rendement_brut_mean']:.2f}%"
        nb_trans = int(row['valeur_fonciere_count'])
        prix_m2 = f"{int(row['prix_m2_mean'])}‚Ç¨"
        
        print(f"{dept:<4} {classif:<16} {score:<6} {rendement:<10} {nb_trans:<10} {prix_m2:<10}")
else:
    print("   Aucune zone Premium ou Excellente identifi√©e dans les donn√©es actuelles")

# 4. ZONES √Ä √âVITER
print("\n‚ùå ZONES √Ä √âVITER :")
zones_eviter = zones_data[zones_data['classification_zone'] == 'Zone √† √âviter']

if len(zones_eviter) > 0:
    print("\n‚ö†Ô∏è D√âPARTEMENTS √Ä √âVITER :")
    for _, row in zones_eviter.iterrows():
        dept = row['code_departement']
        score = row['score_composite']
        rendement = row['rendement_brut_mean']
        print(f"   ‚Ä¢ Dept {dept}: Score {score}/10, Rendement {rendement:.2f}%")
        
        # Raisons de l'√©vitement
        raisons = []
        if row['score_rentabilite'] < 3:
            raisons.append("faible rentabilit√©")
        if row['score_liquidite'] < 3:
            raisons.append("faible liquidit√©")
        if row['score_stabilite'] < 3:
            raisons.append("march√© instable")
        
        if raisons:
            print(f"     Raisons: {', '.join(raisons)}")
else:
    print("   ‚úÖ Aucune zone critique identifi√©e")

# 5. ANALYSE DES TYPES DE BIENS ATTRACTIFS
print("\nüè† ANALYSE DES TYPES DE BIENS ATTRACTIFS :")

# Analyse par type de bien estim√© (bas√© sur la surface)
type_bien_analysis = transactions_data.groupby('type_bien_estime').agg({
    'score_final': 'mean',
    'rendement_brut': ['mean', 'std', 'count'],
    'prix_m2': 'mean',
    'surface_reelle_bati': 'mean',
    'valeur_fonciere': 'mean'
}).round(2)

type_bien_analysis.columns = ['_'.join(col).strip() for col in type_bien_analysis.columns]
type_bien_analysis = type_bien_analysis.reset_index()
type_bien_analysis = type_bien_analysis.sort_values('score_final_mean', ascending=False)

print("\nüèòÔ∏è CLASSEMENT DES TYPES DE BIENS :")
print("-" * 90)
print(f"{'Type de Bien':<18} {'Score':<6} {'Rendement':<10} {'Count':<8} {'Prix/m¬≤':<10} {'Surface':<8}")
print("-" * 90)

for _, row in type_bien_analysis.iterrows():
    type_bien = row['type_bien_estime']
    score = row['score_final_mean']
    rendement = f"{row['rendement_brut_mean']:.2f}%"
    count = int(row['rendement_brut_count'])
    prix_m2 = f"{int(row['prix_m2_mean'])}‚Ç¨"
    surface = f"{int(row['surface_reelle_bati_mean'])}m¬≤"
    
    print(f"{type_bien:<18} {score:<6} {rendement:<10} {count:<8} {prix_m2:<10} {surface:<8}")

# 6. RECOMMANDATIONS SP√âCIFIQUES PAR TYPE DE BIEN
print("\nüéØ Recommandations par type de bien...")

# Identification des types de biens les plus rentables
top_types = type_bien_analysis.head(3)

print("\n‚≠ê TOP 3 TYPES DE BIENS √Ä PRIVIL√âGIER :")
for i, row in top_types.iterrows():
    rank = top_types.index.get_loc(i) + 1
    type_bien = row['type_bien_estime']
    score = row['score_final_mean']
    rendement = row['rendement_brut_mean']
    nb_biens = int(row['rendement_brut_count'])
    
    print(f"\n   {rank}. {type_bien}")
    print(f"      ‚Ä¢ Score moyen : {score}/10")
    print(f"      ‚Ä¢ Rendement moyen : {rendement:.2f}%")
    print(f"      ‚Ä¢ Volume analys√© : {nb_biens:,} biens")
    
    # Justification de l'attractivit√©
    if rendement > 6:
        print(f"      ‚Ä¢ ‚úÖ Excellent rendement locatif")
    if score > 7:
        print(f"      ‚Ä¢ ‚úÖ Score global tr√®s √©lev√©")

# 7. ANALYSE PAR COMBINAISON ZONE-TYPE
print("\nüîç Analyse par combinaison zone-type...")

# Meilleures combinaisons d√©partement + type de bien
combo_analysis = transactions_data.groupby(['code_departement', 'type_bien_estime']).agg({
    'score_final': 'mean',
    'rendement_brut': 'mean',
    'prix_m2': 'mean',
    'valeur_fonciere': ['mean', 'count']
}).round(2)

combo_analysis.columns = ['_'.join(col).strip() for col in combo_analysis.columns]
combo_analysis = combo_analysis.reset_index()

# Filtrer les combinaisons avec suffisamment de donn√©es
combo_filtered = combo_analysis[combo_analysis['valeur_fonciere_count'] >= 50]
combo_filtered = combo_filtered.sort_values('score_final_mean', ascending=False)

print("\nüèÜ TOP 10 COMBINAISONS ZONE-TYPE :")
print("-" * 100)
print(f"{'Dept':<4} {'Type de Bien':<18} {'Score':<6} {'Rendement':<10} {'Count':<8} {'Prix/m¬≤':<10} {'Valeur Moy.':<12}")
print("-" * 100)

for _, row in combo_filtered.head(10).iterrows():
    dept = row['code_departement']
    type_bien = row['type_bien_estime']
    score = row['score_final_mean']
    rendement = f"{row['rendement_brut_mean']:.2f}%"
    count = int(row['valeur_fonciere_count'])
    prix_m2 = f"{int(row['prix_m2_mean'])}‚Ç¨"
    valeur = f"{int(row['valeur_fonciere_mean']/1000)}k‚Ç¨"
    
    print(f"{dept:<4} {type_bien:<18} {score:<6} {rendement:<10} {count:<8} {prix_m2:<10} {valeur:<12}")

# 8. ANALYSE DES OPPORTUNIT√âS PAR BUDGET
print("\nüí∞ Analyse des opportunit√©s par budget...")

# D√©finition des tranches de budget
budgets = [
    (50000, 150000, "Budget Serr√©"),
    (150000, 300000, "Budget Moyen"),
    (300000, 500000, "Budget Confortable"),
    (500000, float('inf'), "Budget √âlev√©")
]

print("\nüíµ OPPORTUNIT√âS PAR TRANCHE DE BUDGET :")

for min_budget, max_budget, label in budgets:
    if max_budget == float('inf'):
        budget_filter = transactions_data['valeur_fonciere'] >= min_budget
        budget_text = f"‚â•{min_budget//1000}k‚Ç¨"
    else:
        budget_filter = (transactions_data['valeur_fonciere'] >= min_budget) & (transactions_data['valeur_fonciere'] < max_budget)
        budget_text = f"{min_budget//1000}-{max_budget//1000}k‚Ç¨"
    
    budget_data = transactions_data[budget_filter]
    
    if len(budget_data) > 0:
        top_budget = budget_data.nlargest(3, 'score_final')
        
        print(f"\n   üí∞ {label} ({budget_text}) - {len(budget_data):,} biens disponibles:")
        print(f"   Top 3 opportunit√©s :")
        
        for i, row in top_budget.iterrows():
            dept = row['code_departement']
            type_bien = row['type_bien_estime']
            score = row['score_final']
            rendement = row['rendement_brut']
            valeur = int(row['valeur_fonciere'])
            surface = int(row['surface_reelle_bati'])
            
            print(f"      {top_budget.index.get_loc(i)+1}. Dept {dept}, {type_bien}: {score}/10, {rendement:.2f}%, {valeur:,}‚Ç¨, {surface}m¬≤")

# 9. SIGNAUX D'ALERTE ET RISQUES
print("\n‚ö†Ô∏è SIGNAUX D'ALERTE ET RISQUES :")

# Identification des signaux d'alerte
alertes = []

# March√© trop concentr√©
dept_concentration = transactions_data['code_departement'].value_counts()
if dept_concentration.iloc[0] / len(transactions_data) > 0.8:
    principal_dept = dept_concentration.index[0]
    alertes.append(f"March√© tr√®s concentr√© sur le d√©partement {principal_dept} ({dept_concentration.iloc[0]/len(transactions_data)*100:.1f}%)")

# Rendements trop uniformes (possibles erreurs)
rendement_std = transactions_data['rendement_brut'].std()
if rendement_std < 0.5:
    alertes.append(f"Rendements tr√®s uniformes (√©cart-type: {rendement_std:.2f}%) - V√©rifier la diversit√© des donn√©es")

# Prix anormalement √©lev√©s ou bas
prix_outliers_high = len(transactions_data[transactions_data['prix_m2'] > 10000])
prix_outliers_low = len(transactions_data[transactions_data['prix_m2'] < 500])

if prix_outliers_high > 0:
    alertes.append(f"{prix_outliers_high} transactions avec prix >10,000‚Ç¨/m¬≤ (√† v√©rifier)")
if prix_outliers_low > 0:
    alertes.append(f"{prix_outliers_low} transactions avec prix <500‚Ç¨/m¬≤ (√† v√©rifier)")

if alertes:
    print("\nüö® ALERTES D√âTECT√âES :")
    for alerte in alertes:
        print(f"   ‚Ä¢ {alerte}")
else:
    print("\n‚úÖ Aucun signal d'alerte majeur d√©tect√©")

# 10. EXPORT DES RECOMMANDATIONS
print("\nüíæ Sauvegarde des recommandations...")

output_dir = Path('../outputs/recommendations')
output_dir.mkdir(exist_ok=True)

# Export des zones classifi√©es
zones_data.to_csv(output_dir / 'zones_attractives_classifiees.csv', index=False, encoding='utf-8')

# Export des types de biens recommand√©s
type_bien_analysis.to_csv(output_dir / 'types_biens_attractifs.csv', index=False, encoding='utf-8')

# Export des meilleures combinaisons
combo_filtered.to_csv(output_dir / 'meilleures_combinaisons_zone_type.csv', index=False, encoding='utf-8')

# R√©sum√© des recommandations
recommendations_summary = {
    'zones_premium': top_zones['code_departement'].tolist() if len(top_zones) > 0 else [],
    'zones_eviter': zones_eviter['code_departement'].tolist() if len(zones_eviter) > 0 else [],
    'types_biens_top3': top_types['type_bien_estime'].tolist(),
    'alertes': alertes
}

import json
with open(output_dir / 'resume_recommandations.json', 'w', encoding='utf-8') as f:
    json.dump(recommendations_summary, f, ensure_ascii=False, indent=2)

print(f"‚úÖ Recommandations export√©es dans {output_dir}/")

# 11. R√âSUM√â DES ZONES ATTRACTIVES
print("\n" + "="*60)
print("‚úÖ T031 - IDENTIFICATION DES ZONES ATTRACTIVES TERMIN√âE")
print("="*60)

print(f"\nüó∫Ô∏è ZONES IDENTIFI√âES :")
for categorie, count in zone_classification.items():
    print(f"   ‚Ä¢ {categorie}: {count} d√©partement(s)")

if len(top_zones) > 0:
    print(f"\n‚≠ê ZONES √Ä PRIVIL√âGIER :")
    for _, row in top_zones.head(3).iterrows():
        print(f"   ‚Ä¢ D√©partement {row['code_departement']}: {row['classification_zone']} (Score: {row['score_composite']}/10)")

print(f"\nüè† TYPES DE BIENS RECOMMAND√âS :")
for _, row in top_types.iterrows():
    rank = top_types.index.get_loc(_) + 1
    print(f"   {rank}. {row['type_bien_estime']}: {row['score_final_mean']:.1f}/10 ({row['rendement_brut_mean']:.2f}%)")

print(f"\nüìä VOLUME D'ANALYSE :")
print(f"   ‚Ä¢ {len(zones_data)} d√©partements √©valu√©s")
print(f"   ‚Ä¢ {len(transactions_data):,} transactions analys√©es")
print(f"   ‚Ä¢ {len(combo_filtered)} combinaisons zone-type valid√©es")

print(f"\nüìÇ FICHIERS CR√â√âS :")
print(f"   ‚Ä¢ zones_attractives_classifiees.csv")
print(f"   ‚Ä¢ types_biens_attractifs.csv")
print(f"   ‚Ä¢ meilleures_combinaisons_zone_type.csv")
print(f"   ‚Ä¢ resume_recommandations.json")

print(f"\nüéØ Donn√©es pr√™tes pour recommandations personnalis√©es (T032)")

# Variables globales pour les t√¢ches suivantes
global zones_attractives, types_attractifs, recommandations_finales
zones_attractives = zones_data.copy()
types_attractifs = type_bien_analysis.copy()
recommandations_finales = recommendations_summary.copy()

print(f"\n‚úÖ Variables globales d√©finies : zones_attractives, types_attractifs, recommandations_finales")

## T032 - üë§ Recommandations d'Investissement Personnalis√©es

G√©n√©ration de recommandations d'investissement personnalis√©es avec justifications d√©taill√©es selon le profil investisseur.

In [None]:
# T032 - Recommandations d'Investissement Personnalis√©es
print("üéØ T032 - RECOMMANDATIONS D'INVESTISSEMENT PERSONNALIS√âES")
print("=" * 70)

# 1. D√âFINITION DES PROFILS D'INVESTISSEURS
print("üë§ D√©finition des profils d'investisseurs...")

# Utilisation des donn√©es des t√¢ches pr√©c√©dentes
if 'zones_attractives' in globals():
    zones_data = zones_attractives.copy()
    types_data = types_attractifs.copy()
    transactions_scored = df_scored.copy()
else:
    zones_data = secteur_scores.copy()
    types_data = type_bien_analysis.copy()
    transactions_scored = df_scored.copy()

print(f"üìä Base de donn√©es : {len(transactions_scored):,} transactions scor√©es")

# D√©finition des profils d'investisseurs
profils_investisseurs = {
    'debutant': {
        'nom': 'Investisseur D√©butant',
        'budget_min': 80000,
        'budget_max': 250000,
        'objectif_rendement': 4.5,
        'tolerance_risque': 'faible',
        'preferences': {
            'stabilite': 0.35,
            'accessibilite': 0.30,
            'rentabilite': 0.25,
            'liquidite': 0.10
        },
        'contraintes': {
            'score_min': 5.0,
            'surface_max': 120,
            'eviter_premium': True
        }
    },
    'experimente': {
        'nom': 'Investisseur Exp√©riment√©',
        'budget_min': 150000,
        'budget_max': 600000,
        'objectif_rendement': 5.5,
        'tolerance_risque': 'mod√©r√©e',
        'preferences': {
            'rentabilite': 0.35,
            'liquidite': 0.25,
            'stabilite': 0.25,
            'croissance': 0.15
        },
        'contraintes': {
            'score_min': 6.0,
            'surface_min': 40,
            'nb_transactions_min': 100
        }
    },
    'aguerri': {
        'nom': 'Investisseur Aguerri',
        'budget_min': 300000,
        'budget_max': float('inf'),
        'objectif_rendement': 6.5,
        'tolerance_risque': '√©lev√©e',
        'preferences': {
            'rentabilite': 0.40,
            'croissance': 0.25,
            'liquidite': 0.20,
            'stabilite': 0.15
        },
        'contraintes': {
            'score_min': 6.5,
            'accepte_premium': True,
            'volume_min': 50
        }
    }
}

print(f"‚úÖ {len(profils_investisseurs)} profils d'investisseurs d√©finis")

# 2. FONCTION DE G√âN√âRATION DE RECOMMANDATIONS
print("\nüîß Cr√©ation du moteur de recommandations...")

def generer_recommandations(profil_key, budget_specifique=None, preferences_custom=None):
    """G√©n√®re des recommandations personnalis√©es pour un profil donn√©"""
    
    profil = profils_investisseurs[profil_key].copy()
    
    # Override budget si sp√©cifi√©
    if budget_specifique:
        profil['budget_max'] = min(budget_specifique, profil['budget_max'])
    
    # Override pr√©f√©rences si sp√©cifi√©es
    if preferences_custom:
        profil['preferences'].update(preferences_custom)
    
    print(f"\nüë§ RECOMMANDATIONS POUR : {profil['nom']}")
    print(f"üí∞ Budget : {profil['budget_min']:,}‚Ç¨ - {profil['budget_max'] if profil['budget_max'] != float('inf') else '‚àû'}‚Ç¨")
    print(f"üéØ Objectif rendement : {profil['objectif_rendement']:.1f}%")
    print("-" * 70)
    
    # Filtrage des transactions selon le profil
    budget_filter = (transactions_scored['valeur_fonciere'] >= profil['budget_min'])
    if profil['budget_max'] != float('inf'):
        budget_filter &= (transactions_scored['valeur_fonciere'] <= profil['budget_max'])
    
    score_filter = transactions_scored['score_final'] >= profil['contraintes']['score_min']
    rendement_filter = transactions_scored['rendement_brut'] >= profil['objectif_rendement']
    
    # Contraintes sp√©cifiques
    additional_filters = True
    
    if 'surface_max' in profil['contraintes']:
        additional_filters &= transactions_scored['surface_reelle_bati'] <= profil['contraintes']['surface_max']
    
    if 'surface_min' in profil['contraintes']:
        additional_filters &= transactions_scored['surface_reelle_bati'] >= profil['contraintes']['surface_min']
    
    if 'eviter_premium' in profil['contraintes'] and profil['contraintes']['eviter_premium']:
        additional_filters &= transactions_scored['prix_m2'] <= 6000
    
    # Application des filtres
    candidats = transactions_scored[budget_filter & score_filter & rendement_filter & additional_filters].copy()
    
    if len(candidats) == 0:
        print("‚ùå Aucune opportunit√© trouv√©e avec ces crit√®res")
        # Rel√¢chement des contraintes
        candidats = transactions_scored[budget_filter & score_filter].copy()
        print(f"üîÑ √âlargissement de la recherche : {len(candidats)} opportunit√©s trouv√©es")
    
    if len(candidats) == 0:
        print("‚ùå Aucune opportunit√© dans votre budget")
        return None
    
    # Recalcul du score selon les pr√©f√©rences du profil
    candidats['score_profil'] = 0
    
    # Mapping des pr√©f√©rences vers les scores
    pref_mapping = {
        'rentabilite': 'score_rendement_indiv',
        'stabilite': 'score_secteur',  # Approximation
        'accessibilite': 'score_prix_relatif',
        'liquidite': 'score_secteur',
        'croissance': 'score_surface'
    }
    
    for pref, poids in profil['preferences'].items():
        if pref in pref_mapping and pref_mapping[pref] in candidats.columns:
            candidats['score_profil'] += candidats[pref_mapping[pref]] * poids
    
    # Si pas de mapping complet, utiliser le score final
    if candidats['score_profil'].sum() == 0:
        candidats['score_profil'] = candidats['score_final']
    
    # Tri par score personnalis√©
    candidats = candidats.sort_values('score_profil', ascending=False)
    
    # Top recommandations
    top_recommandations = candidats.head(5)
    
    print(f"üìä {len(candidats):,} opportunit√©s correspondent √† votre profil")
    print(f"‚≠ê TOP 5 RECOMMANDATIONS PERSONNALIS√âES :")
    print("-" * 70)
    print(f"{'#':<2} {'Dept':<4} {'Type':<16} {'Score':<6} {'Rend.':<7} {'Prix':<10} {'Surface':<7}")
    print("-" * 70)
    
    recommandations_detaillees = []
    
    for i, (_, row) in enumerate(top_recommandations.iterrows(), 1):
        dept = row['code_departement']
        type_bien = row['type_bien_estime'][:15]  # Truncate for display
        score = f"{row['score_profil']:.1f}"
        rendement = f"{row['rendement_brut']:.1f}%"
        valeur = f"{int(row['valeur_fonciere']/1000)}k‚Ç¨"
        surface = f"{int(row['surface_reelle_bati'])}m¬≤"
        
        print(f"{i:<2} {dept:<4} {type_bien:<16} {score:<6} {rendement:<7} {valeur:<10} {surface:<7}")
        
        # D√©tails pour export
        recommandations_detaillees.append({
            'rang': i,
            'departement': dept,
            'type_bien': row['type_bien_estime'],
            'score_profil': row['score_profil'],
            'score_final': row['score_final'],
            'rendement_brut': row['rendement_brut'],
            'valeur_fonciere': row['valeur_fonciere'],
            'surface': row['surface_reelle_bati'],
            'prix_m2': row['prix_m2'],
            'justifications': []
        })
    
    # 3. JUSTIFICATIONS D√âTAILL√âES
    print(f"\nüìã JUSTIFICATIONS D√âTAILL√âES :")
    
    for i, rec in enumerate(recommandations_detaillees):
        print(f"\n{i+1}. RECOMMANDATION #{rec['rang']} - D√©partement {rec['departement']}")
        print(f"   Type: {rec['type_bien']}")
        print(f"   Prix: {rec['valeur_fonciere']:,.0f}‚Ç¨ ({rec['prix_m2']:,.0f}‚Ç¨/m¬≤)")
        print(f"   Surface: {rec['surface']:.0f}m¬≤")
        print(f"   Rendement: {rec['rendement_brut']:.2f}%")
        
        # G√©n√©ration des justifications
        justifications = []
        
        if rec['rendement_brut'] >= profil['objectif_rendement']:
            justifications.append(f"‚úÖ Rendement {rec['rendement_brut']:.1f}% sup√©rieur √† l'objectif ({profil['objectif_rendement']:.1f}%)")
        
        if rec['score_final'] >= 7:
            justifications.append("‚úÖ Score d'opportunit√© excellent (‚â•7/10)")
        elif rec['score_final'] >= 5:
            justifications.append("‚úÖ Score d'opportunit√© satisfaisant (‚â•5/10)")
        
        if rec['valeur_fonciere'] <= profil['budget_max'] * 0.8:
            justifications.append("‚úÖ Prix bien positionn√© dans votre budget")
        
        # Justifications sp√©cifiques au profil
        if profil_key == 'debutant':
            if rec['surface'] <= 80:
                justifications.append("‚úÖ Surface mod√©r√©e, id√©ale pour d√©buter")
            if rec['departement'] in ['91', '94']:  # D√©partements analys√©s
                justifications.append("‚úÖ D√©partement avec historique de transactions stable")
        
        elif profil_key == 'experimente':
            if rec['rendement_brut'] > 5.5:
                justifications.append("‚úÖ Rendement attractif pour investisseur exp√©riment√©")
            if rec['surface'] >= 60:
                justifications.append("‚úÖ Surface int√©ressante pour optimiser la rentabilit√©")
        
        elif profil_key == 'aguerri':
            if rec['rendement_brut'] > 6.5:
                justifications.append("‚úÖ Rendement √©lev√© correspondant √† votre profil dynamique")
            if rec['valeur_fonciere'] > 400000:
                justifications.append("‚úÖ Investissement de qualit√© sup√©rieure")
        
        rec['justifications'] = justifications
        
        print("   üîç Pourquoi cette recommandation :")
        for justification in justifications:
            print(f"      {justification}")
        
        if len(justifications) == 0:
            print("      ‚úÖ Opportunit√© conforme aux crit√®res de base")
    
    return {
        'profil': profil,
        'candidats_total': len(candidats),
        'top_recommandations': recommandations_detaillees,
        'statistiques': {
            'rendement_moyen': candidats['rendement_brut'].mean(),
            'prix_moyen': candidats['valeur_fonciere'].mean(),
            'score_moyen': candidats['score_profil'].mean()
        }
    }

# 3. G√âN√âRATION DES RECOMMANDATIONS POUR CHAQUE PROFIL
print("\nüéØ G√©n√©ration des recommandations par profil...")

recommandations_par_profil = {}

for profil_key in profils_investisseurs.keys():
    print("\n" + "="*70)
    recommandations = generer_recommandations(profil_key)
    if recommandations:
        recommandations_par_profil[profil_key] = recommandations

# 4. RECOMMANDATIONS AVEC BUDGET SP√âCIFIQUE
print("\n" + "="*70)
print("üí∞ EXEMPLES AVEC BUDGET SP√âCIFIQUE")
print("="*70)

exemples_budgets = [
    (200000, 'debutant'),
    (400000, 'experimente'),
    (800000, 'aguerri')
]

for budget, profil_type in exemples_budgets:
    print(f"\nüíµ Exemple avec budget {budget:,}‚Ç¨ (profil {profil_type}) :")
    recommandations_budget = generer_recommandations(profil_type, budget_specifique=budget)

# 5. CONSEILS G√âN√âRAUX PAR PROFIL
print("\n" + "="*70)
print("üí° CONSEILS G√âN√âRAUX PAR PROFIL")
print("="*70)

conseils_par_profil = {
    'debutant': [
        "üéØ Privil√©giez la stabilit√© et l'apprentissage sur votre premier investissement",
        "üìö Formez-vous sur la gestion locative avant d'investir",
        "üîç Visitez plusieurs biens avant de vous d√©cider",
        "üí∞ Gardez une r√©serve financi√®re pour les travaux et vacances locatives",
        "ü§ù Entourez-vous de professionnels (notaire, agent immobilier, comptable)"
    ],
    'experimente': [
        "‚öñÔ∏è Diversifiez g√©ographiquement votre portefeuille",
        "üìä Optimisez votre fiscalit√© (r√©gime r√©el, amortissements)",
        "üîÑ Consid√©rez le refinancement pour multiplier les acquisitions",
        "üìà Surveillez les √©volutions de march√© pour identifier les opportunit√©s",
        "üèóÔ∏è √âvaluez le potentiel de travaux pour augmenter la rentabilit√©"
    ],
    'aguerri': [
        "üé≤ Explorez des strat√©gies avanc√©es (marchand de biens, d√©ficit foncier)",
        "üåç Diversifiez vers diff√©rents types d'actifs (commercial, international)",
        "üí° Utilisez l'effet de levier pour maximiser les rendements",
        "üìã Cr√©ez des structures d'investissement optimis√©es (SCI, SASU)",
        "ü§ñ Automatisez la gestion avec des outils professionnels"
    ]
}

for profil_key, conseils in conseils_par_profil.items():
    profil_nom = profils_investisseurs[profil_key]['nom']
    print(f"\nüë§ {profil_nom.upper()} :")
    for conseil in conseils:
        print(f"   {conseil}")

# 6. EXPORT DES RECOMMANDATIONS PERSONNALIS√âES
print("\nüíæ Sauvegarde des recommandations personnalis√©es...")

output_dir = Path('../outputs/recommendations')
output_dir.mkdir(exist_ok=True)

# Export pour chaque profil
for profil_key, recommandations in recommandations_par_profil.items():
    # DataFrame des recommandations
    df_reco = pd.DataFrame(recommandations['top_recommandations'])
    df_reco.to_csv(output_dir / f'recommandations_{profil_key}.csv', index=False, encoding='utf-8')
    
    # Rapport d√©taill√©
    rapport = {
        'profil': recommandations['profil'],
        'statistiques': recommandations['statistiques'],
        'recommandations': recommandations['top_recommandations'],
        'conseils': conseils_par_profil[profil_key]
    }
    
    with open(output_dir / f'rapport_detaille_{profil_key}.json', 'w', encoding='utf-8') as f:
        json.dump(rapport, f, ensure_ascii=False, indent=2, default=str)

# R√©sum√© g√©n√©ral
resume_general = {
    'date_generation': pd.Timestamp.now().isoformat(),
    'profils_analyses': list(profils_investisseurs.keys()),
    'volume_donnees': len(transactions_scored),
    'zones_analysees': len(zones_data),
    'recommandations_par_profil': {
        profil: len(reco['top_recommandations']) 
        for profil, reco in recommandations_par_profil.items()
    }
}

with open(output_dir / 'resume_recommandations_personnalisees.json', 'w', encoding='utf-8') as f:
    json.dump(resume_general, f, ensure_ascii=False, indent=2)

print(f"‚úÖ Recommandations personnalis√©es export√©es dans {output_dir}/")

# 7. R√âSUM√â DES RECOMMANDATIONS PERSONNALIS√âES
print("\n" + "="*70)
print("‚úÖ T032 - RECOMMANDATIONS PERSONNALIS√âES TERMIN√âES")
print("="*70)

print(f"\nüë• PROFILS ANALYS√âS :")
for profil_key, profil_data in profils_investisseurs.items():
    print(f"   ‚Ä¢ {profil_data['nom']}")
    if profil_key in recommandations_par_profil:
        nb_reco = len(recommandations_par_profil[profil_key]['top_recommandations'])
        print(f"     ‚Üí {nb_reco} recommandations g√©n√©r√©es")

print(f"\nüìä VOLUME DE RECOMMANDATIONS :")
total_recommandations = sum(len(reco['top_recommandations']) for reco in recommandations_par_profil.values())
print(f"   ‚Ä¢ Total : {total_recommandations} recommandations personnalis√©es")
print(f"   ‚Ä¢ Base de donn√©es : {len(transactions_scored):,} transactions analys√©es")

print(f"\nüéØ CARACT√âRISTIQUES DES RECOMMANDATIONS :")
for profil_key, recommandations in recommandations_par_profil.items():
    stats = recommandations['statistiques']
    print(f"   ‚Ä¢ {profils_investisseurs[profil_key]['nom']} :")
    print(f"     - Rendement moyen : {stats['rendement_moyen']:.2f}%")
    print(f"     - Prix moyen : {stats['prix_moyen']:,.0f}‚Ç¨")

print(f"\nüìÇ FICHIERS CR√â√âS :")
for profil_key in profils_investisseurs.keys():
    print(f"   ‚Ä¢ recommandations_{profil_key}.csv")
    print(f"   ‚Ä¢ rapport_detaille_{profil_key}.json")
print(f"   ‚Ä¢ resume_recommandations_personnalisees.json")

print(f"\nüéØ Donn√©es pr√™tes pour r√©sum√© ex√©cutif (T033)")

# Variables globales pour les t√¢ches suivantes
global recommandations_personnalisees, profils_definis
recommandations_personnalisees = recommandations_par_profil.copy()
profils_definis = profils_investisseurs.copy()

print(f"\n‚úÖ Variables globales d√©finies : recommandations_personnalisees, profils_definis")

## T033 - üìã R√©sum√© Ex√©cutif pour Investisseurs Non-Techniques

Cr√©ation d'un r√©sum√© ex√©cutif clair et actionnable pour les investisseurs non-techniques.

In [None]:
# T033 - R√©sum√© Ex√©cutif pour Investisseurs Non-Techniques
print("üéØ T033 - R√âSUM√â EX√âCUTIF POUR INVESTISSEURS NON-TECHNIQUES")
print("=" * 70)

# 1. PR√âPARATION DU R√âSUM√â EX√âCUTIF
print("üìã Pr√©paration du r√©sum√© ex√©cutif...")

# Utilisation de toutes les donn√©es analys√©es
if 'recommandations_personnalisees' in globals():
    reco_data = recommandations_personnalisees
    profils_data = profils_definis
else:
    reco_data = recommandations_par_profil
    profils_data = profils_investisseurs

# Date de g√©n√©ration
date_rapport = pd.Timestamp.now().strftime('%d/%m/%Y')
heure_rapport = pd.Timestamp.now().strftime('%H:%M')

print(f"üìÖ Rapport g√©n√©r√© le {date_rapport} √† {heure_rapport}")

# 2. CR√âATION DU R√âSUM√â EX√âCUTIF
print("\nüìã Cr√©ation du r√©sum√© ex√©cutif...")

# Template du r√©sum√© ex√©cutif
executive_summary = f"""
# üìä R√âSUM√â EX√âCUTIF - ANALYSE INVESTISSEMENT IMMOBILIER DVF

**Date du rapport :** {date_rapport}  
**Source :** Donn√©es DVF (Demandes de Valeurs Fonci√®res) 2019-2023  
**Volume analys√© :** {len(transactions_scored):,} transactions immobili√®res  

---

## üéØ SYNTH√àSE G√âN√âRALE

### March√© Analys√©
- **P√©riode :** 2019-2023
- **Zones g√©ographiques :** {len(zones_data)} d√©partements fran√ßais
- **Types de biens :** Maisons, appartements, surfaces vari√©es de 25m¬≤ √† 200m¬≤+
- **Gamme de prix :** {int(transactions_scored['valeur_fonciere'].min()):,}‚Ç¨ √† {int(transactions_scored['valeur_fonciere'].max()):,}‚Ç¨

### Rendements Observ√©s
- **Rendement moyen :** {transactions_scored['rendement_brut'].mean():.1f}% brut par an
- **Meilleur rendement :** {transactions_scored['rendement_brut'].max():.1f}% (cas exceptionnel)
- **Rendement m√©dian :** {transactions_scored['rendement_brut'].median():.1f}% (valeur typique)
- **Fourchette recommand√©e :** 4,0% √† 7,0% selon le profil investisseur

---

## ‚≠ê RECOMMANDATIONS PRINCIPALES

### üèÜ Zones G√©ographiques Prioritaires
"""

# Ajout des meilleures zones
top_zones = zones_data.nlargest(3, 'score_composite')
for i, (_, zone) in enumerate(top_zones.iterrows(), 1):
    dept = zone['code_departement']
    score = zone['score_composite']
    rendement = zone['rendement_brut_mean']
    classification = zone['classification_zone']
    
    executive_summary += f"""
**{i}. D√©partement {dept}** - {classification}
- Score global : {score}/10
- Rendement moyen : {rendement:.1f}%
- Avantages : {"Excellent √©quilibre rendement/risque" if score >= 7 else "Bon compromis prix/rentabilit√©"}
"""

executive_summary += f"""

### üè† Types de Biens Recommand√©s
"""

# Ajout des meilleurs types de biens
top_types = types_data.head(3)
for i, (_, type_bien) in enumerate(top_types.iterrows(), 1):
    nom_type = type_bien['type_bien_estime']
    score = type_bien['score_final_mean']
    rendement = type_bien['rendement_brut_mean']
    nb_biens = int(type_bien['rendement_brut_count'])
    
    executive_summary += f"""
**{i}. {nom_type}**
- Score d'attractivit√© : {score:.1f}/10
- Rendement moyen : {rendement:.1f}%
- Bas√© sur {nb_biens:,} transactions analys√©es
"""

executive_summary += f"""

---

## üë§ RECOMMANDATIONS PAR PROFIL INVESTISSEUR

"""

# Recommandations par profil
for profil_key, profil_info in profils_data.items():
    profil_nom = profil_info['nom']
    budget_min = profil_info['budget_min']
    budget_max = profil_info['budget_max'] if profil_info['budget_max'] != float('inf') else "Sans limite"
    objectif = profil_info['objectif_rendement']
    tolerance = profil_info['tolerance_risque']
    
    executive_summary += f"""
### üë§ {profil_nom}

**Profil :**
- Budget recommand√© : {budget_min:,}‚Ç¨ √† {budget_max}‚Ç¨
- Objectif rendement : {objectif:.1f}% minimum
- Tol√©rance au risque : {tolerance}

**Nos recommandations :**
"""
    
    if profil_key in reco_data:
        top_reco = reco_data[profil_key]['top_recommandations'][:2]  # Top 2
        for j, reco in enumerate(top_reco, 1):
            dept = reco['departement']
            type_bien = reco['type_bien']
            rendement = reco['rendement_brut']
            prix = int(reco['valeur_fonciere'])
            surface = int(reco['surface'])
            
            executive_summary += f"""
- **Option {j} :** {type_bien} dans le d√©partement {dept}
  - Prix : {prix:,}‚Ç¨ ({surface}m¬≤)
  - Rendement attendu : {rendement:.1f}%
"""
    
    # Conseils sp√©cifiques
    if profil_key == 'debutant':
        executive_summary += """
**Conseils sp√©cifiques :**
- Commencez par un bien proche de chez vous pour faciliter la gestion
- Privil√©giez la stabilit√© √† la performance maximum
- Constituez une r√©serve de 10-15% du prix d'achat pour les impr√©vus
"""
    elif profil_key == 'experimente':
        executive_summary += """
**Conseils sp√©cifiques :**
- Diversifiez g√©ographiquement votre portefeuille
- Optimisez votre fiscalit√© (r√©gime r√©el, amortissements)
- Consid√©rez le refinancement pour multiplier les acquisitions
"""
    elif profil_key == 'aguerri':
        executive_summary += """
**Conseils sp√©cifiques :**
- Explorez des strat√©gies avanc√©es (marchand de biens, d√©ficit foncier)
- Utilisez l'effet de levier pour maximiser les rendements
- Diversifiez vers diff√©rents types d'actifs immobiliers
"""

executive_summary += f"""

---

## ‚ö†Ô∏è POINTS D'ATTENTION

### Risques √† Consid√©rer
- **Vacance locative :** Pr√©voir 1-2 mois de vacance par an dans vos calculs
- **Travaux et entretien :** Budget 0,5-1% de la valeur du bien par an
- **√âvolution fiscale :** Les avantages fiscaux peuvent √©voluer
- **March√© local :** V√©rifier l'attractivit√© √©conomique de la zone

### Zones √† √âviter
"""

# Zones √† √©viter si il y en a
zones_eviter = zones_data[zones_data['classification_zone'] == 'Zone √† √âviter']
if len(zones_eviter) > 0:
    for _, zone in zones_eviter.iterrows():
        dept = zone['code_departement']
        score = zone['score_composite']
        executive_summary += f"- D√©partement {dept} (Score: {score:.1f}/10) - Faible liquidit√© ou rendements insuffisants\n"
else:
    executive_summary += "‚úÖ Aucune zone critique identifi√©e dans l'analyse actuelle\n"

executive_summary += f"""

---

## üìà PERSPECTIVES ET PROCHAINES √âTAPES

### Tendances Observ√©es
- Le march√© immobilier locatif reste attractif avec des rendements moyens de {transactions_scored['rendement_brut'].mean():.1f}%
- Les zones p√©riurbaines offrent souvent le meilleur compromis prix/rentabilit√©
- Les biens de 40-80m¬≤ sont g√©n√©ralement les plus liquides

### Plan d'Action Recommand√©

**Phase 1 - Pr√©paration (2-4 semaines)**
1. D√©finir votre budget d'investissement r√©el (apport + capacit√© d'emprunt)
2. Choisir votre profil investisseur parmi nos 3 cat√©gories
3. Vous former sur les bases de l'investissement locatif

**Phase 2 - Recherche (4-8 semaines)**
1. Cibler 2-3 zones g√©ographiques selon nos recommandations
2. Analyser le march√© locatif local (demande, loyers pratiqu√©s)
3. Visiter 10-15 biens pour calibrer le march√©

**Phase 3 - Acquisition (4-12 semaines)**
1. N√©gocier le prix d'achat (objectif: -5 √† -10% du prix affich√©)
2. Faire r√©aliser les diagnostics obligatoires
3. Finaliser le financement et l'achat

**Phase 4 - Mise en location (2-6 semaines)**
1. R√©aliser les travaux n√©cessaires
2. Fixer le loyer selon le march√© local
3. Trouver et s√©lectionner le locataire

---

## üìû RESSOURCES ET CONTACTS UTILES

### Sources d'Information
- **DVF (Demandes de Valeurs Fonci√®res) :** data.gouv.fr
- **Observatoires des loyers :** OLAP, CLAMEUR
- **Rendements par ville :** Meilleurs-Agents, SeLoger

### Professionnels √† Consulter
- **Notaire :** Validation juridique et fiscale
- **Courtier en pr√™ts :** Optimisation du financement
- **Expert-comptable :** Optimisation fiscale
- **Agent immobilier local :** Connaissance du march√©

### Outils de Gestion
- **Gestion locative :** Smartloc, Immo-Facile
- **Comptabilit√© :** MyRentSoft, Eloficash
- **Veille march√© :** Demandes de Valeurs Fonci√®res

---

## üéØ CONCLUSION

L'analyse des {len(transactions_scored):,} transactions immobili√®res confirme l'attractivit√© de l'investissement locatif en France, avec des rendements moyens de {transactions_scored['rendement_brut'].mean():.1f}%.

**Les cl√©s du succ√®s :**
- Choisir la zone g√©ographique selon nos recommandations
- Adapter le type de bien √† votre profil et budget
- Ma√Ætriser ses co√ªts d'acquisition et de gestion
- Rester patient et m√©thodique dans ses choix

**Votre prochaine action :** D√©finir votre budget et profil investisseur, puis analyser en d√©tail les opportunit√©s dans nos zones recommand√©es.

---

*Rapport g√©n√©r√© automatiquement le {date_rapport} √† {heure_rapport}*  
*Source : Analyse DVF 2019-2023 - {len(transactions_scored):,} transactions*
"""

# 3. CR√âATION D'UNE VERSION SIMPLIFI√âE
print("\nüìÑ Cr√©ation d'une version simplifi√©e...")

# Version One-Page
simple_summary = f"""
# üè† INVESTISSEMENT IMMOBILIER - R√âSUM√â ULTRA-SIMPLIFI√â

## ‚úÖ CE QU'IL FAUT RETENIR

**Rendement moyen :** {transactions_scored['rendement_brut'].mean():.1f}% par an  
**Meilleure zone :** D√©partement {top_zones.iloc[0]['code_departement']} ({top_zones.iloc[0]['rendement_brut_mean']:.1f}% de rendement)  
**Meilleur type :** {top_types.iloc[0]['type_bien_estime']} ({top_types.iloc[0]['rendement_brut_mean']:.1f}% de rendement)  

## üí∞ SELON VOTRE BUDGET

**100-250k‚Ç¨ :** {', '.join([reco['type_bien'] for reco in reco_data['debutant']['top_recommandations'][:2]] if 'debutant' in reco_data else ['Petits appartements, maisons familiales'])}  
**250-600k‚Ç¨ :** {', '.join([reco['type_bien'] for reco in reco_data['experimente']['top_recommandations'][:2]] if 'experimente' in reco_data else ['Grands appartements, maisons de qualit√©'])}  
**600k‚Ç¨+ :** {', '.join([reco['type_bien'] for reco in reco_data['aguerri']['top_recommandations'][:2]] if 'aguerri' in reco_data else ['Biens premium, immeubles de rapport'])}  

## ‚ö†Ô∏è POINTS CL√âS

‚úÖ **√Ä faire :** Viser 4-6% de rendement, pr√©voir des travaux, diversifier  
‚ùå **√Ä √©viter :** Rendements >8% (risqu√©), zones isol√©es, achats impulsifs  

## üéØ VOTRE PROCHAINE ACTION

1. Fixer votre budget r√©el
2. Choisir 1-2 zones dans nos recommandations  
3. Visiter 10+ biens pour comprendre le march√©
4. N√©gocier et acheter avec l'aide de professionnels

*Analyse bas√©e sur {len(transactions_scored):,} transactions 2019-2023*
"""

# 4. SAUVEGARDE DES R√âSUM√âS
print("\nüíæ Sauvegarde des r√©sum√©s ex√©cutifs...")

output_dir = Path('../outputs/recommendations')
output_dir.mkdir(exist_ok=True)

# Sauvegarde du r√©sum√© complet
with open(output_dir / 'resume_executif_complet.md', 'w', encoding='utf-8') as f:
    f.write(executive_summary)

# Sauvegarde du r√©sum√© simplifi√©
with open(output_dir / 'resume_executif_simplifie.md', 'w', encoding='utf-8') as f:
    f.write(simple_summary)

# Version PDF-ready (HTML)
html_summary = f"""
<!DOCTYPE html>
<html>
<head>
    <meta charset="UTF-8">
    <title>R√©sum√© Ex√©cutif - Investissement Immobilier</title>
    <style>
        body {{ font-family: Arial, sans-serif; margin: 40px; line-height: 1.6; }}
        h1 {{ color: #2E86AB; border-bottom: 3px solid #2E86AB; }}
        h2 {{ color: #A23B72; margin-top: 30px; }}
        h3 {{ color: #F18F01; }}
        .highlight {{ background-color: #F0F8FF; padding: 15px; border-left: 4px solid #2E86AB; }}
        .warning {{ background-color: #FFF3CD; padding: 15px; border-left: 4px solid #FFC107; }}
        .success {{ background-color: #D4EDDA; padding: 15px; border-left: 4px solid #28A745; }}
        table {{ border-collapse: collapse; width: 100%; margin: 20px 0; }}
        th, td {{ border: 1px solid #ddd; padding: 12px; text-align: left; }}
        th {{ background-color: #f2f2f2; }}
    </style>
</head>
<body>
{executive_summary.replace('# ', '<h1>').replace('## ', '<h2>').replace('### ', '<h3>').replace('**', '<strong>').replace('- ', '<li>').replace('‚úÖ', '‚úÖ').replace('‚ùå', '‚ùå')}
</body>
</html>
"""

with open(output_dir / 'resume_executif_complet.html', 'w', encoding='utf-8') as f:
    f.write(html_summary)

# 5. M√âTRIQUES DE PERFORMANCE DU RAPPORT
print("\nüìä M√©triques de performance du rapport...")

# Calcul des m√©triques cl√©s pour le r√©sum√©
metriques_rapport = {
    'date_generation': date_rapport,
    'heure_generation': heure_rapport,
    'volume_donnees': {
        'transactions': len(transactions_scored),
        'zones': len(zones_data),
        'types_biens': len(types_data)
    },
    'rendements': {
        'moyen': round(transactions_scored['rendement_brut'].mean(), 2),
        'median': round(transactions_scored['rendement_brut'].median(), 2),
        'max': round(transactions_scored['rendement_brut'].max(), 2),
        'min': round(transactions_scored['rendement_brut'].min(), 2)
    },
    'recommendations': {
        'profils_analyses': len(profils_data),
        'zones_premium': len(top_zones),
        'types_recommandes': len(top_types)
    },
    'budget_ranges': {
        'minimum': int(transactions_scored['valeur_fonciere'].min()),
        'maximum': int(transactions_scored['valeur_fonciere'].max()),
        'median': int(transactions_scored['valeur_fonciere'].median())
    }
}

# Export des m√©triques
with open(output_dir / 'metriques_rapport.json', 'w', encoding='utf-8') as f:
    json.dump(metriques_rapport, f, ensure_ascii=False, indent=2)

# 6. CHECKLIST POUR L'INVESTISSEUR
print("\nüìã Cr√©ation de la checklist investisseur...")

checklist = """
# ‚úÖ CHECKLIST INVESTISSEUR IMMOBILIER

## üìã AVANT D'INVESTIR (Obligatoire)

### Finances
- [ ] Budget total d√©fini (apport + emprunt)
- [ ] Capacit√© d'endettement calcul√©e
- [ ] R√©serve de s√©curit√© constitu√©e (10-15% du prix)
- [ ] Simulation de pr√™t r√©alis√©e

### Formation
- [ ] Bases de l'investissement locatif acquises
- [ ] Fiscalit√© immobili√®re comprise
- [ ] Obligations du bailleur connues
- [ ] March√© local √©tudi√©

### √âquipe
- [ ] Notaire contact√©
- [ ] Courtier en pr√™ts identifi√©
- [ ] Agent immobilier local rencontr√©
- [ ] Expert-comptable consult√© (si n√©cessaire)

## üéØ LORS DE LA RECHERCHE

### Analyse du Bien
- [ ] Prix coh√©rent avec le march√©
- [ ] Travaux n√©cessaires √©valu√©s
- [ ] Rendement brut calcul√© (>4%)
- [ ] Charges de copropri√©t√© v√©rifi√©es
- [ ] Taxes fonci√®res estim√©es

### Analyse de la Zone
- [ ] Demande locative confirm√©e
- [ ] Loyers de march√© analys√©s
- [ ] Transports et commodit√©s v√©rifi√©s
- [ ] √âvolution d√©mographique positive
- [ ] Projets d'am√©nagement connus

### Aspects L√©gaux
- [ ] Diagnostics obligatoires demand√©s
- [ ] R√®glement de copropri√©t√© lu
- [ ] Proc√®s-verbaux d'AG consult√©s
- [ ] Servitudes v√©rifi√©es

## üí∞ LORS DE L'ACHAT

### N√©gociation
- [ ] Prix n√©goci√© (-5 √† -10% objectif)
- [ ] Conditions suspensives incluses
- [ ] D√©lais de r√©tractation respect√©s
- [ ] Clauses protectrices ajout√©es

### Financement
- [ ] Offre de pr√™t valid√©e
- [ ] Assurance emprunteur souscrite
- [ ] Garanties bancaires n√©goci√©es
- [ ] Frais de notaire provisionn√©s

## üè† APR√àS L'ACHAT

### Pr√©paration Locative
- [ ] Travaux r√©alis√©s si n√©cessaire
- [ ] √âtat des lieux d'entr√©e pr√©par√©
- [ ] Loyer fix√© selon le march√©
- [ ] Annonce r√©dig√©e et diffus√©e

### Gestion
- [ ] Contrat de bail √©tabli
- [ ] Dossier locataire v√©rifi√©
- [ ] Assurance PNO souscrite
- [ ] Suivi comptable organis√©

---

**üí° CONSEILS FINAUX :**
- Ne jamais acheter dans l'urgence
- Toujours visiter avant d'acheter
- Pr√©voir le pire (vacance, travaux)
- Commencer petit et progresser

*Checklist bas√©e sur l'analyse DVF 2019-2023*
"""

with open(output_dir / 'checklist_investisseur.md', 'w', encoding='utf-8') as f:
    f.write(checklist)

print(f"‚úÖ Checklist investisseur cr√©√©e")

# 7. R√âSUM√â FINAL DE T033
print("\n" + "="*70)
print("‚úÖ T033 - R√âSUM√â EX√âCUTIF TERMIN√â")
print("="*70)

print(f"\nüìã R√âSUM√âS CR√â√âS :")
print(f"   ‚Ä¢ R√©sum√© ex√©cutif complet ({len(executive_summary.split())} mots)")
print(f"   ‚Ä¢ R√©sum√© simplifi√© one-page ({len(simple_summary.split())} mots)")
print(f"   ‚Ä¢ Version HTML pour impression")
print(f"   ‚Ä¢ Checklist investisseur pratique")

print(f"\nüìä CONTENU DU R√âSUM√â :")
print(f"   ‚Ä¢ {len(profils_data)} profils investisseurs d√©taill√©s")
print(f"   ‚Ä¢ {len(top_zones)} zones g√©ographiques recommand√©es")
print(f"   ‚Ä¢ {len(top_types)} types de biens prioritaires")
print(f"   ‚Ä¢ Plan d'action en 4 phases")
print(f"   ‚Ä¢ Ressources et contacts utiles")

print(f"\nüéØ M√âTRIQUES CL√âS PR√âSENT√âES :")
print(f"   ‚Ä¢ Rendement moyen : {transactions_scored['rendement_brut'].mean():.1f}%")
print(f"   ‚Ä¢ Volume analys√© : {len(transactions_scored):,} transactions")
print(f"   ‚Ä¢ P√©riode : 2019-2023")
print(f"   ‚Ä¢ Couverture : {len(zones_data)} d√©partements")

print(f"\nüìÇ FICHIERS CR√â√âS :")
print(f"   ‚Ä¢ resume_executif_complet.md")
print(f"   ‚Ä¢ resume_executif_simplifie.md")
print(f"   ‚Ä¢ resume_executif_complet.html")
print(f"   ‚Ä¢ checklist_investisseur.md")
print(f"   ‚Ä¢ metriques_rapport.json")

print(f"\nüéØ R√©sum√© pr√™t pour finalisation du projet (T034)")

# Variables globales pour T034
global resume_executif, checklist_final, metriques_finales
resume_executif = executive_summary
checklist_final = checklist
metriques_finales = metriques_rapport

print(f"\n‚úÖ Variables globales d√©finies : resume_executif, checklist_final, metriques_finales")