# BLOC 4 : Analyse du Marché Immobilier - Département de l'Ain (6 heures)

La Direction Départementale des Territoires (DDT) de l'Ain vous a recruté en tant que Data Analyst pour créer un tableau de bord interactif destiné aux collectivités locales et aux professionnels de l'immobilier. Ce tableau de bord servira à mieux comprendre les dynamiques du marché immobilier local et à orienter les politiques d'aménagement du territoire.

La DDT dispose d'une base de données exhaustive des transactions immobilières (données DVF - Demandes de Valeurs Foncières) couvrant les trois dernières années. Ces données comprennent :

* Informations sur la transaction
  - Identifiant unique
  - Date de mutation
  - Nature de la mutation
  - Valeur foncière (prix de vente)

* Localisation précise du bien
  - Adresse complète (numéro, type de voie, nom de voie)
  - Code postal
  - Commune
  - Code département
  - Références cadastrales (section, numéro de plan)

* Caractéristiques du bien
  - Type de local (appartement, maison, dépendance)
  - Surface réelle bâtie
  - Nombre de pièces principales
  - Surface Carrez (pour les copropriétés)
  - Nature et surface du terrain
  - Nombre de lots

Votre mission est de créer un tableau de bord interactif complet qui permettra aux utilisateurs d'analyser :

* L'évolution des prix
  - Prix moyen par commune
  - Prix au m² par type de bien
  - Tendances temporelles des transactions

* La typologie des biens
  - Répartition par type de local
  - Distribution des surfaces
  - Analyse des terrains non bâtis

* Les dynamiques territoriales
  - Nombre de transactions par commune
  - Cartographie des prix
  - Identification des zones de tension

Le tableau de bord devra répondre à des questions stratégiques telles que :

* Quelles sont les communes les plus dynamiques en termes de transactions ?
* Comment évoluent les prix selon les typologies de biens ?
* Existe-t-il des disparités significatives entre les différents secteurs du département ?
* Quel est le profil type des biens vendus par commune ?
* Quelles sont les tendances du marché des terrains non bâtis ?

En complément du tableau de bord, vous devrez produire :

1. Une méthodologie détaillée de traitement des données
   - Nettoyage des valeurs aberrantes
   - Harmonisation des types de biens
   - Traitement des données cadastrales

2. Une analyse approfondie incluant
   - Les tendances majeures du marché
   - Les spécificités territoriales identifiées
   - Les recommandations pour les politiques locales de l'habitat

3. Un guide d'utilisation destiné aux utilisateurs finaux
   - Présentation des différentes fonctionnalités
   - Exemples de cas d'usage
   - Précautions d'interprétation

Ce projet permettra aux acteurs locaux de :
- Mieux comprendre les dynamiques du marché immobilier local
- Adapter les politiques d'urbanisme aux réalités du territoire
- Anticiper les évolutions du marché
- Identifier les zones nécessitant une attention particulière

Points d'attention particuliers :
- La qualité variable des données cadastrales
- La nécessité de croiser les données avec d'autres sources (PLU, zonages...)
- L'importance de la dimension temporelle dans l'analyse
- La confidentialité des données individuelles

Votre analyse devra être accessible aux non-spécialistes tout en conservant la rigueur nécessaire à la prise de décision.

## Données 2024 (1er semestre)

In [None]:
import pandas as pd

df_2024 = pd.read_csv('https://www.data.gouv.fr/fr/datasets/r/1dc47de2-b30a-4497-b9ef-448d054b5a4f',
                 sep='|',                # Séparateur |
                 encoding='latin-1',     # Encodage pour les caractères français
                 compression='zip',      # Spécifie que c'est un fichier zip
                 low_memory=False)       # Pour éviter les warnings de memory

df_2024.info()

## Données 2023 (Année complète)

In [None]:
df_2023 = pd.read_csv('https://www.data.gouv.fr/fr/datasets/r/dd516f7a-91bb-4cad-a63c-4b55cd457f4c',
                 sep='|',                # Séparateur |
                 encoding='latin-1',     # Encodage pour les caractères français
                 compression='zip',      # Spécifie que c'est un fichier zip
                 low_memory=False)       # Pour éviter les warnings de memory

df_2023.info()

## Données 2022 (Année complète)

In [None]:
df_2022 = pd.read_csv('https://www.data.gouv.fr/fr/datasets/r/91fd9f09-fe6f-4ab2-9803-84a626e1faa6',
                 sep='|',                # Séparateur |
                 encoding='latin-1',     # Encodage pour les caractères français
                 compression='zip',      # Spécifie que c'est un fichier zip
                 low_memory=False)       # Pour éviter les warnings de memory

df_2022.info()