#Importation des librairies

In [4]:
#pipenv install pour installer les dependences
import numpy as np 
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px


#Importation des données


##dataset

In [5]:
data = pd.read_csv("https://www.data.gouv.fr/fr/datasets/r/78348f03-a11c-4a6b-b8db-2acf4fee81b1", sep="|", low_memory=False)

##Les villes de france

In [6]:
# https://sql.sh/736-base-donnees-villes-francaises
villes_france = pd.read_csv("villes_france.csv", sep=",",low_memory=False)

#Nettoyage des données


##Pour le dataset

In [25]:
#pour nettoyer les données on va supprimer les colonnes où il n'y a pas de valeurs
clean_data = data.dropna(axis = 1, how = "all")

#on va aussi supprimer les valeurs comme B/T/Q ou Code_coie car elle ne vont pas nous servir
clean_data = data.drop(columns=['Identifiant de document', 'Reference document', '1 Articles CGI','2 Articles CGI', '3 Articles CGI', '4 Articles CGI', '5 Articles CGI',"B/T/Q","No disposition", "Code voie", "Prefixe de section", "Section", "No plan", "No Volume", "Code type local"])

#on doit aussi supprimer les lignes vides si il y en a 
clean_data = clean_data.dropna(axis = 0, how = "all")

# le nettoyage des données est terminé 
#Par la suite, nous allons utiliser le dataframe clean_data



##Pour les villes

In [8]:
positions = villes_france.drop(columns=["Slug","Nom simple","Nom reel","Nom soundex","Nom metaphone","Canton","Population 2010","Population 1999","Densite 2010","Surface","Superficie"])

#Debut des visuels


##Ventes totales en France en 2023

In [26]:
ventes_totales_par_dates = clean_data
ventes_totales_par_dates["Date mutation"] = pd.to_datetime(ventes_totales_par_dates["Date mutation"], format='%d/%m/%Y')
ventes_par_date = ventes_totales_par_dates.groupby("Date mutation").size().reset_index(name="Nombre de ventes")
fig = px.bar(ventes_par_date, x='Date mutation', y='Nombre de ventes', title='Nombre de ventes par date')
fig.show()


The behavior of DatetimeProperties.to_pydatetime is deprecated, in a future version this will return a Series containing python datetime objects instead of an ndarray. To retain the old behavior, call `np.array` on the result



In [None]:
#ici on va creer un nouveau dataframe pour facilite les suite car paris est divise en arrondissement
ventes_paris=clean_data[clean_data["Commune"].str.startswith("PARIS ")]
ventes_paris["Commune"] = "PARIS"
ventes_paris_par_departement = ventes_paris.groupby('Code departement').size().reset_index(name="Nombre de ventes")
ventes_paris_par_commune = ventes_paris.groupby('Commune').size().reset_index(name="Nombre de ventes")


#et on fait la meme avec marseille et lyon
ventes_marseille=clean_data[clean_data["Commune"].str.startswith("MARSEILLE ")]
ventes_marseille["Commune"] = "MARSEILLE"
ventes_marseille_par_departement = ventes_marseille.groupby('Code departement').size().reset_index(name="Nombre de ventes")
ventes_marseille_par_commune = ventes_marseille.groupby('Commune').size().reset_index(name="Nombre de ventes")

ventes_lyon=clean_data[clean_data["Commune"].str.startswith("LYON ")]
ventes_lyon["Commune"] = "LYON"
ventes_lyon_par_departement = ventes_lyon.groupby('Code departement').size().reset_index(name="Nombre de ventes")
ventes_lyon_par_commune = ventes_lyon.groupby('Commune').size().reset_index(name="Nombre de ventes")


##Les différents types de propriété vendus en France en 2023 

In [66]:
type_propriete = clean_data.groupby('Type local').size().reset_index(name="Nombre de ventes")
fig = px.pie(type_propriete, values='Nombre de ventes', names='Type local', title='nombre de ventes immobiliète par type de local en France en 2023')
fig.show()
type_propriete

Unnamed: 0,Type local,Nombre de ventes
0,Appartement,213434
1,Dépendance,403890
2,Local industriel. commercial ou assimilé,49885
3,Maison,242631


##Ventes par département de France en 2023

In [61]:
ventes_par_departement = clean_data.groupby('Code departement').size().reset_index(name="Nombre de ventes")
fig = px.bar(ventes_par_departement, x='Code departement', y='Nombre de ventes', title='Nombre de ventes par departement')
fig.show()

##Densité des ventes en France en 2023 par commune

In [52]:
positions = positions.rename(columns={"Nom" : "Commune"})
ventes_par_commune = clean_data.groupby('Commune').size().reset_index(name="Nombre de ventes")
ventes_par_commune = pd.concat([ventes_par_commune, ventes_paris_par_commune, ventes_marseille_par_commune, ventes_lyon_par_commune], ignore_index=True)
villes_et_positions = pd.merge(positions, ventes_par_commune, on="Commune")
fig = px.density_mapbox(villes_et_positions, lat = "Latitude", lon = "Longitude", z='Nombre de ventes', radius=20, center=dict(lat=46.6035, lon=1.888334), zoom=3, mapbox_style = "open-street-map", title = 'Carte de densité des ventes immobilières en France')
fig.show()

##Prix du mètre carré moyen en France en 2023 par commune

In [106]:
prix_metre_carre = pd.concat([clean_data, ventes_lyon, ventes_marseille, ventes_paris])
#on supprime les valeurs à superficie null 
prix_metre_carre = prix_metre_carre.dropna(subset="Surface reelle bati")
prix_metre_carre = prix_metre_carre[prix_metre_carre["Surface reelle bati"] > 0]
#on garde seulement les appartement et maisons car il y a des prix de dependences a 5000000 pour 0 m² a Paris par exemple. 
#Les prix des dependences sont pardois absurde
#prix_metre_carre = prix_metre_carre[prix_metre_carre["Type local"].isin(["Appartement", "Maison"])]
prix_metre_carre["Valeur fonciere"] = prix_metre_carre["Valeur fonciere"].str.replace(',','.').astype(float)
prix_metre_carre["Prix metre carre"] = prix_metre_carre["Valeur fonciere"] / prix_metre_carre["Surface reelle bati"]


prix_metre_carre = prix_metre_carre.groupby("Commune")["Prix metre carre"].mean().reset_index()
prix_metre_carre = pd.merge(positions, prix_metre_carre, on="Commune")


Unnamed: 0,Commune,Prix metre carre
24058,VILLETANEUSE,3574.07673


Pour mettre le code en HTML : jupyter nbconvert VotreNotebook.ipynb --to html


In [105]:
ventes_paris.groupby('Type local').size().reset_index(name="nbr vente")

Unnamed: 0,Type local,nbr vente
0,Appartement,17725
1,Dépendance,19710
2,Local industriel. commercial ou assimilé,2484
3,Maison,78
