# Notebook #3

## Il faut l'exécuter en entier d'un coup. L'interface graphique est ensuite accessible à cette adresse http://127.0.0.1:8050/

### Importation des tables et des modules

In [1]:
import plotly.express as px
import pandas as pd
from matplotlib import pyplot as plt
from sklearn.linear_model import LinearRegression
import math
import requests
from dash_table import DataTable
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from haversine import haversine, Unit
from jupyter_dash import JupyterDash
import dash_core_components as dcc
import dash_html_components as html
import dash_table
from dash.dependencies import Input, Output, State
from statsmodels.tsa.arima_model import ARIMA
from datetime import date

tab= pd.read_csv('full_paris_def.csv')
df_gares=pd.read_csv('gares-idf.csv',';')

def formatage(txt):
    # Cette fonction sert à séparer latitude et longitude exprimés sous la forme 48.9876,2.0986 
    for i in range(len(txt)):
        if txt[i]==',':
            return(i)
        
    
def format_prix(prix): 
    # Cette fonction prend en entrée un prix et renvoi le prix écrit de façon lisible ex: X XXX XXX €
    prix=int(prix)
    s = str(prix)
    txt=''
    for i in range(len(s)):
        if (len(s)-i)%3==0:
            txt=s[i]+' '+txt
        else:
            txt=s[i]+txt
    return(txt[::-1]+" €") 


# Ce passage du code permet de mettre la table df_gares dans un format lisible (en séparant latitude et longitude)
lat=[]
lon=[]
for i in range(len(df_gares)):
    coord=df_gares['geo_point_2d'].iloc[i]
    j=formatage(coord)
    lat.append(float(coord[:j]))
    lon.append(float(coord[j+1:]))
df_gares["lat"]=lat
df_gares["lon"]=lon

#On récupère la table contenant les données sur les marchés
df_marches=pd.read_csv('marches-decouverts.csv',';')
df_marches=df_marches[df_marches['Produit']=='Alimentaire']
#On se restreint aux marchés alimentaires
df_marches=df_marches.drop(columns=['Identifiant marché','Nom complet','Produit','Arrondissement','Localisation','LUNDI','MARDI','MERCREDI','JEUDI','VENDREDI','SAMEDI','DIMANCHE','Secteur','Gestionnaire','Heure début en semaine','Heure fin en semaine','Heure début le samedi','Heure début le dimanche','Heure fin le dimanche','geo_shape','Linéaire commercial','Heure fin le samedi'])
lat=[]
lon=[]
for i in range(len(df_marches)):
    coord=df_marches['geo_point_2d'].iloc[i]
    j=formatage(coord)
    
    lon.append(float(coord[:j])),
    lat.append(float(coord[j+1:]))
df_marches['lat']=lat
df_marches['lon']=lon
# Comme pour les gares, on met les coordonnés géographiques dans un format acceptable



# Ce passage permet de retrouver les données relatives au quadrillage qui divise Paris et qui permet de localiser les biens
N=max(tab['vert'])
step_lat=(max(tab['latitude'])-min(tab['latitude']))/N
step_lon=(max(tab['longitude'])-min(tab['longitude']))/N
min_lat=min(tab['latitude'])
min_lon=min(tab['longitude'])

### Fonctions de prédiction

In [2]:
def bon_format(nbre_pieces, surface_m_2):
    #Fonction pour mettre au bon format les données fournies par l'utilisateur
    return np.array([nbre_pieces, surface_m_2]).reshape(-1, 2)

def pred_secteurs(dataset, bien):
    dataset=dataset.drop(columns=['Prixm2', 'Unnamed: 0','date_mutation','label', 'code_postal', 'surface_terrain', 'longitude', 'latitude', 'groupes', 'vert', 'horiz'])
    Y = dataset.valeur_fonciere #On isole la valeur_fonciere
    #On retire la valeur_fonciere du dataset pour faire la régression linéaire
    dataset = dataset.loc[:,dataset.columns.difference(['valeur_fonciere'])]
    #On lance une régression linéaire multiple, qu'on fit ensuite
    model_LinRegMul = LinearRegression()
    print(np.shape(dataset))
    print(np.shape(Y))
    model_LinRegMul.fit(dataset, Y)
    #On mesure sa précision et on affiche ses coefficients
    precision = model_LinRegMul.score(dataset, Y)
    print(model_LinRegMul.coef_)
    print(precision*100) #On affiche le R²
    #On prédit la valeur du bien "bien", et on la retourne
    prediction = model_LinRegMul.predict(bien)
    return(prediction)

def predict_temp(tab, date_prix):
    #On supprime les colonnes inutiles
    tab2=tab.drop(columns=['valeur_fonciere',
       'code_postal', 'surface_reelle_bati', 'nombre_pieces_principales',
       'surface_terrain', 'longitude', 'latitude','groupes', 'vert', 'horiz', 'label', 'Unnamed: 0'])
    
    #On transforme les valeurs de la colonne date_mutation en des objets "datetime"
    
    tab2['date_mutation'] = pd.to_datetime(tab2['date_mutation'],dayfirst=True)
    
    #On trie par date de vente croissante, et on met la date en index du dataframe tab
    
    tab2.sort_values('date_mutation',inplace=True)
    tab2.set_index('date_mutation',inplace=True)
    
    #Prédictions avec ARIMA : on fit un ARIMA(5,1,0) sur nos données,
    #et on prédit le prix moyen du m² à la date souhaitée, qu'on retourne dans la variable output
    
    model = ARIMA(tab2, order=(0,1,2))
    model_fit = model.fit()
    dayss = (date_prix - date(2021, 1, 1)).days
    output = model_fit.forecast(dayss)[0]
    return output

### Fonctions pour récupérer les commodités à proximité

In [3]:
def coordo(num,typerue,nomrue,cp):
    #Cette fonction prend en entrée une adresse et renvoi Latitude, Longitude et le nom du lieu
    url='https://api-adresse.data.gouv.fr/search/?q='+str(num)+"+"+typerue+"+"+nomrue+"+"+str(cp)
    Place=requests.get(url).json()
    # On interroge l'API d'adresses du Gouvernement qui renvoi un dictionnaire au format json
    Lon=Place['features'][0]['geometry']['coordinates'][0]
    Lat=Place['features'][0]['geometry']['coordinates'][1]
    Name=Place['features'][0]['properties']['label']
    return(Lat,Lon,Name)


def next_gares(lat,lon):
    # Cette fonction  prend en entrée des coordonnées géographiques et renvoi une table pandas des gares les plus proches
    lat
    pos=(lat,lon)
    res=[]
    dist=[]
    indices=[]
    noms=[]
    for i in range(len(df_gares)):
        station=(df_gares['lat'].iloc[i],df_gares['lon'].iloc[i])
        distance=haversine(pos,station)
        # Pour toutes les gares de la table, on calcule la distance au point (lat,lon)
        if distance<1: #On ne garde que les gares à moins de 1km
            name=df_gares['nom'].iloc[i]
            # Les gares peuvent apparaître plusieurs fois dans la table si il y a plusieurs lignes 
            #mais on ne veut garder qu'une seule ligne par gare
            if name not in noms:
                noms.append(name)
                gare=[int(round(distance,3)*1000)] #distance en m
                gare.append(name)
                gare.append(df_gares['reseau'].iloc[i])
                gare.append(df_gares['ligne'].iloc[i])
                gare.append(df_gares['lat'].iloc[i])
                gare.append(df_gares['lon'].iloc[i])
                res.append(gare)
            else: #Si on a déjà ajouté la gare dans la table de sortie, il faut donc ajouter la ligne
                j=noms.index(name)
                if df_gares['reseau'].iloc[i] not in res[j][2]: 
                    # On ajoute le nom du réseau si il n'y est pas encore 
                    # Les réseaux sont RER et Métro
                    res[j][2]=res[j][2]+" et "+df_gares['reseau'].iloc[i]
                if df_gares['ligne'].iloc[i] not in res[j][3]:
                    # On ajoute le nom ou numéro de la ligne si ils n'y sont pas encore
                    # Par exemple 1 ou A
                    res[j][3]=str(res[j][3])+" et "+str(df_gares['ligne'].iloc[i])
    
        res=sorted(res, key=lambda gares: gares[0])
        # On trie suivant la distance la plus petite
        columns=['Distance (m)','Station','Reseau','Ligne','lat','lon']
        res2=pd.DataFrame(data=res,columns=columns)
        # On crée le DataFrame
        res2=res2.drop(columns=['lat','lon'])
        # Ces colomnes sont inutiles pour l'utilisateur on les enlève
    return(res2)
    



def next_marches(lat,lon):
    # Cette fonction permet de trouver les marchés alimentaires les plus proches
    pos=(lon,lat)
    dist=[]
    jours=[]
    noms=[]
    for i in range(len(df_marches)):
        marche=(df_marches['lat'].iloc[i],df_marches['lon'].iloc[i])
        distance=haversine(pos,marche,unit='m')
        # Pour tous les marchés de la table, on calcule la distance à la position (lon,lat)
        dist.append(int(round(distance,3))) #L'utilisateur n'a que faire de chiffres après la virgule
        noms.append(df_marches['Nom court'].iloc[i])
        jours.append(df_marches['Jours de tenue'].iloc[i])
    res = pd.DataFrame(dist,columns=['Distance (m)'])
    res['Nom']=noms
    res['Jours de Tenue']=jours
    #On crée le DataFrame
    res=res.sort_values('Distance (m)')
    # On trie par distances croissantes
    return(res.iloc[:5]) #On ne garde que les 5 marchés les plus proches,l'utilisateur n'en veut pas plus

def appartenance_zone(lon,lat):
    # Ce programme prend en entrée la longitude et la latitude et renvoi la position sur le quadrillage
    i=int((lat-min_lat)//step_lat)
    j=int((lon-min_lon)//step_lon)
    return(i,j) 

def biens_secteur(lon,lat):
    # Cette fonction renvoi une version filtrée des biens dans le secteur
    i,j=appartenance_zone(lon,lat)
    biens=tab[tab['vert']==i]
    biens=biens[biens['horiz']==j]
    #On ne garde que les biens dans le bon carreau du quadrillage
    biens=biens[biens['Prixm2']<20000]
    biens=biens[biens['Prixm2']>5000]
    # On enlève les valeurs aberrantes (et il y en a ..)
    biens['date_mutation'] = pd.to_datetime(biens['date_mutation'], dayfirst=True)
    # On passe la colonne date_mutation en format date
    return(biens)

def Velib(Latitude,Longitude):
    # Cette fonction interroge l'API de la ville de Paris et renvoi les stations Velib les plus proches
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=velib-emplacement-des-stations&q=&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(400)
    L=requests.get(url).json()
    cap=[]
    name=[]
    dist=[]
    for i in range(len(L['records'])):
        # On récupère les données du dictionnaire
        cap.append(str(L['records'][i]['fields']['capacity'])+' Vélibs')
        dist.append(int(float(L['records'][i]['fields']['dist'])))
        name.append(L['records'][i]['fields']['name'])
    res = pd.DataFrame(dist,columns=['Distance (m)']) # On crée le DataFrame
    res['Station']=name
    res['Capacité']=cap
    res=res.sort_values('Distance (m)') #On trie pour avoir les plus proches en premier
    return(res.iloc[:5]) #On ne garde que les 5 plus proches

def college(Latitude,Longitude):
    # Cette fonction interroge l'API de la ville de Paris et renvoi le collège de secteur
    # Ce n'est pas forcément le collège le plus proche (carte scolaire)
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=secteurs-scolaires-colleges&q=&sort=annee_scol&facet=id_projet&facet=zone_commune&facet=annee_scol&refine.annee_scol=2021-2022&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(10)
    L=requests.get(url).json()
    # On récupère la première donnée du dictionnaire
    # EN effet, on a demandé de trier les données par année scolaire 
    # On a donc le collège de secteur de l'année 2021-2022 en premier
    dist=int(float(L['records'][0]['fields']['dist']))
    name=L['records'][0]['fields']['etiquette']+' ('+str(dist)+' m)'
    #formatage du nom du collège pour l'affichage 
    return('Collège: '+name)

def elementaire(Latitude,Longitude):
    # Cette fonction interroge l'API de la ville de Paris et renvoi l'école élementaire de secteur
    # Ce n'est pas forcément l'école élementaire la plus proche (carte scolaire)
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=secteurs-scolaires-ecoles-elementaires&q=&sort=annee_scol&facet=id_projet&facet=zone_commune&facet=annee_scol&refine.annee_scol=2021-2022&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(10)
    L=requests.get(url).json()
    # On récupère la première donnée du dictionnaire
    # EN effet, on a demandé de trier les données par année scolaire 
    # On a donc l'école élementaire de secteur de l'année 2021-2022 en premier
    dist=int(float(L['records'][0]['fields']['dist']))
    name=L['records'][0]['fields']['etiquette']+' ('+str(dist)+' m)'
    #formatage du nom de l'école pour l'affichage 
    return('Ecole élementaire: '+name)

def maternelle(Latitude,Longitude):
    # Cette fonction interroge l'API de la ville de Paris et renvoi l'école élementaire de secteur
    # Ce n'est pas forcément l'école maternelle la plus proche (carte scolaire)
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=secteurs-scolaires-maternelles&q=&sort=annee_scol&facet=id_projet&facet=zone_commune&facet=annee_scol&refine.annee_scol=2021-2022&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(10)
    L=requests.get(url).json()
    # On récupère la première donnée du dictionnaire
    # EN effet, on a demandé de trier les données par année scolaire 
    # On a donc l'école maternelle de secteur de l'année 2021-2022 en premier
    dist=int(float(L['records'][0]['fields']['dist']))
    name=L['records'][0]['fields']['etiquette']+' ('+str(dist)+' m)'
    #formatage du nom de l'école pour l'affichage 
    return('Ecole maternelle: '+name)

def anomalies(Latitude,Longitude):
    bien=(Latitude,Longitude)
    # La ville de Paris a mis en place depuis 2014 une application mobile (Dans ma rue) 
    #Dans cette application, les parisiens peuvent géolocaliser des anomalies (propreté, dysfonctionnements, ...)
    # Ces données sont accessibles en temps réel à partir de l'API suivant
    # On ne garde que les anomalies situées dans un rayon de 100m
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=dans-ma-rue&q=&rows=10000&sort=type&facet=soustype&facet=type&facet=datedecl&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(100)
    L=requests.get(url).json()
    date=[]
    soustype=[]
    type_anomalie=[]
    for i in range(len(L['records'])):
        #on récupère les données du dictionnaire
        date.append(L['records'][i]['fields']['datedecl'])
        soustype.append(L['records'][i]['fields']['soustype'])
        type_anomalie.append(L['records'][i]['fields']['type'])
    res = pd.DataFrame(date,columns=['Date'])
    res['Description']=soustype
    res['Type']=type_anomalie
    res['Date']=pd.to_datetime(res['Date'])
    #On crée le Dataframe
    return(res)



def encadrement(Latitude,Longitude,NPieces):
    #L'encadrement des loyers est en vigeur à Paris 
    #Cette fonction permet de récuperer et de tracer les loyers en vigeur 
    # Ces loyers dépendent de l'époque de construction du bien, du nombre de pièces, de sa localisation et du caractère meublé ou non
    bien=(Latitude,Longitude)
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=logement-encadrement-des-loyers&q=&sort=epoque&rows=10000&facet=id_zone&facet=nom_quartier&facet=piece&facet=epoque&facet=meuble_txt&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(2)+'&refine.piece='+str(NPieces)
    L=requests.get(url).json()
    #On interroge l'API et on récupère un dictionnaire 
    epoque=[]
    meuble=[]
    max_=[]
    min_=[]
    type_anomalie=[]
    for i in range(len(L['records'])):
        epoque.append(L['records'][i]['fields']['epoque'])
        meuble.append(L['records'][i]['fields']['meuble_txt'])
        max_.append(L['records'][i]['fields']['max'])
        min_.append(L['records'][i]['fields']['min'])
    res = pd.DataFrame(epoque,columns=['Epoque'])
    # On crée un DataFrame
    res['Meublé']=meuble
    res['Max']=max_
    res['Min']=min_
    res=res.drop_duplicates()
    # On supprime les doublons
    Val=res['Max'].to_list()
    Meuble=res['Meublé'].to_list()
    Prix=res['Max'].to_list()
    Epoque=res['Epoque'].to_list()
    # On veut créer un boxplot, pour une même caractéristique on a min et max sur la même ligne dans des colonnes différentes
    #On veut 1 ligne pour max et 1 ligne pour min 
    Epoque=Epoque+Epoque
    Val=Val+Val
    Meuble=Meuble+Meuble
    Prix=Prix+res['Min'].to_list()
    res = pd.DataFrame(Prix,columns=['Loyer (m2)'])
    res['Meublé']=Meuble
    res['Epoque de construction']=Epoque
    # On crée le boxplot 
    fig = px.box(res, x="Epoque de construction", y="Loyer (m2)", color="Meublé")
    return(fig)

### Fonctions pour tracer des figures

In [4]:
def plot_temporel_anomalies(df):
    # Cette fonction représente l'évolution temporelle des anomalies depuis 2018
    df=df[df['Date']>'2018-01-01']
    df=df.groupby(['Type','Date']).count()
    # On ne garde qu'une seule ligne par type et date contenant le nombre d'anomalies (d'ou le count())
    df['Signalements']=df['Description']
    df=df.reset_index(level=[0,1])
    fig=px.scatter(df,x='Date',y='Signalements',color='Type')
    # Renvoi une figure 
    return(fig)

def plot_repartition_anomalies(df):
    #Cette fonction permet de créer une figure de la répartition des anomalies (par catégorie et groupe )depuis 2018
    df=df[df['Date']>'2018-01-01']
    df=df.groupby(['Type','Description']).count()
    df['Nombre']=df['Date']
    df=df.sort_values('Nombre',ascending=False).head(15)
    # On enlève les anomalies avec peu d'occurences en triant et avec le .head(15)
    df=df.reset_index(level=[0,1])
    fig =px.sunburst(df,path=['Type','Description'],values='Nombre')
    # Création de la figure
    return(fig)

def plot_temporel(tab):
    #Et on retire les colonnes inutiles
    
    tab2=tab.drop(columns=['valeur_fonciere',
       'code_postal', 'surface_reelle_bati', 'nombre_pieces_principales',
       'surface_terrain', 'longitude', 'latitude','groupes', 'vert', 'horiz', 'Unnamed: 0', 'label'])
    
    #On trie par date de vente croissante, et on met la date en index du dataframe tab2
    
    tab2['date_mutation'] = pd.to_datetime(tab2['date_mutation'],dayfirst=True)
    tab2.sort_values('date_mutation',inplace=True)
    tab2.set_index('date_mutation',inplace=True)
    tab2.index = pd.to_datetime(tab2.index, dayfirst=True)
    
    #On calcule la moyenne glissante du prix m² sur tab2, que l'on stocke dans tab_roll
    
    tab_roll=tab2.rolling(len(tab)//5, win_type='triang',center=False).mean()
    
    #Réindexation en vue d'ajouter des dates à tab2
    
    ix = pd.DataFrame(index = pd.date_range('2014-01-01','2022-01-01', freq='D'))
    tab2 = pd.merge(ix, tab2, left_index = True, right_index = True, how = 'left')
    
    #On applique predict_temp pour remplir les dates nouvellement ajoutées (1 an)
    
    tab2.iloc[-366:-1]['Prixm2'] = predict_temp(tab, date(2022, 1, 1))
    
    #On trace les ventes (fig2), la moyenne glissante (fig3) et les anticipations sur 1 an (fig4) avec plotly
    fig2=px.scatter(tab,x='date_mutation',y='Prixm2')
    fig3=px.line(tab_roll,x=tab_roll.index,y='Prixm2')
    fig4=px.line(tab2.iloc[-366:-1],x=tab2.iloc[-366:-1].index,y='Prixm2')
    fig3.update_traces(line_color='#DC143C')
    fig4.update_traces(line_color='#DC143C')
    fig3 = go.Figure(data=fig2.data + fig3.data + fig4.data)
    return(fig3)

def plot_map(tab,Latitude,Longitude):
    # Cette fonction permet de tracer une carte open street map
    # Cette carte contient toutes les ventes immoblières non aberrantes du secteur
    # Elle est centrée sur l'adresse saisie (Latitude et Longitude)
    fig = px.scatter_mapbox(data_frame=tab,lon="longitude",lat="latitude",hover_name='label',zoom=16,height=0,center={'lat':Latitude,'lon':Longitude})
    fig.update_layout(mapbox_style="open-street-map")
    fig.update_layout(margin={"r":3,"t":3,"l":3,"b":3})
    fig.update_traces(marker=dict(size=15,opacity=0.9))
    return(fig)

def plot_Parism2(tab):
    # Cette fonction trace une carte de Paris avec des points indiquant le prix moyen au m2
    # Il y a un point par zone du quadrillage
    # Le point est placé sur la position moyenne des biens du secteur 
    #Cela permet de ne pas avoir de points au milieu de la Seine par exemple
    tab=tab[tab['Prixm2']<20000]
    tab=tab[tab['Prixm2']>5000]
    # On élimine les valeurs aberrantes 
    fig = px.scatter_mapbox(data_frame=tab.groupby(['vert','horiz']).mean(),lon="longitude",hover_name="Prixm2",color='Prixm2',lat="latitude",zoom=11,height=0,center={'lon':2.342984676361084,'lat':48.862272686497576})
    #On trace la figure
    fig.update_layout(mapbox_style="carto-positron")
    fig.update_layout(margin={"r":3,"t":3,"l":3,"b":3})
    fig.update_traces(marker=dict(size=17,opacity=0.9))
    return(fig)




### Initialisation

In [5]:
# Cette partie permet d'initialiser l'interface graphique 
# On choisi une position arbitraire dans Paris
# On crée les figures et les tables
Latitude,Longitude,nom=coordo('','','55 rue du Faubourg St Honoré',75008)
prov=biens_secteur(Longitude,Latitude)
data_metro=next_gares(Latitude,Longitude).iloc[:5].to_dict(orient='records')
data_marche=next_marches(Latitude,Longitude).to_dict(orient='records')
data_velib=Velib(Latitude,Longitude).to_dict(orient='records')
fig=plot_map(prov,Latitude, Longitude)
fig2=plot_temporel(prov)
fig0=plot_Parism2(tab[tab['date_mutation']>='2020-01-01'])

tab_anomalies=anomalies(Latitude,Longitude)
fig_rep_anomalies=plot_repartition_anomalies(tab_anomalies)
fig_temp_anomalies=plot_temporel_anomalies(tab_anomalies)
encadrement_loyers=encadrement(Latitude,Longitude,3)



statsmodels.tsa.arima_model.ARMA and statsmodels.tsa.arima_model.ARIMA have
been deprecated in favor of statsmodels.tsa.arima.model.ARIMA (note the .
between arima and model) and
statsmodels.tsa.SARIMAX. These will be removed after the 0.12 release.

statsmodels.tsa.arima.model.ARIMA makes use of the statespace framework and
is both well tested and maintained.

removed, use:




A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.


A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



### Interface Graphique

In [6]:

global click_button
click_button=0
colors = {
    'background': '#99CCFF',
    'title': '#CC3333',
    'text':'#1E90FF'
}
app = JupyterDash(__name__)
# Dash combine de l'HTML et des composants Dash
app.layout = html.Div([
    
    html.H1(
        children='Console Immobilière',
        style={
            'textAlign': 'left',
            'color': colors['title'],
            'background-color': colors['background'],
            'font-family':'Optima'
        }
    ),
    html.H2(
        children='Simulateur des prix des biens immobiliers à Paris',
        style={
            'textAlign': 'left',
            'color': colors['text']
        }
    ),
    html.Div([
        html.H4("Code Postal:"),
        #Zone de texte initialisée à 75008
        html.Div([" ",
                  dcc.Input(id='code_postal', value='75008', type='text')]),
        html.H4("Nombre de pièces :"),
        #Slider initialisé à 3
        dcc.Slider(id='piece',min=1,max=9,marks={i: '{}'.format(i) for i in range(0,10)},value=3),  
        html.H4("Adresse:"),
        #Zone de texte initialisée à 75008
        html.Div([" ",
                  dcc.Input(id='rue', value='55 rue du Faubourg St Honoré', type='text')]),
        html.H4('Surface'),
        #SLider initialisé à 50
        dcc.Slider(id='surface',
            min=0,
            max=400,
            step=10,
            value=50,
            marks={
                0:"0",
                20:"20",
                30:"30",
                40:"40",
                50:"50",
                75:"75",
                100:"100",
                120:"120",
                150:"150",
                200:"200",
                250:"250",
                300:"300",
                400:"400"
            }
        ),
        
       
    ],style={'columnCount': 2}),
        
    html.Div([
        html.Br(),
        html.Button('Estimer', id='submit-val', n_clicks=0,style={'textAlign': 'center'}),
        html.H3(id='text_choix',children=' Sélectionnez les caractéristiques de votre bien',style={'textAlign': 'center'}), 
        #Loading pour signifier à l'utilisateur de patienter
        dcc.Loading(
            id="loading-1",
            type="circle",
            color=colors['text'],
            children=html.Div(id="loading-output-1")
        ),
        
        
    ]),
    html.H2(
        id='estimation',
        children=' ',
        style={
            'textAlign': 'center',
            'color': colors['text']
        }
    ),
    html.H3(
        id='estimation2',
        children='',
        style={
            'textAlign': 'center',
            'color': colors['text']
        }
    ),
    dcc.Graph(id="Biens",figure=fig),
    html.Div([
        
        html.H3(children='Evolution des prix au m2 sur le secteur',style={'textAlign': 'left','color':colors['text']}),
        dcc.Graph(id="temporel",figure=fig2),
        html.H3(children='Prix au m2 dans Paris en 2020',style={'textAlign': 'left','color':colors['text']}),
        dcc.Graph(id="m2_Paris",figure=fig0),
        
        
    ],style={'columnCount': 2}), 
    html.Div([
        html.H3(children='Transports à proximité',style={'textAlign': 'left','color':colors['text']}),
    ],style={'columnCount': 1}),  
    html.Div([
        html.H4(children='Métro et RER',style={'textAlign': 'left'}),
        dash_table.DataTable(
    id='metro',
    columns=[
    {'name': 'Distance (m)', 'id': 'Distance (m)'},
    {'name': 'Station', 'id': 'Station'},
    {'name': 'Reseau', 'id': 'Reseau'},
    {'name': 'Ligne', 'id': 'Ligne'}],
    data=data_metro),
        html.H4(children='Vélib',style={'textAlign': 'left'}),
        dash_table.DataTable(
    id='velib',
    columns=[
    {'name': 'Distance (m)', 'id': 'Distance (m)'},
    {'name': 'Station', 'id': 'Station'},
    {'name': 'Capacité', 'id': 'Capacité'},
    ],
    data=data_velib),
    ],style={'columnCount': 2}),
    html.Div([
        html.H3(children='Carte scolaire',style={'textAlign': 'left','color':colors['text']}),
        html.H4(id='college',children='Collège de Secteur',style={'textAlign': 'left'}),
        html.H4(id='primaire',children='Ecole primaire du secteur',style={'textAlign': 'left'}),
        html.H4(id='maternelle',children='Ecole maternelle du secteur',style={'textAlign': 'left'}),
        html.H3(children='Marchés alimentaires à proximité',style={'textAlign': 'left','color':colors['text']}),
        dash_table.DataTable(
    id='marche',
    columns=[
    {'name': 'Distance (m)', 'id': 'Distance (m)'},
    {'name': 'Nom', 'id': 'Nom'},
    {'name': 'Jours de Tenue', 'id': 'Jours de Tenue'},
    ],
    data=data_marche),
        html.H3(children='Anomalies signalées dans un rayon de 100m (Application Dans Ma Rue)',style={'textAlign': 'left','color':colors['text']}), 
    ],style={'columnCount': 1}), 
    html.Div([
        html.H3(children='Répartition depuis 2018',style={'textAlign': 'left'}),
        dcc.Graph(id="nbre_anomalies",figure=fig_rep_anomalies),
        html.H3(children='Evolution depuis 2018',style={'textAlign': 'left'}),
        dcc.Graph(id="temp_anomalies",figure=fig_temp_anomalies),
    ],style={'columnCount': 2}), 
    html.Div([
        html.H3(children='Encadrement des loyers dans le secteur',style={'textAlign': 'left','color':colors['text']}), 
        dcc.Graph(id="encadrement",figure=encadrement_loyers),
    ],style={'columnCount': 1}), 
])
# La call back permet d'updater les figures et tables en fonction des Input (action utilisateur) et State (état du composant)
@app.callback(
    
    Output(component_id="loading-output-1", component_property="children"),
    Output(component_id='text_choix', component_property='children'),
    Output(component_id="Biens",component_property='figure'),
    Output(component_id="temporel",component_property='figure'),
    Output(component_id="estimation",component_property='children'),
    Output(component_id="estimation2",component_property='children'),
    Output(component_id='metro', component_property='data'),
    Output(component_id='velib', component_property='data'),
    Output(component_id='college', component_property='children'),
    Output(component_id='primaire', component_property='children'),
    Output(component_id='maternelle', component_property='children'),
    Output(component_id='marche', component_property='data'),
    Output(component_id='nbre_anomalies', component_property='figure'),
    Output(component_id='temp_anomalies', component_property='figure'),
    Output(component_id='encadrement', component_property='figure'),
    Input(component_id='submit-val',component_property='n_clicks'),
    State(component_id='code_postal', component_property='value'),
    State(component_id='surface', component_property='value'),
    State(component_id='piece', component_property='value'),
    State(component_id='rue', component_property='value')
    
)
def update_output_div(click,code_postal,surface,piece,rue):
    # Cette fonction prend en entrée les Inupt et State et renvoi ce qui va updater les Output
    global click_button
    if click>click_button:
        click_button=click
        Lat,Lon,Name=coordo('',' ',rue,code_postal)
        text=" Appartement d'une surface de "+str(surface)+"m2 au "
        text=text+Name
        tab=biens_secteur(Lon,Lat)
        fig=plot_map(tab,Lat,Lon)
        fig2=plot_temporel(tab)
        prediction=round(pred_secteurs(tab[tab['date_mutation']>='2019-01-01'], bon_format(piece, surface))[0],0)
        prediction_m2=round(float(prediction)/surface,2)
        data = next_gares(Lat,Lon).iloc[:5].to_dict(orient='records')
        data1=Velib(Lat,Lon).to_dict(orient='records')
        data2 = next_marches(Lat,Lon).iloc[:5].to_dict(orient='records')
        tab_anomalies=anomalies(Lat,Lon)
        fig_rep_anomalies=plot_repartition_anomalies(tab_anomalies)
        fig_temp_anomalies=plot_temporel_anomalies(tab_anomalies)
        fig_encadrement_loyers=encadrement(Lat,Lon,piece)
        return('','{}'.format(text),fig,fig2,'Estimation de votre bien: {}'.format(format_prix(prediction)),'Prix au m2: {}'.format(format_prix(prediction_m2)),data,data1,college(Lat,Lon),elementaire(Lat,Lon),maternelle(Lat,Lon),data2,fig_rep_anomalies,fig_temp_anomalies,fig_encadrement_loyers)




if __name__ == '__main__':
    app.run_server(mode='external',port=8050)

Dash app running on http://127.0.0.1:8050/


### Fonctionnalité abandonnée

In [7]:
def parcs(Latitude,Longitude):
    url='https://opendata.paris.fr/api/records/1.0/search/?dataset=espaces_verts&q=&sort=-nom_ev&facet=type_ev&facet=categorie&facet=adresse_codepostal&facet=ouvert_ferme&geofilter.distance='+str(Latitude)+','+str(Longitude)+','+str(300)
    L=requests.get(url).json()
    cat=[]
    name=[]
    dist=[]
    for i in range(len(L['records'])):
        cat.append(L['records'][i]['fields']['type_ev'])
        name.append(L['records'][i]['fields']['nom_ev'])
        dist.append(L['records'][i]['fields']['dist'])
    res = pd.DataFrame(dist,columns=['Distance (m)'])
    res['Catégorie']=cat
    res['Nom']=name
    return(res)
        

In [8]:
parcs(Latitude,Longitude)

Unnamed: 0,Distance (m),Catégorie,Nom
0,inf,Murs végétalisés,JARDINIERE VERTICALE DU 11 RUE DE COURCELLES
1,inf,Décorations sur la voie publique,JARDINIERE SAINT-PHILIPPE DU ROULE
2,inf,Jardinets décoratifs,JARDINET DU CHEVET SAINT PHILIPPE DU ROULE




statsmodels.tsa.arima_model.ARMA and statsmodels.tsa.arima_model.ARIMA have
been deprecated in favor of statsmodels.tsa.arima.model.ARIMA (note the .
between arima and model) and
statsmodels.tsa.SARIMAX. These will be removed after the 0.12 release.

statsmodels.tsa.arima.model.ARIMA makes use of the statespace framework and
is both well tested and maintained.

removed, use:




A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.


A date index has been provided, but it has no associated frequency information and so will be ignored when e.g. forecasting.



A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy



(298, 2)
(298,)
[-2618.47594699 12460.09314513]
87.59878625124254


#### Fonctionnalité abandonée car la distance est tojours égale à Infinity. L'API fonctionne mal. On pourrait bien sûr recalculer la distance avec haversine