In [None]:
%load_ext autoreload
%autoreload 2

In [None]:
#General
# from pathlib import Path
import geopandas as gpd
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from tqdm import tqdm
# Potentiel solaire package
from potentiel_solaire.constants import DATA_FOLDER
from potentiel_solaire.features.roof_attributes import recuperation_mnh_batiment, recuperation_mns_batiment, recuperation_mnx_batiment
tqdm.pandas()


In [2]:
# Executer ci dessous ci besoin pour récupérer les données
# !extract-sample-data
# Et pour sauver une version markdown des notebooks, utiliser
# jupyter nbconvert wns_hauteur.ipynb --to markdown --output-dir=exports/

In [3]:
saint_denis_path = DATA_FOLDER / "saint_denis_reference_data.gpkg"
batiments = gpd.read_file(saint_denis_path, layer="bdtopo_batiment").to_crs(2154)
batiments = batiments.to_crs(2154)

# Testing caching


In [4]:
%%timeit -n3 -r2
# Takes 2s
recuperation_mnx_batiment(batiments[1:2], srs = 'EPSG:2154', layer = "ELEVATION.ELEVATIONGRIDCOVERAGE.HIGHRES", cache=False)

NameError: name 'recuperation_mnx_batiment' is not defined

In [None]:
%%timeit -n3
# Takes 0.0s
recuperation_mnx_batiment(batiments[1:2], srs = 'EPSG:2154', layer = "ELEVATION.ELEVATIONGRIDCOVERAGE.HIGHRES", cache=True)

# Testing parameters

In [None]:
def getMesureMNHToit(row, valeur="hauteur_calculee"):

    values = ["hauteur_calculee", "hauteur_std-dev", "hauteur_min",
              "hauteur_max", "hauteur_median","mns_std-dev"]
    if valeur not in values:
        return -1
    row = gpd.GeoDataFrame(row).T
    row = gpd.GeoDataFrame(row, geometry="geometry")

    mnh = recuperation_mnh_batiment(row, cache=True)
    mns = recuperation_mns_batiment(row, cache=True)
    row["hauteur_calculee"] = np.average(mnh[np.nonzero(mnh)])
    row["hauteur_std-dev"] = np.std(mnh[np.nonzero(mnh)])
    row["mns_std-dev"] = np.std(mns[np.nonzero(mns)])
    row["hauteur_min"] = np.min(mnh[np.nonzero(mnh)])
    row["hauteur_max"] = np.max(mnh[np.nonzero(mnh)])
    row["hauteur_median"] = np.median(mnh[np.nonzero(mnh)])

    return row[valeur].iloc[0]


#### Test sur les batiments de St Denis, qui n'ont pas de hauteur

In [None]:
batiments_de_test = pd.concat([batiments[batiments.hauteur.isna()].head(50),batiments[~batiments.hauteur.isna()].head(50)]).to_crs(2154)
for measure in ["hauteur_calculee", "hauteur_std-dev","mns_std-dev"]:
    batiments_de_test[measure] = \
        batiments_de_test.progress_apply(lambda batiment:\
        getMesureMNHToit(batiment, valeur=measure), axis = 1)
# Pourquoi du caching? Les calls prennent qques par batiment sans cache ce qui impacte le temps de calcul
batiments_de_test[["cleabs_left__bat","hauteur","hauteur_calculee", "hauteur_std-dev","mns_std-dev"]]

#### Les erreurs sont "elevées" sur les petits batiments, la précision est meilleure sur les plus grands bâtiments

In [None]:
check = batiments_de_test[~batiments_de_test.hauteur.isna()]

In [None]:
identity_line = np.linspace(check.hauteur.min(),
                            check.hauteur.max())

check.plot.scatter(x="hauteur",y="hauteur_calculee",title="Comparaison hauteur calculée / hauteur 'reelle'")
plt.plot(identity_line, identity_line, color="red", linestyle="dashed", linewidth=1.0)

#### Représentation des erreurs

In [None]:
def getAccuracy(row):
    acc = np.abs(row["hauteur"]-row["hauteur_calculee"])/np.abs(row["hauteur"])
    return float(acc)

In [None]:
check["difference"] = check.apply(lambda batiment: getAccuracy(batiment), axis = 1)

In [None]:
detail = "Erreur sur les toits de plus de 4 mètres: "+str(int(100*check["difference"][check.hauteur > 4 ].mean()))+"%"
check.plot.scatter(x="hauteur",y="difference",title="Erreur en fonction de la hauteur\n"+detail)

#### Test avec les pentes de toit

In [None]:
toits = gpd.read_file(saint_denis_path, layer="potentielsolaire_toitures").to_crs(2154)
toits = toits[toits.id.isin(check.cleabs_left__bat.unique())][["id","forme"]]
# can be "hauteur_std-dev" instead of mns to get mnh instead of mns
dataset_test = check[["cleabs_left__bat","mns_std-dev","hauteur_calculee"]]
dataset_test.columns = ["id","stdev","h"]
toits = toits.merge(dataset_test,on="id",how="inner")

#### test non concluant..

In [None]:
colors = {'plat':'blue', 'Npans':'orange', 'toit2pentes':'green', 'petit_toit':'red'}

fig, ax = plt.subplots(figsize=(6, 6))
grouped = toits.groupby('forme')
for key, group in grouped:
    group.plot.scatter(ax=ax, x='h', y='stdev', label=key, color=colors[key])
plt.show()