In [1]:
import pandas as pd
from statsmodels.tsa.statespace.sarimax import SARIMAX
from calendar import monthrange
import matplotlib.pyplot as plt
import plotly.express as px
from sklearn.metrics import mean_squared_error, mean_absolute_error, mean_absolute_percentage_error
import numpy as np


In [2]:
# Masquer les SettingWithCopyWarning
pd.options.mode.chained_assignment = None

In [3]:
df = pd.read_csv("https://jedha-final-project-jrat.s3.amazonaws.com/datameteo_france_1950-2022_clean_04.csv")

In [4]:
df_stations_authorized = df[df["is_authorized"] == True]
len(df_stations_authorized["NUM_POSTE"].unique().tolist())

412

In [5]:
df_stations_old = df_stations_authorized.groupby(["NUM_POSTE"]).max()
print(len(df_stations_old))

412


In [8]:
# filter out station qui n'ont pas de données récentes (2022)
last_year = df["Year"].max()
mask = df_stations_old["Year"]!=last_year
df_stations_old = df_stations_old[mask]
stations_old = df_stations_old.index.to_list()
df_recent = df_stations_authorized[~df_stations_authorized["NUM_POSTE"].isin(stations_old)]

In [9]:
print(len(df_recent.groupby(["NUM_POSTE"]).max()))

274


In [10]:
# check continuité des données sur 8 ans
# UPDATE : le modèle ne peut pas prédire avec moins de 8 années de training

stations = df_recent["NUM_POSTE"].unique()
to_drop = []

for num_station in stations:
    df_station = df_recent[df_recent["NUM_POSTE"]==num_station]

    for year in range(last_year,last_year-8,-1):
        nb_missing_month = 0
        try:
            df_station_year = df_station[df_station["Year"]==year]
            nb_missing_month = 12 - len(df_station_year["Month"].unique().tolist())
            if nb_missing_month > 0:
                to_drop.append(num_station)
                print(f"Drop station N°{num_station}")
                print(f"{nb_missing_month} manquants en {year}\n\n")
            else:
                print(f"Station N°{num_station} has {df_station_year["Month"].count()} months in {year}")

        except Exception as e:
            to_drop.append(num_station)
            print(e)
            print()
            print(f"Drop station N°{num_station}")
            print(f"{year} est manquante\n\n")

    print()

Station N°1014002 has 12 months in 2022
Station N°1014002 has 12 months in 2021
Station N°1014002 has 12 months in 2020
Station N°1014002 has 12 months in 2019
Station N°1014002 has 12 months in 2018
Station N°1014002 has 12 months in 2017
Station N°1014002 has 12 months in 2016
Station N°1014002 has 12 months in 2015

Station N°1071001 has 12 months in 2022
Station N°1071001 has 12 months in 2021
Station N°1071001 has 12 months in 2020
Station N°1071001 has 12 months in 2019
Station N°1071001 has 12 months in 2018
Station N°1071001 has 12 months in 2017
Station N°1071001 has 12 months in 2016
Station N°1071001 has 12 months in 2015

Station N°1414001 has 12 months in 2022
Station N°1414001 has 12 months in 2021
Station N°1414001 has 12 months in 2020
Station N°1414001 has 12 months in 2019
Station N°1414001 has 12 months in 2018
Station N°1414001 has 12 months in 2017
Station N°1414001 has 12 months in 2016
Station N°1414001 has 12 months in 2015

Station N°2037002 has 12 months in 20

In [None]:
# gestion des outliers sur la target


In [11]:
df_recent = df_recent[~df_recent["NUM_POSTE"].isin(to_drop)]

In [12]:
# 648 stations qui ont au moins 8 années de continuité (12 mois complets) à partir de 2022
print(len(df_recent.groupby(["NUM_POSTE"]).max()))

244


In [13]:
# PREPROCESSING DATE

df_recent["AAAAMM"] = pd.to_datetime(df_recent["AAAAMM"])

def last_day_of_month(aaaamm):
    """
    prend une date format AAAAMM et retourne une string format AAAA-MM-DD avec DD = dernier jour du mois
    """
    year = aaaamm.year
    month = aaaamm.month
    last_day = monthrange(year, month)[1]
    return f"{year}-{month:02d}-{last_day:02d}"

df_recent["date"] = df_recent["AAAAMM"].apply(last_day_of_month)
df_recent["date"] = pd.to_datetime(df_recent["date"])


In [14]:
to_keep = ["NUM_POSTE","NOM_USUEL","LAT","LON","ALTI","Year","Month","vent_speed_inst_moy_mensu","departement_num","departement_name","region","date"]
to_drop = [col for col in df if col not in to_keep]

In [15]:
df_recent = df_recent.drop(to_drop,axis=1)

In [16]:
def clean_continuity(dataframe):

    """
    INPUT = un dataframe, le nom de sa variable date
    --> parcours la série d'année en année en commençant par la plus récente
    --> si année en cours < 12 mois, drop l'année et toutes les années antérieures
    --> si "trou" entre année en cours et année suivante, drop N-1 et toutes les années antérieures 
    --> transforme en série temporelle à frequence mensuelle
    
    OUTPUT = série temporelle clean
    """

    print(f"\n\nCleaning de la station {dataframe["NUM_POSTE"].unique().tolist()} ...")

    #--> check continuité des années : stop_year = N si N < 12 mois, N-1 si "trou" entre N et N-1
    years= df_station["Year"].unique().tolist()
    years.sort(reverse=True)

    month_unique = []
    stop_year = 0

    for index, year in enumerate(years):
        df_station_year = df_station[df_station["Year"] == year]
        month_unique = df_station_year["Month"].unique().tolist()
        if len(month_unique)!=12:
            stop_year = year
            print(f"Année : {year}. Continuité rompue.")
            print(f"Mois: {len(month_unique)} / 12.")
            break
        else:
            try:
                if year - years[index+1] != 1:
                    stop_year = years[index+1]
                    print(f"Année : {years[index+1]}. Continuité rompue.")
                    print(f"Année manquante : {years[index+1]}")
                    break
            except IndexError:
                print("Continuité garantie")
                pass

    print("...Terminé.")

    #--> drop
    if stop_year > 0:
        dataframe = dataframe[dataframe["Year"] > stop_year]

        print(f"Données antérieures à {stop_year+1} supprimées.")
    else:
        print(f"Aucune rupture de continuité constatée, toutes les données ont été conservées.")
    

    #--> transforme en série temporelle à frequence mensuelle
    dataframe.set_index("date", inplace=True)
    dataframe = dataframe.asfreq("ME")

    #--> check NA
    check = "NOT OK" if dataframe.isna().any().any() else "OK"
    print(f"Check valeurs manquantes : {check}")

    return dataframe
    

In [23]:
def get_wind_forecast(time, data):

    """
    INPUT =  nombre de mois (time) à prédire et le set de données

    --> prédit la force du vent à horizon "time"
    
    OUTPUT =  le df de test, les prédictions, la MAE et la MAPE
    """
    # calcule date de split 
    date_limite = data.index.max() - pd.DateOffset(months=time)

    # split train / test
    train = data[data.index <= date_limite]
    test = data[data.index > date_limite]

    # split variables exogènes / target
    to_keep = ["LON","LAT","ALTI"]

    var_exog_train = train[to_keep]
    y_train = train["vent_speed_inst_moy_mensu"]

    var_exog_test = test[to_keep]
    y_test = test["vent_speed_inst_moy_mensu"]

    # training
    model = SARIMAX(y_train, exog=var_exog_train, order=(1, 1, 2), seasonal_order=(2, 1, 2, 12), enforce_stationarity=False)
    sarima_model = model.fit(maxiter=1000)

    # prédictions
    forecast = sarima_model.get_forecast(steps = time, exog = var_exog_test)
    predicted_values = forecast.predicted_mean

    # évaluation
    mae = mean_absolute_error(y_test, predicted_values)
    mape = mean_absolute_percentage_error(y_test, predicted_values)

    # rendu
    return test, predicted_values, mae, mape


In [24]:
# créé un dictionnaire contenant un dataframe par numéro de station
# clean continuité des dates sur le dataframe + transforme en série temporelle (clean_continuity)
# prédit (get_wind_forecast) et enregistre les prédictions horizon, la MAE et la MAPE générale
# enregistre le dataframe clean et le dataframe d'évaluation des prédictions

stations = df_recent["NUM_POSTE"].unique()
horizon = 84

dict_stations = {}

for station in stations:
    
    df_station = df_recent[df_recent["NUM_POSTE"]==station]
    df_station = clean_continuity(df_station)

    df_station_eval, predictions, mae, mape = get_wind_forecast(horizon,df_station)
    df_station_eval[f"pred_{horizon}_mois"] = predictions
    df_station_eval["mae"] = mae
    df_station_eval["mape"] = mape

    dict_stations[station] = [df_station,df_station_eval]






Cleaning de la station [1014002] ...
Année : 2004. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [1071001] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [1414001] ...
Année : 2002. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [2037002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [2173002] ...
Année : 1998. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1999 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [2320001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
C

  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [4136001] ...
Année : 2009. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [4209005] ...
Année : 1998. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1999 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5044400] ...
Année : 2010. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [5046001] ...
Année : 1957. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1958 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5055001] ...
Année : 1997. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5061009] ...
Année : 2003. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5070003] ...
Année : 1992. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5077402] ...
Année : 2000. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2001 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5136002] ...
Année : 2010. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : 

  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [5145002] ...
Année : 2003. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [5170001] ...
Année : 1991. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [6005001] ...
Année : 1987. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 1988 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [6081001] ...
Année : 2006. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [6094002] ...
Année : 2002. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [7131001] ...
Année : 2010. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [8145001] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [8401001] ...
Année : 2004. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [9161003] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [10057001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [10228002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [11069001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont é

  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [12154003] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [12216001] ...
Année : 2002. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [12254001] ...
Année : 1996. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 1997 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [12300004] ...
Année : 1989. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1990 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [13036003] ...
Année : 2014. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [13108004] ...
Année : 2010. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquan

  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [14216001] ...
Année : 1997. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [15060002] ...
Année : 2002. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [15120005] ...
Année : 1995. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 1996 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [15122002] ...
Année : 1992. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [16078001] ...
Année : 2009. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [16225001] ...
Année : 1990. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [16390001] ...
Année : 2014. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [17268002] ...
Année : 1989. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1990 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [18015003] ...
Année : 2006. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [18033001] ...
Année : 2009. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [18125004] ...
Année : 2003. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [18172003] ...
Année : 2004. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [18175003] ...
Année : 2003. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [19010001] ...
Année : 1995. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1996 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20041001] ...
Année : 1950. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1951 supprimées.
Check valeurs manquantes : OK






Cleaning de la station [20093002] ...
Année : 1988. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 1989 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20114002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [20154001] ...
Année : 2009. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [20185003] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [20223001] ...
Année : 1991. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20232002] ...
Année : 1992. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20254006] ...
Année : 2009. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [20258001] ...
Année : 1993. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 1994 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20268001] ...
Année : 1990. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20270001] ...
Année : 2009. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [20272004] ...
Année : 1996. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 1997 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [20281001] ...
Année : 2011. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2012 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [21065001] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [21131001] ...
Année : 1992. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [21154001] ...
Année : 1988. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1989 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [21561003] ...
Année : 1998. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1999 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [21584001] ...
Année : 2014. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [22219003] ...
Année : 2004. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manqua

  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [25056001] ...
Année : 2009. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [25219002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [25223002] ...
Année : 2006. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [25356003] ...
Année : 1992. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [25494001] ...
Année : 2006. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [25529002] ...
Année : 2004. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [26074001] ...
Année : 2014. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [26168001] ...
Année : 2014. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [28070001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [28198001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [28206001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [28407001] ...
Année : 2006. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [30003001] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [30101001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [30132004] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [30258001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [30352002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [31147001] ...
Année : 1994. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 

  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [33314005] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [33540001] ...
Année : 2014. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2015 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [34028003] ...
Année : 1991. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [34151005] ...
Année : 1999. Continuité rompue.
Année manquante : 1999
...Terminé.
Données antérieures à 2000 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [34178001] ...
Année : 1990. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [34205001] ...
Année : 1994. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 1995 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [34209002] ...
Année : 1995. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1996 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [34239002] ...
Année : 2004. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [34269001] ...
Année : 2010. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [35005001] ...
Année : 2003. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [35110003] ...
Année : 2005. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [35202001] ...
Année : 1988. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1989 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [36127002] ...
Année : 2001. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [36173002] ...
Année : 2001. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [37107001] ...
Année : 2001. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [37192001] ...
Année : 2001. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquan

  warn('Too few observations to estimate starting parameters%s.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [39362001] ...
Année : 2010. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [39413001] ...
Année : 1997. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [39485002] ...
Année : 1996. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 1997 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [39526003] ...
Année : 1995. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 1996 supprimées.
Check valeurs manquantes : OK






Cleaning de la station [40087001] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [40246003] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [41152001] ...
Année : 2011. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2012 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [41281001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [43111002] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [44110002] ...
Année : 2004. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [45055001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [46071001] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [46100001] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 

  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [48032003] ...
Année : 2010. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [48095005] ...
Année : 2008. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2009 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [49188001] ...
Année : 1999. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2000 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [51015001] ...
Année : 2003. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [51237002] ...
Année : 2004. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [51388003] ...
Année : 2004. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [51595002] ...
Année : 2000. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2001 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [52055001] ...
Année : 2004. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [52248002] ...
Année : 2003. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [54171001] ...
Année : 2005. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [54481001] ...
Année : 2002. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [54582001] ...
Année : 1997. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [55248001] ...
Année : 2011. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2012 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [55386002] ...
Année : 2002. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [55443001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [55484001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [55531001] ...
Année : 2005. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [56017003] ...
Année : 1997. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [56137001] ...
Année : 2012. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2013 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [56243001] ...
Année : 1998. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 1999 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [57119001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [57251001] ...
Année : 1991. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [57587003] ...
Année : 2005. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [57644001] ...
Année : 2003. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK






Cleaning de la station [57732001] ...
Année : 2001. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [58019001] ...
Année : 2009. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [58062001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [58079004] ...
Année : 2001. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [58160001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [58218006] ...
Année : 2003. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [59534001] ...
Année : 2004. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [59606004] ...
Année : 2007. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2008 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [60322001] ...
Année : 1990. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [60555002] ...
Année : 1989. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 1990 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [60566001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [60639001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [61006005] ...
Année : 1994. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 1995 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [62685001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [62873001] ...
Année : 2010. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [65125001] ...
Année : 1990. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [65344001] ...
Année : 2010. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [65460002] ...
Année : 1990. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [66029003] ...
Année : 2011. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 2012 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [66136001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [66137003] ...
Année : 1990. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [66187006] ...
Année : 2005. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [66233001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [67029001] ...
Année : 2003. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [67443001] ...
Année : 2010. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2011 supprim

  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [67462004] ...
Année : 1992. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [67516001] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [68062001] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [68205001] ...
Année : 2010. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [69258001] ...
Année : 2010. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2011 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [70132001] ...
Année : 1997. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 1998 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [70447002] ...
Année : 2001. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [70545001] ...
Année : 2003. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [70561002] ...
Année : 1992. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [71014004] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [71081001] ...
Année : 1991. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [71105001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [71320001] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont

  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [71558001] ...
Année : 2002. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [77054001] ...
Année : 1991. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1992 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [77084001] ...
Année : 1999. Continuité rompue.
Mois: 6 / 12.
...Terminé.
Données antérieures à 2000 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [77211001] ...
Année : 1992. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 1993 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [77306001] ...
Année : 1953. Continuité rompue.
Mois: 2 / 12.
...Terminé.
Données antérieures à 1954 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [77333003] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check va

  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [79174002] ...
Année : 1990. Continuité rompue.
Mois: 11 / 12.
...Terminé.
Données antérieures à 1991 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [79191005] ...
Continuité garantie
...Terminé.
Aucune rupture de continuité constatée, toutes les données ont été conservées.
Check valeurs manquantes : OK


Cleaning de la station [79326004] ...
Année : 2002. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [80523001] ...
Année : 2007. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2008 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [80682001] ...
Année : 1993. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 1994 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [81115002] ...
Année : 2003. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [81182004] ...
Année : 1989. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 1990 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [81192005] ...
Année : 2002. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [81217002] ...
Année : 2003. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [81292001] ...
Année : 2002. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2003 supprimées.
Check valeurs manquant

  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [88271001] ...
Année : 2001. Continuité rompue.
Mois: 1 / 12.
...Terminé.
Données antérieures à 2002 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [88393003] ...
Année : 2008. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2009 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [88402002] ...
Année : 2006. Continuité rompue.
Mois: 10 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting seasonal moving average'




Cleaning de la station [89295001] ...
Année : 2013. Continuité rompue.
Mois: 9 / 12.
...Terminé.
Données antérieures à 2014 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [89333001] ...
Année : 2005. Continuité rompue.
Mois: 5 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'
  warn('Non-invertible starting MA parameters found.'




Cleaning de la station [89365001] ...
Année : 2005. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2006 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [89380001] ...
Année : 2003. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2004 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [89387002] ...
Année : 1986. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1987 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [89418007] ...
Année : 2004. Continuité rompue.
Mois: 4 / 12.
...Terminé.
Données antérieures à 2005 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [90035001] ...
Année : 2009. Continuité rompue.
Mois: 8 / 12.
...Terminé.
Données antérieures à 2010 supprimées.
Check valeurs manquantes : OK


  warn('Too few observations to estimate starting parameters%s.'




Cleaning de la station [91184001] ...
Année : 1998. Continuité rompue.
Mois: 3 / 12.
...Terminé.
Données antérieures à 1999 supprimées.
Check valeurs manquantes : OK


Cleaning de la station [91200002] ...
Année : 2006. Continuité rompue.
Mois: 7 / 12.
...Terminé.
Données antérieures à 2007 supprimées.
Check valeurs manquantes : OK


  warn('Non-invertible starting MA parameters found.'
  warn('Non-invertible starting seasonal moving average'


In [26]:
# 2ème station de la liste, dataframe initial
dict_stations[stations[1]][0]

Unnamed: 0_level_0,NUM_POSTE,NOM_USUEL,LAT,LON,ALTI,Year,Month,vent_speed_inst_moy_mensu,departement_num,departement_name,region
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1
2003-01-31,1071001,CESSY,46.310333,6.080333,507,2003,1,7.9,1,Ain,AUVERGNE RHONE ALPES
2003-02-28,1071001,CESSY,46.310333,6.080333,507,2003,2,6.8,1,Ain,AUVERGNE RHONE ALPES
2003-03-31,1071001,CESSY,46.310333,6.080333,507,2003,3,8.3,1,Ain,AUVERGNE RHONE ALPES
2003-04-30,1071001,CESSY,46.310333,6.080333,507,2003,4,10.1,1,Ain,AUVERGNE RHONE ALPES
2003-05-31,1071001,CESSY,46.310333,6.080333,507,2003,5,7.6,1,Ain,AUVERGNE RHONE ALPES
...,...,...,...,...,...,...,...,...,...,...,...
2022-08-31,1071001,CESSY,46.310333,6.080333,507,2022,8,7.9,1,Ain,AUVERGNE RHONE ALPES
2022-09-30,1071001,CESSY,46.310333,6.080333,507,2022,9,6.8,1,Ain,AUVERGNE RHONE ALPES
2022-10-31,1071001,CESSY,46.310333,6.080333,507,2022,10,5.4,1,Ain,AUVERGNE RHONE ALPES
2022-11-30,1071001,CESSY,46.310333,6.080333,507,2022,11,6.1,1,Ain,AUVERGNE RHONE ALPES


In [28]:
# 2ème station de la liste, dataframe d'évaluation des prédictions
dict_stations[stations[1]][1]

Unnamed: 0_level_0,NUM_POSTE,NOM_USUEL,LAT,LON,ALTI,Year,Month,vent_speed_inst_moy_mensu,departement_num,departement_name,region,pred_84_mois,mae,mape
date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1
2016-01-31,1071001,CESSY,46.310333,6.080333,507,2016,1,6.5,1,Ain,AUVERGNE RHONE ALPES,6.643471,1.074443,0.136078
2016-02-29,1071001,CESSY,46.310333,6.080333,507,2016,2,8.6,1,Ain,AUVERGNE RHONE ALPES,7.050499,1.074443,0.136078
2016-03-31,1071001,CESSY,46.310333,6.080333,507,2016,3,9.7,1,Ain,AUVERGNE RHONE ALPES,8.237794,1.074443,0.136078
2016-04-30,1071001,CESSY,46.310333,6.080333,507,2016,4,7.2,1,Ain,AUVERGNE RHONE ALPES,7.887070,1.074443,0.136078
2016-05-31,1071001,CESSY,46.310333,6.080333,507,2016,5,7.6,1,Ain,AUVERGNE RHONE ALPES,7.418024,1.074443,0.136078
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2022-08-31,1071001,CESSY,46.310333,6.080333,507,2022,8,7.9,1,Ain,AUVERGNE RHONE ALPES,6.151875,1.074443,0.136078
2022-09-30,1071001,CESSY,46.310333,6.080333,507,2022,9,6.8,1,Ain,AUVERGNE RHONE ALPES,6.184310,1.074443,0.136078
2022-10-31,1071001,CESSY,46.310333,6.080333,507,2022,10,5.4,1,Ain,AUVERGNE RHONE ALPES,5.375272,1.074443,0.136078
2022-11-30,1071001,CESSY,46.310333,6.080333,507,2022,11,6.1,1,Ain,AUVERGNE RHONE ALPES,5.838093,1.074443,0.136078


In [29]:
# construction du dataframe de comparaison inter station

num_stations = []
nb_month_available = []
lat = []
lon = []
alti = []
true_val = []
pred_val = []
mae = []
mape = []

for key, value in dict_stations.items():
    num_stations.append(key)
    nb_month_available.append(len(value[0]))
    date_pred = value[1].index.max()

    data = value[1][value[1].index==date_pred]

    lat.append(data.loc[date_pred,"LAT"])
    lon.append(data.loc[date_pred,"LON"])
    alti.append(data.loc[date_pred,"ALTI"])
    true_val.append(data.loc[date_pred,"vent_speed_inst_moy_mensu"])
    pred_val.append(data.loc[date_pred,f"pred_{horizon}_mois"])
    mae.append(data.loc[date_pred,"mae"])
    mape.append(data.loc[date_pred,"mape"])

data = {
    "Num_station": num_stations,
    "Nb_mois_dispo": nb_month_available,
    "Latitude": lat,
    "Longitude": lon,
    "Altitude": alti,
    "Reel_2022-12": true_val,
    "Pred_2022-12": pred_val,
    "MAE": mae,
    "MAPE": mape,
}

df_eval_global = pd.DataFrame(data)


In [30]:
df_eval_global

Unnamed: 0,Num_station,Nb_mois_dispo,Latitude,Longitude,Altitude,Reel_2022-12,Pred_2022-12,MAE,MAPE
0,1014002,216,46.278167,5.669000,534,7.2,5.171361,0.941105,0.157790
1,1071001,240,46.310333,6.080333,507,5.8,6.000233,1.074443,0.136078
2,1414001,240,45.916167,5.624667,878,7.9,7.318747,1.102503,0.118098
3,2037002,408,49.595667,3.610333,78,14.0,15.796287,1.740910,0.146857
4,2173002,288,49.633833,3.197833,83,12.6,12.963039,1.214182,0.104954
...,...,...,...,...,...,...,...,...,...
239,89387002,432,48.167667,3.288667,70,10.4,11.620964,1.374829,0.159942
240,89418007,216,47.868167,3.995000,200,11.9,10.496367,1.487920,0.131908
241,90035001,156,47.591667,6.837000,401,10.8,9.512379,1.644916,0.163906
242,91184001,288,48.421833,2.374333,71,11.2,9.981205,1.404430,0.177406


In [39]:
df_sans_144 = df_eval_global[df_eval_global["Nb_mois_dispo"]!=144]

In [40]:
df_sans_144

Unnamed: 0,Num_station,Nb_mois_dispo,Latitude,Longitude,Altitude,Reel_2022-12,Pred_2022-12,MAE,MAPE
0,1014002,216,46.278167,5.669000,534,7.2,5.171361,0.941105,0.157790
1,1071001,240,46.310333,6.080333,507,5.8,6.000233,1.074443,0.136078
2,1414001,240,45.916167,5.624667,878,7.9,7.318747,1.102503,0.118098
3,2037002,408,49.595667,3.610333,78,14.0,15.796287,1.740910,0.146857
4,2173002,288,49.633833,3.197833,83,12.6,12.963039,1.214182,0.104954
...,...,...,...,...,...,...,...,...,...
239,89387002,432,48.167667,3.288667,70,10.4,11.620964,1.374829,0.159942
240,89418007,216,47.868167,3.995000,200,11.9,10.496367,1.487920,0.131908
241,90035001,156,47.591667,6.837000,401,10.8,9.512379,1.644916,0.163906
242,91184001,288,48.421833,2.374333,71,11.2,9.981205,1.404430,0.177406


In [41]:
MAPE_by_month = df_sans_144.groupby(["Nb_mois_dispo"]).mean()
MAPE_by_month


Unnamed: 0_level_0,Num_station,Latitude,Longitude,Altitude,Reel_2022-12,Pred_2022-12,MAE,MAPE
Nb_mois_dispo,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
96,25048570.0,45.307405,3.52669,523.142857,9.2,31.842857,14.259864,1.48142
108,68194000.0,46.03025,1.868,138.0,8.8,-126.440313,50.46391,6.077275
120,33670000.0,45.4475,0.000916,96.0,13.65,7.282847,6.742552,0.390488
132,45663340.0,45.639639,5.108722,201.0,11.2,9.989918,10.14846,0.914172
156,30226110.0,44.941167,5.825778,452.111111,9.233333,4.565209,2.069486,0.247305
168,46874000.0,45.739834,5.067222,656.333333,7.1,6.760067,1.016239,0.132501
180,70064500.0,50.150083,3.082416,78.5,16.05,18.763901,1.872811,0.135176
192,40403140.0,47.176071,4.441619,574.285714,10.728571,9.619828,1.279801,0.133198
204,55075000.0,47.167204,4.009093,201.222222,11.4,11.400914,1.615551,0.141846
216,44396110.0,47.102009,2.929237,231.263158,11.378947,11.253283,1.291355,0.125079


In [42]:
px.line(MAPE_by_month, x=MAPE_by_month.index, y="MAPE")

In [43]:
df_Mois_168 = df_eval_global[df_eval_global["Nb_mois_dispo"]>=168]
# sortir les outliers 
df_Mois_168.describe()

Unnamed: 0,Num_station,Nb_mois_dispo,Latitude,Longitude,Altitude,Reel_2022-12,Pred_2022-12,MAE,MAPE
count,203.0,203.0,203.0,203.0,203.0,203.0,203.0,203.0,203.0
mean,43525520.0,337.182266,46.33294,3.43281,348.182266,11.052709,11.211772,1.417848,0.133309
std,27759400.0,170.43085,2.261364,2.636816,385.834599,3.962938,3.925114,0.454785,0.037657
min,1014002.0,168.0,41.374833,-2.748333,1.0,1.8,1.076515,0.395272,0.071304
25%,20067000.0,228.0,44.333334,1.7845,119.5,8.3,8.381854,1.123083,0.108331
50%,40087000.0,288.0,46.729,3.146,229.0,11.2,11.032352,1.369465,0.125081
75%,67245500.0,372.0,48.267916,5.592084,405.0,13.85,13.853333,1.622789,0.150757
max,91200000.0,876.0,50.549167,9.3205,2630.0,21.6,29.696657,3.857044,0.305079


In [34]:
df_MAPE_15= df_eval_global[df_eval_global["MAPE"]<0.15]
df_MAPE_15.describe(include="all")

Unnamed: 0,Num_station,Nb_mois_dispo,Latitude,Longitude,Altitude,Reel_2022-12,Pred_2022-12,MAE,MAPE
count,154.0,154.0,154.0,154.0,154.0,154.0,154.0,154.0,154.0
mean,44803270.0,340.207792,46.474846,3.007646,314.266234,11.766234,11.935515,1.328956,0.115985
std,27972930.0,180.715089,2.231443,2.615639,349.128776,3.701496,3.621553,0.350089,0.017149
min,1071001.0,144.0,41.374833,-2.748333,1.0,3.6,4.407452,0.395272,0.071304
25%,18641500.0,228.0,44.420791,1.221708,120.0,9.1,9.611066,1.087425,0.104166
50%,44582500.0,288.0,46.787,2.826666,199.0,12.2,11.716469,1.316727,0.117253
75%,70368250.0,381.0,48.345458,4.791042,371.75,14.0,14.193884,1.487094,0.128565
max,91200000.0,876.0,50.549167,9.178333,2630.0,21.6,29.696657,2.938947,0.148775
