<h1>SARIMA hyper parameter tunning with Grid Search</h1>

In [1]:
#!pip install joblib
#https://machinelearningmastery.com/how-to-grid-search-sarima-model-hyperparameters-for-time-series-forecasting-in-python/?utm_campaign=News&utm_medium=Community&utm_source=DataCamp.com
# grid search sarima hyperparameters
from math import sqrt
from multiprocessing import cpu_count
from joblib import Parallel
from joblib import delayed
from warnings import catch_warnings
from warnings import filterwarnings
from statsmodels.tsa.statespace.sarimax import SARIMAX
from sklearn.metrics import mean_squared_error
import pandas as pd
from dateutil.relativedelta import relativedelta
import time

In [2]:
# one-step sarima forecast
def sarima_forecast(history, config):
    order, sorder, trend = config
    # define model
    model = SARIMAX(history, order=order, seasonal_order=sorder, trend=trend, enforce_stationarity=False, enforce_invertibility=False)
    # fit model
    model_fit = model.fit(disp=False)
    # make one step forecast
    yhat = model_fit.predict(len(history), len(history))
    return yhat[0]

# root mean squared error or rmse
def measure_rmse(actual, predicted):
    return sqrt(mean_squared_error(actual, predicted))

# split a univariate dataset into train/test sets
def train_test_split(data, n_test):
    return data[:-n_test], data[-n_test:]

# walk-forward validation for univariate data
def walk_forward_validation(data, n_test, cfg):
    predictions = list()
    # split dataset
    train, test = train_test_split(data, n_test)
    # seed history with training dataset
    history = [x for x in train]
    # step over each time-step in the test set
    for i in range(len(test)):
        # fit model and make forecast for history
        yhat = sarima_forecast(history, cfg)
        # store forecast in list of predictions
        predictions.append(yhat)
        # add actual observation to history for the next loop
        history.append(test[i])
    # estimate prediction error
    error = measure_rmse(test, predictions)
    return error

# score a model, return None on failure
def score_model(data, n_test, cfg, debug=False):
    result = None
    # convert config to a key
    key = str(cfg)
    # show all warnings and fail on exception if debugging
    if debug:
        result = walk_forward_validation(data, n_test, cfg)
    else:
        # one failure during model validation suggests an unstable config
        try:
            # never show warnings when grid searching, too noisy
            with catch_warnings():
                filterwarnings("ignore")
                result = walk_forward_validation(data, n_test, cfg)
        except:
            error = None
    # check for an interesting result
    #if result is not None:
        #print(' > Model[%s] %.3f' % (key, result))
    return (key, result,cfg)

# grid search configs
def grid_search(data, cfg_list, n_test, parallel=True):
    scores = None
    if parallel:
        # execute configs in parallel
        executor = Parallel(n_jobs=cpu_count(), backend='multiprocessing')
        tasks = (delayed(score_model)(data, n_test, cfg) for cfg in cfg_list)
        scores = executor(tasks)
    else:
        scores = [score_model(data, n_test, cfg) for cfg in cfg_list]
    # remove empty results
    scores = [r for r in scores if r[1] != None]
    # sort configs by error, asc
    scores.sort(key=lambda tup: tup[1])
    return scores

In [3]:
# create a set of sarima configs to try
def sarima_configs(seasonal=[0]):
    models = list()
    # define config lists
    p_params = [0, 1, 2, 3]
    d_params = [0, 1]
    q_params = [0, 1, 2, 3]
    t_params = ['n','c','t','ct']
    P_params = [0, 1, 2, 3]
    D_params = [0, 1]
    Q_params = [0, 1, 2, 3]
    m_params = seasonal
    # create config instances
    for p in p_params:
        for d in d_params:
            for q in q_params:
                for t in t_params:
                    for P in P_params:
                        for D in D_params:
                            for Q in Q_params:
                                for m in m_params:
                                    cfg = [(p,d,q), (P,D,Q,m), t]
                                    models.append(cfg)
    return models

In [4]:
final_df = None
final_errores = None

#DATA: log10 was applied to original data
data = pd.read_csv("LEO_mfp_log10_data.csv")
my_index = data.ID.unique()

for current_index in my_index:
    current_serie = data["ID"] == current_index
    serie = data[current_serie]
    
    timeserie = serie.y.to_list()
    #time axis
    lista_fechas = pd.to_datetime(serie.ds,infer_datetime_format=True)
    max_fecha_fact = pd.Timestamp.date(max(lista_fechas))
    # data split
    n_test = 12
    # model configs
    cfg_list = sarima_configs()
    # grid search
    tic = time.perf_counter()
    scores = grid_search(timeserie, cfg_list, n_test)
    toc = time.perf_counter()
    print("Tiempo:")
    print(toc - tic)
    # list top 3 configs
    #for cfg, error, other in scores[:3]:
        #print(cfg, error)
        
    #Best model top 1
    my_model = scores[:1]
    my_order = my_model[0][2][0]
    my_seasonal_order = my_model[0][2][1]
    my_trend = my_model[0][2][2]
    my_mse = my_model[0][1]    
    
    #Best parameters
    my_model = SARIMAX(timeserie, order=my_order , seasonal_order=my_seasonal_order,trend=my_trend)
    model_fit = my_model.fit(disp=False)
    
    forecast_months = 12
    yhat = model_fit.get_forecast(forecast_months)
    my_forecast = yhat.predicted_mean
    
    #Future dates for the forecast
    futuro_fechas = []
    for i in range(forecast_months):     
        fecha = max_fecha_fact + relativedelta(months=i + 1)
        futuro_fechas.append(fecha.strftime('%Y-%m-%d')) 
        
    #forecast pow 10: log10 was applied to original data
    forecast_pow_10 = []
    for elem in my_forecast:    
        forecast_pow_10.append(round(pow(10,elem),4))   
        
    #intervals
    forecast_lower = []
    forecast_upper = []
    for elem in yhat.conf_int():
        forecast_lower.append(round(pow(10,elem[0]),4))
        forecast_upper.append(round(pow(10,elem[1]),4))
        
    #set final dataframe
    d = {'ID':current_index, 'ds':futuro_fechas, 'yhat':forecast_pow_10, 'yhat_lower': forecast_lower, 'yhat_upper' : forecast_upper}
    my_result = pd.DataFrame(data=d)  
    
    #MSE errors
    e = {'ID':[current_index], 'MSE': [my_mse]}
    my_error_result = pd.DataFrame(data=e)
        
    if final_df is None:        
        final_df = my_result
        final_errores = my_error_result 
    else:        
        final_df = final_df.append(my_result, ignore_index = True)
        final_errores = final_errores.append(my_error_result, ignore_index = True)

Tiempo:
31.883906429000035




Tiempo:
30.344092575000104
Tiempo:
31.883368152000003


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
31.510439829999996




Tiempo:
34.533057578000125
Tiempo:
31.539717320999898
Tiempo:
33.898869731000104
Tiempo:
33.842639416999646
Tiempo:
43.692607616999794
Tiempo:
31.07564001699984
Tiempo:
29.15792838499965


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
30.85251946599965
Tiempo:
28.895555570000397
Tiempo:
34.37908360900019
Tiempo:
33.179659132000324
Tiempo:
31.251385888000186
Tiempo:
31.95330756200019
Tiempo:
28.930474390999734
Tiempo:
29.43922744600013




Tiempo:
31.20436904500002
Tiempo:
28.77009215099997
Tiempo:
28.142495011999927
Tiempo:
30.25390416800019
Tiempo:
28.74408903299991




Tiempo:
31.08353559699981




Tiempo:
26.80661206800005
Tiempo:
29.418678631000148




Tiempo:
27.30633778900028




Tiempo:
30.60675346700009




Tiempo:
31.87996764899981


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.33010835799996
Tiempo:
26.369155097999737


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
27.996695160999934
Tiempo:
26.601280674999998




Tiempo:
35.245806578000156
Tiempo:
29.13169443700008




Tiempo:
28.432935138000175
Tiempo:
28.952415581999958
Tiempo:
30.195085071999983
Tiempo:
24.06778873200028
Tiempo:
28.71323524899981
Tiempo:
23.57880866000005
Tiempo:
27.203779849000057


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
27.666850654999962
Tiempo:
28.04720044500027




Tiempo:
30.75300506299982
Tiempo:
28.285640080999656
Tiempo:
28.042568299000322
Tiempo:
29.667062127999998
Tiempo:
25.829563264999706
Tiempo:
28.999021197000275


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
26.405491294000058


  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.238365332000285
Tiempo:
32.03828202600016
Tiempo:
28.785534938999717
Tiempo:
29.588655180999922


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
23.85383891399988
Tiempo:
29.921003862999896




Tiempo:
30.142942382
Tiempo:
29.107192208000015
Tiempo:
25.84523401899969
Tiempo:
30.531712546000108


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
23.22978952299991
Tiempo:
28.958342237000124




Tiempo:
28.560940200000005
Tiempo:
29.984870079000302
Tiempo:
25.344452200999967
Tiempo:
27.633961453999746
Tiempo:
26.705884636000064




Tiempo:
28.221587469000042
Tiempo:
28.88405356400017
Tiempo:
25.29510819899997
Tiempo:
27.781432623
Tiempo:
25.363674275999983




Tiempo:
30.223744621999685
Tiempo:
22.110783355999956




Tiempo:
24.80168778299958
Tiempo:
26.721374160999403
Tiempo:
29.425684650999756


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
30.602323132000492
Tiempo:
27.600897970000005




Tiempo:
26.388484703999893
Tiempo:
25.923502127000575
Tiempo:
29.55883467500007




Tiempo:
24.045698627000093
Tiempo:
27.67658242500056
Tiempo:
26.607009400000607
Tiempo:
30.658021494000423


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
30.28736098599984
Tiempo:
30.08531822399982




Tiempo:
28.174562043999686




Tiempo:
29.745646883000518
Tiempo:
30.232002163999823


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.78244899099991
Tiempo:
29.55783360999976
Tiempo:
26.504475065000406
Tiempo:
26.051020031000007




Tiempo:
22.024068256000646
Tiempo:
27.644210366000152
Tiempo:
27.04859463000048
Tiempo:
25.49477179800033
Tiempo:
29.87506331199984




Tiempo:
26.4114695570006
Tiempo:
21.659639829000298
Tiempo:
28.556574823999654
Tiempo:
27.731138170999657
Tiempo:
24.17300503399929
Tiempo:
26.87643499800015




Tiempo:
28.751156068000455
Tiempo:
29.87328885900024
Tiempo:
30.32396050999978
Tiempo:
27.92801097099982




Tiempo:
30.11022501699972
Tiempo:
28.66114648400071


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
29.898482499000238




Tiempo:
30.186636014000214
Tiempo:
28.081513961000383
Tiempo:
30.574736292000125




Tiempo:
28.3615435669999
Tiempo:
28.846302269999796




Tiempo:
28.395139983999798
Tiempo:
28.109157675999995
Tiempo:
31.429755409999416
Tiempo:
29.1440559950006
Tiempo:
29.439200132000224


  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.688703004000672
Tiempo:
31.81042055099988
Tiempo:
28.671526301000085


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
25.78321780299939
Tiempo:
28.469497125999624
Tiempo:
24.468919141000697
Tiempo:
29.224034103000122


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
29.88522238400037


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.76272986299955
Tiempo:
30.43601371800014




Tiempo:
30.50235443800011
Tiempo:
30.370431037000344
Tiempo:
32.88925840800039




Tiempo:
30.01030242500019
Tiempo:
24.296606740999778
Tiempo:
27.80379281200021
Tiempo:
28.59128222399977
Tiempo:
30.939718802000243


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
27.284926455999994




Tiempo:
28.881779381999877
Tiempo:
29.327817425999456


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
30.26763129199935


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
26.875486778999402
Tiempo:
32.65394564400049
Tiempo:
28.36137120999956


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.347579790000054




Tiempo:
29.568570823999835


  warn('Non-invertible starting MA parameters found.'


Tiempo:
31.120053862000532


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
29.687807975000396
Tiempo:
29.568952517999605
Tiempo:
29.13933528399957




Tiempo:
29.114243528999395


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
30.365531675000057
Tiempo:
29.399863309000466
Tiempo:
32.36143018199982
Tiempo:
29.2003385299995
Tiempo:
31.913472091000585




Tiempo:
28.65997673399943
Tiempo:
30.077023728999848


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
28.204675051999402




Tiempo:
30.19082566799989


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
27.76887006099969




Tiempo:
31.817057928000395
Tiempo:
28.91204725500029




Tiempo:
32.24357155799953




Tiempo:
28.949706045999847
Tiempo:
33.88869313300074


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
32.038886018000085
Tiempo:
34.281757015999574


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
31.015120803000173
Tiempo:
29.931582789999993
Tiempo:
28.16181920500003
Tiempo:
25.97493579499951




Tiempo:
29.394468200999654
Tiempo:
32.5263416279995
Tiempo:
32.71240372800003
Tiempo:
30.543157357000382
Tiempo:
29.944839390000197
Tiempo:
30.35234229800062




Tiempo:
31.40420017300039
Tiempo:
28.47947894599929
Tiempo:
30.130781541999568
Tiempo:
30.43621094699938
Tiempo:
29.99375384799987
Tiempo:
27.64406762099952
Tiempo:
25.545728672000223
Tiempo:
29.927380240000275
Tiempo:
29.679838050999933
Tiempo:
27.12909064700034
Tiempo:
29.682363103999705
Tiempo:
30.219501766000576
Tiempo:
26.160779728000307
Tiempo:
27.41289385699929
Tiempo:
30.1948582670002
Tiempo:
27.515708451000137
Tiempo:
28.63470123099978
Tiempo:
29.361302810999405
Tiempo:
24.86330110000017




Tiempo:
32.359938896999665
Tiempo:
28.626495774000432




Tiempo:
28.933178150000458


  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.256408127000213
Tiempo:
29.808587611999428


  warn('Non-invertible starting MA parameters found.'


Tiempo:
26.98842108000008
Tiempo:
29.763774656999885
Tiempo:
27.1888879549997
Tiempo:
29.62007200700009
Tiempo:
27.368465828000808




Tiempo:
28.424047567999878
Tiempo:
25.807902184999875
Tiempo:
28.550058065000485
Tiempo:
28.96729959500044
Tiempo:
27.90693156799898


  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.60980722000022


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
28.086498280999876


  warn('Non-invertible starting MA parameters found.'


Tiempo:
26.119654678001098




Tiempo:
28.575000725999416




Tiempo:
27.188148674998956
Tiempo:
27.521168487000978


  warn('Non-invertible starting MA parameters found.'


Tiempo:
24.36020095999993
Tiempo:
30.286081930000364


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
23.83969195499958
Tiempo:
29.87274228699971




Tiempo:
27.01946400899942
Tiempo:
28.904599006000353
Tiempo:
28.50362321799912
Tiempo:
28.765136334999625
Tiempo:
30.539810004000174




Tiempo:
30.443175280001014
Tiempo:
23.26545627300038
Tiempo:
29.228482563999933
Tiempo:
25.828632930999447
Tiempo:
29.408470944999863
Tiempo:
27.3461008689992
Tiempo:
28.287707184999817




Tiempo:
32.2445348070014
Tiempo:
30.787877697999647
Tiempo:
32.65488217699931




Tiempo:
31.076438665999376
Tiempo:
29.92395017600029
Tiempo:
30.54447231800077
Tiempo:
28.648280935998628




Tiempo:
29.76430893199904


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.610038398999677
Tiempo:
27.884105405999435
Tiempo:
26.73807672300063




Tiempo:
27.625532621001184
Tiempo:
27.88699052300035
Tiempo:
26.09313638599997




Tiempo:
29.63288856300096
Tiempo:
25.364952176998486
Tiempo:
29.078775513999062
Tiempo:
28.52901016099895
Tiempo:
27.28584014399894
Tiempo:
29.294518607999635
Tiempo:
27.312606204000986


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
35.94737187999999
Tiempo:
28.68355485900065
Tiempo:
30.520477886999288
Tiempo:
27.54614162100006
Tiempo:
35.87133125699984
Tiempo:
26.066207286999997
Tiempo:
29.541205744999388
Tiempo:
27.417667655001424
Tiempo:
27.653542022000693




Tiempo:
30.554226116999416




Tiempo:
29.778783656000087




Tiempo:
29.20475877899844


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.888200261999373
Tiempo:
28.47357106600066
Tiempo:
30.285193333998905




Tiempo:
27.511643088999335
Tiempo:
28.838428381000995
Tiempo:
31.369730795999203
Tiempo:
29.321137970000564
Tiempo:
29.149834837000526


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.462253970999882
Tiempo:
29.69870155999888




Tiempo:
27.48581123400072
Tiempo:
27.894596146999902


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
29.18674534999991
Tiempo:
30.024463982999805
Tiempo:
28.87602716299989
Tiempo:
27.120824124998762
Tiempo:
31.41381072999866
Tiempo:
29.769813573000647
Tiempo:
25.970002129999557
Tiempo:
28.842415365001216
Tiempo:
26.225418178000837
Tiempo:
28.8664353460008


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
31.754890091999187
Tiempo:
30.96252090499911


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
29.588419400999555
Tiempo:
29.7996931029993
Tiempo:
26.97652369500065
Tiempo:
35.59305233399937
Tiempo:
27.995754861000023
Tiempo:
29.66939131500112


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
29.440954268000496




Tiempo:
29.32606742200005




Tiempo:
26.69612045699978
Tiempo:
28.403334484999505




Tiempo:
28.51218847400014




Tiempo:
30.098322306999762


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
31.10661607700058
Tiempo:
28.80716841299909
Tiempo:
29.282977471000777




Tiempo:
28.750194926000404
Tiempo:
28.829413752999244
Tiempo:
27.62770335300047


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
26.17844309099928




Tiempo:
28.79835420100062


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
25.401918157000182
Tiempo:
26.998563754001225


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
28.445872388998396
Tiempo:
28.538515354000992
Tiempo:
26.404078662999382
Tiempo:
29.50903547099915
Tiempo:
28.480444577000526
Tiempo:
28.20492132199979
Tiempo:
25.222279414001605
Tiempo:
29.42390802999944




Tiempo:
29.3454160959991




Tiempo:
30.104535652000777
Tiempo:
26.876144076000855
Tiempo:
30.711318716999813
Tiempo:
23.778732933000356
Tiempo:
28.045966299998327
Tiempo:
28.242859406000207


  warn('Non-stationary starting autoregressive parameters'
  warn('Non-invertible starting MA parameters found.'


Tiempo:
27.80044074899888


  warn('Non-stationary starting autoregressive parameters'


Tiempo:
28.77996449300008
Tiempo:
28.07718189699881


  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.56804190799994
Tiempo:
25.23022223099906
Tiempo:
25.007399852998788
Tiempo:
24.779967119999128
Tiempo:
27.246589270000186
Tiempo:
29.917166901999735


  warn('Non-invertible starting MA parameters found.'


Tiempo:
28.747150425000655




Tiempo:
27.595571281999582


  warn('Non-invertible starting MA parameters found.'


Tiempo:
26.792752233999636
Tiempo:
30.498038985000676
Tiempo:
27.608452798000144




Tiempo:
25.266829931999382
Tiempo:
30.039727653000227




Tiempo:
30.74834176800141




Tiempo:
27.8916051970009
Tiempo:
29.127484919999915
Tiempo:
27.31541284499872
Tiempo:
28.04458151599829
Tiempo:
24.364141367999764
Tiempo:
28.19798893600091
Tiempo:
29.47653125999932


In [5]:
final_df.to_csv('gridsearch.csv',index=False)
final_errores.to_csv('gridsearch_mse.csv',index=False)