evaluation_lstm.py

import pandas as pd
from model import *
from Extended_Min_Max import *
from sklearn.model_selection import TimeSeriesSplit
from sklearn.metrics import *
import math

def evaluation(true_Y, pred_Y):
    rmse = math.sqrt(mean_squared_error(true_Y, pred_Y))
    mae = (mean_absolute_error(true_Y, pred_Y))
    smape = np.mean(np.abs((true_Y - pred_Y) / (true_Y + pred_Y)))
    r_squared = r2_score(true_Y, pred_Y)

    return rmse, mae, smape, r_squared


activations = ['relu', 'linear', 'tanh','sine', 'cos', 'swish','sigmoid']


data = pd.read_csv('exchange.csv')

data['Date'] = pd.DatetimeIndex(data['Date'])
data.index = data['Date']
data = data.drop('Date', axis=1)
method = 'lstm'

variables = list(data)
for var in variables:
    print(var)

    if var == 'USD_JPY':
        data[var] = np.log10(data[var])

    min_sample = len(data[var]) - 1825
    min_train = data[var].iloc[0:min_sample]
    train = data[var].iloc[min_sample:]

    for activation in activations:

        tscv = TimeSeriesSplit(n_splits=4)

        performance = {'Data': [], 'Method': [], 'Activation':[], 'Index': [],
                       'RMSE': [], 'MAE': [], 'sMAPE': [], 'R_squared': []}

        i = 1
        for train_index, test_index in tscv.split(train):

            training = pd.concat([min_train, train[train_index]], axis=0)
            test = train[test_index]
            print(len(test))
            normalization = Extended_Min_Max(training=training, test=test, days=len(test))

            if activation in ['relu', 'linear', 'swish','sigmoid']:
                training, test = normalization.Normalization(features=[0, 1])
            else:
                training, test = normalization.Normalization(features=[-1, 1])

            data_preprocess = data_preparing(training, training, test, test, time_steps=5)
            trainX, valX, trainY, valY, testX, testY = data_preprocess.data_preprocessing()

            modelling = simple_rnn_models(trainX,  valX, trainY, valY,
                     rnn_layers=[32], time_steps=5, batch_size=64, activation=activation, output_activation=activation,
                     early_stopping=100, model_path='model/%s/model_%s_%s_%s_%s' %(method, method, activation, var, i),
                                 method=method,  var=var, epoch=3000, lr=0.001,
                               reg_lambda= 0.00001)

            final_model = modelling.lstm_model()

            pred_y = final_model.predict(testX)

            testY = normalization.DE_normalization(testY)
            pred_y = normalization.DE_normalization(pred_y)

            if var == 'USD_JPY':
                testY = 10**testY
                pred_y = 10 ** pred_y


            rmse, mae, smape, r_squared = evaluation(true_Y=testY, pred_Y=pred_y)

            performance['Data'].append(var)
            performance['Method'].append(method)
            performance['Activation'].append(activation)
            performance['Index'].append(i)
            performance['RMSE'].append(rmse)
            performance['MAE'].append(mae)
            performance['sMAPE'].append(smape)
            performance['R_squared'].append(r_squared)


            i=i+1


        res = pd.DataFrame.from_dict(performance)
        res.to_csv('model/%s/performance.csv' %method, index=False, mode='a')