# Notebook de contrastes

En este cuadernillo se realizarán distintos contrastes estadísticos sobre los resultados obtenidos. Mayormente se evaluará si hay suficiente evidencia para poder decir que un estimador es mejor que otro, es decir, si hay suficiente evidencia como para poder afirmar que los errores que comete un estimador son mayores que los que comete otro. Para ello se usará el *Test Rank-Sum de Wilcoxon*.

In [2]:
# Imports necesarios

import pandas as pd
import numpy as np
from scipy.stats import ranksums

Se cargan los datos de las predicciones de los distintos estimadores.

In [3]:
preds = pd.read_csv('preds.csv', sep=';', index_col=0)

### Contrastes para Ridge Regression

#### Para el primer horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor o igual que con normalización por semana previa y temperatura centrada
- H<sub>1</sub> : ...con normalización por semana previa y temperatura centrada es mejor que con normalización mixta 7 días y temperatura centrada

In [3]:
yTest = np.array(preds['yTest_0'])
rr0_h0_aux = np.array(preds['RR37ConCen_0'])
rr0_h1_aux = np.array(preds['RR2ConCen_0'])

rr0_h0 = np.absolute(yTest-rr0_h0_aux)
rr0_h1 = np.absolute(yTest-rr0_h1_aux)

ranksums(rr0_h1, rr0_h0, alternative='less')

RanksumsResult(statistic=-0.679846198386547, pvalue=0.24830092549973592)

#### Para el segundo horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor o igual que con normalización por semana previa y temperatura centrada
- H<sub>1</sub> : ...con normalización por semana previa y temperatura centrada es mejor que con normalización mixta 7 días y temperatura centrada

In [4]:
yTest = np.array(preds['yTest_1'])
rr1_h0_aux = np.array(preds['RR37ConCen_1'])
rr1_h1_aux = np.array(preds['RR2ConCen_1'])

rr1_h0 = np.absolute(yTest-rr1_h0_aux)
rr1_h1 = np.absolute(yTest-rr1_h1_aux)

ranksums(rr1_h1, rr1_h0, alternative='less')

RanksumsResult(statistic=-1.1138050538832753, pvalue=0.13268141418560192)

#### Para el tercer horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor o igual que con normalización por semana previa y temperatura centrada
- H<sub>1</sub> : ...con normalización por semana previa y temperatura centrada es mejor que con normalización mixta 7 días y temperatura centrada

In [5]:
yTest = np.array(preds['yTest_2'])
rr2_h0_aux = np.array(preds['RR37ConCen_2'])
rr2_h1_aux = np.array(preds['RR2ConCen_2'])

rr2_h0 = np.absolute(yTest-rr2_h0_aux)
rr2_h1 = np.absolute(yTest-rr2_h1_aux)

ranksums(rr2_h1, rr2_h0, alternative='less')

RanksumsResult(statistic=-1.3415921731215743, pvalue=0.08986413268097138)

#### Para el cuarto horizonte...

- H<sub>0</sub> : ...con normalización por semana previa y temperatura centrada es mejor o igual que con normalización mixta 7 días y temperatura centrada
- H<sub>1</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor que con normalización por semana previa y temperatura centrada

In [8]:
yTest = np.array(preds['yTest_3'])
rr3_h0_aux = np.array(preds['RR2ConCen_3'])
rr3_h1_aux = np.array(preds['RR37ConCen_3'])

rr3_h0 = np.absolute(yTest-rr3_h0_aux)
rr3_h1 = np.absolute(yTest-rr3_h1_aux)

ranksums(rr3_h1, rr3_h0, alternative='less')

RanksumsResult(statistic=0.5603547550288149, pvalue=0.7123812568399247)

#### Para el quinto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor o igual que con normalización mixta 1 día y temperatura centrada
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura centrada es mejor que con normalización mixta 7 días y temperatura centrada

In [9]:
yTest = np.array(preds['yTest_4'])
rr4_h0_aux = np.array(preds['RR37ConCen_4'])
rr4_h1_aux = np.array(preds['RR31ConCen_4'])

rr4_h0 = np.absolute(yTest-rr4_h0_aux)
rr4_h1 = np.absolute(yTest-rr4_h1_aux)

ranksums(rr4_h1, rr4_h0, alternative='less')

RanksumsResult(statistic=-3.7883798069888717, pvalue=7.581645977287259e-05)

#### Para el sexto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura centrada es mejor o igual que con normalización mixta 1 día y temperatura centrada
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura centrada es mejor que con normalización mixta 7 días y temperatura centrada

In [10]:
yTest = np.array(preds['yTest_5'])
rr5_h0_aux = np.array(preds['RR37ConCen_5'])
rr5_h1_aux = np.array(preds['RR31ConCen_5'])

rr5_h0 = np.absolute(yTest-rr5_h0_aux)
rr5_h1 = np.absolute(yTest-rr5_h1_aux)

ranksums(rr5_h1, rr5_h0, alternative='less')

RanksumsResult(statistic=-4.2418173799913745, pvalue=1.108585356992542e-05)

### Contrastes para Multilayer Perceptron

#### Para el primer horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y sin temperatura es mejor o igual que con normalización por semana previa y sin temperatura
- H<sub>1</sub> : ...con normalización por semana previa y sin temperatura es mejor que con normalización mixta 7 días y sin temperatura

In [11]:
yTest = np.array(preds['yTest_0'])
mlp0_h0_aux = np.array(preds['MLP37Sin_0'])
mlp0_h1_aux = np.array(preds['MLP2Sin_0'])

mlp0_h0 = np.absolute(yTest-mlp0_h0_aux)
mlp0_h1 = np.absolute(yTest-mlp0_h1_aux)

ranksums(mlp0_h1, mlp0_h0, alternative='less')

RanksumsResult(statistic=-0.3322859435681248, pvalue=0.3698366764475787)

#### Para el segundo horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 7 días y temperatura

In [12]:
yTest = np.array(preds['yTest_1'])
mlp1_h0_aux = np.array(preds['MLP37Con_1'])
mlp1_h1_aux = np.array(preds['MLP2Con_1'])

mlp1_h0 = np.absolute(yTest-mlp1_h0_aux)
mlp1_h1 = np.absolute(yTest-mlp1_h1_aux)

ranksums(mlp1_h1, mlp1_h0, alternative='less')

RanksumsResult(statistic=-1.1061394293633104, pvalue=0.13433308738141336)

#### Para el tercer horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 7 días y temperatura

In [13]:
yTest = np.array(preds['yTest_2'])
mlp2_h0_aux = np.array(preds['MLP37Con_2'])
mlp2_h1_aux = np.array(preds['MLP2Con_2'])

mlp2_h0 = np.absolute(yTest-mlp2_h0_aux)
mlp2_h1 = np.absolute(yTest-mlp2_h1_aux)

ranksums(mlp2_h1, mlp2_h0, alternative='less')

RanksumsResult(statistic=-1.6899795242525495, pvalue=0.04551593599983871)

#### Para el cuarto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 7 días y temperatura

In [14]:
yTest = np.array(preds['yTest_3'])
mlp3_h0_aux = np.array(preds['MLP37Con_3'])
mlp3_h1_aux = np.array(preds['MLP2Con_3'])

mlp3_h0 = np.absolute(yTest-mlp3_h0_aux)
mlp3_h1 = np.absolute(yTest-mlp3_h1_aux)

ranksums(mlp3_h1, mlp3_h0, alternative='less')

RanksumsResult(statistic=-1.4111971225841324, pvalue=0.07909324918884147)

#### Para el quinto horizonte...

- H<sub>0</sub> : ...con normalización por semana previa y temperatura es mejor o igual que con normalización mixta 1 día y temperatura centrada
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura centrada es mejor que con normalización por semana previa y temperatura

In [15]:
yTest = np.array(preds['yTest_4'])
mlp4_h0_aux = np.array(preds['MLP2Con_4'])
mlp4_h1_aux = np.array(preds['MLP31ConCen_4'])

mlp4_h0 = np.absolute(yTest-mlp4_h0_aux)
mlp4_h1 = np.absolute(yTest-mlp4_h1_aux)

ranksums(mlp4_h1, mlp4_h0, alternative='less')

RanksumsResult(statistic=-0.10016855559200365, pvalue=0.46010525471553804)

#### Para el sexto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización mixta 1 día y temperatura centrada
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura centrada es mejor que con normalización mixta 7 días y temperatura

In [16]:
yTest = np.array(preds['yTest_5'])
mlp5_h0_aux = np.array(preds['MLP37Con_5'])
mlp5_h1_aux = np.array(preds['MLP31ConCen_5'])

mlp5_h0 = np.absolute(yTest-mlp5_h0_aux)
mlp5_h1 = np.absolute(yTest-mlp5_h1_aux)

ranksums(mlp5_h1, mlp5_h0, alternative='less')

RanksumsResult(statistic=-2.703388271385292, pvalue=0.0034318259325462333)

### Contrastes para SVR

#### Para el primer horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 7 días y temperatura

In [17]:
yTest = np.array(preds['yTest_0'])
svr0_h0_aux = np.array(preds['SVR37Con_0'])
svr0_h1_aux = np.array(preds['SVR2Con_0'])

svr0_h0 = np.absolute(yTest-svr0_h0_aux)
svr0_h1 = np.absolute(yTest-svr0_h1_aux)

ranksums(svr0_h1, svr0_h0, alternative='less')

RanksumsResult(statistic=-1.2831650107815606, pvalue=0.09971713571693464)

#### Para el segundo horizonte...

- H<sub>0</sub> : ...con normalización mixta 1 día y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 1 día y temperatura

In [18]:
yTest = np.array(preds['yTest_1'])
svr1_h0_aux = np.array(preds['SVR31Con_1'])
svr1_h1_aux = np.array(preds['SVR2Con_1'])

svr1_h0 = np.absolute(yTest-svr1_h0_aux)
svr1_h1 = np.absolute(yTest-svr1_h1_aux)

ranksums(svr1_h1, svr1_h0, alternative='less')

RanksumsResult(statistic=0.8532846990579646, pvalue=0.8032492784375462)

#### Para el tercer horizonte...

- H<sub>0</sub> : ...con normalización mixta 1 día y temperatura es mejor o igual que con normalización por semana previa y temperatura
- H<sub>1</sub> : ...con normalización por semana previa y temperatura es mejor que con normalización mixta 1 día y temperatura

In [19]:
yTest = np.array(preds['yTest_2'])
svr2_h0_aux = np.array(preds['SVR31Con_2'])
svr2_h1_aux = np.array(preds['SVR2Con_2'])

svr2_h0 = np.absolute(yTest-svr2_h0_aux)
svr2_h1 = np.absolute(yTest-svr2_h1_aux)

ranksums(svr2_h1, svr2_h0, alternative='less')

RanksumsResult(statistic=1.7424851564708075, pvalue=0.9592882067105207)

#### Para el cuarto horizonte...

- H<sub>0</sub> : ...con normalización por semana previa y temperatura es mejor o igual que con normalización mixta 1 día y temperatura
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura es mejor que con normalización por semana previa y temperatura

In [22]:
yTest = np.array(preds['yTest_3'])
svr3_h0_aux = np.array(preds['SVR2Con_3'])
svr3_h1_aux = np.array(preds['SVR31Con_3'])

svr3_h0 = np.absolute(yTest-svr3_h0_aux)
svr3_h1 = np.absolute(yTest-svr3_h1_aux)

ranksums(svr3_h1, svr3_h0, alternative='less')

RanksumsResult(statistic=-2.7001757813597242, pvalue=0.003465142431586501)

#### Para el quinto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización mixta 1 día y temperatura
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura es mejor que con normalización mixta 7 días y temperatura

In [23]:
yTest = np.array(preds['yTest_4'])
svr4_h0_aux = np.array(preds['SVR37Con_4'])
svr4_h1_aux = np.array(preds['SVR31Con_4'])

svr4_h0 = np.absolute(yTest-svr4_h0_aux)
svr4_h1 = np.absolute(yTest-svr4_h1_aux)

ranksums(svr4_h1, svr4_h0, alternative='less')

RanksumsResult(statistic=-3.8491743826872793, pvalue=5.9258307408709044e-05)

#### Para el sexto horizonte...

- H<sub>0</sub> : ...con normalización mixta 7 días y temperatura es mejor o igual que con normalización mixta 1 día y temperatura
- H<sub>1</sub> : ...con normalización mixta 1 día y temperatura es mejor que con normalización mixta 7 días y temperatura

In [24]:
yTest = np.array(preds['yTest_5'])
svr5_h0_aux = np.array(preds['SVR37Con_5'])
svr5_h1_aux = np.array(preds['SVR31Con_5'])

svr5_h0 = np.absolute(yTest-svr5_h0_aux)
svr5_h1 = np.absolute(yTest-svr5_h1_aux)

ranksums(svr5_h1, svr5_h0, alternative='less')

RanksumsResult(statistic=-4.793211924967533, pvalue=8.206604012750657e-07)

### Contrastes finales

Ahora se estudiará si hay suficiente evidencia estadística para afirmar que los modelos de SVR obtienen mejores resultados que los de MLP. Para cada horizonte se tendrán las siguientes hipótesis:

- H<sub>0</sub> : El modelo de MLP es mejor o igual que el modelo de SVR
- H<sub>1</sub> : El modelo de SVR es mejor que el de MLP

#### Primer horizonte

In [5]:
yTest = np.array(preds['yTest_0'])
hor0_h0_aux = np.array(preds['MLP2Sin_0'])
hor0_h1_aux = np.array(preds['SVR2Con_0'])

hor0_h0 = np.absolute(yTest-hor0_h0_aux)
hor0_h1 = np.absolute(yTest-hor0_h1_aux)

ranksums(hor0_h1, hor0_h0, alternative='less')

RanksumsResult(statistic=-2.4755082536481194, pvalue=0.006652334323466802)

#### Segundo horizonte

In [6]:
yTest = np.array(preds['yTest_1'])
hor1_h0_aux = np.array(preds['MLP2Con_1'])
hor1_h1_aux = np.array(preds['SVR2Con_1'])

hor1_h0 = np.absolute(yTest-hor1_h0_aux)
hor1_h1 = np.absolute(yTest-hor1_h1_aux)

ranksums(hor1_h1, hor1_h0, alternative='less')

RanksumsResult(statistic=-1.4552459946791143, pvalue=0.07280058586057886)

#### Tercer horizonte

In [7]:
yTest = np.array(preds['yTest_2'])
hor2_h0_aux = np.array(preds['MLP2Con_2'])
hor2_h1_aux = np.array(preds['SVR2Con_2'])

hor2_h0 = np.absolute(yTest-hor2_h0_aux)
hor2_h1 = np.absolute(yTest-hor2_h1_aux)

ranksums(hor2_h1, hor2_h0, alternative='less')

RanksumsResult(statistic=-1.1051535065849412, pvalue=0.13454653948176776)

#### Cuarto horizonte

In [8]:
yTest = np.array(preds['yTest_3'])
hor3_h0_aux = np.array(preds['MLP2Con_3'])
hor3_h1_aux = np.array(preds['SVR31Con_3'])

hor3_h0 = np.absolute(yTest-hor3_h0_aux)
hor3_h1 = np.absolute(yTest-hor3_h1_aux)

ranksums(hor3_h1, hor3_h0, alternative='less')

RanksumsResult(statistic=-3.334681518844368, pvalue=0.00042698572072486955)

#### Quinto horizonte

In [9]:
yTest = np.array(preds['yTest_4'])
hor4_h0_aux = np.array(preds['MLP31ConCen_4'])
hor4_h1_aux = np.array(preds['SVR31Con_4'])

hor4_h0 = np.absolute(yTest-hor4_h0_aux)
hor4_h1 = np.absolute(yTest-hor4_h1_aux)

ranksums(hor4_h1, hor4_h0, alternative='less')

RanksumsResult(statistic=-3.288109403650946, pvalue=0.0005043131788909152)

#### Sexto horizonte

In [10]:
yTest = np.array(preds['yTest_5'])
hor5_h0_aux = np.array(preds['MLP31ConCen_5'])
hor5_h1_aux = np.array(preds['SVR31Con_5'])

hor5_h0 = np.absolute(yTest-hor5_h0_aux)
hor5_h1 = np.absolute(yTest-hor5_h1_aux)

ranksums(hor5_h1, hor5_h0, alternative='less')

RanksumsResult(statistic=-2.4779775556826977, pvalue=0.00660647282847674)