# Comparación de Subsets

En este notebook se elaboran modelos para la comparativa de los subsets. Se ha seleccionado como base para la comparativa un GLM4, teniendo un input distinto segun el subconjunto de variables seleccionado.
Los resultados de la comparación se encuentran en el notebook "BoxplotMetricasYComparación"

- Cargamos las librerias necesarias para la elaboracion del notebook.

In [None]:
library(loadeR)
library(magrittr)
require(transformeR)
require(downscaleR)
require(visualizeR)
require(climate4R.value)
require(downscaleR.keras)
library(ggplot2)

- Cargamos las variables dependientes e independientes

In [None]:
y <- load('Data/y_sam.rda') %>% get()
x <- load('Data/x_SAM.rda') %>% get()

### Primer subconjunto de variables

- Genero el primero de los subconjuntos con 6 variables.

In [None]:
var.list.min <- c('ta@500',
               'ta@700',
               'ta@850',
               'z@700',
               'z@850',
               'z@500')

grid.list <- lapply(var.list.min, function(x){
    loadGridData(dataset = "path_to_VALUE_ERA-INTERIM_data",#http://www.value-cost.eu/data
                 var = x,
                 # lonLim = c(8,32),
                 # latLim = c(38,42),
                 years = 1979:2008)
    }
)
x.min <- makeMultiGrid(grid.list)

- Indico el numero de folds y su longitud.

In [None]:
folds <- list(1979:1989, 1990:1999, 2000:2008)

- Seleciono los parametros de estandarizacion de variables.

In [None]:
scaling.pars <- list(type = "standardize",
                    spatial.frame = "gridbox")

In [None]:
scaleGrid.args = scaling.pars

- Seleciono el numero de vecinos cercanos.

In [None]:
local.pars.M4 <- list(n=4, vars=var.list.min)

- Generamos el modelo de cross-validacion GLM4_lite y lo guardamos. 

In [None]:
GLM4Lite <- downscaleCV(x = .min, y = y, method="GLM",
                   family=gaussian(link = "identity"),
                   folds=folds,
                   scaleGrid.args = scaling.pars,
                   prepareData.args = list(global.vars = NULL,
                                          local.predictors= local.pars.M4,
                                          sparial.predictors= NULL))

### Segundo subconjunto de variables

- Genero el segundo de los subconjuntos con 8 variables.

In [None]:
var.list <- c('ta@500',
              'ta@700',
              'ta@850',
              'z@700',
              'z@850',
              'z@500',
              'ua@850',
              'va@850')
grid.list <- lapply(var.list, function(x){
    loadGridData(dataset = "path_to_VALUE_ERA-INTERIM_data",#http://www.value-cost.eu/data,
                 var = x,
                 # lonLim = c(8,32),
                 # latLim = c(38,42),
                 years = 1979:2008)
    }
)
x <- makeMultiGrid(grid.list)

- Generamos el modelo de cross-validacion GLM4 .

In [None]:
GLM4cv <- downscaleCV(x = x, y = y, method="GLM",
                   family=gaussian(link = "identity"),
                   folds=folds,
                   scaleGrid.args = scaling.pars,
                   prepareData.args = list(global.vars = NULL,
                                          local.predictors= local.pars.M4,
                                          sparial.predictors= NULL))


### Tercer subset de predictores

- Genero el tercero de los subconjuntos con 20 variables.

In [None]:
var.list.plus <- c('hus@500',
                   'hus@700',
                   'hus@850',
                   'hus@1000',
                   'ta@500',
                   'ta@700',
                   'ta@850',
                   'ta@1000',
                   'ua@500',
                   'ua@700',
                   'ua@850',
                   'ua@1000',
                   'va@500',
                   'va@700',
                   'va@850',
                   'va@1000',
                   'z@500',
                   'z@700',
                   'z@850',
                   'z@1000')
grid.list <- lapply(var.list.plus, function(x){
    loadGridData(dataset = "path_to_VALUE_ERA-INTERIM_data",#http://www.value-cost.eu/data,
                 var = x.plus,
                 # lonLim = c(8,32),
                 # latLim = c(38,42),
                 years = 1979:2008)
    }
)
x.plus <- makeMultiGrid(grid.list)

- Generamos el modelo de cross-validacion GLM4plus.

In [None]:
GLM4plus <- downscaleCV(x = x.plus, y = y, method="GLM",
                   family=gaussian(link = "identity"),
                   folds=folds,
                   scaleGrid.args = scaling.pars,
                   prepareData.args = list(global.vars = NULL,
                                          local.predictors= local.pars.M4,
                                          sparial.predictors= NULL))