# PTI-Clima Notebooks  <img src="https://www.r-project.org/logo/Rlogo.png" alt="Description" width="60" height="40">

***

> Este cuaderno o notebook muestra las operaciones básicas para comenzar a trabajar con los conjuntos de datos de la PTI-Clima que se incluyen en el [almacén de datos](https://pti.climate.ifca.es/data). Este trabajo está licenciado bajo una [Licencia Creative Commons Atribución 4.0 Internacional](http://creativecommons.org/licenses/by/4.0).
>
> ![Licencia de Creative Commons](https://i.creativecommons.org/l/by/4.0/88x31.png)


## Intercomparación de rejillas observacionales

**M. Iturbide** (Instituto de Física de Cantabria, CSIC-Universidad de Cantabria, Santander, Spain).

**¡Bienvenidos al notebook de *Proyecciones CORDEX* de la Plataforma Virtual de Cálculo de la PTI-Clima!**  
Esta guía está diseñada para ayudarte a sacar el máximo provecho de los numerosos recursos disponibles en el [**Almacén de Datos de la PTI-Clima**](https://pti.climate.ifca.es/data). A través de esta plataforma, podrás realizar investigaciones y **análisis climáticos de relevancia**, ya que ofrece **acceso transparente a una amplia gama de materiales y datos** subyacentes a los **servicios climáticos desarrollados en la PTI-Clima**, fomentando su **reutilización** y posibilitando la **reproducibilidad** de los productos generados.

En el directorio principal encontrarás el notebook de [**primeros_pasos_R.ipynb**](../../primeros_pasos_R.ipynb) que describe el **objetivo general y la motivación** detrás de esta plataforma virtual, aclarando su propósito y relevancia en el ámbito de la investigación climática. Además, describe el material disponible, brindándote una visión de los diversos conjuntos de datos y recursos a tu disposición para el análisis climático. Finalmente, ilustra **los pasos fundamentales para comenzar a trabajar de manera efectiva con datos climáticos**. 

Esta plataforma cuenta con **software preinstalado y listo para usar** para gestionar y realizar operaciones con datos climáticos. Este software consiste en un conjunto de **paquetes de R**, conocido como el **framework `climate4R`** (Iturbide et al., 2019. DOI: [10.1016/j.envsoft.2018.09.009](https://www.sciencedirect.com/science/article/pii/S1364815218303049?via%3Dihub)), que puede seleccionarse desde el menú de kernel. Para más información, visita [el repositorio de climate4R en GitHub](https://github.com/SantanderMetGroup/climate4R).

<img src="https://raw.githubusercontent.com/SantanderMetGroup/climate4R/refs/heads/devel/man/figures/climate4R_logo.svg" alt="Description" width="60" height="40">

***climate4R*** ofrece más funcionalidades de las que se ilustran en este notebook, como **funcionalidades de operaciones espaciales y temporales** o como **interpolación, subsetting o intersección espacial**. Además, brinda funcionalidades para la **corrección de sesgo y downscaling**. Consulta [Iturbide et al., 2019](https://www.sciencedirect.com/science/article/pii/S1364815218303049?via%3Dihub) y el repositorio de [github de climate4R](https://github.com/SantanderMetGroup/climate4R) para más información.

Para usuarios de Python, también se dispone de un entorno **`python 3`**. Es importante señalar, no obstante, que en este caso el software preinstalado es más básico.


### Contenido de este cuaderno
1) Carga de librerías
2) Selección de conjuntos de datos  
3) Carga de datos
4) Carga y armonización de varios datasets
   * 4.1. Interpolación a una malla común y unión de varios datasets en un único objeto grid
5) Análisis básico
6) Session Info

Antes de empezar definiremos el heap space de java.

In [1]:
options(java.parameters = "-Xmx20g")

Antes de empezar, o en cualquier momento durante el cuaderno, podemos personalizar el área de visualización de gráficos de la siguiente manera:

In [2]:
library(repr)
# Change plot size 
options(repr.plot.width=8, repr.plot.height=5)

***

### 1. Carga de librerías

Las librerías/paquetes centrales de ***climate4R*** que permiten **cargar y transformar** datos (p. ej., agregaciones espaciotemporales) y **visualizarlos** son `loadeR`, `transformeR` y `visualizeR`.

In [3]:
library(loadeR)
library(transformeR)
library(visualizeR)

Loading required package: rJava

Loading required package: loadeR.java

Java version 22x amd64 by N/A detected

NetCDF Java Library v4.6.0-SNAPSHOT (23 Apr 2015) loaded and ready

Loading required package: climate4R.UDG

climate4R.UDG version 0.2.6 (2023-06-26) is loaded

Please use 'citation("climate4R.UDG")' to cite this package.

loadeR version 1.8.1 (2023-06-22) is loaded


Get the latest stable version (1.8.2) using <devtools::install_github(c('SantanderMetGroup/climate4R.UDG','SantanderMetGroup/loadeR'))>

Please use 'citation("loadeR")' to cite this package.




    _______   ____  ___________________  __  ________ 
   / ___/ /  / /  |/  / __  /_  __/ __/ / / / / __  / 
  / /  / /  / / /|_/ / /_/ / / / / __/ / /_/ / /_/_/  
 / /__/ /__/ / /  / / __  / / / / /__ /___  / / \ \ 
 \___/____/_/_/  /_/_/ /_/ /_/  \___/    /_/\/   \_\ 
 
      github.com/SantanderMetGroup/climate4R



transformeR version 2.2.2 (2023-10-26) is loaded


Get the latest stable version (2.2.3) using <devtools::install_github('SantanderMetGroup/transformeR')>

Please see 'citation("transformeR")' to cite this package.

visualizeR version 1.6.4 (2023-10-26) is loaded

Please see 'citation("visualizeR")' to cite this package.



Sin embargo, el software incluye todo el framework *climate4R* y otras bibliotecas útiles. Por ejemplo, incluye la potente biblioteca de gráficos `lattice` o la biblioteca `magrittr` para operaciones en tuberías (a través de `%>%`).

In [4]:
library(lattice)
library(magrittr)

### 2. Selección de conjuntos de datos

El inventario (`data_inventory.csv`) cataloga la lista de archivos del [**Almacén de datos de la PTI-Clima**](https://pti.climate.ifca.es/data).

Simplemente necesitamos leer este archivo con la función `read.csv` para obtener el `data.frame` con esta información.

In [5]:
df <- read.csv("../../data_inventory.csv")

In [6]:
str(df)

'data.frame':	118 obs. of  9 variables:
 $ dataset   : chr  "AEMET-5KM-regular_Iberia_day" "CHELSA-W5E5v1.0_Canarias_day" "CHELSA-W5E5v1.0_Iberia_day" "PTI-grid-v0_Canarias_day" ...
 $ type      : chr  "observations" "observations" "observations" "observations" ...
 $ access    : chr  "opendap" "opendap" "opendap" "opendap" ...
 $ source    : chr  "AEMET-5KM-regular" "CHELSA-W5E5v1.0" "CHELSA-W5E5v1.0" "PTI-grid-v0" ...
 $ provider  : chr  "" "" "" "" ...
 $ experiment: chr  "" "" "" "" ...
 $ frequency : chr  "day" "day" "day" "day" ...
 $ endpoint  : chr  "https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/AEMET-5KM-regular_Iberia_day.ncml" "https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/CHELSA-W5E5v1.0_Canarias_day.ncml" "https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/CHELSA-W5E5v1.0_Iberia_day.ncml" "https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/PTI-grid-v0_Canarias_day.ncml" ...
 $ dictionary: chr  "../../Har

Podremos ver las primeras filas del `data.frame` resultande con la función `head`.

In [7]:
head(df)

Unnamed: 0_level_0,dataset,type,access,source,provider,experiment,frequency,endpoint,dictionary
Unnamed: 0_level_1,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>,<chr>
1,AEMET-5KM-regular_Iberia_day,observations,opendap,AEMET-5KM-regular,,,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/AEMET-5KM-regular_Iberia_day.ncml,../../Harmonization_dictionaries/AEMET-5KM-regular.dic
2,CHELSA-W5E5v1.0_Canarias_day,observations,opendap,CHELSA-W5E5v1.0,,,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/CHELSA-W5E5v1.0_Canarias_day.ncml,../../Harmonization_dictionaries/CHELSA-W5E5v1.0.dic
3,CHELSA-W5E5v1.0_Iberia_day,observations,opendap,CHELSA-W5E5v1.0,,,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/CHELSA-W5E5v1.0_Iberia_day.ncml,../../Harmonization_dictionaries/CHELSA-W5E5v1.0.dic
4,PTI-grid-v0_Canarias_day,observations,opendap,PTI-grid-v0,,,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/PTI-grid-v0_Canarias_day.ncml,../../Harmonization_dictionaries/PTI-grid-v0.dic
5,PTI-grid-v0_Iberia_day,observations,opendap,PTI-grid-v0,,,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/observations/PTI-grid-v0_Iberia_day.ncml,../../Harmonization_dictionaries/PTI-grid-v0.dic
6,CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day,projections,opendap,CORDEX,ESGF,historical,day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic


Se observan diferentes columnas o campos que describen los datos:

* `dataset` se refiere al nombre que se le da a cada instancia de datos en el almacén.
* `type` se refiere al tipo de los conjuntos de datos, ya sea "observaciones" (observations), "reanalisis" (reanalysis) o proyecciones (projections).
* `source` se refiere al conjuntos de datos de origen (p. ej., CORDEX-EUR, CMIP5, CMIP6, etc.).  
* `provider` se refiere a la entidad distribuidora de donde se obtuvieron los datos originales.  
* `access` se refiere al modo de acceso, ya sea local (netcdf) o remoto (opendap).
* `experiment` se refiere al escenario (p. ej., historical, rcp26, ssp126, rcp85, etc.).
* `frequency` se refiere a la escala temporal de los datos.
* `endpoint` se refiere a la ruta del archivo de datos. Esta ruta es la que se utilizará para cargar los datos más adelante.
* `dictionary` se refiere al archivo que determina el tipo de conversiones necesarias (unidades y nombre de variable) para cargar los datos de manera armonizada, independientemente de las características diferenciadas de los datasets en origen.

Podemos **aplicar fácilmente filtros** para obtener el archivo deseado. El objetivo de este notebook es analizar las proyecciones de CORDEXbc (bias corrected), por lo tanto, filtraremos el catálogo de datos por tipo (`source`). También filtraremos por `experiment`. Nos quedaremos con el nombre del `dataset`, el `endpoint` y el `dictionary`.

In [8]:
datasets.hist <- subset(df, source == "CORDEX" & experiment == "historical")[c("dataset", "endpoint", "dictionary")]
datasets.rcp85 <- subset(df, source == "CORDEX" & experiment == "rcp85")[c("dataset", "endpoint", "dictionary")]

En este caso, optaremos por la región de España peninsular y Baleares. Estos son los datasets que contienen `Iberia` en su nombre.

In [9]:
head(datasets.hist)
head(datasets.rcp85)

Unnamed: 0_level_0,dataset,endpoint,dictionary
Unnamed: 0_level_1,<chr>,<chr>,<chr>
6,CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
8,CORDEXbc_output_EUR-11_CLMcom-ETH_NCC-NorESM1-M_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom-ETH_NCC-NorESM1-M_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
10,CORDEXbc_output_EUR-11_CLMcom_CNRM-CERFACS-CNRM-CM5_historical_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_CNRM-CERFACS-CNRM-CM5_historical_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
13,CORDEXbc_output_EUR-11_CLMcom_ICHEC-EC-EARTH_historical_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_ICHEC-EC-EARTH_historical_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
16,CORDEXbc_output_EUR-11_CLMcom_MOHC-HadGEM2-ES_historical_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_MOHC-HadGEM2-ES_historical_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
19,CORDEXbc_output_EUR-11_CLMcom_MPI-M-MPI-ESM-LR_historical_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_MPI-M-MPI-ESM-LR_historical_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic


Unnamed: 0_level_0,dataset,endpoint,dictionary
Unnamed: 0_level_1,<chr>,<chr>,<chr>
7,CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_rcp85_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_rcp85_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
9,CORDEXbc_output_EUR-11_CLMcom-ETH_NCC-NorESM1-M_rcp85_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom-ETH_NCC-NorESM1-M_rcp85_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
12,CORDEXbc_output_EUR-11_CLMcom_CNRM-CERFACS-CNRM-CM5_rcp85_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_CNRM-CERFACS-CNRM-CM5_rcp85_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
15,CORDEXbc_output_EUR-11_CLMcom_ICHEC-EC-EARTH_rcp85_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_ICHEC-EC-EARTH_rcp85_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
18,CORDEXbc_output_EUR-11_CLMcom_MOHC-HadGEM2-ES_rcp85_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_MOHC-HadGEM2-ES_rcp85_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic
21,CORDEXbc_output_EUR-11_CLMcom_MPI-M-MPI-ESM-LR_rcp85_CLMcom-CCLM4-8-17_v1_day,https://data.meteo.unican.es/thredds/dodsC/PTI-clima/projections/spain/CORDEXbc_output_EUR-11_CLMcom_MPI-M-MPI-ESM-LR_rcp85_CLMcom-CCLM4-8-17_v1_day.ncml,../../Harmonization_dictionaries/CORDEXbc.dic


El resultado son múltiples datasets para cada uno de los experimentos, ya que CORDEX se compone de **múltiples datasets correspondientes a diferentes combinaciones GCM-RCM**.

Una vez que tenemos los datasets y sus `endpoint`, podemos mostrar fácilmente las características de los datos que contienen. Para hacerlo, empleamos la función `dataInventory` del paquete `loadeR`. Por ejemplo, para el primero de los datasets.

In [10]:
di <- dataInventory(datasets.hist$endpoint[1])

[2025-01-17 11:35:35.359653] Doing inventory ...

[2025-01-17 11:35:35.683887] Opening dataset...

[2025-01-17 11:35:37.802127] The dataset was successfuly opened

[2025-01-17 11:35:38.713403] Retrieving info for 'pr' (4 vars remaining)

[2025-01-17 11:35:38.851206] Retrieving info for 'tas' (3 vars remaining)

[2025-01-17 11:35:38.916715] Retrieving info for 'tasmax' (2 vars remaining)

[2025-01-17 11:35:38.979515] Retrieving info for 'tasmin' (1 vars remaining)

[2025-01-17 11:35:39.04886] Retrieving info for 'tasrange' (0 vars remaining)

[2025-01-17 11:35:39.1139] Done.



Podemos echar un primer vistazo a la información disponible con `str`.

In [11]:
str(di)

List of 5
 $ pr      :List of 7
  ..$ Description: NULL
  ..$ DataType   : chr "float"
  ..$ Shape      : int [1:3] 20454 170 273
  ..$ Units      : chr "mm"
  ..$ DataSizeMb : num 3797
  ..$ Version    : logi NA
  ..$ Dimensions :List of 3
  .. ..$ time:List of 4
  .. .. ..$ Type      : chr "Time"
  .. .. ..$ TimeStep  : chr "1.0 days"
  .. .. ..$ Units     : chr "days since 1950-01-01"
  .. .. ..$ Date_range: chr "1950-01-01T00:00:00Z - 2005-12-31T00:00:00Z"
  .. ..$ lat :List of 5
  .. .. ..$ Type       : chr "Lat"
  .. .. ..$ Units      : chr "degrees_north"
  .. .. ..$ Values     : num [1:170] 35.3 35.3 35.4 35.4 35.5 ...
  .. .. ..$ Shape      : int 170
  .. .. ..$ Coordinates: chr "lat"
  .. ..$ lon :List of 5
  .. .. ..$ Type       : chr "Lon"
  .. .. ..$ Units      : chr "degrees_east"
  .. .. ..$ Values     : num [1:273] -9.32 -9.27 -9.22 -9.17 -9.12 ...
  .. .. ..$ Shape      : int 273
  .. .. ..$ Coordinates: chr "lon"
 $ tas     :List of 7
  ..$ Description: NULL
  ..$ Dat

Vemos que, para este dataset, hay cinco variables disponibles: pr, tas, tasmax, tasmin y tasrange. Para cada una de ellas se detalla información adicional, como las unidades,el periodo temporal que cubren, las coordenadas etc.

### 3. Carga de datos


La carga de datos se realiza mediante la **función `loadGridData`** especificando, como fuente de datos, la ruta de un archivo NetCDF o de un catálogo NcML. En nuestro caso, estas rutas son precisamente las que encapsulan los objetos que hemos definido anteriormente (`datasets.hist` y `datasets.rcp85`) en la columna **`endpoint`**.

También **es necesario especificar el parámetro `var`**, que en este ejemplo se establece como `tasmax` (temperatura superficial maxima). Ten en cuenta que **`loadGridData` permite establecer parámetros adicionales**. Por ejemplo, podríamos utilizar los parámetros `lonLim` y `latLim` para cargar únicamente el subconjunto de datos correspondiente a una región más pequeña. Si no se emplean estos parámetros se carga el dominio completo (como en este caso). Otro parámetro útil es `season`, para cargar datos de meses específicos (en este ejemplo, Agosto). En el parámetro `years`, especificamos el periodo deseado (en este caso, 1986-2005 para el experimento histórico y 2041-2060 para el RCP85). **El parámetro que habilita la carga de datos armonizados es `dictionary`**. **Para obtener detalles sobre el funcionamiento de los diccionarios, puedes consultar el notebook `primeros_pasos_R.ipynb`**.

Dado que CORDEX se compone de múltiples datasets correspondientes a diferentes combinaciones GCM-RCM, podemos proceder de manera eficiente, **automatizando la carga en un bucle**. Ten en cuenta que **esta operación puede tardar minutos**, ya que estamos cargando una gran cantidad de datos. Puedes guardar el objeto generado para evitar repetir esta operación en el futuro. Por ese motivo se incluye un `if` que comprueba si el objeto está creado anteriormente, y ejecuta la carga únicamente si el objeto no está en la ruta indicada (puedes modificar la ruta de `resulting.object.path`). 

Dado que cargar múltiples modelos/miembros de CORDEX (es decir, múltiples datasets) para un periodo de varios años ocupa mucha memoria, intentaremos reducir la carga sin comprometer los objetivos del análisis. En nuestro caso, no necesitamos el dato diario, así que **realizaremos la agregación mensual en el momento de la carga** con el arguento `aggr.m`, extrayendo el máximo de la temperatura máxima de cada mes.

Además, **en el mismo bucle de carga realizaremos la unión en un grid multi-miembro**. Para ver ejemplos ilustrativos más sencillos, donde se realicen estas operaciones paso a paso, puedes consultar los notebooks **`primeros_pasos_R.ipynb`** y **`intercomp_rejillas_obs_R.ipynb`**.

Primero cargaremos los datos históricos.

In [16]:
resulting.object.path <- "../../../tasmax.jja.cdx.hist.rds"

if (!file.exists(resulting.object.path)) {
    
    tasmax.jja.cdx.hist <- lapply(datasets.hist$dataset, function(d) {
        dataset.i <- d
        endpoint.i <- subset(datasets.hist, dataset == dataset.i)[["endpoint"]]
        dic.i <- subset(datasets.hist, dataset == dataset.i)[["dictionary"]]
        message("proccessing...", d)
        loadGridData(dataset = endpoint.i,
                               var = "tasmax",
                               season = 8,
                               years = 1986:2005,
                               aggr.m = "max",
                               dictionary = dic.i) %>% suppressMessages 
        
    }) %>% bindGrid(dimension = "member") 
    
    saveRDS(tasmax.jja.cdx.hist, resulting.object.path)
    
} else {
    
    tasmax.jja.cdx.hist <- readRDS(resulting.object.path)
    
}

proccessing...CORDEXbc_output_EUR-11_CLMcom-ETH_ICHEC-EC-EARTH_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day

proccessing...CORDEXbc_output_EUR-11_CLMcom-ETH_NCC-NorESM1-M_historical_CLMcom-ETH-COSMO-crCLIM-v1-1_v1_day

proccessing...CORDEXbc_output_EUR-11_CLMcom_CNRM-CERFACS-CNRM-CM5_historical_CLMcom-CCLM4-8-17_v1_day

proccessing...CORDEXbc_output_EUR-11_CLMcom_ICHEC-EC-EARTH_historical_CLMcom-CCLM4-8-17_v1_day

proccessing...CORDEXbc_output_EUR-11_CLMcom_MOHC-HadGEM2-ES_historical_CLMcom-CCLM4-8-17_v1_day

proccessing...CORDEXbc_output_EUR-11_CLMcom_MPI-M-MPI-ESM-LR_historical_CLMcom-CCLM4-8-17_v1_day

proccessing...CORDEXbc_output_EUR-11_CNRM_CNRM-CERFACS-CNRM-CM5_historical_CNRM-ALADIN63_v2_day

“unable to translate '<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"
"http://www.w3.org/TR/REC-html40/loose.dtd">
<html><head><title>OPeNDAP Dataset Query Form</title>
<link type="text/css" rel="stylesheet" media="screen" href="/thredds/tdsDap.css"/>
<base hr...' to a wide

Ahora cargaremos los datos de proyecciones futuras (RCP85). Para este caso cargaremos el periodo 2041-2060.

In [13]:
resulting.object.path <- "../../../tasmax.jja.cdx.rcp85.rds"

if (!file.exists(resulting.object.path)) {
    
    tasmax.jja.cdx.rcp85 <- lapply(datasets.rcp85$dataset, function(d) {
        dataset.i <- d
        endpoint.i <- subset(datasets.rcp85, dataset == dataset.i)[["endpoint"]]
        dic.i <- subset(datasets.rcp85, dataset == dataset.i)[["dictionary"]]
        message("proccessing...", d)
        loadGridData(dataset = endpoint.i,
                               var = "tasmax",
                               season = 8,
                               years = 2041:2060,
                               aggr.m = "max",
                               dictionary = dic.i) %>% suppressMessages 
    }) %>% bindGrid(dimension = "member")
    
    saveRDS(tasmax.jja.cdx.rcp85, resulting.object.path)
    
} else {
    
    tasmax.jja.cdx.rcp85 <- readRDS(resulting.object.path)
    
}

Ya podemos agregarlo todo en un único grid.

In [None]:
tasmax.jja.grid <- bindGrid(tasmax.jja.interp, dimension = "member")

Especificamos el nombre de los miembros de nuestro nuevo grid,

In [None]:
tasmax.jja.grid$Members <- datasets$dataset

Y generamos la **fiugra de las medias climatológicas**. Para poder ver bien el resultado aumentaremos el entorno gráfico previamente.

In [None]:
options(repr.plot.width= 14, repr.plot.height= 6)

In [None]:
spatialPlot(climatology(tasmax.jja.grid), 
            backdrop.theme = "countries", 
            at = seq(20, 45, 1),
            set.min = 20,
            set.max = 45,
            color.theme = "YlOrBr",
            layout = c(getShape(tasmax.jja.grid, "member"), 1),
            main = "JJA mean maximum temperature for 1987-2016",
            strip = strip.custom(factor.levels = tasmax.jja.grid$Members))

### 5. Análisis básico

Los mapas que acabamos de crear en la sección anterior, muestran la media estacional (Junio-Julio-Agosto) de las temperaturas máximas mensuales en el periodo 1991-2000. Si queremos visualizar la **media climatológica de las máximas estacionales**, debemos realizar la agregación estacional con la función `aggregateGrid`. Previamente, nos aseguraremos que posibles valores `-Inf` se reconfiguren como `NA`.

In [None]:
tasmax.jja.grid.max <- aggregateGrid(tasmax.jja.grid, aggr.y = list(FUN = "max", na.rm = TRUE)) %>% suppressWarnings

Posteriormente, nos aseguraremos que posibles valores `-Inf` generados internamente por la función de base `max` se reconfiguren como `NA`.

In [None]:
tasmax.jja.grid.max$Data[which(is.infinite(tasmax.jja.grid.max$Data))] <- NA

In [None]:
spatialPlot(climatology(tasmax.jja.grid.max), 
            backdrop.theme = "countries", 
            at = seq(20, 45, 1),
            set.min = 20,
            set.max = 45,
            color.theme = "YlOrBr", 
            layout = c(getShape(tasmax.jja.grid.max, "member"), 1),
            main = "JJA maximum temperature for 1991-2000",
            strip = strip.custom(factor.levels = tasmax.jja.grid.max$Members))

Para ver las **series temporales** de la media espacial aplicaremos la función `temporalPlot`, que internamente realiza la **aggregación espacial** (por defecto la media). Sin embargo, dado que no todos los datasets tienen los valores acotados al territorio español, para que las medias espaciales sean comparables, debemos **aplicar primero una máscara**. Esta máscara la podemos generar a partir del dataset `AEMET-5KM-regular_Iberia_day` (el miembro en primera posición en nuestro `grid`), que es nuestra referencia en este notebook.

In [None]:
mask <- tasmax.jja.grid.max %>% subsetGrid(members = 1) %>% gridArithmetics(0, operator = "*")
spatialPlot(climatology(mask))

Posteriormente, aplicamos la máscara.

In [None]:
tasmax.jja.grid.max.masked <- gridArithmetics(tasmax.jja.grid.max, rep(list(mask), 
                                                                        getShape(tasmax.jja.grid.max, "member")) %>% bindGrid(dimension = "member"), 
                                               operator = "+") 

Podemos comprobar el resultado volviendo a pintar los mapas.

In [None]:
spatialPlot(climatology(tasmax.jja.grid.max.masked), 
            backdrop.theme = "countries", 
            at = seq(20, 45, 1),
            set.min = 20,
            set.max = 45,
            color.theme = "YlOrBr", 
            layout = c(getShape(tasmax.jja.grid.max, "member"), 1),
            main = "JJA maximum temperature for 1987-2016",
            strip = strip.custom(factor.levels = tasmax.jja.grid.max$Members))

Ahora ya podemos comparar las medias regionales. La función `temporalPlot` reconocerá la dimensión miembro del `grid`, y dibujará la media multi-miembro, así como el rango multi-miembro, que se representará como una sombra.

In [None]:
temporalPlot("tasmax JJA - multimodel" = tasmax.jja.grid.max.masked, 
             xyplot.custom = list(ylim = c(30, 40), 
                                  main = "JJA maximum temperature"))

Podemos añadir las series de cada miembro independientemente. Recordemos los nombres de los diferentes miembros:

In [None]:
tasmax.jja.grid.max.masked$Members

Ahora aplicaremos `subsetGrid` para extraer cada miembro y los añadiremos a `temporalPlot` incluyendo los nombres correspondientes.

In [None]:
independent.members <- lapply(1:length(datasets$dataset), function(i) subsetGrid(tasmax.jja.grid.max.masked, members = i))

temporalPlot("multimodel" = tasmax.jja.grid.max.masked, 
             "AEMET-5KM-regular_Iberia_day" = independent.members[[1]],
             "CHELSA-W5E5v1.0_Iberia_day" = independent.members[[2]],
             "PTI-grid-v0_Iberia_day" = independent.members[[3]],
             "ERA5-Land_Iberia_day" = independent.members[[4]],
             xyplot.custom = list(main = "JJA maximum temperature"))

Ejecuta `help(temporalPlot)` para ver todas las posibilidades gráficas que ofrece.

La función que genera la figura de series temporales que hemos utilizado anteriormente realiza automáticamente la agregación espacial de los datos, utilizando la media como función de agregación por defecto y **ponderando los valores según la latitud**. Sin embargo, podemos controlar esta operación utilizando el parámetro `aggr.spatial`, tanto en la función `temporalPlot`, como en la función `aggregateGrid` si queremos generar el objeto agregado. En el siguiente ejemplo, calculamos la máxima espacial:

In [None]:
tasmax.jja.regional.max <- aggregateGrid(tasmax.jja.grid.max.masked, aggr.spatial = list(FUN = "max", na.rm = TRUE))

También podemos crear las series temporales del objeto previamente agregado:

In [None]:
temporalPlot("multimodel" = tasmax.jja.regional.max, cols = "purple")

El **framework *climate4R*** ofrece muchas otras **funcionalidades de operaciones espaciales y temporales**, como **interpolación, subsetting o intersección espacial**. Además, brinda funcionalidades para la **corrección de sesgo y downscaling**. Consulta [Iturbide et al., 2019](https://www.sciencedirect.com/science/article/pii/S1364815218303049?via%3Dihub) y el repositorio de [github de climate4R](https://github.com/SantanderMetGroup/climate4R) para más información.


***

### Session Info

In [None]:
sessionInfo()