_Autor:_    __Jesús Casado__ <br> _Revisión:_ __5/11/2019__ <br>

__Introducción__<br>
Funciones para extraer datos de las bases de datos SPREAD (precipitación diaria en España) y STEAD (temperatura máxima y mínima diaria de España).

__Cosas que arreglar__ <br>

***

__Índice__ <br>

In [5]:
import numpy as np
import pandas as pd
import datetime
import os
from netCDF4 import Dataset
from pyproj import Transformer
os.environ['PROJ_LIB'] = r'C:\Anaconda3\pkgs\proj4-4.9.3-vc14_5\Library\share'

In [13]:
def extract_SPREAD(variable, loc, path, xlim=None, ylim=None, datelim=None, coordsIn='epsg:23030',
                   coordsOut=None, dateformat='%Y-%m-%d', plot=False):
    """Extrae los datos de SPREAD para las coordenadas y fechas indicadas.
    
    Entradas:
    ---------
    variable:    string. Abreviatura de la variable de interés: 'pcp', precipitación; 'err' error
    loc:         string. Abreviatura de la localización: 'pen', penínsuala; 'bal', Baleares; 'can', Canarias
    path:        string. Donde se encuentran los archivos .nc de SPREAD
    xlim:        list(2,1). Límites de la coordenada X (m) del rectángulo de búsqueda. Si es 'None' se extraen todas las columnas disponibles
    ylim:        list(2,1). Límites de la coordenada Y (m) del rectángulo de búsqueda. Si es 'None' se extraen todas las filas disponibles
    datelim:     list of strings (2,1). Fechas límites de la serie a extraer. Si es 'None' se extraen todas las fechas disponibles
    coordsIn:    string. Código EPSG del sistema de coords de 'xlim' y 'ylim'. Por defecto ED50-30N, el sistema de coordenadas de SPREAD
    coordsOut:   string. Código EPSG del sistema de coords de los datos de salida. Por defecto las mismas que 'coordsIn'
    dateformat:  string. Formato de las fechas en 'datelim'
    plot:        boolena. Si se quiere plotear la serie
    
    Salidas:
    --------
    Como métodos de la función:
    data:        array 3D [dates, lat, lon]. Datos extraídos
    dates:       array 1D. Fechas en 'data'
    Si las coordenadas son geográficas:
    X:         array 1D. Latitudes en 'data'
    Y:         array 1D. Longitudes en 'data'
    """
        
    # cargar NetCDF
    nc = Dataset(path + 'SPREAD_' + loc + '_' + variable + '.nc', 'r')    
    data = nc[variable][::].copy()
    data = np.rot90(data, axes=(1, 2)) # rotar 90º
    data = data / 10 # convertir datos a mm

    # variable tiempo (fechas)
    time = nc['time'][::].data
    dates = np.array([date.date() for date in pd.date_range('1950-1-1', '2012-12-31')])
    if datelim != None:
        if len(datelim) != 2:
            print('ERROR. Longitud errónea de "datelim".')
            return
        datelim = [datetime.datetime.strptime(lim, dateformat).date() for lim in datelim]
        maskdate = (dates >= datelim[0]) & (dates <= datelim[-1])
        extract_SPREAD.dates = dates[maskdate]
        data = data[maskdate, :, :]
    else:
        extract_SPREAD.dates = dates

    # comprobaciones previas: 
    if (xlim != None) & (ylim != None):
        if len(xlim) != 2 or len(ylim) != 2:
            print('ERROR. Longitud errónea de "ylim" o "xlim".')
            return
        if coordsIn != 'epsg:23030':
            toED50 = Transformer.from_crs(coordsIn, 'epsg:23030')
            ylim, ylim = toED50.transform(xlim, ylim)

    # variable Y
    Y = nc['Y'][::].data
    if ylim != None:
        masky = (Y >= ylim[0]) & (Y <= ylim[-1])
        data = data[:, masky, :]
        Y = Y[masky]

    # variable X
    X = nc['X'][::].data
    if xlim != None:
        maskx = (X >= xlim[0]) & (X <= xlim[-1])
        data = data[:, :, maskx]
        X = X[maskx]

    # guardar 'array' con datos extraídos
    extract_SPREAD.data = data
    
    # guardar latitud y longitud en el sistema 'coords'
    if coordsOut == None:
        coordsOut = coordsIn
    if coordsOut != 'epsg:23030':
        # matrices de longitud y latitud de cada una de las celdas
        Xaux, Yaux = np.meshgrid(X, Y)
        # transformar coordendas y reformar en matrices del mismo tamaño que el mapa diario
        fromED50 = Transformer.from_crs('epsg:23030', coordsIn)
        Ytrans, Xtrans = fromED50.transform(Xaux.flatten(), Yaux.flatten())
        extract_SPREAD.X = Xtrans.reshape(Xaux.shape)
        extract_SPREAD.Y = Ytrans.reshape(Yaux.shape)
    else:
        extract_SPREAD.X = X
        extract_SPREAD.Y = Y        
    
    if plot == True:
        fig, ax = plt.subplots(figsize=(14, 3))
        for i in range(data.shape[1]):
            for j in range(data.shape[2]):
                ax.plot(dates, data[:, i, j], lw=.2, c='steelblue', alpha=.1)

        ax.tick_params(labelsize=11)
        ax.set(xlim=(dates[0], dates[-1]))
        ax.set_ylabel('Pd (mm)', fontsize=13)
        ax.set_title('SPREAD', fontsize=14, fontweight='bold');

In [1]:
def extract_STEAD(variable, loc, path, lonlim=None, latlim=None, datelim=None, coordsIn='epsg:4326',
                  coordsOut=None, dateformat='%lat-%m-%d', uncertainty=False, plot=False):
    """Extrae los datos de STEAD para las coordenadas y fechas indicadas.
    
    Entradas:
    ---------
    variable:    string. Abreviatura de la variable de interés: 'pcp', precipitación; 'tmax', temperatura máxima; 'tmin', temperatura mínima
    loc:         string. Abreviatura de la localización: 'pen', penínsuala; 'bal', Baleares; 'can', Canarias
    path:        string. Donde se encuentran los archivos .nc de STEAD y STEAD
    lonlim:      list(2,1). Límites de la longitud (º) del rectángulo de búsqueda. Si es 'None' se extraen todas las columnas disponibles
    latlim:      list(2,1). Límites de la latitud (º)) del rectángulo de búsqueda. Si es 'None' se extraen todas las filas disponibles
    datelim:     list of strings (2,1). Fechas límites de la serie a extraer. Si es 'None' se extraen todas las fechas disponibles
    coordsIn:    string. Código EPSG del sistema de coords de 'lonlim' y 'latlim'. Por defecto WGS84, el sistema de coordenadas de STEAD
    coordsOut:   string. Código EPSG del sistema de coords de los datos de salida. Por defecto el mismo que 'coordsIn'
    dateformat:  string. Formato de las fechas en 'datelim'
    uncertainty: boolean. Si se quiere extraer el valor de la variable (False) o su incertidumbre (True)
    plot:        boolena. Si se quiere plotear la serie
    
    Salidas:
    --------
    Como métodos de la función:
    data:        array 3D [dates, lat, lon]. Datos extraídos
    dates:       array 1D. Fechas en 'data'
    Si las coordenadas son geográficas:
    lon:         array 1D. Longitudes en 'data'
    lat:         array 1D. Latitudes en 'data'
    Si las coordenadas son proyectadas
    lon:         array 2D. Longitudes en 'data'
    lat:         array 2D. Latitudes en 'data'
    """
          
    # cargar NetCDF
    if uncertainty:
        filename = variable + '_' + loc + '_' + 'unc.nc'
    else:
        filename = variable + '_' + loc + '.nc'
    nc = Dataset(path + filename, 'r')    
    
    # extraer la variable
    if variable == 'tmax':
        variable = 'tx'
        ylabel = 'Tmax (ºC)'
    elif variable == 'tmin':
        variable = 'tn'
        ylabel = 'Tmin (ºC)'
    data = nc[variable][::].copy()

    # variable tiempo (fechas)
    time = nc['Time'][::].data
    if loc == 'pen':
        dates = np.array([date.date() for date in pd.date_range('1901-1-1', '2014-12-31')])
    else:
        dates = np.array([date.date() for date in pd.date_range('1971-1-1', '2014-12-31')])
    if datelim != None:
        if len(datelim) != 2:
            print('ERROR. Longitud errónea de "datelim".')
            return
        datelim = [datetime.datetime.strptime(lim, dateformat).date() for lim in datelim]
        maskdate = (dates >= datelim[0]) & (dates <= datelim[-1])
        extract_STEAD.dates = dates[maskdate]
        data = data[maskdate, :, :]
    else:
        extract_STEAD.dates = dates
    
    # comprobaciones límites latitud y longitud
    if (lonlim != None) & (latlim != None):
        if len(lonlim) != 2 or len(latlim) != 2:
            print('ERROR. Longitud errónea de "latlim" o "lonlim".')
            return
        if coordsIn != 'epsg:4326':
            toWGS84 = Transformer.from_crs(coordsIn, 'epsg:4326')
            latlim, lotlim = toWGS84.transform(lonlim, latlim)

    # variable latitud
    lat = nc['lat'][::].data
    if latlim != None:
        masklat = (lat >= latlim[0]) & (lat <= latlim[-1])
        data = data[:, masklat, :]
        lat = lat[masklat]

    # variable longitud
    lon = nc['lon'][::].data
    if lonlim != None:
        masklon = (lon >= lonlim[0]) & (lon <= lonlim[-1])
        data = data[:, :, masklon]
        lon = lon[masklon]

    # guardar 'array' con datos extraídos
    extract_STEAD.data = data
    
    # guardar latitud y longitud en el sistema 'coords'
    if coordsOut == None:
        coordsOut = coordsIn
    if coordsOut != 'epsg:4326':
        # matrices de longitud y latitud de cada una de las celdas
        lonaux, lataux = np.meshgrid(lon, lat)
        # transformar coordendas y reformar en matrices del mismo tamaño que el mapa diario
        fromWGS84 = Transformer.from_crs('epsg:4326', coordsIn)
        yaux, xaux = fromWGS84.transform(lonaux.flatten(), lataux.flatten())
        extract_STEAD.lon = xaux.reshape(lonaux.shape)
        extract_STEAD.lat = yaux.reshape(lataux.shape)
    else:
        extract_STEAD.lon = lon
        extract_STEAD.lat = lat
        
    if plot == True:
        fig, ax = plt.subplots(figsize=(14, 3))
        for i in range(data.shape[1]):
            for j in range(data.shape[2]):
                ax.plot(dates, data[:, i, j], lw=.2, c='indianred', alpha=.1)

        ax.tick_params(labelsize=11)
        ax.set(xlim=(dates[0], dates[-1]))
        ax.set_ylabel(ylabel, fontsize=13)
        ax.set_title('STEAD', fontsize=14, fontweight='bold');