In [13]:
def extract_hourly_all(API_path, series_path):
    """It extracts hourly climatic data from AEMET's API for all the stations available during the last 24 h.
    
    Parameters:
    -----------
    API_path:     string. Path where the API key text file is saved, including the name and file extension.
    series_path:  string. File path where the previous data is saved (or where the new series will be created). 
    """
    
    # Extraer de AEMET los datos del último día
    # -----------------------------------------
     # Carga la api key 
    api_key = open(API_path).read().rstrip()
    querystring = {"api_key": api_key}

    # Obtenemos información de todas las estaciones disponibles
    url = "https://opendata.aemet.es/opendata/api/observacion/convencional/todas"
    
    iterate = True

    while iterate:

        # Peticion de datos a la url indicada
        r = requests.get(url, params=querystring, verify=False)
        # Si no me deja hacer la conexión, la repito  
        iterate = (r.status_code == requests.codes.too_many_requests)
        print(r.json())
        

        # Chequeo si la petición ha ido bien    
        if r.status_code == requests.codes.ok:
            # Hago la petición para obtener los datos
            data_url = r.json()['datos']
            r_data = requests.get(data_url, params=querystring, verify=False)

            # INCONSISTENCIA DE LA API:
            # Cuando no encuentra datos en el rango seleccionado, la API devuelve
            # que el status code es 200 (todo ok) y devuelve un json con el error
            # cuando encuentra, no hay atributo estado            
            try:
                estado = r_data.json()['estado']
            except:
                estado = 200

            # Si ha ido bien, guardo los datos
            if estado == requests.codes.ok:
                #print(r_data.json())
                data = (r_data.json())
                # Crear una lista con cada una de las entradas de los datos brutos convertidos en data frames
                ls = []
                for i in np.arange(len(data)):
                    ls.append(pd.DataFrame(data[i], index=[i]))
                # Combinar los data frames de la lista en un unico data frame y definir la hora como índice
                data = pd.concat(ls, axis=0, sort=True)
                data.fint = pd.to_datetime(data.fint, yearfirst=True)
                data.set_index('fint', inplace=True)
                # Reorganizar algunas columnas
                col = list(data.columns)
                col.remove('alt')
                col.remove('idema')
                col.remove('lat')
                col.remove('lon')
                col.remove('ubi')
                col = ['idema', 'ubi', 'lat', 'lon', 'alt'] + col
                data = data[col]
            else:
                print(r_data.json()['descripcion'])
        else:
            print(r.json()['descripcion'])

        time.sleep(60/45)

    # Nombre de las estaciones
    estaciones = data.idema.unique()
    
    for cod in estaciones:
        print('Estación {0:<5}'.format(cod), end='\r')
        # Extraer las filas correspondientes a una estación
        data_stn = data.loc[data.idema == cod, :]
        name = data_stn.ubi[0]
        # Corregir caracteres conflictivos en el nombre de las estaciones
        old = ['/', '"', 'Á', 'É', 'Í', 'Ó', 'Ú', 'À', 'È', 'Ò', 'Ü', 'Ç', 'Ñ', '?']
        new = ['-', '', 'A', 'E', 'I', 'O', 'U', 'A', 'E', 'O', 'U', 'C', 'N', ' ']
        for o, n in zip(old, new):
            name = name.replace(o, n)       

        file = Path(series_path + cod + '.csv')
        if file.is_file():
            # Importar la serie preexistente
            serie = pd.read_csv(file, parse_dates=['fint'], dayfirst=False, index_col=0,
                                encoding='latin1', na_values='')
            # Unir las nuevas observaciones
            #serie = serie.append(data_stn[df_stn.index > serie.index[-1]], verify_integrity=True)
            serie = pd.concat((serie, data_stn), axis=0, join='outer', sort=True).drop_duplicates()
            # Exportar la serie
            serie.to_csv(series_path + cod + '.csv', index=True, na_rep='')
        else:
            data_stn.to_csv(series_path + cod + '.csv', index=True, na_rep='')

In [15]:
def extract_data_stn(cod, name, API_path):
    """It extracts hourly climatic data from AEMET's API.
    
    Parameters:
    -----------
    cod:      string. Station code. It must match a index value in the data frame 'stations'.
    stations: data frame. Matrix of available stationes. Its index must be the station's code and it must have a field called
              'ubi' which represents the station's name
    API_path: string. The path where the API key text file is saved, including the name and file extension.
    """
    
    # Extraer de AEMET los datos del último día
    # -----------------------------------------
    # Carga la api key 
    api_key = open(API_path).read().rstrip()
    querystring = {"api_key": api_key}

    raw_data = []
    
    # Mostrar en pantalla la estación de trabajo
    print()
    print('Estación: ', cod, ' - ', name)
    
    # Obtenemos información de todas las estaciones disponibles
    url = ("https://opendata.aemet.es/opendata/api/observacion/convencional/datos/estacion//{station}".format(
            station=cod)
          )
    
    iterate = True
    
    while iterate:
        # Peticion de datos a la url indicada
        r = requests.get(url, params=querystring, verify=False)
        # Si no me deja hacer la conexión, la repito  
        iterate = (r.status_code == requests.codes.too_many_requests)
        print(r.json())
        
        # Chequeo si la petición ha ido bien    
        if r.status_code == requests.codes.ok:
            # Hago la petición para obtener los datos
            data_url = r.json()['datos']
            r_data = requests.get(data_url, params=querystring, verify=False)

            # INCONSISTENCIA DE LA API:
            # Cuando no encuentra datos en el rango seleccionado, la API devuelve
            # que el status code es 200 (todo ok) y devuelve un json con el error
            # cuando encuentra, no hay atributo estado            
            try:
                estado = r_data.json()['estado']
            except:
                estado = 200

            # Si ha ido bien guardo los datos
            if estado == requests.codes.ok:
                #print(r_data.json())
                raw_data.extend(r_data.json())
            else:
                print(r_data.json()['descripcion'])
        else:
            print(r.json()['descripcion'])

        time.sleep(60/45)
    return raw_data

In [11]:
def generate_serie_all(data, path):
    """It joins the past and present series of hourly climatic data. If there's not previous data, it simply creates a new
    csv file with the hourly data from the last 24 h.
    
    Parameters:
    -----------
    data:     data frame. The result of function 'extract_hourly_data'.
    path:     string. File path where the previous data is saved (or where the new series will be created).
    """
    # Nombre de las estaciones
    estaciones = data.idema.unique()
    
    for i in range(len(estaciones)):
        # Extraer las filas correspondientes a una estación
        data_stn = data.loc[data.idema == estaciones[i], :]
        cod = data_stn.idema[0]
        name = data_stn.ubi[0]
        # Corregir caracteres conflictivos en el nombre de las estaciones
        name = name.replace('/', '-')
        name = name.replace('"', '')
        name = name.replace('Á', 'A')
        name = name.replace('É', 'E')
        name = name.replace('Í', 'I')
        name = name.replace('Ó', 'O')
        name = name.replace('Ú', 'U')
        name = name.replace('À', 'A')
        name = name.replace('È', 'E')
        name = name.replace('Ò', 'O')
        name = name.replace('Ü', 'U')
        name = name.replace('Ç', 'C')
        name = name.replace('Ñ', 'N')
        name = name.replace('?', ' ')

        file = Path(path + cod + '_' + name + '.csv')
        if file.is_file():
            # Importar la serie preexistente
            serie = pd.read_csv(file, encoding='latin1', na_values='NaN')
            serie.fint = pd.to_datetime(serie.fint)
            serie.set_index('fint', inplace=True, drop=True)
            # Unir las nuevas observaciones
            serie = serie.append(data_stn[df_stn.index > serie.index[-1]], verify_integrity=True)
            # Exportar la serie
            serie.to_csv(path + cod + '_' + name + '.csv', index=True, na_rep='NaN')
            #del serie, df_stn#, raw_data
        else:
            data_stn.to_csv(path + cod + '_' + name + '.csv', index=True, na_rep='NaN')
            #del data_stn#, raw_data