In [1]:
!pip install pandas

Defaulting to user installation because normal site-packages is not writeable


In [2]:
import pandas as pd
import requests
import time

In [3]:
URL_FICHERO_API_KEY = 'api_key.txt'
with open(URL_FICHERO_API_KEY, 'r') as fichero_api_key:
    API_KEY = fichero_api_key.read().strip()

In [4]:
DIAS_MESES = [31, 28, 31, 30, 31, 30, 31, 31, 30, 31, 30, 31]
def generar_intervalos_fechas(anno: int):
    res = []
    anno_str = str(anno)
    anno_bisiesto = anno % 4 == 0 and (anno % 100 != 0 or anno % 400 == 0)
    
    for mes in range(0, len(DIAS_MESES)):
        # Formatear número mes para tener 2 dígitos. Ver si año bisiesto
        mes_str = f"{mes + 1:02d}"
        dias_mes = DIAS_MESES[mes] + (1 if anno_bisiesto and mes == 1 else 0)
        
        # Primer intervalo
        intervalo_1_ini = f"{anno_str}-{mes_str}-01"
        intervalo_1_fin = f"{anno_str}-{mes_str}-15"
        intervalo_1 = (intervalo_1_ini, intervalo_1_fin)

        # Segundo intervalo
        intervalo_2_ini = f"{anno_str}-{mes_str}-16"
        intervalo_2_fin = f"{anno_str}-{mes_str}-{dias_mes}"
        intervalo_2 = (intervalo_2_ini, intervalo_2_fin)

        res.append(intervalo_1)
        res.append(intervalo_2)

    print(f"Intervalos de fechas generados para el año {anno}")
    return res


In [5]:
OBS_URL = (
        "https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos"
        "/fechaini/{}T00:00:00UTC"
        "/fechafin/{}T00:00:00UTC"
        "/todasestaciones")

In [6]:
ATTEMPT_LIMIT = 3
API_COOLDOWN = 60

def peticion_api(url: str, api_key: str) -> requests.Response:

    # Configuramos header con la api_key
    headers = {
        'accept': 'application/json',
        'api_key': api_key
    }

    # Reintentamos después de un tiempo en caso de que la API se sature
    attempts = 0
    while attempts < ATTEMPT_LIMIT:
        attempts += 1
        response = requests.get(url, headers=headers)

        # 429: API saturada
        if response.status_code == 429:  # Exceso de peticiones
            cooldown = API_COOLDOWN * attempts
            
            print(f"Error {response.status_code}: Exceso de peticiones. "
                  f"Intento {attempts} de {ATTEMPT_LIMIT}. "
                  f"Esperando {cooldown} segundos...")
            time.sleep(cooldown)

        # Retornar cualquier otra respuesta
        else:
            return response
    
    # Si agotamos número de reintentos, avisar y devolver última respuesta
    print(f"ERROR: Número de reintentos agotados.")
    return response

In [7]:
URL_DATOS = 'datos'
STATUS = 'estado'
ERR_TEXT = 'descripcion'

def procesar_respuesta(response: requests.Response) -> pd.DataFrame:
    # Si fallida, imprimir mensaje de error. Devolver df vacío
    if response.status_code != 200:
        print(f"Error en la solicitud: {response.status_code} - {response.text}")
        return pd.DataFrame()
    
    response_json = response.json()
    if response_json.get(STATUS) == 200:
        url_datos = response_json[URL_DATOS]
        datos_response = requests.get(url_datos)
        if datos_response.status_code == 200:
            return pd.DataFrame(datos_response.json())
        else:
            print(f"Error en la sub-solicitud: {datos_response.status_code} - {datos_response.text}")
    else:
        print(f"Error en datos: {response_json.get(STATUS)} - {response_json.get(ERR_TEXT)}")
    
    # Si falla en alguno, imprimir error y devolver df vacío
    return pd.DataFrame()

In [8]:
PATH_DATOS = 'Datos_Annos'
NOMBRE_FICHERO_DATOS = 'Anno{}.csv'
def generate_csv_anno(anno: int) -> pd.DataFrame:
    # Desgranamos el año en intervalos de 15 días para que la API de AEMET OpenData acepte las peticiones
    intervalos_fechas = generar_intervalos_fechas(anno)

    # Inicializamos el DataFrame
    df = pd.DataFrame()

    # Recorremos el resto de intervalos y vamos concatenando cada DataFrame respuesta al inicial
    for i, intervalo in enumerate(intervalos_fechas):
        url = OBS_URL.format(intervalo[0], intervalo[1])
        print(f"Obteniendo datos: {intervalo[0]} - {intervalo[1]}")

        response = peticion_api(url, API_KEY)
        next_df = procesar_respuesta(response)

        if not next_df.empty:
            df = pd.concat([df, next_df], axis = 0)
        else:
            print(f"ERROR: No se obtuvieron datos: [{intervalo[0]} - {intervalo[1]}]")
            return None
        time.sleep(1) # Evitar sobrecargar la API
    
    # Exportamos el DataFrame resultante a CSV
    df.to_csv(PATH_DATOS + NOMBRE_FICHERO_DATOS.format(anno), sep = ';')
    print(f"Creado CSV para el año {anno}")
    return df
    

In [9]:
generate_csv_anno(2024)

Intervalos de fechas generados para el año 2024
Obteniendo datos: 2024-01-01 - 2024-01-15
Error 429: Exceso de peticiones. Intento 1 de 3. Esperando 60 segundos...
Error 429: Exceso de peticiones. Intento 2 de 3. Esperando 120 segundos...
Obteniendo datos: 2024-01-16 - 2024-01-31
Obteniendo datos: 2024-02-01 - 2024-02-15
Obteniendo datos: 2024-02-16 - 2024-02-29
Obteniendo datos: 2024-03-01 - 2024-03-15
Obteniendo datos: 2024-03-16 - 2024-03-31
Obteniendo datos: 2024-04-01 - 2024-04-15
Obteniendo datos: 2024-04-16 - 2024-04-30
Obteniendo datos: 2024-05-01 - 2024-05-15
Obteniendo datos: 2024-05-16 - 2024-05-31
Obteniendo datos: 2024-06-01 - 2024-06-15
Obteniendo datos: 2024-06-16 - 2024-06-30
Obteniendo datos: 2024-07-01 - 2024-07-15
Obteniendo datos: 2024-07-16 - 2024-07-31
Obteniendo datos: 2024-08-01 - 2024-08-15
Obteniendo datos: 2024-08-16 - 2024-08-31
Obteniendo datos: 2024-09-01 - 2024-09-15
Obteniendo datos: 2024-09-16 - 2024-09-30
Error 429: Exceso de peticiones. Intento 1 de 3

In [10]:
# Metadatos
URL_METADATOS = 'metadatos'

NOMBRE_FICHERO_METADATOS = 'metadatos.txt'

url = OBS_URL.format('2024-01-01', '2024-01-02')

response = peticion_api(url, API_KEY)

if response.status_code != 200:
        print(f"Error en la solicitud: {response.status_code} - {response.text}")
else:    
    response_json = response.json()
    if response_json.get(STATUS) == 200:
        url_metadatos = response_json[URL_METADATOS]
        metadatos_response = requests.get(url_metadatos)
        if metadatos_response.status_code == 200:
            with open(NOMBRE_FICHERO_METADATOS, "w") as fichero_metadatos:
                fichero_metadatos.write(metadatos_response.text)
            print(f"Fichero de metadatos creado correctamente: {NOMBRE_FICHERO_METADATOS}")
        else:
            print(f"Error en la sub-solicitud: {metadatos_response.status_code} - {metadatos_response.text}")
    else:
        print(f"Error en datos: {response_json.get(STATUS)} - {response_json.get(ERR_TEXT)}")

Fichero de metadatos creado correctamente: metadatos.txt
