In [1]:
import requests
import pandas as pd
from datetime import datetime, timedelta

API_KEY = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhbHZhcm9tYXJmbG9AZ21haWwuY29tIiwianRpIjoiMTgzZmUwNzktM2I2NC00ZjIxLWE3ZTQtODU3ZjEwNWQ4ZmU3IiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE3NDE3OTI4MDAsInVzZXJJZCI6IjE4M2ZlMDc5LTNiNjQtNGYyMS1hN2U0LTg1N2YxMDVkOGZlNyIsInJvbGUiOiIifQ.OJRFxHD0d2441n2hsr24fIKrbG5hqWZxiP_5EMqXUQs"  # <--- Reemplaza con tu token real
NOMBRE_PICKLE = "datos_temp_municipios_multi_anio.pkl"

municipios = {
    "Málaga Aeropuerto": "6156X", "Ronda": "5427X", "Vélez-Málaga": "6178I", "Antequera": "6138I",
    "Nerja": "6130X", "Marbella": "6155A", "Fuengirola": "6154X", "Torremolinos": "6152A",
    "Estepona": "C108D", "Archidona": "6084O", "Granada Aeropuerto": "5582H", "Madrid Retiro": "3194U",
    "Alhaurín de la Torre": "6166X", "Alhaurín el Grande": "6165X", "Álora": "6140X", "Benalmádena": "6153A",
    "Cártama": "6160X", "Coín": "6164X", "Manilva": "C109D", "Mijas": "6159X", "Pizarra": "6141X",
    "Rincón de la Victoria": "6172X", "Torrox": "6179I"
}

anios = [2020,2021,2022,2023, 2024]  # Lista de años que quieres consultar


def comprobar_acceso_aemet(api_key):
    test_url = "https://opendata.aemet.es/opendata/api/observacion/convencional/todas"
    headers = {"cache-control": "no-cache", "api_key": api_key}
    try:
        resp = requests.get(test_url, headers=headers)
        return resp.status_code == 200
    except Exception as e:
        print(f"[ERROR] Excepción al conectar con AEMET: {e}")
        return False

def obtener_url_datos(estacion, f_ini, f_fin, api_key):
    url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{f_ini}/fechafin/{f_fin}/estacion/{estacion}"
    headers = {"cache-control": "no-cache", "api_key": api_key}
    resp = requests.get(url, headers=headers)
    if resp.status_code == 200 and "datos" in resp.json():
        return resp.json()["datos"]
    return None

def obtener_datos_estacion(url_datos):
    if url_datos:
        resp = requests.get(url_datos)
        if resp.status_code == 200:
            return resp.json()
    return []

def procesar_datos(datos, nombre_municipio):
    registros = []
    for dia in datos:
        fecha = dia.get("fecha")
        tmed = dia.get("tmed")
        registros.append({"Municipio": nombre_municipio, "Fecha": fecha, "Tmed": tmed})
    return registros


def obtener_datos_municipios(municipios, anios, api_key):
    registros_totales = []
    for anio in anios:
        fecha_inicio_anio = datetime(anio, 1, 1)
        fecha_fin_anio = datetime(anio, 12, 31)
        fecha_actual = fecha_inicio_anio
        while fecha_actual <= fecha_fin_anio:
            fecha_fin_periodo = fecha_actual + timedelta(days=180)  # 6 meses
            if fecha_fin_periodo > fecha_fin_anio:
                fecha_fin_periodo = fecha_fin_anio
            
            f_ini = fecha_actual.strftime("%Y-%m-%dT00:00:00UTC")
            f_fin = fecha_fin_periodo.strftime("%Y-%m-%dT23:59:59UTC")
            
            for nombre, codigo in municipios.items():
                url_datos = obtener_url_datos(codigo, f_ini, f_fin, api_key)
                datos = obtener_datos_estacion(url_datos)
                if datos:
                    print(f"[INFO] Datos exitosos para {nombre} ({codigo}) desde {f_ini} hasta {f_fin}. Registros: {len(datos)}")
                    registros_totales.extend(procesar_datos(datos, nombre))
                else:
                    print(f"[ERROR] Fallo (o sin datos) para {nombre} ({codigo}) desde {f_ini} hasta {f_fin}.")
            
            fecha_actual = fecha_fin_periodo + timedelta(days=1)
    return pd.DataFrame(registros_totales)
    
def filtrar_municipios_con_registros(df):
    municipios_con_datos = df['Municipio'].unique()
    return df[df['Municipio'].isin(municipios_con_datos)]

def transformar_df_municipios_columnas(df):
    """
    Transforma un DataFrame con datos de temperatura por municipio y fecha
    en un DataFrame donde cada municipio es una columna.

    Args:
        df (pd.DataFrame): DataFrame con columnas 'Municipio', 'Fecha', 'Tmed'.

    Returns:
        pd.DataFrame: DataFrame transformado con municipios como columnas.
    """

    # 1. Pivotar el DataFrame
    df_pivot = df.pivot(index='Fecha', columns='Municipio', values='Tmed')

    # 2. Reiniciar el índice para tener 'Fecha' como columna
    df_pivot.reset_index(inplace=True)

    return df_pivot

In [4]:
GET_DATA = True
if GET_DATA:    
    if comprobar_acceso_aemet(API_KEY):
        df = obtener_datos_municipios(municipios, anios, API_KEY)
        df = filtrar_municipios_con_registros(df)
        df.sort_values(by=["Municipio", "Fecha"], inplace=True)
        print("\n[INFO] Primeras filas del DataFrame:\n", df.head(10))
        df.to_pickle(f'{NOMBRE_PICKLE}.pkl')
        print(f"\n[INFO] DataFrame guardado en '{NOMBRE_PICKLE}'.")
    else:
        print("[ERROR] No se puede continuar sin acceso a la API de AEMET.")

[INFO] Datos exitosos para Málaga Aeropuerto (6156X) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC. Registros: 181
[INFO] Datos exitosos para Ronda (5427X) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC. Registros: 181
[ERROR] Fallo (o sin datos) para Vélez-Málaga (6178I) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC.
[ERROR] Fallo (o sin datos) para Antequera (6138I) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC.
[ERROR] Fallo (o sin datos) para Nerja (6130X) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC.
[INFO] Datos exitosos para Marbella (6155A) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC. Registros: 181
[ERROR] Fallo (o sin datos) para Fuengirola (6154X) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC.
[ERROR] Fallo (o sin datos) para Torremolinos (6152A) desde 2020-01-01T00:00:00UTC hasta 2020-06-29T23:59:59UTC.
[ERROR] Fallo (o sin datos) para Estepona (C108D) desde 2020-01-01T00:00:00UTC hasta 20

In [5]:
df_columnas = transformar_df_municipios_columnas(df)
df_columnas.to_pickle(f'{NOMBRE_PICKLE}_columnas.pkl')

In [7]:
df.Municipio.unique()

array(['Madrid Retiro', 'Marbella', 'Málaga Aeropuerto',
       'Rincón de la Victoria', 'Ronda'], dtype=object)