# 🌦️ AEMET: Descarga climática diaria

Este notebook usa el endpoint de **AEMET OpenData** para descargar datos **diarios** de una **estación (idema)** en bloques de ~6 meses, guarda cada bloque como CSV en una carpeta por ciudad, y luego concatena todo en un único CSV por ciudad.

Lo tenemos que hacer de 6 en 6 meses porque es lo maximo que nos deja descargar AEMET.

## 🧰 Intalación

In [None]:
pip install requests

Note: you may need to restart the kernel to use updated packages.


## ⚙️ Configuración

- **Rango temporal**: (2017-01-01 a 2025-12-31.
- **Chunking**:  **bloques de ~182 días** (≈6 meses) es lo máximo que deja descragar aemet.
- **Endpoint**: `valores/climatologicos/diarios/datos/fechaini/{...}/fechafin/{...}/estacion/{idema}`


In [None]:
import os
import time
import glob
import requests
import pandas as pd
from datetime import datetime, timedelta
from typing import List, Dict, Any, Optional

# 🔐 Tu API Key (usa variable de entorno si prefieres)
API_KEY = os.getenv("AEMET_API_KEY", "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJlbGVuYWFlbWhAZ21haWwuY29tIiwianRpIjoiMWMzYThhZWQtNDJiNC00OTdiLThkMmUtNTI4Y2QzYjBkNWY0IiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE3NTc3NjY3NTYsInVzZXJJZCI6IjFjM2E4YWVkLTQyYjQtNDk3Yi04ZDJlLTUyOGNkM2IwZDVmNCIsInJvbGUiOiIifQ.S3EPS2nAdEuJYcIth_amTuXws0Eytr-xwIpwJJAX4Ms")

# 🗓️ Rango global (igual al original)
START_DATE = datetime(2017, 1, 1)
END_DATE   = datetime(2025, 12, 31)

# 🏙️ Orden de ciudades solicitado
CITY_ORDER = [
    "Tenerife", "Barcelona", "Madrid", "Malaga",
    "Gran Canaria", "Sevilla", "Valencia", "Palma de Mallorca"
]

# 🛰️ Mapeo ciudad ➜ idema (códigos de estación AEMET)

IDEMA_MAP: Dict[str, Optional[str]] = {
    "Madrid": "3195",
    "Sevilla": "5783",
    "Valencia": "8416Y",
    "Barcelona": "0201D",
    "Tenerife": "C449C",
    "Malaga": "6156X",
    "Gran Canaria": "C649I",
    "Palma de Mallorca": "B228",
}

# 📂 Carpeta base de salida
BASE_DIR = "."

# 🔗 Endpoint (mismo patrón que el original)
ENDPOINT_FMT = (
    "https://opendata.aemet.es/opendata/api/valores/"
    "climatologicos/diarios/datos/fechaini/{fechaini}/fechafin/{fechafin}/estacion/{idema}/"
    "?api_key={API_KEY}"
)


## 🔧 Funciones auxiliares

In [None]:
def get_datos_periodo(idema: str, fecha_ini: datetime, fecha_fin: datetime, reintentos: int = 3):
    """Descarga JSON diario desde AEMET para [fecha_ini, fecha_fin] en una estación (idema)."""
    fechaini = fecha_ini.strftime("%Y-%m-%dT00:00:00UTC")
    fechafin = fecha_fin.strftime("%Y-%m-%dT23:59:59UTC")
    url = ENDPOINT_FMT.format(fechaini=fechaini, fechafin=fechafin, idema=idema, API_KEY=API_KEY)

    for intento in range(reintentos):
        try:
            # Paso 1: pedir URL temporal
            resp = requests.get(url, timeout=30)
            resp.raise_for_status()
            data = resp.json()
            datos_url = data.get("datos")
            if not datos_url:
                return []

            # Paso 2: pedir los datos a la URL temporal
            resp2 = requests.get(datos_url, timeout=60)
            resp2.raise_for_status()
            return resp2.json()
        except Exception as e:
            print(f"⚠️ Error {intento+1}/{reintentos} en {fecha_ini.date()}-{fecha_fin.date()}: {e}")
            time.sleep(5)
    return []


def slugify(name: str) -> str:
    s = name.lower()
    s = s.replace(" ", "_").replace("á", "a").replace("é", "e").replace("í", "i").replace("ó", "o").replace("ú", "u").replace("ü", "u").replace("ñ", "n")
    s = s.replace("-", "_")
    return s


## 🕸️ Descarga por ciudad (misma mecánica del original)

- Crea una carpeta `datos_<slug>` por ciudad.
- Descarga en bloques de ~182 días.
- Guarda cada bloque como CSV con el nombre `<slug>_<inicio>_<fin>.csv`.


In [None]:
def descargar_ciudad(ciudad: str, idema: str, start: datetime = START_DATE, end: datetime = END_DATE) -> str:
    slug = slugify(ciudad)
    carpeta = os.path.join(BASE_DIR, f"datos_{slug}")
    os.makedirs(carpeta, exist_ok=True)

    current = start
    while current < end:
        next_date = current + timedelta(days=182)  # ~6 meses
        if next_date > end:
            next_date = end

        print(f"⏳ {ciudad}: {current.date()} → {next_date.date()}")
        datos = get_datos_periodo(idema, current, next_date)

        if datos:
            df = pd.DataFrame(datos)
            fname = os.path.join(carpeta, f"{slug}_{current.date()}_{next_date.date()}.csv")
            df.to_csv(fname, index=False)
            print(f"✅ Guardado {fname} ({len(df)} registros)")
        else:
            print(f"❌ Sin datos {current.date()} → {next_date.date()}")

        current = next_date + timedelta(days=1)

    return carpeta


## 🧩 Unificación de CSVs por ciudad

In [None]:
def unificar_ciudad(ciudad: str) -> Optional[str]:
    slug = slugify(ciudad)
    carpeta = os.path.join(BASE_DIR, f"datos_{slug}")
    if not os.path.isdir(carpeta):
        print(f"⚠️ Carpeta no encontrada: {carpeta}")
        return None

    archivos = glob.glob(os.path.join(carpeta, "*.csv"))
    print(f"📚 {ciudad}: {len(archivos)} archivos CSV encontrados")
    if not archivos:
        return None

    dfs = []
    for path in archivos:
        try:
            dfs.append(pd.read_csv(path))
        except Exception as e:
            print(f"⚠️ Error leyendo {path}: {e}")

    if not dfs:
        print(f"⚠️ No se pudieron leer CSVs para {ciudad}")
        return None

    df_final = pd.concat(dfs, ignore_index=True)
    out_path = os.path.join(BASE_DIR, f"datos_{slug}_unificado.csv")
    df_final.to_csv(out_path, index=False, encoding="utf-8")
    print(f"🎉 {ciudad}: unificado → {out_path} ({len(df_final)} filas)")
    return out_path


## ▶️ Ejecutar para las 8 ciudades

Se recorre el orden solicitado.

In [None]:
def run_all_cities(city_order = CITY_ORDER, idema_map = IDEMA_MAP):
    resultados = []
    for city in city_order:
        idema = idema_map.get(city)
        if not idema:
            print(f"🛈 Sin idema para '{city}'. Añádelo en IDEMA_MAP y vuelve a ejecutar.")
            resultados.append((city, None, None))
            continue

        try:
            carpeta = descargar_ciudad(city, idema)
            unificado = unificar_ciudad(city)
            resultados.append((city, carpeta, unificado))
        except Exception as e:
            print(f"❌ Error con {city}: {e}")
            resultados.append((city, None, None))
    return resultados


run_all_cities()


⏳ Tenerife: 2017-01-01 → 2017-07-02
✅ Guardado ./datos_tenerife/tenerife_2017-01-01_2017-07-02.csv (183 registros)
⏳ Tenerife: 2017-07-03 → 2018-01-01
✅ Guardado ./datos_tenerife/tenerife_2017-07-03_2018-01-01.csv (183 registros)
⏳ Tenerife: 2018-01-02 → 2018-07-03
⚠️ Error 1/3 en 2018-01-02-2018-07-03: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
⚠️ Error 2/3 en 2018-01-02-2018-07-03: ('Connection aborted.', RemoteDisconnected('Remote end closed connection without response'))
✅ Guardado ./datos_tenerife/tenerife_2018-01-02_2018-07-03.csv (183 registros)
⏳ Tenerife: 2018-07-04 → 2019-01-02
✅ Guardado ./datos_tenerife/tenerife_2018-07-04_2019-01-02.csv (183 registros)
⏳ Tenerife: 2019-01-03 → 2019-07-04
✅ Guardado ./datos_tenerife/tenerife_2019-01-03_2019-07-04.csv (183 registros)
⏳ Tenerife: 2019-07-05 → 2020-01-03
✅ Guardado ./datos_tenerife/tenerife_2019-07-05_2020-01-03.csv (183 registros)
⏳ Tenerife: 2020-01-04 → 2020-07-04
✅ Guardado