In [1]:
import os
import requests
import time
import pandas as pd
import uuid
from datetime import datetime, date, timedelta
from dotenv import load_dotenv

load_dotenv()
API_KEY = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJqb3JnZXJpdmVyb2RlbG9zcmlvc0BnbWFpbC5jb20iLCJqdGkiOiJiMjlhZmM2Zi0yMTkwLTQ4ZTEtYjlmYy01NGY5OTk3OTc1YjUiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTc0ODk2ODY4NSwidXNlcklkIjoiYjI5YWZjNmYtMjE5MC00OGUxLWI5ZmMtNTRmOTk5Nzk3NWI1Iiwicm9sZSI6IiJ9.90idEjGLaI61xKuPe8sdQtBJ2fdf4gwZmsww11V1VpE"
if not API_KEY:
    raise RuntimeError("‚ùå No se encontr√≥ AEMET_API_KEY en las variables de entorno.")

# ---------------------------------------------------
# Funci√≥n para obtener inventario completo de estaciones
# ---------------------------------------------------
def obtener_inventario_completo():
    url_inv = (
        "https://opendata.aemet.es/opendata/api/"
        "valores/climatologicos/inventarioestaciones/todasestaciones"
    )
    r = requests.get(url_inv, params={"api_key": API_KEY}, timeout=15)
    r.raise_for_status()
    datos_meta = r.json().get("datos")
    if not datos_meta:
        raise RuntimeError("No se obtuvo URL de datos del inventario.")
    r2 = requests.get(datos_meta, timeout=15)
    r2.raise_for_status()
    estaciones = r2.json()
    return pd.DataFrame(estaciones).dropna(subset=["indicativo"])

# ---------------------------------------------------
# Funci√≥n para descargar datos de una estaci√≥n en bloques
# ---------------------------------------------------
def descargar_para_una_estacion(idema, nombre, bloques):
    filas = []
    for fecha_ini, fecha_fin in bloques:
        url_meta = (
            f"https://opendata.aemet.es/opendata/api/valores/"
            f"climatologicos/diarios/datos/fechaini/{fecha_ini}/fechafin/{fecha_fin}/estacion/{idema}"
        )
        try:
            r = requests.get(url_meta, params={"api_key": API_KEY}, timeout=15)
            if r.status_code != 200:
                continue
            url_real = r.json().get("datos")
            if not url_real:
                continue
            rd = requests.get(url_real, timeout=15)
            if rd.status_code != 200:
                continue
            for rec in rd.json():
                rec["idema"] = idema
                rec["nombre_estacion"] = nombre
                filas.append(rec)
            time.sleep(1.2)
        except requests.RequestException:
            continue
    return filas

# ---------------------------------------------------
# Script principal: extraer 10 a√±os, 1 CSV por a√±o
# ---------------------------------------------------
def main():
    os.makedirs("data", exist_ok=True)
    estaciones_df = obtener_inventario_completo()
    
    hoy = date.today()
    a√±o_actual = hoy.year
    a√±os = list(range(a√±o_actual - 9, a√±o_actual + 1))  # √∫ltimos 10 a√±os
    
    for a√±o in a√±os:
        print(f"üì• Extrayendo datos para {a√±o}...")
        start = date(a√±o, 1, 1)
        end   = date(a√±o, 12, 31)
        
        # Dividimos cada a√±o en 2 bloques de ~6 meses para no saturar la API
        bloques = []
        mid = start + timedelta(days=182)
        bloques.append((f"{start.isoformat()}T00:00:00UTC", f"{mid.isoformat()}T00:00:00UTC"))
        bloques.append((f"{(mid+timedelta(days=1)).isoformat()}T00:00:00UTC", f"{end.isoformat()}T00:00:00UTC"))
        
        todas = []
        for _, fila in estaciones_df.iterrows():
            idema = fila["indicativo"]
            nombre = fila.get("nombre", "")
            filas_est = descargar_para_una_estacion(idema, nombre, bloques)
            todas.extend(filas_est)
        
        if todas:
            df_year = pd.DataFrame(todas)
            salida = f"data/temperaturas_{a√±o}.csv"
            df_year.to_csv(salida, index=False)
            print(f"   ‚úÖ Guardado {len(df_year)} registros en '{salida}'")
        else:
            print(f"   ‚ö†Ô∏è No se obtuvieron datos para {a√±o}")

if __name__ == "__main__":
    main()




üì• Extrayendo datos para 2016...
   ‚úÖ Guardado 165590 registros en 'data/temperaturas_2016.csv'
üì• Extrayendo datos para 2017...
   ‚úÖ Guardado 185217 registros en 'data/temperaturas_2017.csv'
üì• Extrayendo datos para 2018...
   ‚úÖ Guardado 134786 registros en 'data/temperaturas_2018.csv'
üì• Extrayendo datos para 2019...
   ‚úÖ Guardado 156595 registros en 'data/temperaturas_2019.csv'
üì• Extrayendo datos para 2020...
   ‚úÖ Guardado 47687 registros en 'data/temperaturas_2020.csv'
üì• Extrayendo datos para 2021...
   ‚ö†Ô∏è No se obtuvieron datos para 2021
üì• Extrayendo datos para 2022...
   ‚ö†Ô∏è No se obtuvieron datos para 2022
üì• Extrayendo datos para 2023...
   ‚ö†Ô∏è No se obtuvieron datos para 2023
üì• Extrayendo datos para 2024...
   ‚úÖ Guardado 146082 registros en 'data/temperaturas_2024.csv'
üì• Extrayendo datos para 2025...
   ‚úÖ Guardado 26870 registros en 'data/temperaturas_2025.csv'
