In [4]:
# Celda 1: Lista de Provincias y Capitales de Ecuador
provincias_ecuador = {
    "Azuay": {"capital": "Cuenca", "lat": -2.9006, "lon": -79.0045},
    "Bolívar": {"capital": "Guaranda", "lat": -1.5926, "lon": -79.0440},
    "Cañar": {"capital": "Azogues", "lat": -2.7396, "lon": -78.8456},
    "Carchi": {"capital": "Tulcán", "lat": 0.8119, "lon": -77.7178},
    "Chimborazo": {"capital": "Riobamba", "lat": -1.6598, "lon": -78.6558},
    "Cotopaxi": {"capital": "Latacunga", "lat": -0.9333, "lon": -78.6158},
    "El Oro": {"capital": "Machala", "lat": -3.2581, "lon": -79.9605},
    "Esmeraldas": {"capital": "Esmeraldas", "lat": 0.9661, "lon": -79.6540},
    "Galápagos": {"capital": "Puerto Baquerizo Moreno", "lat": -0.8967, "lon": -89.6057},
    "Guayas": {"capital": "Guayaquil", "lat": -2.1897, "lon": -79.8847},
    "Imbabura": {"capital": "Ibarra", "lat": 0.3517, "lon": -78.1223},
    "Loja": {"capital": "Loja", "lat": -4.0079, "lon": -79.2153},
    "Los Ríos": {"capital": "Babahoyo", "lat": -1.8224, "lon": -79.5346},
    "Manabí": {"capital": "Portoviejo", "lat": -1.0546, "lon": -80.4544},
    "Morona Santiago": {"capital": "Macas", "lat": -2.3131, "lon": -78.1136},
    "Napo": {"capital": "Tena", "lat": -0.9938, "lon": -77.8144},
    "Orellana": {"capital": "Puerto Francisco de Orellana", "lat": -0.4658, "lon": -76.9876},
    "Pastaza": {"capital": "Puyo", "lat": -1.4914, "lon": -78.0024},
    "Pichincha": {"capital": "Quito", "lat": -0.1807, "lon": -78.4678},
    "Santa Elena": {"capital": "Santa Elena", "lat": -2.2269, "lon": -80.8556},
    "Santo Domingo de los Tsáchilas": {"capital": "Santo Domingo", "lat": -0.2530, "lon": -79.1754},
    "Sucumbíos": {"capital": "Nueva Loja", "lat": 0.0740, "lon": -77.3586},
    "Tungurahua": {"capital": "Ambato", "lat": -1.2422, "lon": -78.6228},
    "Zamora Chinchipe": {"capital": "Zamora", "lat": -4.0667, "lon": -79.1083}
}

print(f"Se han definido {len(provincias_ecuador)} provincias.")

Se han definido 24 provincias.


In [10]:
# Celda 2 (Final): Descarga de 5 años de datos climáticos desde NASA Power API
import pandas as pd
import requests
import time
import os

# Crear directorio para guardar datos crudos si no existe
if not os.path.exists('../data/raw'):
    os.makedirs('../data/raw')

# Lista para almacenar los dataframes de cada provincia
all_data_nasa = []

# Parámetros base para la API
base_url_nasa = "https://power.larc.nasa.gov/api/temporal/daily/point"
# --- FECHAS PARA 5 AÑOS ---
start_date_int = 20190101
end_date_int = 20231231
parameters_nasa = "ALLSKY_SFC_SW_DWN,WS10M,T2M,PRECTOTCORR"

print(f"--- Iniciando descarga desde NASA Power API ({start_date_int} a {end_date_int}) ---")

for provincia, info in provincias_ecuador.items():
    params = {
        "start": start_date_int,
        "end": end_date_int,
        "latitude": info['lat'],
        "longitude": info['lon'],
        "community": "SB",
        "parameters": parameters_nasa,
        "format": "JSON"
    }
    try:
        response = requests.get(base_url_nasa, params=params, timeout=60) # Aumentamos el timeout por ser más datos
        if response.status_code == 200:
            data = response.json()
            df = pd.DataFrame(data['properties']['parameter'])
            df.index = pd.to_datetime(df.index)
            df['provincia'] = provincia
            all_data_nasa.append(df)
            print(f"✅ Datos descargados para {provincia}")
        else:
            print(f"❌ Error al descargar datos para {provincia}. Status: {response.status_code}")
    except Exception as e:
        print(f"❌ Excepción al descargar datos para {provincia}: {e}")
    
    # Pausa para no sobrecargar la API
    time.sleep(0.5)

if all_data_nasa:
    # Concatenar todos los dataframes en uno solo
    df_nasa_final = pd.concat(all_data_nasa)
    # Guardar en un archivo CSV
    output_path = '../data/raw/datos_climaticos_nasa_5años.csv'
    df_nasa_final.to_csv(output_path)
    print(f"\n--- Descarga de NASA Power completada y guardada en '{output_path}' ---")
    display(df_nasa_final.head())
    print(f"\nShape del dataset final: {df_nasa_final.shape}")
else:
    print("\n--- No se pudo descargar ningún dato de NASA Power ---")


--- Iniciando descarga desde NASA Power API (20190101 a 20231231) ---
✅ Datos descargados para Azuay
✅ Datos descargados para Bolívar
✅ Datos descargados para Cañar
✅ Datos descargados para Carchi
✅ Datos descargados para Chimborazo
✅ Datos descargados para Cotopaxi
✅ Datos descargados para El Oro
✅ Datos descargados para Esmeraldas
✅ Datos descargados para Galápagos
✅ Datos descargados para Guayas
✅ Datos descargados para Imbabura
✅ Datos descargados para Loja
✅ Datos descargados para Los Ríos
✅ Datos descargados para Manabí
✅ Datos descargados para Morona Santiago
✅ Datos descargados para Napo
✅ Datos descargados para Orellana
✅ Datos descargados para Pastaza
✅ Datos descargados para Pichincha
✅ Datos descargados para Santa Elena
✅ Datos descargados para Santo Domingo de los Tsáchilas
✅ Datos descargados para Sucumbíos
✅ Datos descargados para Tungurahua
✅ Datos descargados para Zamora Chinchipe

--- Descarga de NASA Power completada y guardada en '../data/raw/datos_climaticos_nasa_5

Unnamed: 0,ALLSKY_SFC_SW_DWN,WS10M,T2M,PRECTOTCORR,provincia
2019-01-01,160.59,4.9,12.55,0.14,Azuay
2019-01-02,185.62,5.19,14.09,0.06,Azuay
2019-01-03,148.69,4.35,14.21,0.45,Azuay
2019-01-04,181.2,4.27,13.64,0.92,Azuay
2019-01-05,155.28,3.84,13.63,0.52,Azuay



Shape del dataset final: (43824, 5)


In [11]:
# Celda 5 (Final): Enriquecer los datos de NASA con altitud usando un diccionario estático
import pandas as pd
import os

# Cargar el dataset de 5 años de NASA Power que acabamos de crear
try:
    df_clima_nasa = pd.read_csv('../data/raw/datos_climaticos_nasa_5años.csv', index_col=0)
    df_clima_nasa.index = pd.to_datetime(df_clima_nasa.index)
    print("Dataset de NASA Power (5 años) cargado exitosamente.")
except FileNotFoundError:
    print("Error: Asegúrate de haber ejecutado la celda anterior para generar el archivo CSV.")
    df_clima_nasa = pd.DataFrame()

# Proceder solo si el dataset se cargó correctamente
if not df_clima_nasa.empty:
    # Crear el directorio 'processed' si no existe
    if not os.path.exists('../data/processed'):
        os.makedirs('../data/processed')

    # Diccionario robusto con la altitud de las capitales de Ecuador (en metros)
    altitudes_capitales = {
        "Azuay": 2560, "Bolívar": 2750, "Cañar": 2418, "Carchi": 2950,
        "Chimborazo": 3600, "Cotopaxi": 2850, "El Oro": 8, "Esmeraldas": 15,
        "Galápagos": 0, "Guayas": 8, "Imbabura": 2225, "Loja": 2060,
        "Los Ríos": 30, "Manabí": 20, "Morona Santiago": 1050, "Napo": 500,
        "Orellana": 300, "Pastaza": 950, "Pichincha": 2850, "Santa Elena": 35,
        "Santo Domingo de los Tsáchilas": 625, "Sucumbíos": 300, "Tungurahua": 2650,
        "Zamora Chinchipe": 970
    }

    print("\n--- Añadiendo altitud usando el diccionario estático ---")
    
    # Mapear las altitudes al dataframe principal de NASA
    df_clima_nasa['altitud'] = df_clima_nasa['provincia'].map(altitudes_capitales)
    
    print("--- Datos de NASA enriquecidos con altitud ---")
    display(df_clima_nasa.head())
    
    # Verificar que no haya valores nulos en altitud
    if df_clima_nasa['altitud'].isnull().any():
        print("\n⚠️ Advertencia: Algunas provincias no pudieron ser mapeadas con altitud.")
    else:
        print("\n✅ Todas las provincias tienen un valor de altitud asignado.")

    # Guardar el dataset final enriquecido
    output_path = '../data/processed/datos_climaticos_geograficos_nasa_5años.csv'
    df_clima_nasa.to_csv(output_path)
    print(f"\n--- Dataset maestro (5 años + altitud) guardado en '{output_path}' ---")


Dataset de NASA Power (5 años) cargado exitosamente.

--- Añadiendo altitud usando el diccionario estático ---
--- Datos de NASA enriquecidos con altitud ---


Unnamed: 0,ALLSKY_SFC_SW_DWN,WS10M,T2M,PRECTOTCORR,provincia,altitud
2019-01-01,160.59,4.9,12.55,0.14,Azuay,2560
2019-01-02,185.62,5.19,14.09,0.06,Azuay,2560
2019-01-03,148.69,4.35,14.21,0.45,Azuay,2560
2019-01-04,181.2,4.27,13.64,0.92,Azuay,2560
2019-01-05,155.28,3.84,13.63,0.52,Azuay,2560



✅ Todas las provincias tienen un valor de altitud asignado.

--- Dataset maestro (5 años + altitud) guardado en '../data/processed/datos_climaticos_geograficos_nasa_5años.csv' ---
