# Datos Climáticos Estado/Municipio NASA API

El proyecto **"Prediction Of Worldwide Energy Resources (POWER)"** de la **NASA** se inició con el propósito de mejorar los conjuntos de datos relacionados con energía renovable y crear nuevos conjuntos de datos a partir de sistemas de satélites más recientes. Este proyecto tiene como objetivo servir a tres comunidades de usuarios: **(1)** la comunidad de Energía Renovable, **(2)** la de Edificios Sostenibles y **(3)** la de Agroclimatología.

El proyecto **POWER** proporciona conjuntos de datos solares y meteorológicos derivados de la investigación de la NASA para satisfacer las necesidades relacionadas con la energía renovable, la eficiencia energética de los edificios y la agricultura. Estos datos son valiosos debido a su frecuente actualización con un retraso de tan solo un día, lo que los hace disponibles en *"tiempo casi real"*.

Para más información visite el siguiente enlace: https://power.larc.nasa.gov/#resources

Para facilitar el acceso a estos datos, el proyecto POWER ofrece varias opciones:

- Data Access Viewer: Se trata de una aplicación de mapeo web receptiva que proporciona herramientas para subconjuntos de datos, gráficos y visualización en una interfaz fácil de usar.

- API Services Catalog: Este catálogo permite el acceso a los datos de POWER a través de scripts personalizados y aplicaciones escalables, lo que brinda flexibilidad a los usuarios.

- ArcGIS Image Services: Ofrece servicios de imágenes ArcGIS habilitados para el tiempo, lo que permite su uso en sistemas de información geográfica (GIS) para mapeo, visualización y análisis espacial.

- AWS Open Data Registry: El proyecto POWER pone a disposición su tienda de datos en formato NetCDF y Zarr en la nube a través de Amazon Web Services (AWS), lo que facilita el acceso a estos datos desde la nube.

Además de los conjuntos de datos, el proyecto POWER también ofrece recursos adicionales, como notas de lanzamiento, publicaciones, preguntas frecuentes y un foro de usuarios de Earthdata. Estos recursos adicionales ayudan a los usuarios a comprender y utilizar eficazmente los datos proporcionados por el proyecto.

<p align="center">
  <img src="power_logo_event.png" alt="Descripción de la imagen" width="40%" height="40%">
</p>

<p align="center">
  <img src="https://github.com/Axel-Castro/Resource/blob/main/Img/power_logo_event.png" alt="Descripción de la imagen" width="40%" height="40%">
</p>

<p align="center">
  <em>Figura 1: Prediction Of Worldwide Energy Resources (POWER).</em>
</p>

### Importación de librerías

In [81]:
import pandas as pd
import numpy as np
import requests
import datetime
import csv
import os
pd.set_option('display.max_columns', None)

### Creación de directorios

In [82]:
subdir = "./data/"

input_coord_estado = 'data/Data_In/Coordenadas_Centroide_Estado.csv' # Dir de archivo de entrada coordenadas estado
input_coord_municipio = 'data/Data_In/Coordenadas_Centroide_Municipio.csv' # Dir de archivo de entrada coordenadas municipio

output_estado_raw = "data/Estados/Estados_Raw/" # Dir de carpeta de salida estado raw
output_estado_mod = 'data/Estados/Estados_Mod/' # Dir de carpeta de salida estado mod

output_municipio_raw = "data/Municipios/Municipios_Raw/" # Dir de carpeta de salida municipio raw
output_municipio_mod = 'data/Municipios/Municipios_Mod' # Dir de carpeta de salida municipio mod

output_estado = 'data/Estados'
output_municipio = 'data/Municipios'

# Crea la carpeta de salida si no existe
if not os.path.exists(output_estado_raw):
    os.makedirs(output_estado_raw)

if not os.path.exists(output_estado_mod):
    os.makedirs(output_estado_mod)

if not os.path.exists(output_municipio_raw):
    os.makedirs(output_municipio_raw)

if not os.path.exists(output_municipio_mod):
    os.makedirs(output_municipio_mod)


### Creación de Registro

In [83]:
with open(subdir + "clima_info.txt", 'w') as f:
        f.write("Prediction Of Worldwide Energy Resources (POWER) \n")
        info = """

        Fuente: NASA POWER API

        Descripción:
        Este registro de datos climatológicos es una valiosa fuente de información que ofrece un profundo análisis 
        de las condiciones meteorológicas en México. Los datos se obtienen de la API de NASA POWER, que proporciona 
        información detallada sobre diversos parámetros climáticos. Estos datos incluyen, pero no se limitan a, la 
        temperatura, la precipitación, la radiación solar, la velocidad del viento, la humedad relativa y otros 
        indicadores meteorológicos esenciales.

        Cobertura Geográfica:
        Los datos climatológicos se recopilan para los 32 estados y todos los municipios de México (2458), lo que 
        garantiza una cobertura completa de todo el territorio nacional. Esto permite un seguimiento preciso de 
        las condiciones climáticas en áreas urbanas y rurales, así como en zonas remotas.

        Rango de Tiempo:
        Los datos abarcan un período que se extiende desde 2020-01-01 hasta la fecha actual, lo que 
        significa que se pueden acceder a registros históricos y datos en tiempo real. Esto es esencial para el 
        análisis de tendencias a lo largo del tiempo y para la toma de decisiones basadas en datos precisos.

        Parámetros Climáticos:
        El registro incluye una variedad de parámetros climáticos, como la temperatura máxima y mínima diaria, la 
        precipitación acumulada, la radiación solar, la velocidad del viento, la humedad relativa y otros indicadores 
        climáticos relevantes. Estos datos son fundamentales para una amplia gama de aplicaciones, incluyendo la 
        agricultura, la gestión de recursos hídricos, la planificación urbana y la investigación científica.

        Usos Potenciales:
        Este registro de datos climatológicos tiene un amplio rango de aplicaciones, como la optimización de los 
        calendarios de siembra y cosecha en la agricultura, la gestión de la disponibilidad de agua para riego, 
        la planificación de proyectos de energía solar, la evaluación de riesgos climáticos y la toma de decisiones 
        informadas en diversas industrias y sectores.
        
        Este registro se encuentra disponible para consulta y análisis, y puede ser una herramienta valiosa 
        para investigadores, científicos, planificadores y profesionales que requieran datos climatológicos precisos 
        y detallados.

        """ 
        f.write(info + '\n')
        f.write("Descargado el " + datetime.datetime.now().strftime("%Y-%m-%d %H:%M:%S") + "\n")
        f.write('\n')
        f.write("Desde: " + 'https://power.larc.nasa.gov/docs/tutorials/api-getting-started/' + "\n")

## Descarga de Datos a nivel Estatal 

In [84]:
coord_estado = pd.read_csv(input_coord_estado) # Lee archivo de entrada coordenadas estado
estado_nom = coord_estado['Estado'].tolist() # Lista de nombres de estado
estado_ids = coord_estado['Estado_ID'].tolist() # Lista de ids de estado
locations = [(lat, lon) for lat, lon in zip(coord_estado['centroid_lat'], coord_estado['centroid_lon'])] # Lista de coordenadas de estado
coord_estado.head(10)

Unnamed: 0,Estado,Estado_ID,centroid_lat,centroid_lon,Pertenece
0,Zacatecas,MX-ZAC,23.266403,-102.708831,True
1,Yucatán,MX-YUC,20.779755,-88.927237,True
2,Veracruz,MX-VER,19.351889,-96.378018,True
3,Tlaxcala,MX-TLA,19.452613,-98.083483,True
4,Tamaulipas,MX-TAM,24.300779,-98.674508,True
5,Tabasco,MX-TAB,17.932353,-92.618729,True
6,Sonora,MX-SON,29.683748,-110.761555,True
7,Sinaloa,MX-SIN,24.99258,-107.491726,True
8,San Luis Potosí,MX-SLP,22.605843,-100.4516,True
9,Quintana Roo,MX-ROO,19.670401,-88.118478,True


### Definición de Parámetros

- **TS**: Earth Skin Temperature ($°C$) 
- **TS_MAX**: Earth Skin Temperature Maximum ($°C$) 
- **TS_MIN**: Earth Skin Temperature Minimum ($°C$) 
- **T2M**: Temperature at 2 Meters ($°C$) 
- **T2M_MAX**: Temperature at 2 Meters Maximum ($°C$) 
- **T2M_MIN**: Temperature at 2 Meters Minimum ($°C$) 
- **T2MDEW**: Dew/Frost Point at 2 Meters ($°C$) 
- **T2MWET**: Wet Bulb Temperature at 2 Meters ($°C$) 
- **PS**: Surface Pressure ($kPa$) 
- **WS2M**: Wind Speed at 2 Meters ($m/s$) 
- **RH2M**: Relative Humidity at 2 Meters (%) 
- **EVPTRNS**: Evapotranspiration Energy Flux ($kW-hr/m^2/day$) 
- **GWETPROF**: Profile Soil Moisture (%) 
- **CLRSKY_DAYS**: Clear Sky Day ($Days$) 
- **PRECTOTCORR**: Precipitation Corrected ($mm/day$) 
- **SG_DAY_HOURS**: Solar Geometry Day Hours ($Hours$) 
- **MIDDAY_INSOL**: Midday Insolation Incident ($kW-hr/m^2/day$) 

In [85]:
parameter = 'TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL' # Parametros a descargar

start_day = '20200101' # Primer dia del año 2020
end_day =  datetime.datetime.now().strftime('%Y%m%d') # Los Ultimos dias del mes actual vienen con faltantes

base_url = r"https://power.larc.nasa.gov/api/temporal/daily/point?parameters={parameter}&community=RE&longitude={longitude}&latitude={latitude}&start={start_day}&end={end_day}&format=CSV" # URL de consulta

### Descarga de la API

In [98]:
# Descarga de datos por estado
for estado_nom, latitude, longitude in zip(coord_estado['Estado'], coord_estado['centroid_lat'], coord_estado['centroid_lon']): # Itera sobre los estados y sus coordenadas
    api_request_url = base_url.format(longitude=longitude, latitude=latitude, parameter=parameter, start_day=start_day, end_day=end_day) # Forma la URL de consulta

    response = requests.get(url=api_request_url, verify=True, timeout=30.00) # Hace la consulta a la API

    # Si la consulta fue exitosa, guarda el archivo en la carpeta de salida
    if response.status_code == 200:
        content = response.content.decode('utf-8')
        filename = f"Data_{estado_nom}.csv"
        filepath = os.path.join(output_estado_raw, filename)

        with open(filepath, 'wb') as file_object: # Guarda el archivo en la carpeta de salida
            file_object.write(response.content)

print("Datos de estados descargados")

Datos de estados descargados


### Dataframe de prueba

In [99]:
# Consulta datos del primer archivo CSV de la carpeta de salida a forma de prueba
archivos_csv = [archivo for archivo in os.listdir(output_estado_raw) if archivo.endswith('.csv')]

if archivos_csv:
    # Lee el primer archivo CSV de la lista
    primer_archivo = archivos_csv[0]
    ruta_completa_primer_csv = os.path.join(output_estado_raw, primer_archivo)
    df_test = pd.read_csv(ruta_completa_primer_csv,skiprows=25)

print(df_test.shape)
df_test

(1409, 20)


Unnamed: 0,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,2020,1,1,13.37,22.76,6.50,13.30,20.08,7.35,7.12,10.21,79.30,3.91,68.44,0.04,0.43,0.0,6.93,10.0,12.09
1,2020,1,2,10.40,18.46,1.71,10.26,16.07,3.16,5.71,7.99,79.07,4.16,75.94,0.03,0.43,0.0,6.69,10.0,14.65
2,2020,1,3,7.87,21.67,-1.38,7.77,18.33,0.31,-1.83,2.97,79.56,2.52,59.25,0.06,0.44,1.0,0.01,10.0,19.79
3,2020,1,4,6.33,20.80,-3.20,6.06,17.44,-2.65,-8.14,-1.04,80.13,3.05,42.31,0.06,0.43,0.0,0.00,10.0,16.03
4,2020,1,5,7.31,23.21,-3.40,7.55,20.03,-1.74,-8.03,-0.24,80.07,2.41,39.00,0.07,0.43,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1404,2023,11,5,17.08,29.33,9.86,16.15,25.30,9.96,7.14,11.64,79.68,2.06,63.88,-999.00,-999.00,-999.0,0.13,-999.0,-999.00
1405,2023,11,6,18.21,33.52,9.06,17.37,27.40,9.22,5.40,11.38,79.59,1.00,55.06,-999.00,-999.00,-999.0,0.02,-999.0,-999.00
1406,2023,11,7,18.03,30.81,9.77,17.69,27.19,10.37,4.97,11.33,79.61,1.29,48.94,-999.00,-999.00,-999.0,0.00,-999.0,-999.00
1407,2023,11,8,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Transformación de Dataframe

In [101]:
# Obtén la lista de archivos CSV en la carpeta
archivos_csv = [archivo for archivo in os.listdir(output_estado_raw) if archivo.endswith('.csv')]
n = 0 # Contador de toda vida 

# Procesa y transforma cada archivo CSV
for archivo_csv in archivos_csv:

    # Lee el archivo CSV, salta las primeras 25 filas y agrega una columna con el nombre del estado
    ruta_completa = os.path.join(output_estado_raw, archivo_csv)
    df = pd.read_csv(ruta_completa, skiprows=25)
    estado_nom = archivo_csv.split('_')[1].split('.')[0]
    df.insert(0, 'Estado_Nom', estado_nom)

    # Agrega una columna con el ID del estado
    df.insert(1, 'Estado_ID', estado_ids[n])
    n+=1
 
    # Transforma las columnas YEAR, MO y DY en una sola columna de tipo fecha
    #df = df.rename(columns={'YEAR': 'year', 'MO': 'month', 'DY': 'day'})
    #df.insert(0, 'Fecha', pd.to_datetime(df[['year', 'month', 'day']], format='%Y%m%d'))
    #df.drop(columns=['year', 'month', 'day'], inplace=True) 

    # Guarda el archivo CSV procesado en la carpeta de salida
    ruta_completa_salida = os.path.join(output_estado_mod, archivo_csv)
    with open(ruta_completa_salida, 'w') as file_object:
        df.to_csv(file_object, index=False,lineterminator='\n')
    
df.head(10)

Unnamed: 0,Estado_Nom,Estado_ID,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,Zacatecas,MX-AGU,2020,1,1,13.49,22.79,6.98,13.26,20.01,7.52,7.44,10.35,79.5,6.55,70.5,0.01,0.42,0.0,3.97,10.0,8.08
1,Zacatecas,MX-AGU,2020,1,2,9.68,19.83,0.72,8.91,15.9,1.69,1.99,5.45,79.33,4.95,66.06,0.01,0.43,0.0,2.49,10.0,17.16
2,Zacatecas,MX-AGU,2020,1,3,7.39,22.49,-1.85,6.27,17.22,-1.24,-4.01,1.13,79.96,3.94,56.69,0.01,0.42,1.0,0.0,10.0,19.06
3,Zacatecas,MX-AGU,2020,1,4,5.67,22.48,-6.32,5.58,16.76,-3.06,-8.46,-1.45,80.62,1.88,40.38,0.0,0.42,1.0,0.0,10.0,19.46
4,Zacatecas,MX-AGU,2020,1,5,7.58,25.4,-5.63,8.16,20.12,-1.71,-8.05,0.06,80.56,1.98,35.38,0.0,0.42,1.0,0.0,10.0,19.05
5,Zacatecas,MX-AGU,2020,1,6,10.92,28.74,-1.63,10.88,21.42,2.56,-8.14,1.37,80.29,1.77,29.81,0.0,0.42,0.0,0.0,10.0,17.83
6,Zacatecas,MX-AGU,2020,1,7,10.87,24.83,2.65,9.91,19.19,3.3,-3.36,3.28,80.41,3.35,42.62,0.0,0.42,1.0,0.0,10.0,18.71
7,Zacatecas,MX-AGU,2020,1,8,10.85,23.79,0.93,10.33,20.42,1.37,1.12,5.73,80.2,3.02,59.19,0.01,0.42,0.0,0.0,10.0,15.26
8,Zacatecas,MX-AGU,2020,1,9,14.3,28.23,3.67,13.84,23.42,5.25,2.99,8.42,80.01,2.79,52.94,0.01,0.41,0.0,0.0,10.0,14.56
9,Zacatecas,MX-AGU,2020,1,10,13.46,26.1,3.73,13.45,22.69,5.41,1.44,7.44,79.84,5.01,49.25,0.01,0.41,0.0,0.0,10.0,13.96


### Concatenación de Dataframes

In [102]:
# Obtener la lista de archivos CSV en la carpeta
archivos_csv = [archivo for archivo in os.listdir(output_estado_mod)]

# Lista para almacenar los DataFrames individuales
dataframes = []

# Lee y combina los archivos CSV en un solo DataFrame
for archivo_csv in archivos_csv:
    ruta_completa = os.path.join(output_estado_mod, archivo_csv)
    df = pd.read_csv(ruta_completa)
    dataframes.append(df)

# Combina los DataFrames en uno solo
df_combinado = pd.concat(dataframes, ignore_index=True)

df_combinado

Unnamed: 0,Estado_Nom,Estado_ID,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,Aguascalientes,MX-ZAC,2020,1,1,13.37,22.76,6.50,13.30,20.08,7.35,7.12,10.21,79.30,3.91,68.44,0.04,0.43,0.0,6.93,10.0,12.09
1,Aguascalientes,MX-ZAC,2020,1,2,10.40,18.46,1.71,10.26,16.07,3.16,5.71,7.99,79.07,4.16,75.94,0.03,0.43,0.0,6.69,10.0,14.65
2,Aguascalientes,MX-ZAC,2020,1,3,7.87,21.67,-1.38,7.77,18.33,0.31,-1.83,2.97,79.56,2.52,59.25,0.06,0.44,1.0,0.01,10.0,19.79
3,Aguascalientes,MX-ZAC,2020,1,4,6.33,20.80,-3.20,6.06,17.44,-2.65,-8.14,-1.04,80.13,3.05,42.31,0.06,0.43,0.0,0.00,10.0,16.03
4,Aguascalientes,MX-ZAC,2020,1,5,7.31,23.21,-3.40,7.55,20.03,-1.74,-8.03,-0.24,80.07,2.41,39.00,0.07,0.43,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
45083,Zacatecas,MX-AGU,2023,11,5,16.01,28.56,7.69,15.15,23.37,8.76,6.76,10.95,80.16,1.58,64.50,-999.00,-999.00,-999.0,0.14,-999.0,-999.00
45084,Zacatecas,MX-AGU,2023,11,6,17.45,32.50,7.69,16.33,25.71,9.50,5.02,10.67,80.06,1.62,55.38,-999.00,-999.00,-999.0,0.00,-999.0,-999.00
45085,Zacatecas,MX-AGU,2023,11,7,16.43,29.57,8.93,16.30,25.29,10.18,2.08,9.19,80.08,1.50,43.50,-999.00,-999.00,-999.0,0.00,-999.0,-999.00
45086,Zacatecas,MX-AGU,2023,11,8,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Estandarizacion de nombres de columnas

In [104]:
# Definir el nuevo nombre de las columnas
new_columns = ['Estado', 'Estado_ID', 'Año', 'Mes', 'Día', 'Temp_Superficial', 'Temp_Superficial_MAX',
               'Temp_Superficial_MIN', 'Temp_2_Metros', 'Temp_2_Metros_MAX', 'Temp_2_Metros_MIN',
               'Temp_2_Metros_Pto_Congelación', 'Temp_2_Metros_Pto_Húmedo', 'Presión_Superficial',
               'Velocidad_Viento', 'Humedad_Relativa', 'Flujo_Evapotranspiración', 'Perfil_Humedad_Suelo',
               'Dias_Sin_Nubosidad', 'Precipitacion', 'Horas_De_Sol', 'Insolacion_Mediodia']

# Cambiar los nombres de las columnas
df_combinado.columns = new_columns
df_combinado

Unnamed: 0,Estado,Estado_ID,Año,Mes,Día,Temp_Superficial,Temp_Superficial_MAX,Temp_Superficial_MIN,Temp_2_Metros,Temp_2_Metros_MAX,Temp_2_Metros_MIN,Temp_2_Metros_Pto_Congelación,Temp_2_Metros_Pto_Húmedo,Presión_Superficial,Velocidad_Viento,Humedad_Relativa,Flujo_Evapotranspiración,Perfil_Humedad_Suelo,Dias_Sin_Nubosidad,Precipitacion,Horas_De_Sol,Insolacion_Mediodia
0,Aguascalientes,MX-ZAC,2020,1,1,13.37,22.76,6.50,13.30,20.08,7.35,7.12,10.21,79.30,3.91,68.44,0.04,0.43,0.0,6.93,10.0,12.09
1,Aguascalientes,MX-ZAC,2020,1,2,10.40,18.46,1.71,10.26,16.07,3.16,5.71,7.99,79.07,4.16,75.94,0.03,0.43,0.0,6.69,10.0,14.65
2,Aguascalientes,MX-ZAC,2020,1,3,7.87,21.67,-1.38,7.77,18.33,0.31,-1.83,2.97,79.56,2.52,59.25,0.06,0.44,1.0,0.01,10.0,19.79
3,Aguascalientes,MX-ZAC,2020,1,4,6.33,20.80,-3.20,6.06,17.44,-2.65,-8.14,-1.04,80.13,3.05,42.31,0.06,0.43,0.0,0.00,10.0,16.03
4,Aguascalientes,MX-ZAC,2020,1,5,7.31,23.21,-3.40,7.55,20.03,-1.74,-8.03,-0.24,80.07,2.41,39.00,0.07,0.43,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
45083,Zacatecas,MX-AGU,2023,11,5,16.01,28.56,7.69,15.15,23.37,8.76,6.76,10.95,80.16,1.58,64.50,-999.00,-999.00,-999.0,0.14,-999.0,-999.00
45084,Zacatecas,MX-AGU,2023,11,6,17.45,32.50,7.69,16.33,25.71,9.50,5.02,10.67,80.06,1.62,55.38,-999.00,-999.00,-999.0,0.00,-999.0,-999.00
45085,Zacatecas,MX-AGU,2023,11,7,16.43,29.57,8.93,16.30,25.29,10.18,2.08,9.19,80.08,1.50,43.50,-999.00,-999.00,-999.0,0.00,-999.0,-999.00
45086,Zacatecas,MX-AGU,2023,11,8,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Guardado de Dataframe

In [106]:
output_filename = 'Data_Climatic_Diario_Estados_Concat.csv'  # Nombre del archivo de salida
output_path = os.path.join(output_estado, output_filename)

# Guarda el DataFrame combinado en el archivo CSV utilizando with open
with open(output_path, 'w', newline='') as file_object:
    df_combinado.to_csv(file_object, index=False)

## Descarga de Datos a nivel Municipal

In [107]:
coord_municipio = pd.read_csv(input_coord_municipio) # Lee archivo de entrada coordenadas municipio
municipio_nom = coord_municipio['Municipio'].tolist() # Lista de nombres de municipio
locations_mun = [(lat, lon) for lat, lon in zip(coord_municipio['centroid_lat'], coord_municipio['centroid_lon'])]
coord_municipio

Unnamed: 0,Estado_CVE,Municipio_CVE,Municipio,centroid_lat,centroid_lon,Pertenece
0,1,2,Asientos,22.126737,-102.045605,True
1,1,11,San Francisco de los Romo,22.033110,-102.228397,True
2,1,7,Rincón de Romos,22.267232,-102.340802,True
3,1,8,San José de Gracia,22.146885,-102.525446,True
4,1,5,Jesús María,21.932282,-102.445932,True
...,...,...,...,...,...,...
2453,15,90,Tenango del Valle,19.081422,-99.630837,True
2454,15,106,Toluca,19.295633,-99.666356,True
2455,15,58,Nezahualcóyotl,19.422791,-99.023116,True
2456,9,5,Gustavo A. Madero,19.503795,-99.115742,True


Se utilizan los mismos parámetros y el mismo base_url que en el caso a nivel estatal.

In [108]:
# Mismos parametros que para los estados
# mismo base_url que para los estados

start_day = '20200101' # mismo que para los estados
end_day =  datetime.datetime.now().strftime('%Y%m%d')

### Descarga de la API

In [None]:
# Descarga de datos por municipio

# Itera sobre los municipios y sus coordenadas para hacer la consulta a la API
for estado_cve, municipio_cve, municipio_nom, latitude, longitude in zip(coord_municipio['Estado_CVE'], coord_municipio['Municipio_CVE'], coord_municipio['Municipio'], coord_municipio['centroid_lat'], coord_municipio['centroid_lon']): 
    api_request_url = base_url.format(longitude=longitude, latitude=latitude, parameter=parameter, start_day=start_day, end_day=end_day) # Forma la URL de consulta

    response = requests.get(url=api_request_url, verify=True, timeout=30.00) # Hace la consulta a la API

    # Si la consulta fue exitosa, guarda el archivo en la carpeta de salida
    if response.status_code == 200:
        content = response.content.decode('utf-8')
        filename = f"Data-{estado_cve}-{municipio_cve}_{municipio_nom}_{start_day}-{end_day}.csv"
        filepath = os.path.join(output_municipio_raw, filename)

        with open(filepath, 'wb') as file_object: # Guarda el archivo en la carpeta de salida
            file_object.write(response.content)

print("Datos de estados descargados")

### Dataframe de prueba

In [109]:
# Consulta datos del primer archivo CSV de la carpeta de salida a forma de prueba
archivos_csv = [archivo for archivo in os.listdir(output_municipio_raw) if archivo.endswith('.csv')]

if archivos_csv:
    # Lee el primer archivo CSV de la lista
    primer_archivo = archivos_csv[0]
    ruta_completa_primer_csv = os.path.join(output_municipio_raw, primer_archivo)
    df_test = pd.read_csv(ruta_completa_primer_csv,skiprows=25)

print(df_test.shape)
df_test

(1402, 20)


Unnamed: 0,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,2020,1,1,12.91,23.01,6.02,12.88,19.87,7.19,7.03,9.95,78.76,5.12,69.81,0.01,0.50,0.0,13.81,10.0,12.09
1,2020,1,2,11.03,19.21,3.86,10.91,16.86,5.05,6.05,8.48,78.48,6.74,74.31,0.01,0.51,0.0,5.85,10.0,14.65
2,2020,1,3,8.24,21.95,0.26,8.14,18.27,1.51,-1.43,3.36,79.02,3.66,59.56,0.02,0.51,1.0,0.02,10.0,19.79
3,2020,1,4,6.03,20.34,-3.12,5.65,16.12,-1.79,-6.48,-0.42,79.68,3.70,49.56,0.01,0.51,0.0,0.00,10.0,16.03
4,2020,1,5,6.23,22.62,-4.48,6.79,18.73,-1.85,-7.67,-0.44,79.60,3.02,42.12,0.02,0.51,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1397,2023,10,29,21.12,35.68,11.92,19.13,27.32,12.52,12.08,15.60,78.96,1.34,69.88,-999.00,-999.00,-999.0,0.13,-999.0,-999.00
1398,2023,10,30,18.40,30.68,11.73,16.85,24.48,11.74,9.05,12.94,79.00,3.40,67.50,-999.00,-999.00,-999.0,0.20,-999.0,-999.00
1399,2023,10,31,16.31,29.09,8.74,14.51,22.44,8.44,8.58,11.55,79.13,2.99,70.88,-999.00,-999.00,-999.0,1.22,-999.0,-999.00
1400,2023,11,1,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Transforma el DataFrame

In [110]:
# Obtén la lista de archivos CSV en la carpeta
archivos_csv = [archivo for archivo in os.listdir(output_municipio_raw) if archivo.endswith('.csv')]

# Procesa y transforma cada archivo CSV
for archivo_csv in archivos_csv:

    # Lee el archivo CSV, salta las primeras 25 filas y agrega una columna con el nombre del estado
    ruta_completa = os.path.join(output_municipio_raw, archivo_csv)
    df = pd.read_csv(ruta_completa, skiprows=25)
    municipio_nom = archivo_csv.split('_')[1]
    df.insert(0, 'Municipio_Nom', municipio_nom)

    estado_cve = archivo_csv.split('_')[0].split('-')[1] # Agrega una columna con el ID del estado
    df.insert(1, 'Estado_CVE', estado_cve)

    municipio_cve = archivo_csv.split('_')[0].split('-')[2] # Agrega una columna con el ID del municipio
    df.insert(2, 'Municipio_CVE', municipio_cve)
 
    # Transforma las columnas YEAR, MO y DY en una sola columna de tipo fecha
    #df = df.rename(columns={'YEAR': 'year', 'MO': 'month', 'DY': 'day'})
    #df.insert(0, 'Fecha', pd.to_datetime(df[['year', 'month', 'day']], format='%Y%m%d'))
    #df.drop(columns=['year', 'month', 'day'], inplace=True) 

    # Guarda el archivo CSV procesado en la carpeta de salida
    ruta_completa_salida = os.path.join(output_municipio_mod, archivo_csv)
    with open(ruta_completa_salida, 'w') as file_object:
        df.to_csv(file_object, index=False,lineterminator='\n')
        
df.head(10)

Unnamed: 0,Municipio_Nom,Estado_CVE,Municipio_CVE,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,Milpa Alta,9,9,2020,1,1,16.68,28.42,8.19,15.95,23.64,9.95,8.69,12.33,79.27,2.01,66.56,0.07,0.4,0.0,0.0,10.0,19.0
1,Milpa Alta,9,9,2020,1,2,15.65,26.0,8.27,15.13,21.72,10.05,8.13,11.63,79.14,2.38,67.75,0.05,0.4,0.0,0.01,10.0,13.58
2,Milpa Alta,9,9,2020,1,3,13.34,20.68,7.5,13.9,18.54,10.03,7.69,10.8,79.37,1.23,69.56,0.02,0.4,0.0,0.03,10.0,14.83
3,Milpa Alta,9,9,2020,1,4,13.61,27.27,6.36,12.74,22.02,7.15,3.82,8.28,79.75,1.79,59.31,0.06,0.4,0.0,0.12,10.0,19.11
4,Milpa Alta,9,9,2020,1,5,14.05,29.55,4.98,13.68,23.98,5.74,-2.99,5.34,79.7,1.94,35.0,0.06,0.4,1.0,0.0,10.0,20.49
5,Milpa Alta,9,9,2020,1,6,13.88,30.27,2.36,15.44,24.96,7.96,-2.11,6.66,79.53,1.22,32.81,0.06,0.39,1.0,0.11,10.0,20.36
6,Milpa Alta,9,9,2020,1,7,13.77,27.92,4.9,13.42,22.79,6.55,-1.25,6.08,79.54,2.02,41.5,0.05,0.39,0.0,0.02,10.0,18.89
7,Milpa Alta,9,9,2020,1,8,13.12,28.35,3.57,12.65,22.91,4.44,-0.35,6.15,79.57,2.04,47.69,0.05,0.39,1.0,0.0,10.0,20.17
8,Milpa Alta,9,9,2020,1,9,13.52,30.05,1.87,14.63,24.1,6.86,-2.71,5.96,79.4,1.26,33.12,0.05,0.39,1.0,0.0,10.0,20.14
9,Milpa Alta,9,9,2020,1,10,14.02,28.93,3.37,14.84,23.73,7.73,1.39,8.12,79.36,1.44,43.31,0.04,0.39,1.0,0.0,10.0,20.44


### Concatena DataFrames

In [115]:
# Obtener la lista de archivos CSV en la carpeta
archivos_csv = [archivo for archivo in os.listdir(output_municipio_mod)]

# Lista para almacenar los DataFrames individuales
dataframes = []

# Lee y combina los archivos CSV en un solo DataFrame
for archivo_csv in archivos_csv:
    ruta_completa = os.path.join(output_municipio_mod, archivo_csv)
    df = pd.read_csv(ruta_completa)
    dataframes.append(df)

# Combina los DataFrames en uno solo
df_combinado = pd.concat(dataframes, ignore_index=True)

df_combinado

Unnamed: 0,Municipio_Nom,Estado_CVE,Municipio_CVE,YEAR,MO,DY,TS,TS_MAX,TS_MIN,T2M,T2M_MAX,T2M_MIN,T2MDEW,T2MWET,PS,WS2M,RH2M,EVPTRNS,GWETPROF,CLRSKY_DAYS,PRECTOTCORR,SG_DAY_HOURS,MIDDAY_INSOL
0,El Llano,1,10,2020,1,1,12.91,23.01,6.02,12.88,19.87,7.19,7.03,9.95,78.76,5.12,69.81,0.01,0.50,0.0,13.81,10.0,12.09
1,El Llano,1,10,2020,1,2,11.03,19.21,3.86,10.91,16.86,5.05,6.05,8.48,78.48,6.74,74.31,0.01,0.51,0.0,5.85,10.0,14.65
2,El Llano,1,10,2020,1,3,8.24,21.95,0.26,8.14,18.27,1.51,-1.43,3.36,79.02,3.66,59.56,0.02,0.51,1.0,0.02,10.0,19.79
3,El Llano,1,10,2020,1,4,6.03,20.34,-3.12,5.65,16.12,-1.79,-6.48,-0.42,79.68,3.70,49.56,0.01,0.51,0.0,0.00,10.0,16.03
4,El Llano,1,10,2020,1,5,6.23,22.62,-4.48,6.79,18.73,-1.85,-7.67,-0.44,79.60,3.02,42.12,0.02,0.51,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3446111,Milpa Alta,9,9,2023,10,29,17.36,26.55,11.39,17.51,23.84,12.43,13.53,15.52,79.16,0.81,79.31,-999.00,-999.00,-999.0,1.07,-999.0,-999.00
3446112,Milpa Alta,9,9,2023,10,30,16.24,24.74,10.30,16.44,22.36,11.41,11.78,14.11,79.20,1.09,76.50,-999.00,-999.00,-999.0,0.08,-999.0,-999.00
3446113,Milpa Alta,9,9,2023,10,31,15.48,24.34,9.40,15.36,21.87,10.44,11.56,13.46,79.28,1.26,79.75,-999.00,-999.00,-999.0,0.89,-999.0,-999.00
3446114,Milpa Alta,9,9,2023,11,1,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Estadarización de nombres de columnas

In [116]:
 # Definir diccionario para el nuevo nombre de las columnas de estados
estados_mexico = {
    'Aguascalientes': 1, 'Baja California': 2, 'Baja California Sur': 3, 'Campeche': 4, 'Coahuila': 5, 'Colima': 6, 'Chiapas': 7,
    'Chihuahua': 8, 'Ciudad de México': 9, 'Durango': 10, 'Guanajuato': 11, 'Guerrero': 12, 'Hidalgo': 13, 'Jalisco': 14,
    'México': 15, 'Michoacán': 16, 'Morelos': 17, 'Nayarit': 18, 'Nuevo León': 19, 'Oaxaca': 20, 'Puebla': 21, 'Querétaro': 22,
    'Quintana Roo': 23, 'San Luis Potosí': 24, 'Sinaloa': 25, 'Sonora': 26, 'Tabasco': 27, 'Tamaulipas': 28, 'Tlaxcala': 29,
    'Veracruz': 30, 'Yucatán': 31, 'Zacatecas': 32
}

# Definir el nuevo nombre de las columnas
new_columns = ['Estado', 'Municipio', 'Estado_CVE', 'Municipio_CVE', 'Año', 'Mes', 'Día', 'Temp_Superficial', 'Temp_Superficial_MAX',
               'Temp_Superficial_MIN', 'Temp_2_Metros', 'Temp_2_Metros_MAX', 'Temp_2_Metros_MIN',
               'Temp_2_Metros_Pto_Congelación', 'Temp_2_Metros_Pto_Húmedo', 'Presión_Superficial',
               'Velocidad_Viento', 'Humedad_Relativa', 'Flujo_Evapotranspiración', 'Perfil_Humedad_Suelo',
               'Dias_Sin_Nubosidad', 'Precipitacion', 'Horas_De_Sol', 'Insolacion_Mediodia']

In [117]:
# Crear la nueva columna 'Estado' utilizando el mapeo
df_combinado.insert(0, 'Estado', df_combinado['Estado_CVE'].map({v: k for k, v in estados_mexico.items()}))
df_combinado.columns = new_columns
df_combinado

Unnamed: 0,Estado,Municipio,Estado_CVE,Municipio_CVE,Año,Mes,Día,Temp_Superficial,Temp_Superficial_MAX,Temp_Superficial_MIN,Temp_2_Metros,Temp_2_Metros_MAX,Temp_2_Metros_MIN,Temp_2_Metros_Pto_Congelación,Temp_2_Metros_Pto_Húmedo,Presión_Superficial,Velocidad_Viento,Humedad_Relativa,Flujo_Evapotranspiración,Perfil_Humedad_Suelo,Dias_Sin_Nubosidad,Precipitacion,Horas_De_Sol,Insolacion_Mediodia
0,Aguascalientes,El Llano,1,10,2020,1,1,12.91,23.01,6.02,12.88,19.87,7.19,7.03,9.95,78.76,5.12,69.81,0.01,0.50,0.0,13.81,10.0,12.09
1,Aguascalientes,El Llano,1,10,2020,1,2,11.03,19.21,3.86,10.91,16.86,5.05,6.05,8.48,78.48,6.74,74.31,0.01,0.51,0.0,5.85,10.0,14.65
2,Aguascalientes,El Llano,1,10,2020,1,3,8.24,21.95,0.26,8.14,18.27,1.51,-1.43,3.36,79.02,3.66,59.56,0.02,0.51,1.0,0.02,10.0,19.79
3,Aguascalientes,El Llano,1,10,2020,1,4,6.03,20.34,-3.12,5.65,16.12,-1.79,-6.48,-0.42,79.68,3.70,49.56,0.01,0.51,0.0,0.00,10.0,16.03
4,Aguascalientes,El Llano,1,10,2020,1,5,6.23,22.62,-4.48,6.79,18.73,-1.85,-7.67,-0.44,79.60,3.02,42.12,0.02,0.51,1.0,0.00,10.0,19.88
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
3446111,Ciudad de México,Milpa Alta,9,9,2023,10,29,17.36,26.55,11.39,17.51,23.84,12.43,13.53,15.52,79.16,0.81,79.31,-999.00,-999.00,-999.0,1.07,-999.0,-999.00
3446112,Ciudad de México,Milpa Alta,9,9,2023,10,30,16.24,24.74,10.30,16.44,22.36,11.41,11.78,14.11,79.20,1.09,76.50,-999.00,-999.00,-999.0,0.08,-999.0,-999.00
3446113,Ciudad de México,Milpa Alta,9,9,2023,10,31,15.48,24.34,9.40,15.36,21.87,10.44,11.56,13.46,79.28,1.26,79.75,-999.00,-999.00,-999.0,0.89,-999.0,-999.00
3446114,Ciudad de México,Milpa Alta,9,9,2023,11,1,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.00,-999.0,-999.00,-999.0,-999.00


### Guarda el DataFrame en un archivo CSV

In [118]:
output_filename = 'Data_Climatic_Municipios_Concat.csv'  # Nombre del archivo de salida
output_path = os.path.join(output_municipio, output_filename)

# Guarda el DataFrame combinado en el archivo CSV utilizando with open
with open(output_path, 'w', newline='') as file_object:
    df_combinado.to_csv(file_object, index=False)

# Listo! Por ahora...