# Obtención de datos meteorológicos con la API de la AEMET

Constará de varias funciones para obtener los datos históricos a partir del 22 de junio de la API (en la zona de Cangas de Onís como municipio), y luego las previsiones para los siguientes días (en la zona de montaña de los Picos de Europa). Se construirán algunos dataframe con los que podremos construir un CSV y exportarlo. 

> NOTA: Es necesario proporcionar una API KEY para acceder a la AEMET y otra para acceder a ChatGPT.

In [77]:
# Paquetes
from api_key import api_key
from api_key_chatgpt import api_chati
import requests
import json
import os
import pandas as pd
from datetime import datetime, timedelta, timezone
import time

## Definición de constantes

In [78]:
querystring = {"api_key": api_key}
headers = {
	'cache-control': "no-cache"
}

ID_MUNICIPIO = '33012'  # Cangas de Onís
ZONA = 'peu1'  # Zona montañosa Picos de Europa
IDEMA = "1178R"  # Sotres
IDEMA2 = "1176"  # Cangas de Onís
IDEMA3 = "1175X"  # Bulnes
hoy = datetime.now(timezone.utc)

fecha_inicio = "2025-06-22T00:00:00UTC"
fecha_fin = "2025-06-29T00:00:00UTC"

fecha_inicio2 = "2025-07-01T00:00:00UTC"
fecha_fin2 = (hoy - timedelta(days=4)).strftime("%Y-%m-%dT00:00:00UTC")

## Obtención de valores climatológicos pasados

Esta función usa el endpoint de la AEMET para obtener los valores climatológicos por días observados en una determinada estación, dentro de un rango de días especificado. Devuelve el dataframe con las columnas de interés.

In [None]:
def consulta_historicos(inicio: str, fin: str, estacion:str=IDEMA) -> pd.DataFrame | None:
	url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{inicio}/fechafin/{fin}/estacion/{estacion}"

	# Si la información está ya almacenada, la leemos de un fichero
	if os.path.exists(f"datos_aemet_historicos_{inicio}.json"):
		with open(f"datos_aemet_historicos_{inicio}.json") as f:
			prediccion = json.load(f)
	else:
		# Si no, hacemos la petición y guardamos la información devuelta
		response = requests.request("GET", url, headers=headers, params=querystring)

		if response.status_code == 200:

			# Descarga de los datos reales
			datos = response.json()
			url_datos = datos["datos"]
			# print(url_datos)
			response_datos = requests.request("GET", url_datos, headers=headers)

			if response_datos.status_code == 200:
				prediccion = response_datos.json()

				# Almacenar la información devuelta en un fichero
				with open(f"datos_aemet_historicos_{inicio}.json", "w") as f:
					json.dump(prediccion, f)

	if prediccion:
		# Convertir a dataframe y poner la fecha en el índice
		df = pd.DataFrame(prediccion)
		if "fecha" in df.columns:
			df["fecha"] = pd.to_datetime(df["fecha"])

		# Eliminar columnas que no nos interesan
		df_nuevo = df.drop(columns=["indicativo", "nombre", "provincia", "altitud", "horatmin", "horatmax", "tmed", "horaracha", "horaPresMax", "horaPresMin", "horaHrMax", "horaHrMin"])
		
		return df_nuevo

In [None]:
# Cambio en la configuración de pandas para mostrar el dataframe
pd.set_option('display.max_columns', None)      # Muestra todas las columnas
pd.set_option('display.width', None)            # Usa el ancho completo del terminal o Jupyter
pd.set_option('display.expand_frame_repr', False)  # Evita que pandas divida líneas

df_pasado = consulta_historicos(fecha_inicio, fecha_fin)
time.sleep(2)
df_pasado2 = consulta_historicos(fecha_inicio2, fecha_fin2)

# Concatenar ambos dataframes
df_pasado_completo = pd.concat([df_pasado, df_pasado2], ignore_index=True)
print(df_pasado_completo)

        fecha  prec  tmin  tmax dir velmedia racha presMax presMin hrMedia hrMax hrMin
0  2025-06-22   0,0  11,9  20,4  15      1,4   7,2   884,2   881,9      99   100    61
1  2025-06-23   2,0  11,7  25,0  24      2,5  16,1   884,0   882,2      64   100    40
2  2025-06-24  23,8  13,7  26,6  23      5,6  21,7   884,7   878,7      54    94    34
3  2025-06-25   2,0  11,5  19,9  12      3,6  14,7   882,5   875,5      86   100    50
4  2025-06-26   0,0  11,4  18,2  07      1,4   6,1   886,9   882,5      95   100    80
5  2025-06-27   0,0  14,8  23,5  06      2,5   7,5   889,2   886,2      58    88    51
6  2025-06-28   0,0  16,7  26,7  06      2,8   6,7   889,0   887,9      56    90    46
7  2025-06-29   6,0  14,6  28,9  26      1,4  22,2   888,0   884,5      43    85    28
8  2025-07-01   0,4  14,4  29,1  10      2,2   6,9   882,9   880,4      61   100    30
9  2025-07-02   5,8  11,4  16,0  08      3,3  10,0   885,9   879,9     100   100    94
10 2025-07-03  30,6  11,0  17,0  10      3,

Una vez tenemos estos datos, vamos a completarlos con la información obtenida en la observación directa y en las previsiones de esos días. Esto tendrá que hacerse manualmente. 
 
> NOTA: Si se quiere usar este programa para otros fines y se buscan otros datos u otras fechas, habrá que rellenar manualmente estas columnas o dejarlas vacías con comillas.

In [85]:
if df_pasado_completo is not None:
	# low/high/mid
	df_pasado_completo["altonubes"] = ["low", "", "mid", "", "low", "mid", "mid", "mid", "low", "low", "low", "low"]      

	# abundante/escasa/media
	df_pasado_completo["nubosidad"] = ["abundante", "","escasa", "abundante", "escasa", "escasa", "media", "escasa", "abundante", "abundante", "abundante", "abundante"] 

	# chubascos/posible/no
	df_pasado_completo["lluvia"] = ["posible", "", "chubascos", "chubascos", "no", "no", "no", "posible", "posible", "posible", "posible", "posible"]

	# SI/NO  (en base a las imágenes finales)
	df_pasado_completo["SUBIR"] = ["NO", "NO", "SI", "SI", "NO", "SI", "SI", "SI", "NO", "NO", "NO", "NO"]  

	print(df_pasado_completo)

        fecha  prec  tmin  tmax dir velmedia racha presMax presMin hrMedia hrMax hrMin altonubes  nubosidad     lluvia SUBIR
0  2025-06-22   0,0  11,9  20,4  15      1,4   7,2   884,2   881,9      99   100    61       low  abundante    posible    NO
1  2025-06-23   2,0  11,7  25,0  24      2,5  16,1   884,0   882,2      64   100    40                                    NO
2  2025-06-24  23,8  13,7  26,6  23      5,6  21,7   884,7   878,7      54    94    34       mid     escasa  chubascos    SI
3  2025-06-25   2,0  11,5  19,9  12      3,6  14,7   882,5   875,5      86   100    50            abundante  chubascos    SI
4  2025-06-26   0,0  11,4  18,2  07      1,4   6,1   886,9   882,5      95   100    80       low     escasa         no    NO
5  2025-06-27   0,0  14,8  23,5  06      2,5   7,5   889,2   886,2      58    88    51       mid     escasa         no    SI
6  2025-06-28   0,0  16,7  26,7  06      2,8   6,7   889,0   887,9      56    90    46       mid      media         no    SI


## Obtención de previsiones en zona de montaña

Esta función devuelve un dataframe con las previsiones de los próximos 4 días (desde hoy hasta dentro de 3 días). Devuelve también un dataframe con la información.

Como la API de la AEMET en este caso devuelve algunos datos en forma de descripción textual, conviene procesar esa descripción para imputar el valor de las variables con las que trabajamos. Para ello, emplearemos la API de ChatGPT, integrando el LLM en la aplicación, para poder enviarle un prompt y evalúe el texto que le pasemos, transformando su significado en el valor que tomen las variables categóricas que manejamos. 

### Funciones para procesar descripciones con ChatGPT

In [None]:
# Paquetes
from openai import OpenAI

#### 1. Procesamiento del texto sobre la nubosidad:

In [None]:
def procesa_nubes(text):
	client = OpenAI(api_key=api_chati)
	prompt = f"Dado la siguiente descripción sobre la nubosidad de un lugar: '{text}'. Devuelve un JSON con los campos 'altonubes' que tome los valores 'low', 'mid', o 'high' dependiendo de la altura de las nubes; y 'nubosidad' con los valores 'escasa', 'media' o 'abundante' dependiendo de la cantidad de nubes que diga el texto que puede haber. Responde únicamente con el JSON."

	response = client.chat.completions.create(
		model = "gpt-4",
		messages = [
			{"role": "user", "content": prompt}
		]
	)

	return response.choices[0].message.content

print(procesa_nubes("Abundante nubosidad baja en el norte, que podrá reducir la visibilidad localmente. En el resto, poco nuboso o despejado, aumentando la nubosidad por la tarde con el desarrollo de nubes de evolución diurna"))

NotFoundError: Error code: 404 - {'error': {'message': 'The model `gpt-4` does not exist or you do not have access to it.', 'type': 'invalid_request_error', 'param': None, 'code': 'model_not_found'}}

In [22]:
def consulta_mountain(zona=ZONA):
	url = f"https://opendata.aemet.es/opendata/api/prediccion/especifica/montaña/pasada/area/{zona}/dia/"
	dict_respuesta = dict()

	for i in range(4):
		response = requests.request("GET", url+str(i), headers=headers, params=querystring)

		if response.status_code == 200:

			# Descarga de los datos reales
			datos = response.json()
			url_datos = datos["datos"]
			print(url_datos)

			
			response_datos = requests.request("GET", url_datos, headers=headers)

			if response_datos.status_code == 200:
				prediccion = response_datos.json()

				# En base a la respuesta dada, rellenamos un JSON propio
			

In [23]:
consulta_mountain()

https://opendata.aemet.es/opendata/sh/ddf16566
https://opendata.aemet.es/opendata/sh/f886f646
https://opendata.aemet.es/opendata/sh/c8bf7fe4
https://opendata.aemet.es/opendata/sh/359a1f45
