# 1. Primera explroación de la obtención de los datos a través de OpenData API

- https://opendata.aemet.es/dist/index.html?

## Se consigue mi API KEY en la siguiente página web

- https://opendata.aemet.es/centrodedescargas/altaUsuario

Guardo mi API KEY en un fichero de texto

In [1]:
import os

with open('API_KEY_AEMET.txt') as f:
    API_KEY = f.readline().strip()

print(f"Mi API Key es: \n\n{API_KEY}")

Mi API Key es: 

eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJmZWxpeHRjbDk3QGdtYWlsLmNvbSIsImp0aSI6ImFmYTVjNjEwLTNmNmUtNDNhZS1iYTZiLWI0OTkyOTM2NTY2ZSIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNzQwOTM4NzY4LCJ1c2VySWQiOiJhZmE1YzYxMC0zZjZlLTQzYWUtYmE2Yi1iNDk5MjkzNjU2NmUiLCJyb2xlIjoiIn0.-D_-Zb0rh0kAgHJgGZOM_QCCKaNZhgDuP4wQPo2Bw7E


## Ejecuto el código pertinente para la obtención de los datos. Pruebo con la estación de Madrid - Retrio

![image.png](attachment:image.png)

- El rango de fechas no ha de ser superior a 6 meses

In [2]:
import requests
import json

fecha_ini = "2024-01-01T00:00:00UTC"
fecha_fin = "2024-12-31T23:59:59UTC"
estacion_id = "3195"  # Ejemplo de estación meteorológica de Madrid-Retiro

url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_ini}/fechafin/{fecha_fin}/estacion/{estacion_id}?api_key={API_KEY}"

response = requests.get(url)
if response.status_code == 200:
    data = response.json()
    print(json.dumps(data, indent=4, ensure_ascii=False))
    datos_url = data.get("datos")
    if datos_url:
        response_data = requests.get(datos_url)
        if response_data.status_code == 200:
            datos_historicos = response_data.json()
            print(json.dumps(datos_historicos, indent=4, ensure_ascii=False))
        else:
            print("Error al obtener los datos reales")
    else:
        print("No se encontró la URL de datos")
else:
    print("Error en la petición inicial, código de error:", response.status_code)

{
    "descripcion": "El rango de fechas no puede ser superior a 6 meses",
    "estado": 404
}
No se encontró la URL de datos


## Se intenta descargar los datos de todas las estaciones

![image.png](attachment:image.png)

- El rango de fechas no ha de ser superior a 15 días

In [3]:
import requests
import json

fecha_ini = "2024-01-01T00:00:00UTC"
fecha_fin = "2024-01-31T23:59:59UTC"

url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_ini}/fechafin/{fecha_fin}/todasestaciones?api_key={API_KEY}"

response = requests.get(url)
if response.status_code == 200:
    data = response.json()
    print(json.dumps(data, indent=4, ensure_ascii=False))
    datos_url = data.get("datos")
    if datos_url:
        response_data = requests.get(datos_url)
        if response_data.status_code == 200:
            datos_historicos = response_data.json()
            print(json.dumps(datos_historicos, indent=4, ensure_ascii=False))
        else:
            print("Error al obtener los datos reales")
    else:
        print("No se encontró la URL de datos")
else:
    print("Error en la petición inicial, código de error:", response.status_code)

{
    "descripcion": "El rango de fechas no puede ser superior a 15 dias",
    "estado": 404
}
No se encontró la URL de datos


# 2. Segunda exploración. Se analiza el JSON que se descarga de la estación meteorológica de Madird - Retiro (id: 3195)

In [4]:
import datetime

ahora = datetime.datetime.now()
dia_1_mes_actual = datetime.datetime(ahora.year, ahora.month, 1)

ahora = ahora.strftime("%Y-%m-%dT%H:%M:%SUTC")
dia_1_mes_actual = dia_1_mes_actual.strftime("%Y-%m-%dT%H:%M:%SUTC")

print(ahora)
print(dia_1_mes_actual)

2025-03-16T18:14:47UTC
2025-03-01T00:00:00UTC


In [5]:
import requests
import json

fecha_ini = dia_1_mes_actual
fecha_fin = ahora

estacion_id = "3195"  # Ejemplo de estación meteorológica de Madrid-Retiro

url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_ini}/fechafin/{fecha_fin}/estacion/{estacion_id}?api_key={API_KEY}"

response = requests.get(url)
if response.status_code == 200:
    data = response.json()
    print(json.dumps(data, indent=4, ensure_ascii=False))
    datos_url = data.get("datos")
    if datos_url:
        response_data = requests.get(datos_url)
        if response_data.status_code == 200:
            datos_historicos = response_data.json()
            print(json.dumps(datos_historicos, indent=4, ensure_ascii=False))
        else:
            print("Error al obtener los datos reales")
    else:
        print("No se encontró la URL de datos")
else:
    print("Error en la petición inicial, código de error:", response.status_code)

{
    "descripcion": "exito",
    "estado": 200,
    "datos": "https://opendata.aemet.es/opendata/sh/cb43c705",
    "metadatos": "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}
[
    {
        "fecha": "2025-03-01",
        "indicativo": "3195",
        "nombre": "MADRID, RETIRO",
        "provincia": "MADRID",
        "altitud": "667",
        "tmed": "7,4",
        "prec": "12,0",
        "tmin": "4,0",
        "horatmin": "23:59",
        "tmax": "10,8",
        "horatmax": "00:10",
        "dir": "99",
        "velmedia": "3,3",
        "racha": "9,2",
        "horaracha": "Varias",
        "presMax": "940,7",
        "horaPresMax": "23",
        "presMin": "936,0",
        "horaPresMin": "04",
        "hrMedia": "94",
        "hrMax": "98",
        "horaHrMax": "Varias",
        "hrMin": "64",
        "horaHrMin": "00:00"
    },
    {
        "fecha": "2025-03-02",
        "indicativo": "3195",
        "nombre": "MADRID, RETIRO",
        "provincia": "MADRID",
        "altitud"

Guardo el json descargado en un fichero .json

In [6]:
with open(f"datos_historicos_estacion_{estacion_id}.json", "w") as f:
    json.dump(datos_historicos, f, indent=4, ensure_ascii=False)

## Tras observar el JSON, se observa que hay un retraso de 4 días en los datos

La fecha máxima descargada es

In [7]:
fechas = [fecha['fecha'] for fecha in datos_historicos]
fecha_max_descargada = max(fechas)
print(fecha_max_descargada)

2025-03-13


In [8]:
from datetime import datetime

# Convert fecha_max_descargada to datetime
fecha_max = datetime.strptime(fecha_max_descargada, '%Y-%m-%d')

# Convert ahora to datetime
ahora_dt = datetime.strptime(ahora, '%Y-%m-%dT%H:%M:%SUTC')

# Calculate difference in days
diferencia_dias = (ahora_dt - fecha_max).days

print(f"Diferencia en días: {diferencia_dias}")

Diferencia en días: 3


# 3. Se investigan los datos que faltan y se valoran soluciones

En la siguiente página web:

- https://www.aemet.es/es/eltiempo/observacion/ultimosdatos?k=mad&l=3195&w=2&datos=det&x=&f=tmax

Hay datos diarios e incluso por hora de los últimos 3 días de temperatura, viento y precipitaciones. ¿Merce la pena anexarlos a lo que se descarga por la API? 

![image.png](attachment:image.png)

Se definen los rangos de fechas en funcion de la fecha maxima descargada

In [9]:
from datetime import datetime, timedelta

fecha_max_descargada = fecha_max.strftime("%Y-%m-%dT%H:%M:%SUTC")
print(fecha_max_descargada)

# Convert string to datetime
fecha_max_dt = datetime.strptime(fecha_max_descargada, "%Y-%m-%dT%H:%M:%SUTC")
# Subtract 180 days
seis_meses_atras_dt = fecha_max_dt - timedelta(days=180)
# Convert back to string format
seis_meses_atras = seis_meses_atras_dt.strftime("%Y-%m-%dT%H:%M:%SUTC")
print(seis_meses_atras)

2025-03-13T00:00:00UTC
2024-09-14T00:00:00UTC


Se descargan los 6 ultimos meses disponibles de la API

In [10]:
import requests
import json

fecha_ini = seis_meses_atras
fecha_fin = fecha_max_descargada

estacion_id = "3195"  # Ejemplo de estación meteorológica de Madrid-Retiro

url = f"https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_ini}/fechafin/{fecha_fin}/estacion/{estacion_id}?api_key={API_KEY}"

response = requests.get(url)
if response.status_code == 200:
    data = response.json()
    print(json.dumps(data, indent=4, ensure_ascii=False))
    datos_url = data.get("datos")
    if datos_url:
        response_data = requests.get(datos_url)
        if response_data.status_code == 200:
            datos_historicos = response_data.json()
            print(json.dumps(datos_historicos, indent=4, ensure_ascii=False))
        else:
            print("Error al obtener los datos reales")
    else:
        print("No se encontró la URL de datos")
else:
    print("Error en la petición inicial, código de error:", response.status_code)

{
    "descripcion": "exito",
    "estado": 200,
    "datos": "https://opendata.aemet.es/opendata/sh/d7f9dc5d",
    "metadatos": "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}
[
    {
        "fecha": "2024-09-14",
        "indicativo": "3195",
        "nombre": "MADRID, RETIRO",
        "provincia": "MADRID",
        "altitud": "667",
        "tmed": "19,7",
        "prec": "0,0",
        "tmin": "13,0",
        "horatmin": "04:40",
        "tmax": "26,4",
        "horatmax": "14:00",
        "dir": "05",
        "velmedia": "0,8",
        "racha": "8,9",
        "horaracha": "01:30",
        "presMax": "946,3",
        "horaPresMax": "09",
        "presMin": "942,5",
        "horaPresMin": "Varias",
        "hrMedia": "38",
        "hrMax": "49",
        "horaHrMax": "05:20",
        "hrMin": "23",
        "horaHrMin": "17:40"
    },
    {
        "fecha": "2024-09-15",
        "indicativo": "3195",
        "nombre": "MADRID, RETIRO",
        "provincia": "MADRID",
        "altit

Guardo el json descargado en un fichero .json

In [11]:
with open(f"datos_historicos_estacion_{estacion_id}.json", "w") as f:
    json.dump(datos_historicos, f, indent=4, ensure_ascii=False)

Transformo el json a un DataFrame

In [12]:
import pandas as pd
df = pd.DataFrame(datos_historicos).set_index("fecha")
df

Unnamed: 0_level_0,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,...,horaracha,presMax,horaPresMax,presMin,horaPresMin,hrMedia,hrMax,horaHrMax,hrMin,horaHrMin
fecha,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
2024-09-14,3195,"MADRID, RETIRO",MADRID,667,197,00,130,04:40,264,14:00,...,01:30,9463,09,9425,Varias,38,49,05:20,23,17:40
2024-09-15,3195,"MADRID, RETIRO",MADRID,667,230,00,159,06:10,301,14:00,...,20:50,9434,09,9396,18,25,49,Varias,10,14:10
2024-09-16,3195,"MADRID, RETIRO",MADRID,667,226,00,158,06:00,293,13:10,...,23:30,9415,08,9373,17,15,30,23:59,11,Varias
2024-09-17,3195,"MADRID, RETIRO",MADRID,667,206,00,148,06:20,265,13:50,...,01:10,9385,00,9331,Varias,31,50,06:30,18,15:40
2024-09-18,3195,"MADRID, RETIRO",MADRID,667,218,00,159,Varias,277,13:50,...,20:00,9371,24,9337,16,46,72,23:59,30,16:40
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2025-03-08,3195,"MADRID, RETIRO",MADRID,667,84,138,57,23:59,112,13:10,...,12:50,9293,00,9190,17,92,99,01:00,88,14:00
2025-03-09,3195,"MADRID, RETIRO",MADRID,667,72,,41,06:30,103,14:00,...,11:20,9236,22,9211,16,86,99,Varias,70,13:40
2025-03-11,3195,"MADRID, RETIRO",MADRID,667,84,75,62,23:59,106,16:40,...,13:10,9258,24,9216,15,,,,,
2025-03-12,3195,"MADRID, RETIRO",MADRID,667,85,00,42,07:00,128,13:20,...,15:10,9281,09,9235,24,,,,,


In [13]:
df.info()

<class 'pandas.core.frame.DataFrame'>
Index: 180 entries, 2024-09-14 to 2025-03-13
Data columns (total 23 columns):
 #   Column       Non-Null Count  Dtype 
---  ------       --------------  ----- 
 0   indicativo   180 non-null    object
 1   nombre       180 non-null    object
 2   provincia    180 non-null    object
 3   altitud      180 non-null    object
 4   tmed         177 non-null    object
 5   prec         179 non-null    object
 6   tmin         177 non-null    object
 7   horatmin     177 non-null    object
 8   tmax         177 non-null    object
 9   horatmax     177 non-null    object
 10  dir          180 non-null    object
 11  velmedia     180 non-null    object
 12  racha        180 non-null    object
 13  horaracha    180 non-null    object
 14  presMax      167 non-null    object
 15  horaPresMax  167 non-null    object
 16  presMin      166 non-null    object
 17  horaPresMin  166 non-null    object
 18  hrMedia      159 non-null    object
 19  hrMax        143 n

# Descripción de las columnas principales:

### Identificación de la estación
- **indicativo**: Código identificador de la estación meteorológica
- **nombre**: Nombre de la estación
- **provincia**: Provincia donde está ubicada
- **altitud**: Altura sobre el nivel del mar

### Datos de temperatura
- **tmed**: Temperatura media diaria
- **tmin**: Temperatura mínima
- **horatmin**: Hora de la temperatura mínima
- **tmax**: Temperatura máxima
- **horatmax**: Hora de la temperatura máxima

### Precipitación
- **prec**: Precipitación acumulada

### Viento
- **dir**: Dirección del viento
- **velmedia**: Velocidad media del viento
- **racha**: Velocidad máxima de la racha de viento
- **horaracha**: Hora de la racha máxima

### Presión atmosférica
- **presMax**: Presión atmosférica máxima
- **horaPresMax**: Hora de la presión máxima
- **presMin**: Presión atmosférica mínima
- **horaPresMin**: Hora de la presión mínima

### Humedad relativa
- **hrMedia**: Humedad relativa media
- **hrMax**: Humedad relativa máxima
- **horaHrMax**: Hora de la humedad máxima
- **hrMin**: Humedad relativa mínima
- **horaHrMin**: Hora de la humedad mínima

Guardo en un diccionario las descripciones de los campos

In [14]:
descripcion_campos_df = {
    'indicativo': 'Código identificador de la estación meteorológica',
    'nombre': 'Nombre de la estación',
    'provincia': 'Provincia donde está ubicada', 
    'altitud': 'Altura sobre el nivel del mar',
    'tmed': 'Temperatura media diaria',
    'tmin': 'Temperatura mínima',
    'horatmin': 'Hora de la temperatura mínima',
    'tmax': 'Temperatura máxima',
    'horatmax': 'Hora de la temperatura máxima',
    'prec': 'Precipitación acumulada',
    'dir': 'Dirección del viento',
    'velmedia': 'Velocidad media del viento',
    'racha': 'Velocidad máxima de la racha de viento',
    'horaracha': 'Hora de la racha máxima',
    'presMax': 'Presión atmosférica máxima',
    'horaPresMax': 'Hora de la presión máxima',
    'presMin': 'Presión atmosférica mínima', 
    'horaPresMin': 'Hora de la presión mínima',
    'hrMedia': 'Humedad relativa media',
    'hrMax': 'Humedad relativa máxima',
    'horaHrMax': 'Hora de la humedad máxima',
    'hrMin': 'Humedad relativa mínima',
    'horaHrMin': 'Hora de la humedad mínima'
}

## Hay valores nulos en esta estación, incluso para la precipitacion.

In [15]:
df.isna().sum()

indicativo      0
nombre          0
provincia       0
altitud         0
tmed            3
prec            1
tmin            3
horatmin        3
tmax            3
horatmax        3
dir             0
velmedia        0
racha           0
horaracha       0
presMax        13
horaPresMax    13
presMin        14
horaPresMin    14
hrMedia        21
hrMax          37
horaHrMax      37
hrMin          37
horaHrMin      37
dtype: int64

In [16]:
df["prec"].unique() # No es lo mismo un nan que un 0

array(['0,0', '6,7', '0,4', '0,2', '6,5', '4,7', '21,4', '11,3', '14,5',
       '1,4', '3,4', '0,1', '29,7', '3,9', '5,2', '0,5', '1,7', '1,6',
       '8,9', '6,4', '0,6', '0,8', '7,5', '7,6', '16,3', '1,9', '2,0',
       '12,0', '17,6', '14,3', '2,1', '4,4', '16,1', '21,9', '13,8', nan],
      dtype=object)

# 4. Estadísticas de fenómenos meteorológicos adversos (EFMA)

## Se analiza el fichero efma_estaciones_red_climatologica_Principal.csv descargado de 2022 en 

- https://www.aemet.es/es/datos_abiertos/estadisticas/fenomenos_meteorologicos_adversos

In [17]:
carpeta_efma = r'efma_estadistica_anual_2022\efma_estadistica_anual_2022'

os.listdir(carpeta_efma)

['efma_estaciones_red_climatologica_Principal.csv',
 'efma_fenomenos_maritimos_2022.csv.csv',
 'efma_granizada_singular_2022.csv.csv',
 'efma_precipitacion_12_2022.csv.csv',
 'efma_precipitacion_1_2022.csv.csv',
 'efma_precipitacion_engelante_2022.csv.csv',
 'efma_precipitacion_subita_2022.csv.csv',
 'efma_reventon_calido_2022.csv.csv',
 'efma_reventon_frente_racha_2022.csv.csv',
 'efma_temperatura_maxima_2022.csv.csv',
 'efma_temperatura_minima_2022.csv.csv',
 'efma_tornado_tromba_2022.csv.csv',
 'efma_tuba_2022.csv.csv',
 'efma_viento_2022.csv.csv']

In [18]:
ruta_csv_efma = os.path.join(carpeta_efma, 'efma_estaciones_red_climatologica_Principal.csv')
ruta_csv_efma

'efma_estadistica_anual_2022\\efma_estadistica_anual_2022\\efma_estaciones_red_climatologica_Principal.csv'

In [19]:
df_efma = pd.read_csv(ruta_csv_efma, sep=';', encoding='latin1', header = 1)
df_efma

Unnamed: 0,INDICATIVO,NOMBRE,ALTITUD,C_X,C_Y,PROVINCIA,LONG,LAT,LONG.1,LAT.1,Vmax (Km/h),Tmin (°C),Tmax (°C),Prec 1H (mm),Prec 12H (mm)
0,B228,"PALMA DE MALLORCA, CMT",3,983435,4393329,BALEARES,237311,393312,2° 37' 31'' E,39° 33' 12'',90,-4,39,30,100
1,B278,PALMA DE MALLORCA/SON SAN JUAN,8,992960,4394769,BALEARES,244121,393339,2° 44' 12'' E,39° 33' 39'',90,-4,39,30,100
2,B893,MENORCA/AEROPUERTO,91,1117516,4436634,BALEARES,412561,395117,4° 12' 56'' E,39° 51' 17'',100,-4,37,40,100
3,B954,IBIZA/ES CODOLÁ,6,880396,4312208,BALEARES,123041,385235,1° 23' 4'' E,38° 52' 35'',90,-4,37,40,100
4,C029O,LANZAROTE/AEROPUERTO,14,-536098,3249414,LAS PALMAS,1336012,285707,13° 36' 1'' O,28° 57' 7'',90,-4,37,30,80
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
91,9434,ZARAGOZA/AEROPUERTO,249,666170,4614014,ZARAGOZA,100152,413938,1° 0' 15'' O,41° 39' 38'',90,-8,39,30,80
92,9585,LA MOLINA,1703,906984,4698529,GIRONA,156221,421957,1° 56' 22'' E,42° 19' 57'',100,-10,37,40,100
93,9771C,LLEIDA,185,799744,4614524,LLEIDA,35531,413734,0° 35' 53'' E,41° 37' 34'',90,-8,39,30,80
94,9898,HUESCA/PIRINEOS,546,721206,4662615,HUESCA,19322,420504,0° 19' 32'' O,42° 5' 4'',90,-8,39,30,80


## Hay datos de Madrid retiro en el EFMA

*"En estas estaciones se realizan y se registran las observaciones, considerándose la ocurrencia de un fenómeno meteorológico adverso cuando se alcanzan o superan los umbrales establecidos para el nivel de aviso naranja del Plan METEOALERTA en cada una de las estaciones meteorológicas consideradas."*

In [20]:
df_efma[df_efma["INDICATIVO"] == "3195"]

Unnamed: 0,INDICATIVO,NOMBRE,ALTITUD,C_X,C_Y,PROVINCIA,LONG,LAT,LONG.1,LAT.1,Vmax (Km/h),Tmin (°C),Tmax (°C),Prec 1H (mm),Prec 12H (mm)
54,3195,"MADRID,RETIRO",667,442470,4473702,MADRID,340412,402443,3° 40' 41'' O,40° 24' 43'',90,-8,39,30,80


# 5. Se investiga https://sinobas.aemet.es/ que es el Sistema de Notificación de Observaciones Atmosféricas Singulares

Me he descargado un reporte desde seleccionando el intervalo de fechas más grande posible (01-01-1671 a 16-03-2025) en CSV haciendome una cuenta en SINOBAS

In [30]:
df_sinobas = pd.read_csv("reportes.csv", sep=';', encoding='latin1').set_index("Fecha del evento").sort_index()
df_sinobas

Unnamed: 0_level_0,Nº reporte,Url del reporte,Usuario,Grupo,Hora del evento,Precisión,Fecha introducción,Tipo de fenómeno,Fiabilidad,Latitud,...,Diferencia altitud inicio-fin,Cobertura nubosa,¿Sabe temperatura exacta?,Temperatura exacta,Temperatura aproximada,Velocidad viento,Dirección viento,Espesor hielo,Tipo fenómeno marítimo,Comentario fen. marítimo
Fecha del evento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
1671-03-15,1601,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,04:00,+/- 15 minutos,2021-09-06,Tornado / Tromba Marina,Alta,36.529,...,,,,,,,,,,
1880-09-03,1602,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,12:00,+/- 12 horas,2021-09-06,Tornado / Tromba Marina,Media,39.958,...,,,,,,,,,,
1886-05-12,1540,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,19:00,+/- 1 minuto,2021-05-12,Tornado / Tromba Marina,Alta,40.401,...,,,,,,,,,,
1886-05-12,1597,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,19:30,+/- 5 minutos,2021-08-31,Tornado / Tromba Marina,Baja,40.631,...,,,,,,,,,,
1935-07-12,1644,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,14:50,+/- 5 minutos,2021-11-30,Tornado / Tromba Marina,Alta,42.075,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2025-03-13,2050,https://sinobas.aemet.es/index.php?pag=detal&r...,Ivanduque,,16:25,+/- 5 minutos,2025-03-13,Tuba,Alta,39.981,...,,,,,,,,,,
2025-03-13,2051,https://sinobas.aemet.es/index.php?pag=detal&r...,Gutarb,ACAM,16:30,+/- 1 minuto,2025-03-13,Tuba,No Validado,40.687,...,,,,,,,,,,
2025-03-13,2053,https://sinobas.aemet.es/index.php?pag=detal&r...,MeteOrihuela,FrostSE,17:45,+/- 5 minutos,2025-03-13,Tornado / Tromba Marina,No Validado,37.995,...,,,,,,,,,,
2025-03-14,2054,https://sinobas.aemet.es/index.php?pag=detal&r...,arahalmeteo,,14:40,+/- 1 minuto,2025-03-14,Granizada Singular,No Validado,37.262,...,,,,,,,,,,


In [None]:
df_sinobas.info()

<class 'pandas.core.frame.DataFrame'>
Index: 1867 entries, 1671-03-15 to 2025-03-14
Data columns (total 81 columns):
 #   Column                                   Non-Null Count  Dtype  
---  ------                                   --------------  -----  
 0   Nº reporte                               1867 non-null   int64  
 1   Url del reporte                          1867 non-null   object 
 2   Usuario                                  1862 non-null   object 
 3   Grupo                                    949 non-null    object 
 4   Hora del evento                          1867 non-null   object 
 5   Precisión                                1867 non-null   object 
 6   Fecha introducción                       1867 non-null   object 
 7   Tipo de fenómeno                         1867 non-null   object 
 8   Fiabilidad                               1867 non-null   object 
 9   Latitud                                  1867 non-null   float64
 10  Longitud                              

In [32]:
df_sinobas = df_sinobas[df_sinobas["Localidad"] == "Madrid"]
df_sinobas

Unnamed: 0_level_0,Nº reporte,Url del reporte,Usuario,Grupo,Hora del evento,Precisión,Fecha introducción,Tipo de fenómeno,Fiabilidad,Latitud,...,Diferencia altitud inicio-fin,Cobertura nubosa,¿Sabe temperatura exacta?,Temperatura exacta,Temperatura aproximada,Velocidad viento,Dirección viento,Espesor hielo,Tipo fenómeno marítimo,Comentario fen. marítimo
Fecha del evento,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1,Unnamed: 20_level_1,Unnamed: 21_level_1
1886-05-12,1540,https://sinobas.aemet.es/index.php?pag=detal&r...,mmoray,AEMET,19:00,+/- 1 minuto,2021-05-12,Tornado / Tromba Marina,Alta,40.401,...,,,,,,,,,,
2014-07-03,352,https://sinobas.aemet.es/index.php?pag=detal&r...,Delia,AEMET,15:30,+/- 15 minutos,2014-07-22,Granizada Singular,Alta,40.462,...,,,,,,,,,,
2014-10-11,467,https://sinobas.aemet.es/index.php?pag=detal&r...,fercazatormentas,,22:00,+/- 15 minutos,2015-04-28,Precipitación Súbita Torrencial,Media,40.373,...,,,,,,,,,,
2015-06-11,483,https://sinobas.aemet.es/index.php?pag=detal&r...,fercazatormentas,,11:05,+/- 5 minutos,2015-06-11,Precipitación Súbita Torrencial,Alta,40.421,...,,,,,,,,,,
2015-08-30,543,https://sinobas.aemet.es/index.php?pag=detal&r...,fercazatormentas,,18:50,+/- 5 minutos,2015-08-31,Reventón / Frente de racha,Alta,40.349,...,,,,,,,,,,
2017-07-07,934,https://sinobas.aemet.es/index.php?pag=detal&r...,Dario,,13:50,+/- 5 minutos,2017-07-10,Reventón / Frente de racha,Alta,40.458,...,,,,,,,,,,
2017-07-07,935,https://sinobas.aemet.es/index.php?pag=detal&r...,gbarru,,04:30,+/- 15 minutos,2017-07-10,Granizada Singular,Alta,40.456,...,,,,,,,,,,
2020-05-25,1431,https://sinobas.aemet.es/index.php?pag=detal&r...,JesusGS,,17:10,+/- 5 minutos,2020-05-26,Reventón / Frente de racha,Alta,40.452,...,,,,,,,,,,
2021-01-09,1507,https://sinobas.aemet.es/index.php?pag=detal&r...,fercazatormentas,,06:00,+/- 12 horas,2021-01-12,Nevada Singular,Alta,40.417,...,,,,,,,,,,
2021-01-09,1504,https://sinobas.aemet.es/index.php?pag=detal&r...,margainclanrobr,,10:00,+/- 1 día,2021-01-09,Nevada Singular,Alta,40.486,...,,,,,,,,,,


In [None]:
df_sinobas["Tipo de fenómeno"].unique()

array(['Tornado / Tromba Marina', 'Granizada Singular',
       'Precipitación Súbita Torrencial', 'Reventón / Frente de racha',
       'Nevada Singular'], dtype=object)

In [38]:
df_sinobas["Fiabilidad"]

Fecha del evento
1886-05-12     Alta
2014-07-03     Alta
2014-10-11    Media
2015-06-11     Alta
2015-08-30     Alta
2017-07-07     Alta
2017-07-07     Alta
2020-05-25     Alta
2021-01-09     Alta
2021-01-09     Alta
2024-06-25     Alta
Name: Fiabilidad, dtype: object

Se conservan los datos de fiabilidad alta

In [48]:
df_sinobas = df_sinobas[df_sinobas["Fiabilidad"] == "Alta"]

In [49]:
df_sinobas.columns

Index(['Nº reporte', 'Url del reporte', 'Usuario', 'Grupo', 'Hora del evento',
       'Precisión', 'Fecha introducción', 'Tipo de fenómeno', 'Fiabilidad',
       'Latitud', 'Longitud', 'Altitud', 'Provincia', 'Localidad', 'Dirección',
       'Cod_postal', 'Detalles lugar', 'Descripción del suceso',
       '¿Es multirreporte?', '¿Es destacado?', 'Daños en bienes',
       'Daños en campo', 'Total daños', 'Nº heridos', 'Nº muertos',
       'Fuentes de la información', 'Tipo de vórtice', 'Nº de vórtices',
       '¿Otros fenómenos?', 'Fujita', 'Torro', 'Vel.viento Km/h',
       '¿Nube embudo?', 'Nº vórtices en tuba', 'Duración', 'Otros meteoros',
       'Longitud trayectoria', 'Anchura med. trayectoria',
       'Anchura máx trayectoria', 'Dirección de avance',
       'Distancia tuba-suelo', 'Aumento temperatura', 'Tamaño máx. granizo',
       'Tamaño med. granizo', 'Peso máx. granizo', 'Espesor capa granizo',
       'Aspecto del granizo', 'Precipitación total', 'Hora inicio',
       'Máx. p

In [50]:
df_sinobas[["Precipitación total", "Temperatura exacta"]]

Unnamed: 0_level_0,Precipitación total,Temperatura exacta
Fecha del evento,Unnamed: 1_level_1,Unnamed: 2_level_1
1886-05-12,,
2014-07-03,,
2015-06-11,50.0,
2015-08-30,,
2017-07-07,,
2017-07-07,,
2020-05-25,,
2021-01-09,,
2021-01-09,,
2024-06-25,,


Se pueden concatenar los datos de sinobas con lo que devuelve la estación meteorológica del retiro a través de la fecha

# 6. Conclusiones de la primera exploración:

### 1. Hay que construir un dataset que contenga toda la información disponible en https://opendata.aemet.es/dist/index.html? de la estación meteorológica de Madrid - Reitro (id: 3195) donde se puede descargar datos meteorológicos de 6 en 6 meses. No se pueden descargar los datos de los últimos 3 días, pero si que se puede descargar ciertos campos de https://www.aemet.es/es/eltiempo/observacion/ultimosdatos?k=mad&l=3195&w=2&datos=det&x=&f=tmax

### 2. Se tiene que descargar las estadísticas anuales disponibles (2018 - 2022) de EFMA https://www.aemet.es/es/datos_abiertos/estadisticas/fenomenos_meteorologicos_adversos El 31 de marzo de este mes habrá info nueva

### 3. Se obtiene un reporte de https://sinobas.aemet.es/ que es el Sistema de Notificación de Observaciones Atmosféricas Singulares

### 4. Tras obtener todos los datos tabulares, se unen por la fecha de evento u otro campo verificandose la validez y consistencia del dato. Se analiza lo construido con estadísticas descriptivas y objetos visuales (valorar la posibilidad de hacerlo en Tableau o Power BI) y se construye un modelo de clasificación que indique cuando va a ocurrir un FMA (Fenómeno Meterológico Adverso) o un OAS (Observación Atmosférica Singular). También sería interesante estudiar los datos que reporta esta estación en las fechas próximas a estos fenómenos