# Web scraping application with python using APIs

### Extraction of data from the Agencia Estatal de Meterología (AEMET) using its API

<img src='./img/portada.jpg' windth=800>
Imagen de la web de AEMET



### **Consideraciones legales y éticas**

Esta publicación no trata sobre cómo extraer datos de una página web con fines ilegales.

Hay que asegurarse de tener permiso antes de extraer ciertos tipos de datos que puede violar los términos del servicio o incluso regulaciones legales:

- Revise los términos de uso de la página web en relación a los permisos de extracción de datos.
- Priorice el uso de las APIs, si están disponibles, ya que proporcionan acceso legal a los datos.
- Póngase en contacto directamente con el propietario de la página web para comprobar el permiso de extracción de datos.

### **Introducción**

La Agencia Estatal de Meteorología, en adelante AEMET, se encuentra abscrita al Ministerio para la Transición Ecológica y el Reto Demográfico a través de la Secretaría de Estado de Medio Ambiente.

Como Servicio Meteorológico Nacional y Autoridad Meteorológica del Estado, el objetivo básico de AEMET es contribuir a la protección de vidas y bienes a través de la adecuada predicción y vigilancia de fenómenos meteorológicos adversos y como soporte a las actividades sociales y económicas en España mediante la prestación de servicios meteorológicos de calidad.

Entre sus actividades se encuentran:

- Emisión de avisos y predicciones de fenómenos meteorológicos que puedan afectar a la seguridad de las personas y a los bienes materiales.
- Elaboración, suministro y difusión de informaciones meteorológicas y predicciones de interés general en el ámbito nacional.
- Servicios meteorológicos de apoyo a la navegación aérea y marítima necesarios para la seguridad, regularidad y eficiencia del tránsito aéreo y la seguridad del tráfico marítimo.
- Suministro de información meteorológica necesaria para la defensa nacional.
- Vigilancia de las condiciones meteorológicas, climáticas y de la estructura y composición física y química de la atmósfera sobre el territorio nacional.
- Mantenimiento y actualización del registro histórico de datos meteorológicos y climatológicos.
- Realización de estudios e investigaciones en los campos de las ciencias atmosféricas y desarrollo de técnicas y aplicaciones necesarios para la mejora de nuestros servicios.
- Elaboración y actualización de los escenarios de cambio climático.
- Representación del Estado en los organismos nacionales, supranacionales e intergubernamentales relacionados con la observación, la predicción meteorológica y el estudio y modelización del clima y su evolución.
- Contribución a la planificación y ejecución de la política del Estado en materia de cooperación internacional al desarrollo en materia de meteorología y climatología.
- Asesoramiento y servicios meteorológicos y climatológicos adaptados a los requerimientos específicos de distintos sectores de actividad.
- Actividades en materia de formación, documentación, y comunicación en materia meteorológica y climatológica.

En este proyecto, veremos cómo se pueden obtener datos climatológicos, haciendo uso de la API pública que dispone AEMET. Explicaré paso a paso las diferentes maneras en que podemos hacerlo.

### **Inspeccionar la página web**

Accediendo a la página web de [AEMET](https://www.aemet.es/es/portada), en el apartado "DATOS ABIERTOS" tenemos la opción "AEMET OPENDATA"; accedemos.

<img src='./img/aemet_opendata.jpg' windth=800> 
Imagen de la web de AEMET

AEMET OpenData es un API REST (Application Programming Interface. Representational State Transfer) a través del cual se pueden descargar gratuitamente los datos explicitados en el Anexo II de la resolución de 30 de diciembre de 2015 de AEMET, por la que se establecen los precios públicos que han de regir la prestación de servicios meteorológicos y climatológicos. Esta resolución ha sido publicada en el BOE nº 4 de 5 de enero de 2016.

AEMET OpenData permite dos tipos de acceso a los datos: 

**Acceso general**

Se trata de un acceso gráfico, destinado al público en general. Tiene como finalidad permitir el acceso a los datos para usuarios de una manera amigable. La interacción con los datos se caracteriza por ser puntual, realizada a través de interfaces amigables destinados a un humano, dirigida paso a paso y mediante la elección de distintas opciones.


**AEMET OpenData API**

AEMET OpenData API permite otro tipo de interacción con los datos: esta interacción se caracteriza por la posibilidad de ser periódica e incluso programada, desde cualquier lenguaje de programación, sin interfaces amigables, con posibilidad de autodescubrimiento y permite a los reutilizadores de información el incluir los datos de AEMET en sus propios sistemas de información.

<img src='./img/acceso_aemet_opendata.jpg' windth=800>

Pinchando sobre la zona que tiene un rectángulo rojo, accedemos al [AEMET OpenData API](https://opendata.aemet.es/centrodedescargas/inicio). Podemos observar cuatro apartados:

- AEMET OpenData. Nos da una visión general de este servicio y los pasos que tenemos que seguir.
- Obtencion de API Key. Necesaria para poder acceder a los datos.
- Acceso General. Permite consultar datos puntuales de una estación.
- Acceso Desarrolladores. Permite construir una base de datos con diferentes estaciones.

<img src='./img/aemet_opendata_api.jpg' windth=800>


**Obtención de API Key**

Lo primero que debemos hacer es "Solicitar" la APY Key para poder tener acceso a los datos. Entrando en esa sección, debemos introducir una dirección de correo a la que nos enviarán la API OpenData.

<img src='./img/api_key.jpg' windth=800>

### **Instalación de dependencias**

Me encuentro en un entorno conda en la que tengo instalada la versión 3.12.2 de Python.

A continuación, se muestran las librerías necesarias para la ejecución del código creado:

- ipykernel : kernel de Jupyter necesario para ejecutar Python.
- tqdm : herramienta útil para crear barras de progeso en bucles.
- joblib : biblioteca que permite la serialización de objetos Python.
- requests : librería que permite hacer peticiones HTTP.
- scipy : librería de optimización  y cálculos avanzados.
- pandas : biblioteca escrita sobre Numpy para la manipulación y el análisis de datos.


Ejecutamos en la terminal:

`pip install tqdm joblib ipykernel requests scipy pandas`

### **Importación de dependencias**

In [1]:
import requests
import pandas as pd

### **Obtención de datos a través del Acceso General**

Nos permite consultar datos de una estación climatológica, pero no nos será muy útil si lo que pretendemos es generar nuestra propia Base de Datos con la información disponible para una, varias o todas las estaciones publicadas.

Entrando en esta sección, vemos que lo primero que nos pide es que introduzcamos el API Key y a continuación, tenemos una serie de bloques con diferentes temáticas. 

<img src='./img/acceso_general_api_key.jpg' windth=800>

Buscamos el bloque "Valores Climatológicos" que es el que nos interesa.

Los datos que vamos a querer obtener son:

- El inventario de estaciones de valores climatológicos
- Las climatologías diarias de una estación

##### **Inventario de estaciones de valores climatológicos**

Al pulsar sobre el botón "Obtener", se abre una ventana en la que aparece una URL y una respuesta json que nos dice si todo ha ido bien (código 200), la url de acceso a los metadatos (que nos da una descripción de los datos que vamos a obtener) y la url de acceso a los datos.

<img src='./img/acceso_general_datos_metadatos.jpg' windth=800>

Ya disponemos de la información necesaria para poder obtener los datos usando la API.

El código siguiente hará la solicitud a la API de AEMET, extraerá los datos, los convertirá en un DataFrame de Pandas y finalmente los guardará en un archivo csv.

In [3]:
# Tu API Key de AEMET
api_key = "TU-API-KEY"

# URL de la API para obtener el inventario de estaciones climatológicas --> endpoint
url = 'https://opendata.aemet.es/opendata/api/valores/climatologicos/inventarioestaciones/todasestaciones/'

# Parámetros de la solicitud (API key)
params = {'api_key': api_key}

# Realizar la solicitud a la API de AEMET
response = requests.get(url, params = params) 
data = response.json() 

# Comprobar si la solicitud tuvo éxito y hay una URL para descargar los datos
if 'datos' in data:
    
    # url
    estaciones_url = data['datos']
    
    # Descargar los datos de estaciones
    estaciones_response = requests.get(estaciones_url)
    
    # Convertir los datos en un DataFrame de pandas
    estaciones_data = estaciones_response.json()
    df_estaciones = pd.DataFrame(estaciones_data)
    
    # Guardar el DataFrame en un archivo CSV
    df_estaciones.to_csv('estaciones_climatologicas.csv', index=False)
    
else:
    print("Error en la solicitud: ", data.get('descripcion', 'No se pudo obtener la información'))


### **Valores climatológicos diarios de una estación**

Vamos a obtener los valores climatológicos diarios de la estación "A Coruña Aeropuerto" usando la API de AEMET, con fechas de inicio "2023-01-01" y fecha fin "2023-12-31". Cubrimos los campos, tal y como se muestra en la imagen, teniendo en cuenta que el rango de fechas que permite la API de AEMET no puede ser superior a 6 meses, por lo que tendremos que realizar la extracción en dos tandas.

<img src='./img/acceso_general_climatologia_diaria_formulario.jpg' windth=800>

Al pulsar sobre el botón "Obtener", se abre una ventana en la que aparece una URL y una respuesta json que nos dice si todo ha ido bien (código 200), la url de acceso a los metadatos (que nos da una descripción de los datos que vamos a obtener) y la url de acceso a los datos.

<img src='./img/acceso_general_climatologia_diaria_datos_metadatos.jpg' windth=800>

Ya tenemos todo lo necesario para crear nuestro código. Para ello seguiremos los siguientes pasos:

1. Obtener el código de la estación: Necesitamos el código de la estación "A Coruña Aeropuerto" (indicativo). Este código lo obtenemos del inventario de estaciones climatológicas o de las imágenes anteriores.
2. Hacer la solicitud de los datos diarios usando las fechas y el código de la estación.
3. Convertir los datos en un DataFrame y luego guardarlos en un archivo CSV.

In [5]:
# Buscar las estaciones de A Coruña para localizar el código "indicativo"
df_estaciones[df_estaciones['provincia']=='A CORUÑA']

Unnamed: 0,latitud,provincia,altitud,indicativo,nombre,indsinop,longitud
285,434710N,A CORUÑA,90,1351,ESTACA DE BARES,8004.0,074106W
286,432835N,A CORUÑA,4,1354C,FERROL,8005.0,081533W
287,432646N,A CORUÑA,343,1363X,AS PONTES,,075141W
288,432157N,A CORUÑA,57,1387,A CORUÑA,8001.0,082517W
289,432148N,A CORUÑA,132,1387D,A CORUÑA BENS,8000.0,082631W
290,431825N,A CORUÑA,98,1387E,A CORUÑA AEROPUERTO,8002.0,082219W
291,431213N,A CORUÑA,98,1390X,"CARBALLO, DEPURADORA",,084239W
292,430938N,A CORUÑA,50,1393,CABO VILÁN,8006.0,091239W
293,430327N,A CORUÑA,287,1399,VIMIANZO,,090249W
294,425529N,A CORUÑA,230,1400,FISTERRA,8040.0,091729W


Definimos una función con la que podamos extraer los metadatos y los valores climáticos.

In [6]:
def datos_climatologicos_diarios (api_key, estacion_codigo, fecha_inicio, fecha_fin):
    """ 
    Nos devuelve dos dataframes, uno para los metadatos y otro para los valores climatológicos diarios.
    Args:
    api_key: tu api_kei de Aemet, 
    estacion_codigo: indicativo de la estación climatológica, 
    fecha_inicio: desde cuándo queremos los datos, 
    fecha_fin: hasta cuando queremos los datos
    """
    
    # URL para obtener los valores climatológicos diarios
    url = f'https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{fecha_inicio}/fechafin/{fecha_fin}/estacion/{estacion_codigo}'

    # Parámetros de la solicitud (API key)
    params = {'api_key': api_key}

    # Realizar la solicitud a la API de AEMET
    response = requests.get(url, params=params)
    data = response.json()
    
    # Comprobar si la solicitud tuvo éxito y hay una URL para descargar los metadatos y los datos
    if 'metadatos' in data:
        
        # url
        metadatos_url = data['metadatos']
        
        # Descargar los metadatos
        metadatos_response = requests.get(metadatos_url) 
        
        # Convertir los datos en un DataFrame de pandas
        metadatos_data = metadatos_response.json()        
        df_metadatos = pd.DataFrame(metadatos_data['campos'])  

    if 'datos' in data:
        datos_url = data['datos']
                
        # Descargar los datos climáticos diarios
        datos_response = requests.get(datos_url)
                
        # Convertir los datos en un DataFrame de pandas
        datos_climaticos = datos_response.json()
        df_climaticos = pd.DataFrame(datos_climaticos)    
        
    else:
        print("Error en la solicitud: ", data.get('descripcion', 'No se pudo obtener la información'))  
    
    return df_metadatos, df_climaticos
    

In [7]:
# Defino las variables
# Introduce tu API Key de AEMET
api_key = "TU-API-KEY"
estacion_codigo = "1387E"
fecha_inicio_1 = "2023-01-01T00:00:00UTC"
fecha_fin_1 = "2023-06-30T23:59:59UTC"
fecha_inicio_2 = "2023-07-01T00:00:00UTC"
fecha_fin_2 = "2023-12-31T23:59:59UTC"

# Primer semestre
df_metadatos, df_climaticos_1_6_meses = datos_climatologicos_diarios (api_key, estacion_codigo, fecha_inicio_1, fecha_fin_1)

# Segundo semestre
df_metadatos, df_climaticos_7_12_meses = datos_climatologicos_diarios (api_key, estacion_codigo, fecha_inicio_2, fecha_fin_2)

# Concatenar los DataFrames verticalmente
df_climaticos = pd.concat([df_climaticos_1_6_meses, df_climaticos_7_12_meses], ignore_index=True)

# Guardar los DataFrames en archivos CSV
df_metadatos.to_csv('metadatos_acoruna_2023.csv', index=False)
print("El DataFrame ha sido guardado en 'metadatos_acoruna_2023.csv'")

df_climaticos.to_csv('datos_climatologicos_diarios_acoruna_2023.csv', index=False)
print("El DataFrame ha sido guardado en 'datos_climatologicos_diarios_acoruna_2023.csv'")

El DataFrame ha sido guardado en 'metadatos_acoruna_2023.csv'
El DataFrame ha sido guardado en 'datos_climatologicos_diarios_acoruna_2023.csv'


### **Obtención de datos a través del Acceso para Desarrolladores**

Si lo que queremos es construir nuestra propia Base de Datos, no nos queda más remedio que desarrollar una aplicación a medida, para lo cual necesitaremos apoyarnos en el Acceso para Desarrolladores. Cuando entramos, nos encontramos tres secciones:

1. Documentación AEMET OpenData. HATEOAS : Acceso a documentación dinámica AEMET OpenData y autodescubrimiento HATEOAS, que permite conocer los recursos del API y sus detalles.
2. Ejemplos de programas cliente : Acceso a un conjunto de programas cliente (ejemplos).
3. AEMET Codegen --> Utilidad que permite la creación automática de programas cliente de AEMET OpenData, para los lenguajes de programación más utilizados en la comunidad de desarrolladores.


<img src='./img/acceso_desarrolladores.jpg' windth=800>


##### **Documentación AEMET OpenData. HATEOAS**

AEMET OpenData es una API REST desarrollado por AEMET que permite la difusión y la reutilización de la información meteorológica y climatológica de la Agencia, en el sentido indicado en la Ley 18/2015, de 9 de julio, por la que se modifica la Ley 37/2007, de 16 de noviembre, sobre reutilización de la información del sector público.

Pulsamos el botón de "Autorize" e introducimos la api_key. Nos encontraremos con todas las peticiones disponibles. En la siguiente imagen vemos algunas de ellas:

<img src='./img/documentacion_peticiones.jpg' windth=800)>

**Inventario de todas las estaciones**

Vamos a la socilitud GET correspondiente, pilsamos el botób "Try it out" y a continuación "Execute", devolviéndonos la siguiente respuesta:

<img src='./img/documentacion_peticiones_estaciones.jpg' windth=800>

Como vemos, obtenemos la misma información que con los métodos anteriores.

In [10]:
api_key = 'TU-API-KEY'
url = 'https://opendata.aemet.es/opendata/api/valores/climatologicos/inventarioestaciones/todasestaciones'
params = {'api_key': api_key}

response = requests.get(url, params=params)
data = response.json()
data

{'descripcion': 'exito',
 'estado': 200,
 'datos': 'https://opendata.aemet.es/opendata/sh/cd44b4e8',
 'metadatos': 'https://opendata.aemet.es/opendata/sh/0556af7a'}

In [11]:
# metadatos de las estaciones
pd.DataFrame(requests.get(data['metadatos']).json()['campos'])

Unnamed: 0,id,descripcion,tipo_datos,requerido
0,latitud,latitud de la estación,string,True
1,provincia,provincia donde reside la estación,string,True
2,indicativo,indicativo climatológico de la estación,string,True
3,altitud,altitud de la estación,string,True
4,nombre,ubicación de la estación,string,True
5,indsinop,Indicativo sinóptico,string,True
6,longitud,longitud de la estación,string,True


In [12]:
# Inventario de las estaciones
pd.DataFrame(requests.get(data['datos']).json())

Unnamed: 0,latitud,provincia,altitud,indicativo,nombre,indsinop,longitud
0,394924N,ILLES BALEARS,490,B013X,"ESCORCA, LLUC",08304,025309E
1,394744N,ILLES BALEARS,5,B051A,"SÓLLER, PUERTO",08316,024129E
2,394121N,ILLES BALEARS,60,B087X,BANYALBUFAR,,023046E
3,393445N,ILLES BALEARS,52,B103B,ANDRATX - SANT ELM,99103,022208E
4,393305N,ILLES BALEARS,50,B158X,"CALVIÀ, ES CAPDELLÀ",,022759E
...,...,...,...,...,...,...,...
942,424131N,LLEIDA,2467,9988B,CAP DE VAQUÈIRA,08936,005826E
943,424201N,LLEIDA,1161,9990X,"NAUT ARAN, ARTIES",08107,005237E
944,424634N,LLEIDA,722,9994X,BOSSÒST,,004123E
945,430528N,NAVARRA,334,9995Y,VALCARLOS/LUZAIDE,,011803W


**Climatología diaría de todas las estaciones**

Aunque también tenemos la opción de hacer la petición a una estación específica, como ya lo hicimos en apartados anteriores, en este caso vamos a hacer la petición para todas las estaciones, por lo que podremos tener los datos climatológicos de todos los municipios de España.

Aemet sólo nos permite hacer extraciones con rangos de 15 días. Introducimos los parámetros: 

- Fecha inicial: 2024-08-01T00:00:00UTC
- Fecha final: 2024-08-15T23:59:59UTC

Y obtenemos la respuesta:

<img src='./img//documentacion_peticiones_todos municipios.jpg' windth=800>

In [13]:
api_key = 'TU-API-KEY'
url = 'https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/2024-08-01T00%3A00%3A00UTC/fechafin/2024-08-15T23%3A59%3A59UTC/todasestaciones'
params = {'api_key': api_key}

response = requests.get(url, params=params)
data = response.json()
data

{'descripcion': 'exito',
 'estado': 200,
 'datos': 'https://opendata.aemet.es/opendata/sh/0c674363',
 'metadatos': 'https://opendata.aemet.es/opendata/sh/b3aa9d28'}

In [14]:
# metadatos de los valores diarios
pd.DataFrame(requests.get(data['metadatos']).json()['campos'])

Unnamed: 0,id,descripcion,tipo_datos,requerido,unidad
0,fecha,fecha del dia (AAAA-MM-DD),string,True,
1,indicativo,indicativo climatológico,string,True,
2,nombre,nombre (ubicación) de la estación,string,True,
3,provincia,provincia de la estación,string,True,
4,altitud,altitud de la estación en m sobre el nivel del...,float,True,m
5,tmed,Temperatura media diaria,float,False,°C
6,prec,Precipitación diaria de 07 a 07,float,False,"mm (Ip = inferior a 0,1 mm) (Acum = Precipitac..."
7,tmin,Temperatura Mínima del día,float,False,°C
8,horatmin,Hora y minuto de la temperatura mínima,string,False,UTC
9,tmax,Temperatura Máxima del día,float,False,°C


In [15]:
# Datos de los valores diarios de todos los municipios
df_diarios = pd.DataFrame(requests.get(data['datos']).json())
df_diarios

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,...,hrMedia,hrMax,horaHrMax,hrMin,horaHrMin,presMax,horaPresMax,presMin,horaPresMin,sol
0,2024-08-01,8270X,BICORP,VALENCIA,305,290,00,202,03:15,379,...,43,78,02:30,35,Varias,,,,,
1,2024-08-01,8293X,XÀTIVA,VALENCIA,88,294,00,216,05:50,373,...,58,89,00:10,38,11:40,10033,09,9989,16,
2,2024-08-01,7250C,ABANILLA,MURCIA,174,290,00,222,04:57,358,...,55,81,23:59,47,15:00,,,,,
3,2024-08-01,1354C,FERROL,A CORUÑA,4,211,00,183,23:59,239,...,80,94,Varias,67,13:50,10184,11,10165,04,
4,2024-08-01,3094B,TARANCÓN,CUENCA,808,308,00,220,05:50,397,...,15,35,Varias,7,16:00,9236,Varias,9199,18,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
13170,2024-08-15,1658,FOLGOSO DO COUREL,LUGO,612,194,00,89,06:04,299,...,57,90,02:40,24,14:50,,,,,
13171,2024-08-15,0324A,RIPOLL,GIRONA,675,213,,161,06:00,265,...,68,93,Varias,45,14:10,,,,,
13172,2024-08-15,0200E,"BARCELONA, FABRA",BARCELONA,408,238,Ip,178,00:00,298,...,60,,,,,9698,22,9667,06,42
13173,2024-08-15,B691,LA PUEBLA (SA CANOVA),BALEARES,40,,500,,,,...,,,,,,,,,,


In [16]:
df_diarios[df_diarios['nombre']=='FERROL']

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,...,hrMedia,hrMax,horaHrMax,hrMin,horaHrMin,presMax,horaPresMax,presMin,horaPresMin,sol
3,2024-08-01,1354C,FERROL,A CORUÑA,4,211,0,183,23:59,239,...,80,94,Varias,67,13:50,10184,11,10165,4,
883,2024-08-02,1354C,FERROL,A CORUÑA,4,199,0,160,23:59,238,...,77,93,03:30,64,15:20,10191,Varias,10172,5,
1762,2024-08-03,1354C,FERROL,A CORUÑA,4,196,0,143,04:00,249,...,76,96,Varias,59,12:40,10188,00,10172,16,
2641,2024-08-04,1354C,FERROL,A CORUÑA,4,208,0,161,04:00,255,...,76,96,Varias,62,Varias,10177,00,10156,18,
3521,2024-08-05,1354C,FERROL,A CORUÑA,4,217,0,176,04:20,258,...,76,95,Varias,57,16:10,10161,00,10143,15,
4399,2024-08-06,1354C,FERROL,A CORUÑA,4,202,6,185,16:30,220,...,84,94,Varias,74,19:10,10164,21,10132,4,
5277,2024-08-07,1354C,FERROL,A CORUÑA,4,214,0,187,04:50,241,...,67,77,Varias,62,Varias,10175,22,10154,3,
6155,2024-08-08,1354C,FERROL,A CORUÑA,4,216,0,173,05:50,259,...,76,89,06:00,65,Varias,10198,24,10160,4,
7034,2024-08-09,1354C,FERROL,A CORUÑA,4,224,0,167,06:00,280,...,74,96,Varias,58,13:20,10203,08,10180,18,
7916,2024-08-10,1354C,FERROL,A CORUÑA,4,248,0,205,04:00,292,...,68,86,05:20,59,Varias,10182,00,10115,24,


Se puede generar un código que vaya extrayendo de 15 en 15 días y crear nuestra propia base de datos con todos estos valores climatológicos. No lo haremos ya que la finalidad de este artículo es cómo podemos obtener datos climatológicos usando la API de AEMET y no la de crear una base de datos.

##### **Ejemplos de programas cliente**

Al entrar accedemos a un conjunto de programas cliente con los que poder utilizar la API: Curl, Java, Python, PHP, Ruby, etc.

<img src='./img/Ejemplos_programa cliente.jpg' windth=800>

Entramos en Python y nos ponen un ejemplo de estructura que podemos usar, con dos métodos diferentes:

<img src='./img/Ejemplos_programa_cliente_2.jpg' windth=800>

Probamos los dos para comprobar que obtenemos los mismos resultados. Lo vamos a hacer para el inventario de estaciones.

**Python http.client (Python 3)**

In [1]:
import http.client

conn = http.client.HTTPSConnection("opendata.aemet.es")

url = "/opendata/api/valores/climatologicos/inventarioestaciones/todasestaciones/?api_key=eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhZ3VpbnJvZHJpZ3Vlei5qQGdtYWlsLmNvbSIsImp0aSI6Ijc4ZTAxNzkyLWMwMmMtNGM4Yy04ZTY2LTE0MGJlZjU3YzNmNyIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNzI2MTI4NTY1LCJ1c2VySWQiOiI3OGUwMTc5Mi1jMDJjLTRjOGMtOGU2Ni0xNDBiZWY1N2MzZjciLCJyb2xlIjoiIn0.eET4e8MRdBHaQZqB0lWG9RIS_k9di-yVDtUvb8CB2vU"
headers = {
    'cache-control': "no-cache"
    }

conn.request("GET", url, headers=headers)

res = conn.getresponse()
data = res.read()

print(data.decode("utf-8"))

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/cd44b4e8",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/0556af7a"
}


**Python Requests**

In [18]:
import requests

api_key = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhZ3VpbnJvZHJpZ3Vlei5qQGdtYWlsLmNvbSIsImp0aSI6Ijc4ZTAxNzkyLWMwMmMtNGM4Yy04ZTY2LTE0MGJlZjU3YzNmNyIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNzI2MTI4NTY1LCJ1c2VySWQiOiI3OGUwMTc5Mi1jMDJjLTRjOGMtOGU2Ni0xNDBiZWY1N2MzZjciLCJyb2xlIjoiIn0.eET4e8MRdBHaQZqB0lWG9RIS_k9di-yVDtUvb8CB2vU'
url = 'https://opendata.aemet.es/opendata/api/valores/climatologicos/inventarioestaciones/todasestaciones'
params = {'api_key': api_key}

headers = {
    'cache-control': 'no-cache'
    }

response = requests.request('GET', url, headers=headers, params=params)

print(response.text)

{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/cd44b4e8",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/0556af7a"
}


### **Generación de código mediante Swagger Codegen para el API AEMET OpenData**

Swagger Codegen es una herramienta para generar código cliente en diferentes lenguajes de programación a partir del documento Swagger de una API REST (este documento para el caso de AEMET OpenData se puede descargar en https://opendata.aemet.es/AEMET_OpenData_specification.json). Algunos de los lenguajes soportados son: Java, Python, PHP, Ruby, HTML, C#, JavaScript, Perl, Objective-C, Go, Scala, Swift... Para obtener más información, consulte GitHub: Swagger Codegen y Swagger Editor.

Swagger Codegen está integrado en la plataforma SwaggerHub (junto con UI, Editor, Validator). SwaggerHub permite definir APIs utilizando la especificación OpenAPI, y administrarlas a lo largo de su ciclo de vida. La página de ayuda de SwaggerHub proporciona información detallada. El apartado "Generating Code" de la opción "APIs" da información particular sobre el use de Codegen.

Las opciones de generación de código para los diferentes lenguajes soportados son muchas. Desde esta página puede descargarse el código con las opciones básicas para los lenguajes más usados.

Descargamos el codigo para python generado por Swagger Codegen, lo descomprimimos y lo introducimos dentro de nuestra carpeta de proyecto. Lee el README.md del código y sigue las instrucciones para realizar la instalación e importar los modulos.

En la siguiente imagen podemos ver la estructura que tiene la carpeta:

<img src='./img/codegen_api_aemet_estructura.jpg' windth=800>

Dentro de la carpeta "docs" se encuentra la documentación de todas las posiblilidades que tenemos para obtener los datos usando la API y su código correspondiente.

Pongámoslo en práctica!!!

Vamos a obtener los datos climáticos de todos los municipios para los primeros 15 primeros días de agosto del 2024 (recordemos que Aemet nos pone la limitación de los 15 días).

**Importación de dependencias**

In [19]:
import sys
import os

# Ruta al directorio donde se encuentra el modulo
ruta_swagger_client = './python-client-generated'

# Agrego la ruta al sistema de búsqueda de módulos
sys.path.append(ruta_swagger_client)

from __future__ import print_function
import time
import swagger_client
from swagger_client.rest import ApiException
from pprint import pprint

**Obtener los datos diarios de todos los municipios**

In [20]:
# Configure API key authorization: api_key
configuration = swagger_client.Configuration()
configuration.api_key['api_key'] = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhZ3VpbnJvZHJpZ3Vlei5qQGdtYWlsLmNvbSIsImp0aSI6Ijc4ZTAxNzkyLWMwMmMtNGM4Yy04ZTY2LTE0MGJlZjU3YzNmNyIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNzI2MTI4NTY1LCJ1c2VySWQiOiI3OGUwMTc5Mi1jMDJjLTRjOGMtOGU2Ni0xNDBiZWY1N2MzZjciLCJyb2xlIjoiIn0.eET4e8MRdBHaQZqB0lWG9RIS_k9di-yVDtUvb8CB2vU'
# Uncomment below to setup prefix (e.g. Bearer) for API key, if needed
# configuration.api_key_prefix['api_key'] = 'Bearer'

# create an instance of the API class
api_instance = swagger_client.ValoresClimatologicosApi(swagger_client.ApiClient(configuration))
fecha_ini_str = '2024-08-01T00:00:00UTC' # str | Fecha Inicial (AAAA-MM-DDTHH:MM:SSUTC)
fecha_fin_str = '2024-08-15T23:59:59UTC' # str | Fecha Final (AAAA-MM-DDTHH:MM:SSUTC)

try:
    # Avisos de Fenómenos Meteorológicos Adversos. Archivo.
    api_response = api_instance.climatologas_diarias_1(fecha_ini_str, fecha_fin_str)
    pprint(api_response)
except ApiException as e:
    print("Exception when calling AvisosCapApi->climatologas_diarias_1: %s\n" % e)

{'datos': 'https://opendata.aemet.es/opendata/sh/0c674363',
 'descripcion': 'exito',
 'estado': 200,
 'metadatos': 'https://opendata.aemet.es/opendata/sh/b3aa9d28'}


In [21]:
type(api_response)

swagger_client.models.model200.Model200

El código anterior me devuelve un modelo200. Si vemos el código de "model200.py" que se encuentra dentro de la carpeta "models", vemos que es una clase que contiene varias funciones. Una de ellas nos permitirá convertir la respuesta en un ditado.

In [22]:
# Lo convertimos en dictado 
api_response_dict = api_response.to_dict()

A partir de ahora hacemos igual que siempre

In [23]:
# metadatos de los valores diarios
pd.DataFrame(requests.get(api_response_dict['metadatos']).json()['campos'])


Unnamed: 0,id,descripcion,tipo_datos,requerido,unidad
0,fecha,fecha del dia (AAAA-MM-DD),string,True,
1,indicativo,indicativo climatológico,string,True,
2,nombre,nombre (ubicación) de la estación,string,True,
3,provincia,provincia de la estación,string,True,
4,altitud,altitud de la estación en m sobre el nivel del...,float,True,m
5,tmed,Temperatura media diaria,float,False,°C
6,prec,Precipitación diaria de 07 a 07,float,False,"mm (Ip = inferior a 0,1 mm) (Acum = Precipitac..."
7,tmin,Temperatura Mínima del día,float,False,°C
8,horatmin,Hora y minuto de la temperatura mínima,string,False,UTC
9,tmax,Temperatura Máxima del día,float,False,°C


In [24]:
# Datos de los valores diarios
pd.DataFrame(requests.get(api_response_dict['datos']).json())

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,...,hrMedia,hrMax,horaHrMax,hrMin,horaHrMin,presMax,horaPresMax,presMin,horaPresMin,sol
0,2024-08-01,8270X,BICORP,VALENCIA,305,290,00,202,03:15,379,...,43,78,02:30,35,Varias,,,,,
1,2024-08-01,8293X,XÀTIVA,VALENCIA,88,294,00,216,05:50,373,...,58,89,00:10,38,11:40,10033,09,9989,16,
2,2024-08-01,7250C,ABANILLA,MURCIA,174,290,00,222,04:57,358,...,55,81,23:59,47,15:00,,,,,
3,2024-08-01,1354C,FERROL,A CORUÑA,4,211,00,183,23:59,239,...,80,94,Varias,67,13:50,10184,11,10165,04,
4,2024-08-01,3094B,TARANCÓN,CUENCA,808,308,00,220,05:50,397,...,15,35,Varias,7,16:00,9236,Varias,9199,18,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
13170,2024-08-15,1658,FOLGOSO DO COUREL,LUGO,612,194,00,89,06:04,299,...,57,90,02:40,24,14:50,,,,,
13171,2024-08-15,0324A,RIPOLL,GIRONA,675,213,,161,06:00,265,...,68,93,Varias,45,14:10,,,,,
13172,2024-08-15,0200E,"BARCELONA, FABRA",BARCELONA,408,238,Ip,178,00:00,298,...,60,,,,,9698,22,9667,06,42
13173,2024-08-15,B691,LA PUEBLA (SA CANOVA),BALEARES,40,,500,,,,...,,,,,,,,,,


### **Conclusiones**

El uso de la API de AEMET OpenData para realizar web scraping presenta una solución eficiente y fiable para acceder a datos meteorológicos en tiempo real o históricos de España. A lo largo del proceso, hemos destacado varias ventajas que hacen de esta herramienta una excelente opción para desarrolladores y analistas que buscan integrar datos climáticos en sus proyectos.

En primer lugar, el acceso a la API permite obtener datos actualizados de manera automática, eliminando la necesidad de realizar scraping tradicional a través de sitios web, lo que reduce el riesgo de errores y bloqueos de páginas web. Además, AEMET OpenData ofrece un acceso legal y autorizado a la información, lo que asegura que los datos sean verídicos y puedan ser utilizados de manera fiable en diversas aplicaciones.

Por otro lado, la API proporciona flexibilidad, ya que sus endpoints permiten acceder a una amplia variedad de datos meteorológicos, como previsiones, fenómenos adversos y datos históricos, adaptándose a múltiples necesidades y proyectos. Este enfoque permite ahorrar tiempo y recursos en comparación con otras técnicas de recopilación de datos.

Sin embargo, es importante tener en cuenta algunas consideraciones. La correcta configuración y autenticación mediante una API Key es esencial para evitar problemas de acceso. Además, es fundamental manejar correctamente las limitaciones de uso, como las tasas de peticiones permitidas, para no sobrepasar los límites establecidos y evitar bloqueos.

En resumen, la API de AEMET OpenData representa una alternativa poderosa y versátil para la recolección de datos meteorológicos. Su uso no solo optimiza el acceso a la información, sino que también fomenta la creación de soluciones innovadoras en campos como la agricultura, el turismo, la logística y la planificación urbana. Con el enfoque adecuado, esta API puede ser un componente clave en proyectos que requieren análisis predictivo, toma de decisiones informadas y acceso a datos precisos y actualizados.

### **Referencias**

- [AEMET](https://www.aemet.es/)
- [AEMET OpenData](https://www.aemet.es/es/datos_abiertos/AEMET_OpenData)
- [python](https://www.python.org/)
- [tqdm](https://pypi.org/project/tqdm/)
- [joblib](https://pypi.org/project/joblib/)
- [ipykernel](https://pypi.org/project/ipykernel/)
- [requests](https://pypi.org/project/requests/)
- [spicy](https://scipy.org/)
- [pandas](https://pandas.pydata.org/)