
# MBIT School

## Executive Master en Data Science (2020-2021)
 
by

*Nuria Espadas*  
*Mireia Vecino*  
*Tomeu Mir*  



# AEMET open data API


  
**With this notebook we collect the meteo data for each day of 2019 in Tenerife.**


How to get the key:
https://opendata.aemet.es/centrodedescargas/inicio


How to use the api - pdf document:
https://opendata.aemet.es/centrodedescargas/docs/FAQs150217.pdf


How to get the IDEMA codes or references:
https://es.stackoverflow.com/questions/63842/aemet-opendata-api-no-devuelve-body

In [1]:
import requests
import json
import numpy as np
import pandas as pd

In [2]:
DATA_PATH = '../data/'

In [2]:
url = "https://opendata.aemet.es/opendata"
api_key = 'better get your own key amiguito'

In [3]:
# As the API always responses with a string containing a json with a URL for metadata and a URL for data, 
# we implement this functions for calling the URL having the data that we want and returns the result as 
# a json object.
def get_data( response):
    js =  json.loads(response.text)
    datos = requests.request("GET", js['datos'])
    return json.loads(datos.text)

In [4]:
# get all estaciones
api = '/api/valores/climatologicos/inventarioestaciones/todasestaciones/'
querystring = {"api_key":api_key}
headers = {
    'cache-control': "no-cache"
    }

response = requests.request("GET", url+api, headers=headers, params=querystring)

if response.status_code == 200:
    all_estations = get_data( response)
else:
    print(response)
    
all_estations

[{'latitud': '413515N',
  'provincia': 'BARCELONA',
  'altitud': '74',
  'indicativo': '0252D',
  'nombre': 'ARENYS DE MAR',
  'indsinop': '08186',
  'longitud': '023224E'},
 {'latitud': '411734N',
  'provincia': 'BARCELONA',
  'altitud': '4',
  'indicativo': '0076',
  'nombre': 'BARCELONA AEROPUERTO',
  'indsinop': '08181',
  'longitud': '020412E'},
 {'latitud': '412506N',
  'provincia': 'BARCELONA',
  'altitud': '408',
  'indicativo': '0200E',
  'nombre': 'BARCELONA, FABRA',
  'indsinop': '',
  'longitud': '020727E'},
 {'latitud': '412326N',
  'provincia': 'BARCELONA',
  'altitud': '6',
  'indicativo': '0201D',
  'nombre': 'BARCELONA',
  'indsinop': '08180',
  'longitud': '021200E'},
 {'latitud': '414312N',
  'provincia': 'BARCELONA',
  'altitud': '291',
  'indicativo': '0149X',
  'nombre': 'MANRESA',
  'indsinop': '08174',
  'longitud': '015025E'},
 {'latitud': '413125N',
  'provincia': 'BARCELONA',
  'altitud': '146',
  'indicativo': '0229I',
  'nombre': 'SABADELL AEROPUERTO',
  'i

In [5]:
# get all the IDEMA codes

api = '/api/observacion/convencional/todas'

response = requests.request("GET", url+api, headers=headers, params=querystring)

if response.status_code == 200:
    all_observatories = get_data( response)
else:
    print(response)
    
all_observatories

[{'idema': '0009X',
  'lon': 0.963335,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 406.0,
  'vmax': 3.6,
  'vv': 1.8,
  'dv': 261.0,
  'lat': 41.213894,
  'dmax': 240.0,
  'ubi': 'ALFORJA',
  'hr': 91.0,
  'tamin': 8.8,
  'ta': 9.5,
  'tamax': 9.7},
 {'idema': '0016A',
  'lon': 1.178894,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 71.0,
  'vmax': 6.7,
  'vv': 3.5,
  'dv': 330.0,
  'lat': 41.14972,
  'dmax': 310.0,
  'ubi': 'REUS/AEROPUERTO',
  'pres': 1013.3,
  'hr': 76.0,
  'stdvv': 0.2,
  'ts': 13.4,
  'pres_nmar': 1022.5,
  'tamin': 13.1,
  'ta': 13.1,
  'tamax': 13.7,
  'tpr': 8.9,
  'vis': 25.3,
  'stddv': 2.0,
  'inso': 0.0},
 {'idema': '0034X',
  'lon': 1.260838,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 233.0,
  'lat': 41.293053,
  'ubi': 'VALLS',
  'hr': 84.0,
  'tamin': 11.2,
  'ta': 11.2,
  'tamax': 12.1},
 {'idema': '0042Y',
  'lon': 1.249167,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 55.0,
  'vmax': 2.1,
  'vv': 0.9,


In [6]:
tenerife_list = []

for observatory in all_observatories:
    if 'TENERIFE' in observatory['ubi']:
        tenerife_list.append(observatory)

tenerife_list

[{'idema': 'C429I',
  'lon': -16.561157,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 64.0,
  'vmax': 8.2,
  'vv': 5.7,
  'dv': 50.0,
  'lat': 28.046991,
  'dmax': 60.0,
  'ubi': 'TENERIFE/SUR',
  'pres': 1011.1,
  'hr': 71.0,
  'stdvv': 0.7,
  'ts': 21.5,
  'pres_nmar': 1020.1,
  'tamin': 21.7,
  'ta': 21.8,
  'tamax': 22.4,
  'tpr': 16.3,
  'stddv': 4.0,
  'inso': 0.0},
 {'idema': 'C439J',
  'lon': -16.382229,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 115.0,
  'vmax': 8.7,
  'vv': 7.0,
  'dv': 53.0,
  'lat': 28.318405,
  'dmax': 61.0,
  'ubi': 'TENERIFE-GÜIMAR',
  'pres': 1005.8,
  'hr': 68.0,
  'pres_nmar': 1019.8,
  'tamin': 21.3,
  'ta': 21.3,
  'tamax': 21.4,
  'tpr': 15.2},
 {'idema': 'C447A',
  'lon': -16.329445,
  'fint': '2021-10-24T20:00:00',
  'prec': 0.0,
  'alt': 632.0,
  'vmax': 6.2,
  'vv': 1.3,
  'dv': 330.0,
  'lat': 28.477497,
  'dmax': 50.0,
  'ubi': 'TENERIFE/LOS RODEOS',
  'pres': 949.7,
  'hr': 81.0,
  'stdvv': 0.6,
  'ts': 14.9,
  'pre

In [8]:
df_idemas = pd.DataFrame(tenerife_list)
df_idemas = df_idemas[['idema', 'ubi', 'lat', 'lon']]
df_idemas = df_idemas.drop_duplicates(subset = ["ubi"])

In [11]:
df_idemas

Unnamed: 0,idema,ubi,lat,lon
0,C429I,TENERIFE/SUR,28.046991,-16.561157
1,C439J,TENERIFE-GÜIMAR,28.318405,-16.382229
2,C447A,TENERIFE/LOS RODEOS,28.477497,-16.329445
3,C449C,SANTA CRUZ DE TENERIFE,28.463337,-16.255281


In [13]:
df_idemas.to_csv(DATA_PATH+'idemas.csv', index = False)

## Valores Climatológicos

In [14]:
# valores climatológicos
fechaini = '2019-01-01T00:00:00UTC'
fechafin = '2019-12-31T00:00:00UTC'
idema = 'C429I,C439J,C449C,C447A' #aquí podría hacer un bucle
api = '/api/valores/climatologicos/diarios/datos/fechaini/'+fechaini+'/fechafin/'+fechafin+'/estacion/'+idema

response = requests.request("GET", url+api, headers=headers, params=querystring)

print(response.text)


if response.status_code == 200:
    valores_climatologicos = get_data( response)
else:
    print(response)
    
valores_climatologicos

# create dataframe
# export to csv.


{
  "descripcion" : "exito",
  "estado" : 200,
  "datos" : "https://opendata.aemet.es/opendata/sh/679b5b5d",
  "metadatos" : "https://opendata.aemet.es/opendata/sh/b3aa9d28"
}


[{'fecha': '2019-01-01',
  'indicativo': 'C447A',
  'nombre': 'TENERIFE NORTE AEROPUERTO',
  'provincia': 'STA. CRUZ DE TENERIFE',
  'altitud': '632',
  'tmed': '15,0',
  'prec': '0,0',
  'tmin': '10,4',
  'horatmin': '07:56',
  'tmax': '19,5',
  'horatmax': '15:30',
  'dir': '16',
  'velmedia': '3,9',
  'racha': '11,4',
  'horaracha': '10:11',
  'sol': '5,5',
  'presMax': '956,5',
  'horaPresMax': 'Varias',
  'presMin': '951,2',
  'horaPresMin': '01'},
 {'fecha': '2019-01-01',
  'indicativo': 'C449C',
  'nombre': 'STA.CRUZ DE TENERIFE',
  'provincia': 'STA. CRUZ DE TENERIFE',
  'altitud': '35',
  'tmed': '19,6',
  'prec': '0,0',
  'tmin': '15,0',
  'horatmin': '07:00',
  'tmax': '24,2',
  'horatmax': '15:20',
  'dir': '20',
  'velmedia': '3,1',
  'racha': '8,6',
  'horaracha': '13:00',
  'sol': '9,3',
  'presMax': '1023,3',
  'horaPresMax': 'Varias',
  'presMin': '1018,1',
  'horaPresMin': '01'},
 {'fecha': '2019-01-01',
  'indicativo': 'C429I',
  'nombre': 'TENERIFE SUR AEROPUERTO',


In [15]:
df_meteo = pd.DataFrame(valores_climatologicos)

In [16]:
df_meteo.head()

Unnamed: 0,fecha,indicativo,nombre,provincia,altitud,tmed,prec,tmin,horatmin,tmax,horatmax,dir,velmedia,racha,horaracha,sol,presMax,horaPresMax,presMin,horaPresMin
0,2019-01-01,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,150,0,104,07:56,195,15:30,16.0,39.0,114.0,10:11,55.0,9565,Varias,9512,1
1,2019-01-01,C449C,STA.CRUZ DE TENERIFE,STA. CRUZ DE TENERIFE,35,196,0,150,07:00,242,15:20,20.0,31.0,86.0,13:00,93.0,10233,Varias,10181,1
2,2019-01-01,C429I,TENERIFE SUR AEROPUERTO,STA. CRUZ DE TENERIFE,64,192,0,151,06:54,233,13:05,3.0,44.0,89.0,20:50,96.0,10183,Varias,10130,5
3,2019-01-01,C439J,GÜÍMAR,STA. CRUZ DE TENERIFE,115,166,0,105,05:50,226,17:00,,,,,,10137,22,10084,5
4,2019-01-02,C447A,TENERIFE NORTE AEROPUERTO,STA. CRUZ DE TENERIFE,632,146,0,109,23:30,182,12:28,14.0,31.0,78.0,00:47,63.0,9575,Varias,9545,24


In [17]:
df_meteo.shape

(1460, 20)

In [18]:
df_meteo.to_csv(DATA_PATH+'df_meteo_tfs_2019.csv', index = False)