# Extracción de datos climatológicos de la estación de Retiro

**Este notebook pertenece al Trabajo Fin de Grado del Curso de Adaptación al Grado de Ingeniería en Informática**


*Fecha:* Abril 2022

*Autor:* Ruth Lospitao Ruiz


*Email:* rlospitao@gmail.com

*Descripción:* este notebook se conecta a [OpenData AEMET](https://opendata.aemet.es/) y se descarga, únicamente, los datos climatológicos de la estación de Retiro

## Importación de librerías y funciones

Se importan las librerías necesarias:

In [1]:
import requests
import json
import pandas as pd
import time


A continuación, se establecen las funciones desarrolladas y utilizadas en este notebook:

In [2]:
def request_data(start_year, end_year, station):
    '''  Devuelve todos los datos climatológicos disponibles en AEMET OpenData desde en el año indicado en el primer parámetro
         hasta el año indicado en el segundo parámetro
         y para la estación indicada en el tercer parámetro. 
    '''  

    data = []
    
    #se define el código API KEY necesario para realizar consultar en la API REST de AEMET OpenData
    api_key = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJybG9zcGl0YW9AZ21haWwuY29tIiwianRpIjoiMzFiNTgyZjktMDYxNy00OWZkLTkzYzEtNWI3M2EzMDg0MDc4IiwiaXNzIjoiQUVNRVQiLCJpYXQiOjE2NDcyNjgyNzUsInVzZXJJZCI6IjMxYjU4MmY5LTA2MTctNDlmZC05M2MxLTViNzNhMzA4NDA3OCIsInJvbGUiOiIifQ.eNLyN0LnAPZTtRrRDBJRcVBXY6XTKTiQEVeipOCesWo"
    
    query_string = {"api_key" : api_key}
    
    headers = {
            'cache-control': "no-cache"
    }
    
    for year in range(start_year, end_year): #realizamos la petición de datos para el intervalo de años indicado
        try: 
            url = "https://opendata.aemet.es/opendata/api/valores/climatologicos/mensualesanuales/datos/anioini/"+str(year)+"/aniofin/"+str(year)+"/estacion/"+str(station)+"/"

            first_response = json.loads(requests.request("GET", url, headers=headers, params=query_string).text)
         
            
            if(first_response["estado"]==429): # Error exceso de peticiones
                print("Error 429: Exceso de peticiones. Espera 1 minuto")
                time.sleep(60)
                first_response = json.loads(requests.get(url, headers=headers, params=query_string).text)
            
            if(first_response["estado"]==200):  # Comunicación con éxito
                print("Comunicación con éxito")
                data.append(json.loads((requests.get(first_response["datos"], headers=headers, params=query_string)).text))
                       
        except ValueError:
            print(requests.get(first_response["datos"], headers=headers, params=query_string).text)
            print("--------------------------\n")
            print("Error 429: Exceso de peticiones. Espera 1 minuto")
            time.sleep(60)
            first_response = json.loads(requests.get(url, headers=headers, params=query_string).text)
            if(first_response["estado"]==200):
                data.append(json.loads((requests.get(first_response["datos"], headers=headers, params=query_string)).text))          
            
            
           

    return data

## Extracción de los datos climatológicos de la estación de Retiro

Se comienza la extracción de los datos desde 1893 (año que fue dada de alta la estación) hasta 2021 para la estación de Retiro (código 3195)

In [3]:
register_data = []
register_data.append(request_data(1893,2021,3195))

Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
Comunicación con éxito
<!DOCTYPE html><html><head><title>Apache Tomcat/8.0.32 - Error report</title><style type="text/css">H1 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:22px;} H2 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:16px;} H3 {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;font-size:14px;} BODY {font-family:Tahoma,Arial,sans-serif;color:black;background-color:white;} B {font-family:Tahoma,Arial,sans-serif;color:white;background-color:#525D76;} P {font-family:Tahoma,Arial,sans-serif;background:white;color:black;font-size:12px;}A {color : black;}A.name {color : black;}.line {height: 1px; background-color: #525D76; border: none;

In [4]:
# Data is transformed to a DataFrame
df=pd.DataFrame()
for i in range (len(register_data)):
    for j in range(len(register_data[i])):
        df = pd.concat([df,pd.DataFrame(register_data[i][j])], axis=0,)
df=df.reset_index() 
df = df.drop(["index"],axis=1)
print ("Los datos obtenidos para la estación de Retiro son: ")
df

Los datos obtenidos para la estación de Retiro son: 


Unnamed: 0,fecha,indicativo,p_max,n_cub,hr,n_gra,n_fog,inso,q_max,q_mar,...,q_min,np_010,nw_55,w_racha,nw_91,w_rec,w_med,ts_20,ts_10,ts_50
0,1920-1,3195,1.4(03),5.0,79.0,0.0,5.0,5.0,959.7(16),1025.4,...,922.7(04),1.0,,,,,,,,
1,1920-2,3195,26.2(19),13.0,75.0,0.0,1.0,4.9,960.6(02),1024.7,...,923.9(20),10.0,,,,,,,,
2,1920-3,3195,8.2(07),7.0,,1.0,0.0,6.8,951.9(03),1021.5,...,918.7(15),6.0,,,,,,,,
3,1920-4,3195,9.2(08),9.0,60.0,1.0,0.0,7.4,950.3(21),1015.9,...,927.0(12),6.0,,,,,,,,
4,1920-5,3195,38.4(13),7.0,58.0,1.0,1.0,9.2,954.5(05),1015.8,...,931.8(23),5.0,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1308,2020-9,3195,22.2(18),,,0.0,1.0,,,,...,,6.0,,,,,6.0,,,
1309,2020-10,3195,24.2(20),,61.0,0.0,0.0,,,,...,,7.0,,,,,,,,
1310,2020-11,3195,20.0(06),,79.0,0.0,3.0,,954.4(19),,...,928.8(28),9.0,,,,,,,,
1311,2020-12,3195,4.5(07),,74.0,0.0,0.0,,952.0(21),,...,919.3(04),7.0,,,,,,,,


## Exportación de los datos

Por último, se exportan los datos a un fichero CSV para poder trabajar posteriormente con él si fuera necesario:

In [5]:
# Export data to an Excel file
df.to_csv("data/data_3195.csv", index=False, header=True)