## En este notebook se levanta la información del clima de la API de AEMET.

Vamos a necesitar esta información para el TFM, para poder cruzar la relación entre el clima y el uso de las bicicletas. La idea además de guardar estos datos en memoria, es volcarlos a la Base de datos armada con este fin


In [44]:
import requests
import time
from datetime import date, datetime, timedelta
import pandas as pd
api_key = 'eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJnYXN0b25sZWduYW5pQGdtYWlsLmNvbSIsImp0aSI6ImIyZDhmNDE2LTE3MDItNDM2YS1hODlkLTQ2NTVjMDA3YmUxNiIsImlzcyI6IkFFTUVUIiwiaWF0IjoxNTQ0ODI1NjA1LCJ1c2VySWQiOiJiMmQ4ZjQxNi0xNzAyLTQzNmEtYTg5ZC00NjU1YzAwN2JlMTYiLCJyb2xlIjoiIn0.ASVNRgmmUnZruDkbSHFYtagQNC4qW5N2WqgLtqzTvEM'
url = 'https://opendata.aemet.es/opendata/api/valores/climatologicos/diarios/datos/fechaini/{0}/fechafin/{1}/estacion/{2}/'
params = {'api_key': api_key}
station = 3195 #Estacion de Retiro (la que vamos a utilizar)

In [158]:
def cast_number(number):
    try:
        if number:
            number = number.replace(',','.')
            return float(number)
    except:
        return None
    

def cast_date(date):
    return datetime.strptime(date, '%Y-%m-%d')

def cast_time(time):
    try:
        return datetime.strptime(time, '%H:%M').time()
    except:
        return None

def get_properties(dict_weather_day):
    #extraccion de propiedades
    date = cast_date(dict_weather_day['fecha'])
    print('Analizando datos fecha: ' + dict_weather_day['fecha'])
    try:  
        temp_med = cast_number(dict_weather_day['tmed'])
    except: 
        temp_med = None
    try:
        precipitation = cast_number(dict_weather_day['prec'])
    except:
        precipitation = None
    try:
        temp_min = cast_number(dict_weather_day['tmin'])
    except:
        temp_min = None
    try:
        temp_max = cast_number(dict_weather_day['tmax'])
    except:
        temp_max = None
    try:
        wind_speed = cast_number(dict_weather_day['velmedia'])
    except:
        wind_speed = None
    try:
        wind_speed_max = cast_number(dict_weather_day['racha'])
    except:
        wind_speed_max = None
    try:
        hour_temp_min = cast_time(dict_weather_day['horatmin'])
    except:
        hour_temp_min = None
    try:
        hour_temp_max = cast_time(dict_weather_day['horatmax'])
    except:
        hour_temp_max = None
      
    properties = {
            'date': date, 
            'temp_media': temp_med, 
            'precipitation': precipitation, 
            'temp_min': temp_min, 
            'temp_max': temp_max, 
            'wind_speed': wind_speed,
            'wind_speed_max': wind_speed_max,
            'hour_temp_min': hour_temp_min,
            'hour_temp_max': hour_temp_max
        }
    
    return properties

## Opciones para obtener la información del clima

Para probar los datos hay dos opciones que se describen a continuación.

### Opción 1

A continuación está la función que ejecuta la api del clima sobre un período de fechas establecidos y la almacena en un dataframe. Este código ya fue ejecutado para todo 2015,2016,2017, 2018 y lo que va del 2019. Pero obviamente tarda un poco. Se puede probar cambiando el periodo que se quiere analizar en las variables **min_date_to_check** y **max_date_to_check** y probar con esos datos.

### Opción 2

Se puede acceder a los datos obtenidos a través de la opción 1 desde un archivo .csv que se encuentra en la carpeta dat y se llama **all_weather_data.csv** que ya existe y contiene toda la información desde el 2015 a la fecha.

La idea de descargar esos datos es para poder cruzarlo con otra información en otro notebook y además para nosotros poder guardarlos en BD para el TFM más adelante.

# Opción 1

Itera sobre la API y descarga la información en un .csv

In [159]:
results_per_day = []

In [160]:
min_date_to_check = datetime(2015,1,1)
max_date_to_check = datetime(2019,2,5)
day_count = (max_date_to_check - min_date_to_check).days + 1

#Por cada fecha entre el maximo y el minimo hago la llamada a la API
for single_date in (min_date_to_check + timedelta(n) for n in range(day_count)):
    
    time.sleep(4) #Es necesario para que no empiece a dar problemas de "Too many requests" si se buscan muchos datos.
    
    single_date_formatted = datetime.strftime(single_date, '%Y-%m-%d' + 'T00:00:00UTC')
    response = requests.get(url.format(single_date_formatted, single_date_formatted, str(station)), params=params)
    
    if response.status_code == 200:
        data_url = response.json()['datos']
        #invoco a url de datos
        response_data = requests.get(data_url)
        response_data_json = response_data.json()
        results_per_day.append(get_properties(response_data_json[0]))
    else:
        print('Código de respuesta erróneo para la fecha: {0}, código: {1} '
              .format(single_date_formatted, str(response.status_code)))

Analizando datos fecha: 2015-01-01
Analizando datos fecha: 2015-01-02
Analizando datos fecha: 2015-01-03
Analizando datos fecha: 2015-01-04
Analizando datos fecha: 2015-01-05
Analizando datos fecha: 2015-01-06
Analizando datos fecha: 2015-01-07
Analizando datos fecha: 2015-01-08
Analizando datos fecha: 2015-01-09
Analizando datos fecha: 2015-01-10
Analizando datos fecha: 2015-01-11
Analizando datos fecha: 2015-01-12
Analizando datos fecha: 2015-01-13
Analizando datos fecha: 2015-01-14
Analizando datos fecha: 2015-01-15
Analizando datos fecha: 2015-01-16
Analizando datos fecha: 2015-01-17
Analizando datos fecha: 2015-01-18
Analizando datos fecha: 2015-01-19
Analizando datos fecha: 2015-01-20
Analizando datos fecha: 2015-01-21
Analizando datos fecha: 2015-01-22
Analizando datos fecha: 2015-01-23
Analizando datos fecha: 2015-01-24
Analizando datos fecha: 2015-01-25
Analizando datos fecha: 2015-01-26
Analizando datos fecha: 2015-01-27
Analizando datos fecha: 2015-01-28
Analizando datos fec

Analizando datos fecha: 2015-08-24
Analizando datos fecha: 2015-08-25
Analizando datos fecha: 2015-08-26
Analizando datos fecha: 2015-08-27
Analizando datos fecha: 2015-08-28
Analizando datos fecha: 2015-08-29
Analizando datos fecha: 2015-08-30
Analizando datos fecha: 2015-08-31
Analizando datos fecha: 2015-09-01
Analizando datos fecha: 2015-09-02
Analizando datos fecha: 2015-09-03
Analizando datos fecha: 2015-09-04
Analizando datos fecha: 2015-09-05
Analizando datos fecha: 2015-09-06
Analizando datos fecha: 2015-09-07
Analizando datos fecha: 2015-09-08
Analizando datos fecha: 2015-09-09
Analizando datos fecha: 2015-09-10
Analizando datos fecha: 2015-09-11
Analizando datos fecha: 2015-09-12
Analizando datos fecha: 2015-09-13
Analizando datos fecha: 2015-09-14
Analizando datos fecha: 2015-09-15
Analizando datos fecha: 2015-09-16
Analizando datos fecha: 2015-09-17
Analizando datos fecha: 2015-09-18
Analizando datos fecha: 2015-09-19
Analizando datos fecha: 2015-09-20
Analizando datos fec

Analizando datos fecha: 2016-04-15
Analizando datos fecha: 2016-04-16
Analizando datos fecha: 2016-04-17
Analizando datos fecha: 2016-04-18
Analizando datos fecha: 2016-04-19
Analizando datos fecha: 2016-04-20
Analizando datos fecha: 2016-04-21
Analizando datos fecha: 2016-04-22
Analizando datos fecha: 2016-04-23
Analizando datos fecha: 2016-04-24
Analizando datos fecha: 2016-04-25
Analizando datos fecha: 2016-04-26
Analizando datos fecha: 2016-04-27
Analizando datos fecha: 2016-04-28
Analizando datos fecha: 2016-04-29
Analizando datos fecha: 2016-04-30
Analizando datos fecha: 2016-05-01
Analizando datos fecha: 2016-05-02
Analizando datos fecha: 2016-05-03
Analizando datos fecha: 2016-05-04
Analizando datos fecha: 2016-05-05
Analizando datos fecha: 2016-05-06
Analizando datos fecha: 2016-05-07
Analizando datos fecha: 2016-05-08
Analizando datos fecha: 2016-05-09
Analizando datos fecha: 2016-05-10
Analizando datos fecha: 2016-05-11
Analizando datos fecha: 2016-05-12
Analizando datos fec

Analizando datos fecha: 2016-12-06
Analizando datos fecha: 2016-12-07
Analizando datos fecha: 2016-12-08
Analizando datos fecha: 2016-12-09
Analizando datos fecha: 2016-12-10
Analizando datos fecha: 2016-12-11
Analizando datos fecha: 2016-12-12
Analizando datos fecha: 2016-12-13
Analizando datos fecha: 2016-12-14
Analizando datos fecha: 2016-12-15
Analizando datos fecha: 2016-12-16
Analizando datos fecha: 2016-12-17
Analizando datos fecha: 2016-12-18
Analizando datos fecha: 2016-12-19
Analizando datos fecha: 2016-12-20
Analizando datos fecha: 2016-12-21
Analizando datos fecha: 2016-12-22
Analizando datos fecha: 2016-12-23
Analizando datos fecha: 2016-12-24
Analizando datos fecha: 2016-12-25
Analizando datos fecha: 2016-12-26
Analizando datos fecha: 2016-12-27
Analizando datos fecha: 2016-12-28
Analizando datos fecha: 2016-12-29
Analizando datos fecha: 2016-12-30
Analizando datos fecha: 2016-12-31
Analizando datos fecha: 2017-01-01
Analizando datos fecha: 2017-01-02
Analizando datos fec

Analizando datos fecha: 2017-07-29
Analizando datos fecha: 2017-07-30
Analizando datos fecha: 2017-07-31
Analizando datos fecha: 2017-08-01
Analizando datos fecha: 2017-08-02
Analizando datos fecha: 2017-08-03
Analizando datos fecha: 2017-08-04
Analizando datos fecha: 2017-08-05
Analizando datos fecha: 2017-08-06
Analizando datos fecha: 2017-08-07
Analizando datos fecha: 2017-08-08
Analizando datos fecha: 2017-08-09
Analizando datos fecha: 2017-08-10
Analizando datos fecha: 2017-08-11
Analizando datos fecha: 2017-08-12
Analizando datos fecha: 2017-08-13
Analizando datos fecha: 2017-08-14
Analizando datos fecha: 2017-08-15
Analizando datos fecha: 2017-08-16
Analizando datos fecha: 2017-08-17
Analizando datos fecha: 2017-08-18
Analizando datos fecha: 2017-08-19
Analizando datos fecha: 2017-08-20
Analizando datos fecha: 2017-08-21
Analizando datos fecha: 2017-08-22
Analizando datos fecha: 2017-08-23
Analizando datos fecha: 2017-08-24
Analizando datos fecha: 2017-08-25
Analizando datos fec

Analizando datos fecha: 2018-03-21
Analizando datos fecha: 2018-03-22
Analizando datos fecha: 2018-03-23
Analizando datos fecha: 2018-03-24
Analizando datos fecha: 2018-03-25
Analizando datos fecha: 2018-03-26
Analizando datos fecha: 2018-03-27
Analizando datos fecha: 2018-03-28
Analizando datos fecha: 2018-03-29
Analizando datos fecha: 2018-03-30
Analizando datos fecha: 2018-03-31
Analizando datos fecha: 2018-04-01
Analizando datos fecha: 2018-04-02
Analizando datos fecha: 2018-04-03
Analizando datos fecha: 2018-04-04
Analizando datos fecha: 2018-04-05
Analizando datos fecha: 2018-04-06
Analizando datos fecha: 2018-04-07
Analizando datos fecha: 2018-04-08
Analizando datos fecha: 2018-04-09
Analizando datos fecha: 2018-04-10
Analizando datos fecha: 2018-04-11
Analizando datos fecha: 2018-04-12
Analizando datos fecha: 2018-04-13
Analizando datos fecha: 2018-04-14
Analizando datos fecha: 2018-04-15
Analizando datos fecha: 2018-04-16
Analizando datos fecha: 2018-04-17
Analizando datos fec

Analizando datos fecha: 2018-11-11
Analizando datos fecha: 2018-11-12
Analizando datos fecha: 2018-11-13
Analizando datos fecha: 2018-11-14
Analizando datos fecha: 2018-11-15
Analizando datos fecha: 2018-11-16
Analizando datos fecha: 2018-11-17
Analizando datos fecha: 2018-11-18
Analizando datos fecha: 2018-11-19
Analizando datos fecha: 2018-11-20
Analizando datos fecha: 2018-11-21
Analizando datos fecha: 2018-11-22
Analizando datos fecha: 2018-11-23
Analizando datos fecha: 2018-11-24
Analizando datos fecha: 2018-11-25
Analizando datos fecha: 2018-11-26
Analizando datos fecha: 2018-11-27
Analizando datos fecha: 2018-11-28
Analizando datos fecha: 2018-11-29
Analizando datos fecha: 2018-11-30
Analizando datos fecha: 2018-12-01
Analizando datos fecha: 2018-12-02
Analizando datos fecha: 2018-12-03
Analizando datos fecha: 2018-12-04
Analizando datos fecha: 2018-12-05
Analizando datos fecha: 2018-12-06
Analizando datos fecha: 2018-12-07
Analizando datos fecha: 2018-12-08
Analizando datos fec

KeyError: 'datos'

In [161]:
weather_data = pd.DataFrame(results_per_day)
weather_data.to_csv('../dat/weather_data.csv') #Cambiar nombre

# Opción 2

Levanta la información utilizando el csv donde ya se descargó toda la información para esos años. Si se quiere utilizar el archivo que contiene la info desde el 2015 hasta la fecha usar **all_weather_data.csv**. De lo contrario utilizar el archivo que descargo en la opción 1

In [None]:
weather_data = pd.read_csv('../dat/all_weather_data.csv', sep = ',', index_col = 0)
weather_data

### Agrego columnas de interés para utilizar luego en la visualización

In [None]:
def get_season(row):
    date = row.datetime
    if date >= datetime(date.year, 3, 21) & date <= datetime(date.year, 6, 20):
        return 'spring'
    elif date >= datetime(date.year, 6, 21) & date <= datetime(date.year, 9 , 20):
        return 'summer'
    elif date >= datetime(date.year, 9, 21) & date <= datetime(date.year, 12 , 20):
        return 'autumn'
    else:
        return 'winter'

weather_data['year'] = weather_data.apply(lambda fila: fila.datetime.year, axis = 1)
weather_data['month'] = weather_data.apply(lambda fila: fila.datetime.month, axis = 1)
weather_data['season'] = weather_data.apply(get_season, axis = 1)

## Visualización datos relacionados al clima

En otro notebook se va a cruzar la información del clima con los usos de las bicicletas.

In [None]:
import seaborn as sns
import matplotlib.pyplot as plt

from matplotlib import rcParams
rcParams['figure.figsize'] = 14, 10
sns.set_context('talk')

In [None]:
#Cruzo precipitaciones con temperaturas media
out = sns.scatterplot(x='precipitation', y='temp_media', data=weather_data, size = 'precipitation')