# Obtención de datos históricos para el primer modelo
Este notebook descargará los datos históricos necesarios para el primer modelo que se realizó (PMV):

**Radiación solar historica** http://www.soda-pro.com/web-services/radiation/cams-radiation-service<br>
**Datos climáticos históricos** https://opendata.aemet.es/centrodedescargas/productosAEMET<br>

- [Nota previa](#Nota-previa)<br>

### 1. [Funciones](#Funciones)

### 2. [Datos historicos de clima](#Datos-historicos-de-clima)

### 3. [Datos historicos de radiacion PVGIS](#Datos-historicos-de-radiacion-PVGIS)

### 4. [Datos historicos de radiacion SODA](#Datos-historicos-de-radiacion-SODA)

También se experimenta con las obtenciones de los datos que se utilizarán finalmente en los modleos de predicción:

### 5. [Datos de radiacion AEMET](#Datos-de-radiacion-AEMET)

### 6. [Datos climatológicos de los últimos 5 días de OpenWeather](#Datos-climatológicos-de-los-últimos-5-días-de-OpenWeather)

### 7. [Datos de prediccion climatológica de los siguientes 48 horas de OpenWeather](#Datos-de-prediccion-climatológica-de-los-siguientes-48-horas-de-OpenWeather)

## Nota previa
Para poder ejecutar el script adecuadamente hay que utilizar la siguiente línea de comando para abrir el notebook desde la terminal:

In [1]:
#jupyter-lab --NotebookApp.iopub_data_rate_limit=1.0e10

# Funciones
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

In [2]:
import numpy as np
import pandas as pd
import random
pd.options.display.max_columns = None
pd.options.display.max_rows = None
import matplotlib.pyplot as plt

Se fija el directorio de trabajo

In [None]:
%cd /home/dsc/git/TFM/

In [3]:
directorio = '/home/dsc/git/TFM/'

### Funcion API AEMET

url_base: url base para todas las urls de descarga.

url: fragmento de la url para la descarga.

api_key: clave necesaria para la descarga de los datos (se crea en [AEMET](https://opendata.aemet.es/centrodedescargas/altaUsuario?)).

ide: parametros para realizar la consulta (puede no ser necesario)

In [3]:
import requests
import json

def get_response_aemet(url_base = "", url = "", api_key = "", ide = ""):
    
    # Se genera la llamada, uniendo las diferentes partes de la url
    call = '/'.join([url_base, url, ide])
    if(ide == ""):
        call = call[:-1]

    headers = {    
        'Accept': 'application/json',  
        'Authorization': 'api_key' + api_key
    }
    response = requests.get(call, headers = headers)
    
    # Se obtienen los datos del body
    body = json.loads(response.text)["datos"]
    
    
    response = requests.get(body, headers = headers)
    if response:
        print('Exito')
    else:
        print('Ha ocurrido un error')

    return response.text


Funciones para detectar si un año es bisiesto y obetener el numero de dias de un mes

In [4]:
def es_bisiesto(anio):
    return anio % 4 == 0 and (anio % 100 != 0 or anio % 400 == 0)


def obtener_dias_del_mes(mes, anio):
    # Abril, junio, septiembre y noviembre tienen 30 dias
    if mes in [4, 6, 9, 11]:
        return 30
    # Febrero depende de si es o no bisiesto
    if mes == 2:
        if es_bisiesto(anio):
            return 29
        else:
            return 28
    else:
        # En caso contrario, tiene 31 días
        return 31


Funciones para convertir las coordenadas en formato DMS a grados decimales

In [5]:
def conversor_coordenadas(coord):
    #Si coord es latitud, al norte dele cuador es siempre positiva
    #Si coord es longitud, al oeste del Meridiano 0º son negativas
    
    D = int(coord[0:2])
    M = float(coord[2:4])
    S = float(coord[4:6])
    
    #GMS a GD
    DD = float((D) + (M/60) + (S/3600))
        
    if(coord[6] == "S" or coord[6] == "W"):
            DD = -DD
            
    return DD

### Función API PVGIS

In [6]:
#API rad

def get_response_pvgis(url = ""):
    
    response = requests.get(url)
    
    body = json.loads(response.text)


    if response:
        print('Exito')
    else:
        print('Ha ocurrido un error')

    return response.text


Cargo lista de estaciones meteorlogicas

In [7]:
df_estaciones = pd.read_csv('./data/estaciones.csv')

# Datos historicos de clima
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

Estos datos **diarios** se obtienen del portal Opendata de AEMET (https://opendata.aemet.es/centrodedescargas/productosAEMET). Los campos obtenidos para cada día son:

- ``fecha``: Fecha del día en formato AAA MM DD
- ``indicativo``: Indicativo de la estación meteorológica a la que correpsonden los datos
- ``nombre``: Nombre (ubicación) de la estación
- ``provincia``: Provincia de la estación
- ``altitud``: Altitud de la estación en m sobre el nivel del mar (m)
- ``tmed``: Temperatura media diaria (Celsius)
- ``prec``: Precipitación diaria de 07 a 07 (mm)
- ``tmin``: Temperatura Mínima del día (Cº)
- ``horatmin``: Hora y minuto de la temperatura mínima
- ``tmax``: Temperatura Máxima del día (Cº)
- ``horatmax``: Hora y minuto de la temperatura máxima
- ``dir``: Dirección de la racha máxima (decenas de grado)
- ``velmedia``: Velocidad media del viento (m/s)
- ``racha``: Racha máxima del viento (m/s)
- ``horaracha``: Hora y minuto de la racha máxima
- ``sol``: Insolación (horas)
- ``presmax``: Presión máxima al nivel de referencia de la estación (hPa)
- ``horapresmax``: Hora de la presión máxima (redondeada a la hora entera más próxima)
- ``presmin``: Presión miníma al nivel de referencia de la estación (hPa)
- ``horapresmin``: Hora de la presión mínima (redondeada a la hora entera más próxima)


In [None]:
api_key = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhbGVqYW5kcm8ucnVpei5iZXJjaWFub0BnbWFpbC5jb20iLCJqdGkiOiI2NDNmZjZmMi04OTQyLTQ1YzYtODIxNC0yZGU4NmQzMDU0NWYiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTYxMzQ3NjEwNywidXNlcklkIjoiNjQzZmY2ZjItODk0Mi00NWM2LTgyMTQtMmRlODZkMzA1NDVmIiwicm9sZSI6IiJ9.CCEfI4NjKp9kiTCFsNLQFB-u_oLhcXJTEtdHluoToe8"

url_base = "https://opendata.aemet.es/opendata/api"

df_clima = pd.DataFrame()

import time


for anio in range(2005,2016+1):
    time.sleep(2*60) # espera en segundos
    for mes in range(1,12+1):
        
        # Genero la fecha
        AAAA = int(anio)
        MM = '%02d' % mes
        DD = int(obtener_dias_del_mes(mes, anio))
        print(AAAA,MM)
        
        # Fecha en formato AAAA-MM-DDTHH:MM:SSUTC
        fechaIniStr = "%d-%s-01T00:00:00UTC" %(AAAA, MM)
        fechaFinStr = "%d-%s-%dT23:59:59UTC" %(AAAA, MM, DD)
        
        estaciones_url = "valores/climatologicos/diarios/datos/fechaini/%s/fechafin/%s/todasestaciones" %(fechaIniStr, fechaFinStr)
        
        # Obtengo la respuesta 
        resp = get_response_aemet(url_base, estaciones_url, api_key)
        
        # La convierto en data frame
        data = json.loads(resp)
        df = pd.DataFrame.from_records(data)
        df_clima = pd.concat([df_clima, df])
        

df_clima.head() 

In [None]:
nombre_csv = "historicos_climaticos.csv"
df_clima.to_csv('./data/Historicos_modelo_1/'+ str(nombre_csv), index = False, header=True)

# Datos historicos de radiacion SODA
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

Estos datos **horarios** se obtienen del portal CAMS Radiation Service de la Unión Europea (http://www.soda-pro.com/web-services/radiation/cams-radiation-service). Proporciona la radiación para cualquier fecha hasta 2 días antes de la llamada. Los campos obtenidos para cada día son:

- ``Observation period``: Beginning/end of the time period with the format "yyyy-mm-ddTHH:MM:SS.S/yyyy-mm-ddTHH:MM:SS.S"
- ``TOA``: Irradiation on horizontal plane at the top of atmosphere (Wh/m2) computed from Solar Geometry 2
- ``Clear sky GHI``: Clear sky global irradiation on horizontal plane at ground level (Wh/m2)
- ``Clear sky BHI``: Clear sky beam irradiation on horizontal plane at ground level (Wh/m2)
- ``Clear sky DHI``: Clear sky diffuse irradiation on horizontal plane at ground level (Wh/m2)
- ``Clear sky BNI``: Clear sky beam irradiation on mobile plane following the sun at normal incidence (Wh/m2)
- ``GHI``: Global irradiation on horizontal plane at ground level (Wh/m2)
- ``BHI``: Beam irradiation on horizontal plane at ground level (Wh/m2)
- ``DHI``: Diffuse irradiation on horizontal plane at ground level (Wh/m2)
- ``BNI``: Beam irradiation on mobile plane following the sun at normal incidence (Wh/m2)
- ``Reliability``: Proportion of reliable data in the summarization (0-1)

Celda para experimentar con los datos y generar el script completo

In [None]:
import math
import time
from bs4 import BeautifulSoup

df_rad = pd.DataFrame()

cont_call_rad = 0

fecha_ini = "2005-01-01"
fecha_fin = "2016-12-31"

# Se almacenan 24 archivos porque son muchso datos

lista_guardar = [24, 48, 72, 96, 120, 144, 168, 192, 216, 240, 264, 287]

# Para cada estación
for estacion in df_estaciones["indicativo"]:
    
    cont_call_rad += 1
    print(cont_call_rad)
    time.sleep(2*60) # espera en segundos
    
    print(estacion)

    lat = df_estaciones[df_estaciones["indicativo"] == estacion]["latitud"]
    lat = lat[lat.index[0]]
    lon = df_estaciones[df_estaciones["indicativo"] == estacion]["longitud"]
    lon = lon[lon.index[0]]
        
       
    lat = str(float(conversor_coordenadas(lat)))
    lon = str(float(conversor_coordenadas(lon)))
    print(lat, lon)
        
    # Se usan tres correos porque solo se permiten 100 llamadas al día por cuenta
    correo1 = 'arb%2540technologyenergychain.com'
    correo2 = 'ruizber23%2540gmail.com'
    correo3 = 'alejandro.ruiz.berciano%2540gmail.com'
    if (cont_call_rad <= 95):
        correo = correo1
    elif(cont_call_rad > 95 and cont_call_rad <= 195):
        correo = correo2
    else:
        correo = correo3
        
    url = 'http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude={};longitude={};altitude=-999;date_begin={};date_end={};time_ref=UT;summarization=PT01H;username={}&RawDataOutput=irradiation'.format(lat, lon, fecha_ini, fecha_fin, correo)
    print(url)
        
    response = requests.get(url)
    soup = BeautifulSoup(response.content)

    # Se convierte la respuesta en texto y se cuentan las líneas que hay hasta los datos
    f = soup.text
    nbTotalLines = 0
    nbLinesToSkip = 0
    nbTotalLines, nbLinesToSkip = openAndSkipLines(f, '#')

    if(nbTotalLines < 0):
        print('No hay datos')
        exit()
    #print('filas que saltar: ', nbLinesToSkip)
    sizeData = nbTotalLines - nbLinesToSkip
    print(sizeData)
    df = getCamsData(f, nbLinesToSkip)
    
    df_rad = pd.concat([df_rad, df])
    
    
    if cont_call_rad in lista_guardar:
        nombre_csv = "historicos_radiacion_{}.csv".format(lista_guardar.index(cont_call_rad))
        df_rad.to_csv('./data/'+ str(nombre_csv), index = False, header=True)
        df_rad = pd.DataFrame()


## Descarga de lista de estaciones


In [8]:
df_estaciones = pd.read_csv(directorio + 'data/estaciones.csv')

In [9]:
len(df_estaciones)

287

## Funciones necesarias para la descarga


Función para determinar el número de líneas que hay que saltarse hasta llegar a los datos

In [10]:
from datetime import datetime
import os
import re
import io

def openAndSkipLines(f, symbol):
# Devuelve el número de filas a saltarse hasta los datos

    buf = io.StringIO(f)
    
    nbTotalLines = len(buf.read())
    if(nbTotalLines == 0): return -1, -1
    buf.seek(0,0)
    stop = False
    nbLine = 0
    while (not stop) :
        nbLine = nbLine + 1
        l = buf.readline()
        if (l[0] != symbol): stop = True
    buf.seek(buf.tell()-len(l),0)
    nbLinesToSkip = nbLine-1
    return nbTotalLines, nbLinesToSkip


Función para generar un data frame con los datos de radiación descargados

In [11]:
import io

def getCamsData(camsFile, nbLinesToSkip):

    # Lista de variables:
    # Observation period;TOA;Clear sky GHI;Clear sky BHI;Clear sky DHI;Clear sky BNI;GHI;BHI;DHI;BNI;Reliability
    camsFile = io.StringIO(camsFile) 
    datacolumns = pd.DataFrame()
    dateBegins = list()
    dateEnds = list()
    #toa = list()
    #cs_ghi = list()
    #cs_bhi = list()
    #cs_dhi = list()
    #cs_bni = list()
    ghi = list()
    bhi = list()
    dhi = list()
    bni = list()
    reliability = list()
    cont_lines = 0
    
    # Para cada fila se almacenan los datos en listas
    for ll in camsFile.readlines():
        cont_lines += 1
        if (cont_lines > nbLinesToSkip):
            ll = ll[0:len(ll)-1]
            l = ll.split(';')
            date = l[0].split('/')
            dateBegins.append(date[0].strip()) 
            dateEnds.append(date[1].strip())
            #toa.append(l[1].strip())
            #cs_ghi.append(l[2].strip())
            #cs_bhi.append(l[3].strip())
            #cs_dhi.append(l[4].strip())
            #cs_bni.append(l[5].strip())
            ghi.append(l[6].strip())
            bhi.append(l[7].strip())
            dhi.append(l[8].strip())
            bni.append(l[9].strip())
            reliability.append(l[10].strip())

    # Guarda un data frame con los datos
    dictio = {"dateBegins":dateBegins, "dateEnds":dateEnds, "ghi":ghi, "bhi":bhi, "dhi" : dhi, "bni" : bni, "reliability" : reliability}
    datacolumns = pd.DataFrame(dictio)

    return datacolumns


No es posible descargar todos los datos en un único data frame

In [20]:
! cat /proc/sys/vm/overcommit_memory

0


Realizo la descarga en varias llamadas

In [21]:
# Años 2005-2010

In [22]:
import math
import time
from bs4 import BeautifulSoup

df_rad = pd.DataFrame()

cont_call_rad = 0

fecha_ini = "2005-01-01"
fecha_fin = "2010-12-31"

# Se almacenan 24 archivos porque son muchso datos
lista_guardar = [24, 48, 72, 96, 120, 144, 168, 192, 216, 240, 264, 287]

# para cada estación
for estacion in df_estaciones["indicativo"]:
    
    cont_call_rad += 1
    print(cont_call_rad)
    time.sleep(30) # espera en segundos
    
    print(estacion)

    lat = df_estaciones[df_estaciones["indicativo"] == estacion]["latitud"]
    lat = lat[lat.index[0]]
    lon = df_estaciones[df_estaciones["indicativo"] == estacion]["longitud"]
    lon = lon[lon.index[0]]
        
       
    lat = str(float(conversor_coordenadas(lat)))
    lon = str(float(conversor_coordenadas(lon)))
    print(lat, lon)
       
    # Se usan 3 correos porque solo se permiten 100 llamadas por cuenta
    correo1 = 'arb%2540technologyenergychain.com'
    correo2 = 'ruizber23%2540gmail.com'
    correo3 = 'alejandro.ruiz.berciano%2540gmail.com'
    if (cont_call_rad <= 95):
        correo = correo1
    elif(cont_call_rad > 95 and cont_call_rad <= 195):
        correo = correo2
    else:
        correo = correo3
        
    url = 'http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude={};longitude={};altitude=-999;date_begin={};date_end={};time_ref=UT;summarization=PT01H;username={}&RawDataOutput=irradiation'.format(lat, lon, fecha_ini, fecha_fin, correo)
    print(url)
        
    response = requests.get(url)
    soup = BeautifulSoup(response.content)

    # Se convierte la respuesta en texto y se cuentan las líneas que hay hasta los datos
    f = soup.text
    nbTotalLines = 0
    nbLinesToSkip = 0
    nbTotalLines, nbLinesToSkip = openAndSkipLines(f, '#')
    if(nbTotalLines < 0):
        print('No hay datos')
        exit()
    #print('filas que saltar: ', nbLinesToSkip)
    sizeData = nbTotalLines - nbLinesToSkip
    print(sizeData)
    
    # Se guardan los datos como dataframe, añadiendo una columna indicando la estación
    try:
        df = getCamsData(f, nbLinesToSkip)
        df.insert(len(df.columns),"estacion",list(np.repeat([estacion], len(df["dateEnds"]))),True)
        df_rad = pd.concat([df_rad, df])
    except:
        print("Fallo en {}, estacion {}".format(cont_call_rad, estacion))
        print(f)
    
    # Se guarda el archivo    
    if cont_call_rad in lista_guardar:
        nombre_csv = "historicos_radiacion_{}.csv".format(lista_guardar.index(cont_call_rad))
        df_rad.to_csv('./data/Historicos_modelo_1/Rad/'+ str(nombre_csv), index = False, header=True)
        df_rad = pd.DataFrame()


1
0252D
41.587500000000006 2.54
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.587500000000006;longitude=2.54;altitude=-999;date_begin=2005-01-01;date_end=2010-12-31;time_ref=UT;summarization=PT01H;username=arb%2540technologyenergychain.com&RawDataOutput=irradiation
6405872
2
0076
41.29277777777778 2.0700000000000003
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.29277777777778;longitude=2.0700000000000003;altitude=-999;date_begin=2005-01-01;date_end=2010-12-31;time_ref=UT;summarization=PT01H;username=arb%2540technologyenergychain.com&RawDataOutput=irradiation
6407015
3
0200E
41.41833333333333 2.1241666666666665
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.41833333333333;longitude=2.1241666666666665;altitude=-999;date_begin=2005-01-01;date

In [None]:
# Años 2011-2016

In [12]:
import math
import time
from bs4 import BeautifulSoup

df_rad = pd.DataFrame()

cont_call_rad = 0

fecha_ini = "2011-01-01"
fecha_fin = "2016-12-31"

# Se almacenan 24 archivos porque son muchso datos
lista_guardar = [24, 48, 72, 96, 120, 144, 168, 192, 216, 240, 264, 287]

# para cada estación
for estacion in df_estaciones["indicativo"]:
    
    cont_call_rad += 1
    print(cont_call_rad)
    time.sleep(30) # espera en segundos
    
    print(estacion)

    lat = df_estaciones[df_estaciones["indicativo"] == estacion]["latitud"]
    lat = lat[lat.index[0]]
    lon = df_estaciones[df_estaciones["indicativo"] == estacion]["longitud"]
    lon = lon[lon.index[0]]
        
       
    lat = str(float(conversor_coordenadas(lat)))
    lon = str(float(conversor_coordenadas(lon)))
    print(lat, lon)
       
    # Se usan 3 correos porque solo se permiten 100 llamadas por cuenta
    correo1 = 'arb%2540technologyenergychain.com'
    correo2 = 'ruizber23%2540gmail.com'
    correo3 = 'alejandro.ruiz.berciano%2540gmail.com'
    if (cont_call_rad <= 95):
        correo = correo1
    elif(cont_call_rad > 95 and cont_call_rad <= 195):
        correo = correo2
    else:
        correo = correo3
        
    url = 'http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude={};longitude={};altitude=-999;date_begin={};date_end={};time_ref=UT;summarization=PT01H;username={}&RawDataOutput=irradiation'.format(lat, lon, fecha_ini, fecha_fin, correo)
    print(url)
        
    response = requests.get(url)
    soup = BeautifulSoup(response.content)

    # Se convierte la respuesta en texto y se cuentan las líneas que hay hasta los datos
    f = soup.text
    nbTotalLines = 0
    nbLinesToSkip = 0
    nbTotalLines, nbLinesToSkip = openAndSkipLines(f, '#')
    if(nbTotalLines < 0):
        print('No hay datos')
        exit()
    #print('filas que saltar: ', nbLinesToSkip)
    sizeData = nbTotalLines - nbLinesToSkip
    print(sizeData)
    
    # Se guardan los datos como dataframe, añadiendo una columna indicando la estación
    try:
        df = getCamsData(f, nbLinesToSkip)
        df.insert(len(df.columns),"estacion",list(np.repeat([estacion], len(df["dateEnds"]))),True)
        df_rad = pd.concat([df_rad, df])
    except:
        print("Fallo en {}, estacion {}".format(cont_call_rad, estacion))
        print(f)
    
    # Se guarda el archivo
    if cont_call_rad in lista_guardar:
        nombre_csv = "historicos_radiacion_{}.csv".format(12 + lista_guardar.index(cont_call_rad))
        df_rad.to_csv('./data/Historicos_modelo_1/Rad/'+ str(nombre_csv), index = False, header=True)
        df_rad = pd.DataFrame()


1
0252D
41.587500000000006 2.54
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.587500000000006;longitude=2.54;altitude=-999;date_begin=2011-01-01;date_end=2016-12-31;time_ref=UT;summarization=PT01H;username=arb%2540technologyenergychain.com&RawDataOutput=irradiation
filas que saltar:  43
6413092
2
0076
41.29277777777778 2.0700000000000003
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.29277777777778;longitude=2.0700000000000003;altitude=-999;date_begin=2011-01-01;date_end=2016-12-31;time_ref=UT;summarization=PT01H;username=arb%2540technologyenergychain.com&RawDataOutput=irradiation
filas que saltar:  43
6414319
3
0200E
41.41833333333333 2.1241666666666665
http://www.soda-is.com/service/wps?Service=WPS&Request=Execute&Identifier=get_cams_radiation&version=1.0.0&DataInputs=latitude=41.41833333333333;longitude=2.1241666666666

# Datos de radiacion AEMET
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

Celda para experimentar con los datos y poder realizar una llamada diaria para obtener los datos

El proceso final de obtención de datos se realiza en el script `Obtención_datos_periodica`

In [None]:
import csv

api_key = "eyJhbGciOiJIUzI1NiJ9.eyJzdWIiOiJhbGVqYW5kcm8ucnVpei5iZXJjaWFub0BnbWFpbC5jb20iLCJqdGkiOiI2NDNmZjZmMi04OTQyLTQ1YzYtODIxNC0yZGU4NmQzMDU0NWYiLCJpc3MiOiJBRU1FVCIsImlhdCI6MTYxMzQ3NjEwNywidXNlcklkIjoiNjQzZmY2ZjItODk0Mi00NWM2LTgyMTQtMmRlODZkMzA1NDVmIiwicm9sZSI6IiJ9.CCEfI4NjKp9kiTCFsNLQFB-u_oLhcXJTEtdHluoToe8"

url_base = "https://opendata.aemet.es/opendata/api"

estaciones_url = "red/especial/radiacion"

resp = get_response_aemet(url_base, estaciones_url, api_key)

datos_rad = resp[32:]



lines = datos_rad.splitlines()
fecha = (resp.splitlines()[1])
fecha = fecha[1:len(fecha)-1]
print(fecha)


reader = csv.reader(lines)
parsed_csv = list(reader)

titulos = [palabra.strip() for palabra in parsed_csv[0][0].replace(';', ', ').replace("\"", "").split(",")]
filas = [[palabra.strip() for palabra in fila[0].replace(';', ', ').replace("\"", "").split(",")] for fila in parsed_csv[1:]]

#9 y 16 tienen el titulo partido
filas[9][0] = filas[9][0] + filas[9][1]
filas[9].pop(1)
filas[16][0] = filas[16][0] + filas[16][1]
filas[16].pop(1)

df_rad_aemet = pd.DataFrame(columns = titulos, data = filas)
df_rad_aemet.loc[df_rad_aemet['Indicativo'] == '6156', 'Indicativo'] = '6156X'

            
df_fecha = []
for i in range(0, len(df_rad_aemet['Indicativo'])):
    for j in range(0, len(df_estaciones['indicativo'])):
        if (df_rad_aemet['Indicativo'][i] == df_estaciones['indicativo'][j]):
            df_rad_aemet.loc[df_rad_aemet['Indicativo'] == df_estaciones['indicativo'][j], 'Estación'] = df_estaciones['nombre'][j]
    for j in range(0, len(titulos)):
        if(df_rad_aemet.iloc[i][j] == ""):
            #df_rad_aemet.iloc[i][j] =  math.nan
            continue
    df_fecha.append(fecha)
df_fecha = pd.DataFrame(df_fecha, columns=['fecha']) 
df_rad_aemet = pd.concat([df_fecha, df_rad_aemet], axis=1)

df_rad_aemet

# Datos climatológicos de los últimos 5 días de OpenWeather
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

Celdas para experimentar con los datos y poder realizar una llamada diaria para obtener los datos

El proceso final de obtención de datos se realiza en el script `Obtención_datos_periodica`

In [39]:
def get_response_OW(url = ""):
    
    response = requests.get(url)

    
    if response:
        print('Exito')
    else:
        print('Ha ocurrido un error')

    return response.content


In [75]:
estacion = "0200E"

from datetime import timezone, datetime, date, timedelta
import os
import os.path as path


#Día
for retardo in range(0,5):
    
    dia = date.today() + timedelta(days = -retardo)
    dia = "{}-{}-{}".format(dia.year, str(dia.month).zfill(2), str(dia.day).zfill(2))
    print(date.today() + timedelta(days = -retardo))

    dia = datetime.strptime(dia, "%Y-%m-%d")

    # convert datetime to timestamp.
    dia_unix = int(datetime.timestamp(dia))

    lat = df_estaciones[df_estaciones["indicativo"] == estacion]["latitud"]
    lat = lat[lat.index[0]]
    lon = df_estaciones[df_estaciones["indicativo"] == estacion]["longitud"]
    lon = lon[lon.index[0]]


    lat = str(float(conversor_coordenadas(lat)))
    lon = str(float(conversor_coordenadas(lon)))

    print(lat, lon)

    api_key1 = "61da1382fcce5b67ce2ca4f27d9a34f4"
    api_key2 = "f21448c171f8f0584b48b3c51c9b6cd6"
    
    api_key = api_key1

    time = dia_unix

    url = "https://api.openweathermap.org/data/2.5/onecall/timemachine?lat={}&lon={}&dt={}&appid={}".format(lat, lon, time, api_key)


    response = get_response_OW(url)

    response = json.loads(response)
    df_clima_ow = pd.json_normalize(response["hourly"])

    df_we = []
    df_time = []
    df_hour = []
    df_estacion = []
    df_fecha = []
    for m in range(0,24):
        df_we.append(df_clima_ow["weather"][m][0]["id"])
        df_estacion.append(estacion)
        df_time.append(datetime.utcfromtimestamp(int(df_clima_ow["dt"][m])).strftime('%Y-%m-%d'))
        df_hour.append(datetime.utcfromtimestamp(int(df_clima_ow["dt"][m])).strftime('%H:%M'))
        hoy = "{}-{}-{}".format(date.today().year, str(date.today().month).zfill(2), str(date.today().day).zfill(2)) 
        df_fecha.append(hoy)
    df_we = pd.DataFrame(df_we, columns=['we'])  
    df_estacion = pd.DataFrame(df_estacion, columns=['estacion'])
    df_time = pd.DataFrame(df_time, columns=['date']) 
    df_hour = pd.DataFrame(df_hour, columns=['hour']) 
    df_fecha = pd.DataFrame(df_fecha, columns=['fecha prediccion']) 


    df_clima_ow = pd.concat([df_clima_ow, df_we], axis=1)
    df_clima_ow = df_clima_ow.drop("weather", axis = 1)

    df_clima_ow = pd.concat([df_estacion, df_clima_ow], axis=1)

    df_time = pd.concat([df_time, df_hour, df_fecha], axis=1)
    df_clima_ow = pd.concat([df_time, df_clima_ow], axis=1)
    df_clima_ow = df_clima_ow.drop("dt", axis = 1)
    #print(df_clima_ow)
    
    if not(path.exists('./data/Clima_ow')):
        df_clima_ow_total = pd.DataFrame()
        df_clima_ow_total.to_csv('./data/Clima_ow', index = False, header = False)
    
    columnas = pd.DataFrame(df_clima_ow.columns)
    columnas = columnas.transpose()

    #Si el tamaño es 0 significa que el contenido está vacio.
    if (os.stat('./data/Clima_ow').st_size == 0):
        df_clima_ow.to_csv('./data/Clima_ow', header = columnas.all, index = False)
        #print(df_clima_ow.head())
    else:
        df_clima_ow_total = pd.read_csv('./data/Clima_ow')
        df_clima_ow_total = df_clima_ow_total.append(df_clima_ow, ignore_index = True)
        #print(df_clima_ow_total)
        df_clima_ow_total.to_csv('./data/Clima_ow', index = False, header = columnas.all)    




2021-03-10
41.41833333333333 2.1241666666666665
Success!
2021-03-09
41.41833333333333 2.1241666666666665
Success!
2021-03-08
41.41833333333333 2.1241666666666665
Success!
2021-03-07
41.41833333333333 2.1241666666666665
Success!
2021-03-06
41.41833333333333 2.1241666666666665
Success!


# Datos de prediccion climatológica de los siguientes 48 horas de OpenWeather
<div style = "float:right"><a style="text-decoration:none" href = "#Obtención-de-datos-históricos-para-el-primer-modelo">

Celdas para experimentar con los datos y poder realizar una llamada diaria para obtener los datos

El proceso final de obtención de datos se realiza en el script `Obtención_datos_periodica`

In [71]:
estacion = "0200E"

from datetime import timezone, datetime, date, timedelta
import os
import os.path as path


#Día
ayer = date.today()


lat = df_estaciones[df_estaciones["indicativo"] == estacion]["latitud"]
lat = lat[lat.index[0]]
lon = df_estaciones[df_estaciones["indicativo"] == estacion]["longitud"]
lon = lon[lon.index[0]]
        
       
lat = str(float(conversor_coordenadas(lat)))
lon = str(float(conversor_coordenadas(lon)))

print(lat, lon)

api_key1 = "61da1382fcce5b67ce2ca4f27d9a34f4"
api_key2 = "f21448c171f8f0584b48b3c51c9b6cd6"
    
api_key = api_key1

exclude = "current,minutely,daily,alerts"

url = "https://api.openweathermap.org/data/2.5/onecall?lat={}&lon={}&exclude={}&appid={}".format(lat, lon, exclude, api_key)


response = get_response_OW(url)
response = json.loads(response)
df_pred_ow = pd.json_normalize(response["hourly"])


df_we = []
df_time = []
df_hour = []
df_estacion = []
df_fecha = []
for m in range(0,48):
    df_we.append(df_pred_ow["weather"][m][0]["id"])
    df_estacion.append(estacion)
    df_time.append(datetime.utcfromtimestamp(int(df_pred_ow["dt"][m])).strftime('%Y-%m-%d'))
    df_hour.append(datetime.utcfromtimestamp(int(df_pred_ow["dt"][m])).strftime('%H:%M'))
    hoy = "{}-{}-{}".format(date.today().year, str(date.today().month).zfill(2), str(date.today().day).zfill(2)) 
    df_fecha.append(hoy)
df_we = pd.DataFrame(df_we, columns=['we'])  
df_estacion = pd.DataFrame(df_estacion, columns=['estacion'])
df_time = pd.DataFrame(df_time, columns=['date']) 
df_hour = pd.DataFrame(df_hour, columns=['hour'])
df_fecha = pd.DataFrame(df_fecha, columns=['fecha prediccion']) 

df_pred_ow = pd.concat([df_pred_ow, df_we], axis=1)
df_pred_ow = df_pred_ow.drop("weather", axis = 1)

df_pred_ow = pd.concat([df_estacion, df_pred_ow], axis=1)

df_time = pd.concat([df_time, df_hour, df_fecha], axis=1)
df_pred_ow = pd.concat([df_time, df_pred_ow], axis=1)
df_pred_ow = df_pred_ow.drop("dt", axis = 1)
#print(df_pred_ow)


if not(path.exists('./data/Pred_ow')):
    df_pred_ow_total = pd.DataFrame()
    df_pred_ow_total.to_csv('./data/Pred_ow', index = False, header = False)
    
columnas = pd.DataFrame(df_pred_ow.columns)
columnas = columnas.transpose()

#Si el tamaño es 0 significa que el contenido está vacio.
if (os.stat('./data/Pred_ow').st_size == 0):
    df_pred_ow.to_csv('./data/Pred_ow', header = columnas.all, index = False)
    print(df_pred_ow)
else:
    df_pred_ow_total = pd.read_csv('./data/Pred_ow')
    df_pred_ow_total = df_pred_ow_total.append(df_pred_ow, ignore_index = True)
    print(df_pred_ow_total)
    df_pred_ow_total.to_csv('./data/Pred_ow', index = False, header = columnas.all)    


41.41833333333333 2.1241666666666665
Success!
          date   hour fecha prediccion estacion    temp  feels_like  pressure  \
0   2021-03-10  22:00       2021-03-10    0200E  283.37      279.57      1023   
1   2021-03-10  23:00       2021-03-10    0200E  283.47      279.68      1023   
2   2021-03-11  00:00       2021-03-10    0200E  283.33      279.68      1023   
3   2021-03-11  01:00       2021-03-10    0200E  283.11      279.56      1022   
4   2021-03-11  02:00       2021-03-10    0200E  282.85      279.26      1022   
5   2021-03-11  03:00       2021-03-10    0200E  282.67      279.10      1022   
6   2021-03-11  04:00       2021-03-10    0200E  282.57      279.16      1022   
7   2021-03-11  05:00       2021-03-10    0200E  282.40      279.03      1022   
8   2021-03-11  06:00       2021-03-10    0200E  282.24      278.85      1022   
9   2021-03-11  07:00       2021-03-10    0200E  282.42      279.22      1022   
10  2021-03-11  08:00       2021-03-10    0200E  283.22      27