# Descarga datos esios

## Documentacion:

La nueva web pública de e·sios pone a disposición de todos los usuarios una API para la descarga de información, cuya documentación se encuentra disponible en https://api.esios.ree.es.

Para poder utilizar esta API deberán solicitar un token personal enviando un correo a **consultasios@ree.es**.En mi caso:

token: 9d6bcd627698602fbcd18721cca88b90d0f6e6025963f86be84fa18c87801a10

En nuestro caso, la solicitud de datos será para un periodo de tiempo solicitando los datos por código indicador:

https://api.esios.ree.es/indicator/getting_a_specific_indicator_filtering_values_by_a_date_range


## 1. Importamos librerías necesarias

In [1]:
import pandas as pd
import numpy as np
import requests
import json

In [2]:
requests.get?

[0;31mSignature:[0m [0mrequests[0m[0;34m.[0m[0mget[0m[0;34m([0m[0murl[0m[0;34m,[0m [0mparams[0m[0;34m=[0m[0;32mNone[0m[0;34m,[0m [0;34m**[0m[0mkwargs[0m[0;34m)[0m[0;34m[0m[0m
[0;31mDocstring:[0m
Sends a GET request.

:param url: URL for the new :class:`Request` object.
:param params: (optional) Dictionary or bytes to be sent in the query string for the :class:`Request`.
:param \*\*kwargs: Optional arguments that ``request`` takes.
:return: :class:`Response <Response>` object
:rtype: requests.Response
[0;31mFile:[0m      /anaconda3/lib/python3.6/site-packages/requests/api.py
[0;31mType:[0m      function


## 2. Definición features

Creamos diccionario

In [2]:
d={10010: 'P48_EOLICA',
   10027: 'P48_DEMANDA',
   10008: 'P48_CARBON',
   #475: 'POT_DISP_HULLA_ANT',  #Los tendremos que sumar para obtener MW disponibles Carbón
   #476: 'POT_DISP_HULA_SB',
   #600: [['PRECIO_MD_ESP',3],['PRECIO_MD_FR',2]],
   #612: 'PRECIO_I1'
  }

In [3]:
d.items()

dict_items([(10010, 'P48_EOLICA'), (10027, 'P48_DEMANDA'), (10008, 'P48_CARBON'), (600, [['PRECIO_MD_ESP', 3], ['PRECIO_MD_FR', 2]])])

En el caso del id_precios habrá que adentrarse un nivel adicional y consultar GEOIDS:

* ESPAÑA = 3
* FRANCIA = 2

## 3. Funciones solicitud datos

Función para obtener los datos del indicador *ind* solicitado entre dos fechas dadas.

En nuestro dataset se nos presentan 2 peculiaridades a introducir en la función:

1) Existe un único indicador para los precios de cada mercado, diferenciándose el pais por el parámetro GEOIDS --> **solicita_datos_precios**

2) Los datos de potencia disponible hay que agregarlos porque viene desglosada en comunidades --> **solicita datos disponibles**

In [23]:
def solicita_datos_general(fecha_ini,fecha_fin,ind):

    headers_={'Accept': 'application/json; application/vnd.esios-api-v1+json',
              'Content-Type': 'application/json',
              'Host': 'api.esios.ree.es',
              'Authorization': 'Token token="9d6bcd627698602fbcd18721cca88b90d0f6e6025963f86be84fa18c87801a10"',
              'Cookie':''
             }

    query_parametros_={'start_date': fecha_ini,
                'end_date':fecha_fin}

    url_='https://api.esios.ree.es/indicators/' + str(ind)
    
    #Hacemos peticion:
    r = requests.get(url_,headers=headers_,params=query_parametros_)
    
    #Comprobamos que trae datos
    assert r.status_code==200
    
    #r.content --> durante el diseño para explorar datos
    
    data=json.loads(r.content)
    
    #type(data)
    #data['indicator']['values'] --> durante el diseño para explorar datos
    
    df_data=pd.DataFrame(data['indicator']['values'])
    
    #df_data.dtypes --> Tenemos que convertir las fechas a formato fecha
    #y crear nuestro df
    
    df=pd.DataFrame()        
    df['datetime']=pd.to_datetime([f[:10] + ' ' + f[11:13] + ':00:00' for f in df_data['datetime']]) 
    df['value']=df_data['value']
    
    #df['period']=pd.Series([int(f[11:13])+1 for f in df_data['datetime']]) La crearemos al final
    
    df=df.set_index('datetime')

    return df

In [116]:
def solicita_datos_precios(fecha_ini,fecha_fin,lista):
    
    headers_={'Accept': 'application/json; application/vnd.esios-api-v1+json',
              'Content-Type': 'application/json',
              'Host': 'api.esios.ree.es',
              'Authorization': 'Token token="9d6bcd627698602fbcd18721cca88b90d0f6e6025963f86be84fa18c87801a10"',
              'Cookie':''
             }

    query_parametros_={'start_date': fecha_ini,
                       'end_date': fecha_fin}

    url_='https://api.esios.ree.es/indicators/600'

    #Hacemos peticion:
    r = requests.get(url_,headers=headers_,params=query_parametros_)

    #Comprobamos que trae datos
    assert r.status_code==200

    data=json.loads(r.content)

    data['indicator']['values'] 

    df_data=pd.DataFrame(data['indicator']['values'])

    df=pd.DataFrame()
    for i in enumerate(lista):
        df_subset=pd.DataFrame()
        df_data_subset=df_data[df_data['geo_id']==i[1][1]]
        df_subset['datetime']=pd.to_datetime([f[:10] + ' ' + f[11:13] + ':00:00' for f in df_data_subset['datetime']]) 
        df_subset['value']=df_data_subset['value']
        print(df_subset)
        #df_subset[i[1][0]]=df_data_subset['value']
        #df_subset=df_subset.set_index('datetime')
        #print(df_subset)
    #return df
        
       
 

In [117]:
a=solicita_datos_precios('2015-10-01 00:00:00','2015-10-01 23:59:59',[['PRECIO_MD_ESP',3],['PRECIO_MD_FR',2]])


              datetime  value
0  2015-10-01 00:00:00    NaN
1  2015-10-01 01:00:00    NaN
2  2015-10-01 02:00:00  56.65
3  2015-10-01 03:00:00    NaN
4  2015-10-01 04:00:00    NaN
5  2015-10-01 05:00:00  53.50
6  2015-10-01 06:00:00    NaN
7  2015-10-01 07:00:00    NaN
8  2015-10-01 08:00:00  49.69
9  2015-10-01 09:00:00    NaN
10 2015-10-01 10:00:00    NaN
11 2015-10-01 11:00:00  49.10
12 2015-10-01 12:00:00    NaN
13 2015-10-01 13:00:00    NaN
14 2015-10-01 14:00:00  51.25
15 2015-10-01 15:00:00    NaN
16 2015-10-01 16:00:00    NaN
17 2015-10-01 17:00:00  53.60
18 2015-10-01 18:00:00    NaN
19 2015-10-01 19:00:00    NaN
20 2015-10-01 20:00:00  58.02
21 2015-10-01 21:00:00    NaN
22 2015-10-01 22:00:00    NaN
23 2015-10-01 23:00:00  63.03
              datetime  value
0  2015-10-01 00:00:00    NaN
1  2015-10-01 01:00:00  38.56
2  2015-10-01 02:00:00    NaN
3  2015-10-01 03:00:00    NaN
4  2015-10-01 04:00:00  31.27
5  2015-10-01 05:00:00    NaN
6  2015-10-01 06:00:00    NaN
7  2015-10

df['datetime']=pd.to_datetime([f[:10] + ' ' + f[11:13] + ':00:00' for f in df_data_subset['datetime']]) 
        df=df.set_index('datetime')
        df.columns=[str(i[1][0])]
        historico=pd.concat([df,historico],axis=1)
        historico.head()

## 4. Agregación dataset

In [24]:
datos_esios=pd.DataFrame()  #será nuestro set de datos

fecha_ini_='2015-10-01 00:00:00'
fecha_fin_='2018-09-30 23:59:59'

Definimos parámetros de entrada:

La idea inicial es que mi dataset empiece en 01/10/2015 hasta 30/09/2018.

He escogido 3 años móviles, teniendo en cuenta que el año hidráulico comienza el octubre (y la hidraulicidad es importante en el Mercado eléctrico) e intentar evitar el efecto de cambios regulatorios en la mayor medida posible

In [28]:
for k,v in d.items():
    historico=solicita_datos_general(fecha_ini_,fecha_fin_,k)
    historico.columns=[str(v)]
    datos_esios=pd.concat([datos_esios,historico],axis=1)

In [30]:
datos_esios.head()

Unnamed: 0_level_0,P48_EOLICA,P48_DEMANDA,P48_CARBON
datetime,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2015-10-01 00:00:00,2196.1,24517.1,8203.3
2015-10-01 01:00:00,2064.4,23168.6,8286.8
2015-10-01 02:00:00,1866.5,22437.2,8301.3
2015-10-01 03:00:00,1660.9,22281.3,8281.3
2015-10-01 04:00:00,1373.9,21909.7,8247.7


## 5. Check datos

In [31]:
datos_esios.describe()

Unnamed: 0,P48_EOLICA,P48_DEMANDA,P48_CARBON
count,26304.0,26304.0,26304.0
mean,5479.286014,28672.990169,4409.936025
std,3185.927399,4616.496856,2216.248299
min,240.8,17728.4,546.0
25%,3018.4,24734.15,2316.975
50%,4822.95,28920.6,4634.0
75%,7289.25,32267.65,6282.75
max,16952.6,41297.9,8768.3


In [32]:
datos_esios.shape  #para testear que no tengo NA

(26304, 3)

## 6. Salvar datos