Obtener datos energéticos usando la API de Red Eléctrica.

Descripción: La empresa para la que trabajamos dispone de una base de datos que contiene información sobre el número de personas censadas en las distintas Comunidades Autónomas españolas desde 1998 hasta 2022. El objetivo es enriquecer estos datos con información sobre la generación de energía renovable y no renovable, utilizando la API de REData, la cual proporciona información sobre el mercado energético en España.

1. Extracción de Datos a Nivel Nacional:

Extraer datos de generación de energía renovable y no renovable a nivel nacional desde el 1 de enero de 2011 hasta el 31 de diciembre de 2022. La información debe ser recopilada a nivel mensual.

Transformar los datos para incluir una columna nueva que identifique si la energía es renovable o no renovable.

Almacenar los datos en un DataFrame con la siguiente estructura:

In [3]:
# importamos las librerías que necesitamos

# Tratamiento de datos
# -----------------------------------------------------------------------
import pandas as pd

# Uso de API's
# -----------------------------------------------------------------------
import requests

# Importar librerías para procesamiento de texto
# -----------------------------------------------------------------------
import re

# Configuración
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames

In [8]:
# asi hemos empezado el ejercicio pero nos daba el error 500
# url_evolucion_energias = "https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date=2011-01-01T00:00&end_date=2022-12-31T23:59&time_trunc=month"

# llamada = requests.get(url_evolucion_energias)

In [11]:
# con trunc=month solo te deja hacer el rango de start date y end date en un mismo año
url_evolucion_energias = "https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date=2011-01-01T00:00&end_date=2011-12-31T23:59&time_trunc=month"

llamada = requests.get(url_evolucion_energias)

In [12]:
llamada.status_code

200

In [None]:
# para ver los datos de 2011
contenidos = llamada.json()
contenidos

In [15]:
len(contenidos)

2

In [17]:
contenidos.keys()

dict_keys(['data', 'included'])

In [18]:
contenidos['data']

{'type': 'Generación por tecnología',
 'id': 'gen1',
 'attributes': {'title': 'Generación por tecnología',
  'last-update': '2019-06-12T15:32:24.000+02:00',
  'description': None},
 'meta': {'cache-control': {'cache': 'HIT',
   'expireAt': '2024-09-21T07:33:14'}}}

In [19]:
contenidos['included']

[{'type': 'Hidráulica',
  'id': '10288',
  'groupId': '1',
  'attributes': {'title': 'Hidráulica',
   'description': None,
   'color': '#0090d1',
   'type': 'Renovable',
   'magnitude': None,
   'composite': False,
   'last-update': '2019-06-12T15:32:24.000+02:00',
   'values': [{'value': 5119512.38,
     'percentage': 0.19757364151478785,
     'datetime': '2011-01-01T00:00:00.000+01:00'},
    {'value': 2998051.279,
     'percentage': 0.12956959110916957,
     'datetime': '2011-02-01T00:00:00.000+01:00'},
    {'value': 3910363.276,
     'percentage': 0.15594663753166463,
     'datetime': '2011-03-01T00:00:00.000+01:00'},
    {'value': 3537937.995,
     'percentage': 0.16314748356694456,
     'datetime': '2011-04-01T00:00:00.000+02:00'},
    {'value': 2797500.027,
     'percentage': 0.1279110558374734,
     'datetime': '2011-05-01T00:00:00.000+02:00'},
    {'value': 2070305.344,
     'percentage': 0.09182271836090777,
     'datetime': '2011-06-01T00:00:00.000+02:00'},
    {'value': 1661

In [22]:
contenidos['included'][0]['type']

'Hidráulica'

In [24]:
# creamos una variable para almacenar al tipo de energia

tipo_energia = contenidos['included'][0]['type']
tipo_energia

'Hidráulica'

In [26]:
contenidos['included'][0].keys()

dict_keys(['type', 'id', 'groupId', 'attributes'])

In [28]:
contenidos['included'][0]['attributes']['type']

'Renovable'

In [29]:
# creamos una variable para almacenar si es renovable o no lo es

tipo_generacion = contenidos['included'][0]['attributes']['type']
tipo_generacion

'Renovable'

In [34]:
contenidos['included'][0]['attributes']['values'][0]['datetime']

'2011-01-01T00:00:00.000+01:00'

In [35]:
# creamos una variable para almacenar la fecha

fecha = contenidos['included'][0]['attributes']['values'][0]['datetime']
fecha

'2011-01-01T00:00:00.000+01:00'

In [37]:
contenidos['included'][0]['attributes']['values'][0]['value']

5119512.38

In [38]:
# creamos una variable para almacenar el valor del primer diccionario de la lista que se corresponde con enero

valor = contenidos['included'][0]['attributes']['values'][0]['value']
valor

5119512.38

In [39]:
# iteramos por la lista de diccionarios, que contiene 12, que a su ve se corresponden con los meses del año

lista_detalles_mes = contenidos['included'][0]['attributes']['values']
lista_values_2011 = []
lista_datetimes_2011 = []
for mes in lista_detalles_mes:
    lista_values_2011.append(mes['value']) 
    lista_datetimes_2011.append(mes['datetime'])

In [41]:
lista_values_2011

[5119512.38,
 2998051.279,
 3910363.276,
 3537937.995,
 2797500.027,
 2070305.344,
 1661925.007,
 1520944.891,
 1221591.745,
 1250278.628,
 2163287.326,
 2185620.242]

In [40]:
lista_datetimes_2011

['2011-01-01T00:00:00.000+01:00',
 '2011-02-01T00:00:00.000+01:00',
 '2011-03-01T00:00:00.000+01:00',
 '2011-04-01T00:00:00.000+02:00',
 '2011-05-01T00:00:00.000+02:00',
 '2011-06-01T00:00:00.000+02:00',
 '2011-07-01T00:00:00.000+02:00',
 '2011-08-01T00:00:00.000+02:00',
 '2011-09-01T00:00:00.000+02:00',
 '2011-10-01T00:00:00.000+02:00',
 '2011-11-01T00:00:00.000+01:00',
 '2011-12-01T00:00:00.000+01:00']

In [None]:
# f dinamica con variable de year

# iteramos por todos los años hasta 2022
# creamos una lista vacia que mas tarde incluiremos en nuestro diccionario que se acabara convirtiendo en tabla

lista_energia = []
lista_generacion = []
lista_fecha = []
lista_valor = []


for year in range(2011, 2023):

    url_anual = f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={year}-01-01T00:00&end_date={year}-12-31T23:59&time_trunc=month"
    llamada_anual = requests.get(url_anual)
    
    if llamada_anual.status_code != 200:
        print("Tu llamada presenta un error.")

    else:
        contenido_anual_json = llamada.json()
        print(contenido_anual_json)
        
        tipo_energia = contenido_anual_json['included'][0]['type']
        tipo_generacion = contenido_anual_json['included'][0]['attributes']['type']
        lista_detalles_mes = contenido_anual_json['included'][0]['attributes']['values']

        for mes in lista_detalles_mes:
            lista_valor.append(mes['value']) 
            lista_fecha.append(mes['datetime'])
            lista_energia.append(tipo_energia)
            lista_generacion.append(tipo_generacion)

In [None]:
# COPIADO Y PEGADO DE CARLA 
for año in range(2011, 2023):
    url = f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month"
    llamada = requests.get(url)
    llamada.status_code

    llamada_json = llamada.json()
    print(llamada_json)

In [10]:
# COPIADO Y PEGADO DE CARLA
import requests
# Inicializamos el diccionario donde almacenaremos los datos extraídos de la API.
datos_energia = {"tipo_de_energia": [], "tipo_generacion": [], "fecha": [], "valor": []}
# Año específico para el que se realizará la solicitud
año = 2011
# Construimos la URL para la solicitud de datos para el año especificado.
url = f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month"
# Realizamos la solicitud a la API.
llamada = requests.get(url)
# Comprobamos el código de estado de la respuesta para asegurarnos de que la llamada fue exitosa.
if llamada.status_code == 200:
    print(f"Solicitud exitosa para el año {año}")
    # Convertimos la respuesta en formato JSON para poder trabajar con los datos.
    llamada_json = llamada.json()

Solicitud exitosa para el año 2011


2. Extracción de Datos por Comunidad Autónoma:

Extraer datos de generación de energía renovable y no renovable por Comunidad Autónoma.

Utilizar el diccionario cod_comunidades para obtener los códigos de cada comunidad autónoma.

Transformar los datos para incluir una columna que especifique la comunidad autónoma y su identificador.

Almacenar los datos en un DataFrame con la siguiente estructura:

In [None]:
cod_comunidades = {'Ceuta': 8744,
                    'Melilla': 8745,
                    'Andalucía': 4,
                    'Aragón': 5,
                    'Cantabria': 6,
                    'Castilla - La Mancha': 7,
                    'Castilla y León': 8,
                    'Cataluña': 9,
                    'País Vasco': 10,
                    'Principado de Asturias': 11,
                    'Comunidad de Madrid': 13,
                    'Comunidad Foral de Navarra': 14,
                    'Comunitat Valenciana': 15,
                    'Extremadura': 16,
                    'Galicia': 17,
                    'Illes Balears': 8743,
                    'Canarias': 8742,
                    'Región de Murcia': 21,
                    'La Rioja': 20}