**EJERCICIO PAIR - API'S**

Enunciado - Obtener datos energéticos usando la API de Red Eléctrica.

Descripción: La empresa para la que trabajamos dispone de una base de datos que contiene información sobre el número de personas censadas en las distintas Comunidades Autónomas españolas desde 1998 hasta 2022. El objetivo es enriquecer estos datos con información sobre la generación de energía renovable y no renovable, utilizando la API de REData, la cual proporciona información sobre el mercado energético en España. Puedes encontrar la documentación de la API aquí.

. Extracción de Datos a Nivel Nacional:

Extraer datos de generación de energía renovable y no renovable a nivel nacional desde el 1 de enero de 2011 hasta el 31 de diciembre de 2022. La información debe ser recopilada a nivel mensual.

In [1]:
import requests
import pandas as pd

In [2]:
periodo_años = []
posicion = 0

for año in range(2011, 2023):

    periodo_años.append(año)
    url_datos_energeticos = f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={periodo_años[posicion]}-01-01T00:00&end_date={periodo_años[posicion]}-12-31T23:59&time_trunc=month&geo"
    posicion += 1
    llamada_datos_energeticos = requests.get(url_datos_energeticos)

llamada_datos_energeticos


<Response [200]>

In [3]:
datos_energeticos = llamada_datos_energeticos.json()

datos_energeticos

{'data': {'type': 'Generación por tecnología',
  'id': 'gen1',
  'attributes': {'title': 'Generación por tecnología',
   'last-update': '2022-12-12T12:48:47.000+01:00',
   'description': None},
  'meta': {'cache-control': {'cache': 'MISS'}}},
 'included': [{'type': 'Hidráulica',
   'id': '10288',
   'groupId': '1',
   'attributes': {'title': 'Hidráulica',
    'description': None,
    'color': '#0090d1',
    'type': 'Renovable',
    'magnitude': None,
    'composite': False,
    'last-update': '2022-12-12T12:48:38.000+01:00',
    'values': [{'value': 2085857.451,
      'percentage': 0.08582950714262061,
      'datetime': '2022-01-01T00:00:00.000+01:00'},
     {'value': 1174970.17,
      'percentage': 0.05563114753653532,
      'datetime': '2022-02-01T00:00:00.000+01:00'},
     {'value': 1775478.144,
      'percentage': 0.07797540348807623,
      'datetime': '2022-03-01T00:00:00.000+01:00'},
     {'value': 1802751.588,
      'percentage': 0.08279938338802582,
      'datetime': '2022-04-0

In [4]:
datos_energeticos["data"].keys()

dict_keys(['type', 'id', 'attributes', 'meta'])

In [5]:
len(datos_energeticos["included"])

datos_energeticos["included"][0]["attributes"]["title"]

'Hidráulica'

In [6]:
datos_energeticos.keys()

dict_keys(['data', 'included'])

In [10]:
# Inicializamos el diccionario donde almacenaremos los datos
diccionario_energias = {"tipo_energia": [], "tipo_generacion": [], "fecha": [], "valor": []}

# Accedemos a los resultados principales
resultados = datos_energeticos["included"]

# Recorremos cada diccionario en "included"
for diccionario in resultados:
    tipo_energia = diccionario["type"]  # Tipo de energía
    tipo_generacion = diccionario["attributes"]["type"]
    # Ahora recorremos los datos individuales de generación
    for generacion in diccionario["attributes"]["values"]:
        fecha = generacion["datetime"]
        valor = generacion["value"]

        # Agregamos los datos al diccionario
        diccionario_energias["tipo_energia"].append(tipo_energia)
        diccionario_energias["fecha"].append(fecha)
        diccionario_energias["valor"].append(valor)
        diccionario_energias["tipo_generacion"].append(tipo_generacion)

# Verificación de los primeros datos
print(diccionario_energias["tipo_energia"][:5])
print(diccionario_energias["fecha"][:5])
print(diccionario_energias["valor"][:5])
print(diccionario_energias["tipo_generacion"][:5])

['Hidráulica', 'Hidráulica', 'Hidráulica', 'Hidráulica', 'Hidráulica']
['2022-01-01T00:00:00.000+01:00', '2022-02-01T00:00:00.000+01:00', '2022-03-01T00:00:00.000+01:00', '2022-04-01T00:00:00.000+02:00', '2022-05-01T00:00:00.000+02:00']
[2085857.451, 1174970.17, 1775478.144, 1802751.588, 1923714.557]
['Renovable', 'Renovable', 'Renovable', 'Renovable', 'Renovable']


In [11]:
df_energias = pd.DataFrame(diccionario_energias)
df_energias

Unnamed: 0,tipo_energia,tipo_generacion,fecha,valor
0,Hidráulica,Renovable,2022-01-01T00:00:00.000+01:00,2.085857e+06
1,Hidráulica,Renovable,2022-02-01T00:00:00.000+01:00,1.174970e+06
2,Hidráulica,Renovable,2022-03-01T00:00:00.000+01:00,1.775478e+06
3,Hidráulica,Renovable,2022-04-01T00:00:00.000+02:00,1.802752e+06
4,Hidráulica,Renovable,2022-05-01T00:00:00.000+02:00,1.923715e+06
...,...,...,...,...
201,Generación total,Generación total,2022-08-01T00:00:00.000+02:00,2.528589e+07
202,Generación total,Generación total,2022-09-01T00:00:00.000+02:00,2.366621e+07
203,Generación total,Generación total,2022-10-01T00:00:00.000+02:00,2.195664e+07
204,Generación total,Generación total,2022-11-01T00:00:00.000+01:00,2.152262e+07


In [12]:
df_energias.tail()

Unnamed: 0,tipo_energia,tipo_generacion,fecha,valor
201,Generación total,Generación total,2022-08-01T00:00:00.000+02:00,25285890.0
202,Generación total,Generación total,2022-09-01T00:00:00.000+02:00,23666210.0
203,Generación total,Generación total,2022-10-01T00:00:00.000+02:00,21956640.0
204,Generación total,Generación total,2022-11-01T00:00:00.000+01:00,21522620.0
205,Generación total,Generación total,2022-12-01T00:00:00.000+01:00,22230770.0


2. Extracción de Datos por Comunidad Autónoma:

- Extraer datos de generación de energía renovable y no renovable por Comunidad Autónoma.

- Utilizar el diccionario cod_comunidades para obtener los códigos de cada comunidad autónoma.

- Transformar los datos para incluir una columna que especifique la comunidad autónoma y su identificador.

In [None]:
cod_comunidades = {'Ceuta': 8744,
                    'Melilla': 8745,
                    'Andalucía': 4,
                    'Aragón': 5,
                    'Cantabria': 6,
                    'Castilla - La Mancha': 7,
                    'Castilla y León': 8,
                    'Cataluña': 9,
                    'País Vasco': 10,
                    'Principado de Asturias': 11,
                    'Comunidad de Madrid': 13,
                    'Comunidad Foral de Navarra': 14,
                    'Comunitat Valenciana': 15,
                    'Extremadura': 16,
                    'Galicia': 17,
                    'Illes Balears': 8743,
                    'Canarias': 8742,
                    'Región de Murcia': 21,
                    'La Rioja': 20}

In [13]:
periodo_años = []
posicion = 0

for año in range(2011, 2023):
    for comunidad.values() in cod_comunidades:
        periodo_años.append(año)
        url_datos_energeticos_ccaa = f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={periodo_años[posicion]}-01-01T00:00&end_date={periodo_años[posicion]}-12-31T23:59&time_trunc=month&geo_limit=ccaa&geo_ids={comunidad}"
        posicion += 1
        llamada_datos_energeticos_ccaa = requests.get(url_datos_energeticos_ccaa)

llamada_datos_energeticos_ccaa

<Response [200]>

In [14]:
datos_energeticos_ccaa = llamada_datos_energeticos_ccaa.json()

datos_energeticos_ccaa

{'data': {'type': 'Generación por tecnología',
  'id': 'gen1',
  'attributes': {'title': 'Generación por tecnología',
   'last-update': '2022-12-12T12:48:47.000+01:00',
   'description': None},
  'meta': {'cache-control': {'cache': 'MISS'}}},
 'included': [{'type': 'Hidráulica',
   'id': '10288',
   'groupId': '1',
   'attributes': {'title': 'Hidráulica',
    'description': None,
    'color': '#0090d1',
    'type': 'Renovable',
    'magnitude': None,
    'composite': False,
    'last-update': '2022-12-12T12:48:38.000+01:00',
    'values': [{'value': 2085857.451,
      'percentage': 0.0429147537690877,
      'datetime': '2022-01-01T00:00:00.000+01:00'},
     {'value': 1174970.17,
      'percentage': 0.027815573951327884,
      'datetime': '2022-02-01T00:00:00.000+01:00'},
     {'value': 1775478.144,
      'percentage': 0.03898770239983407,
      'datetime': '2022-03-01T00:00:00.000+01:00'},
     {'value': 1802751.588,
      'percentage': 0.04139969317525416,
      'datetime': '2022-04-0