In [None]:
## PAIR APIs
# Obtener datos energéticos usando la API de Red Eléctrica.
# BBDD número de personas censadas en las distintas Comunidades Autónomas españolas 
# desde 1998 hasta 2022.
# OBJETIVO: enriquecer datos con info sobre la generación de energia renovable y no renovable
# usando la API REData, información sobre mercado energético en España

**Ejercicio 1: Ejercicio generación renovable/no renovable nacional**

### Extracción de Datos a Nivel Nacional:
- Extraer datos de generación de energía renovable y no renovable a nivel nacional desde el 1 de enero de 2011 hasta el 31 de diciembre de 2022. La información debe ser recopilada a nivel mensual.
- Transformar los datos para incluir una columna nueva que identifique si la energía es renovable o no renovable.
- Almacenar los datos en un DataFrame con la siguiente estructura:

In [None]:
import requests
import pandas as pd

In [None]:
# Configuración
# -----------------------------------------------------------------------
pd.set_option('display.max_columns', None) # para poder visualizar todas las columnas de los DataFrames

EN PRIMER LUGAR, creamos un diccionario para la tabla en función de lo que nos piden:                      (ver tabla ejercicio)

In [None]:
diccionario_año = {"tipo_energia": [], "tipo_generacion": [], "fecha": [], "valor": []}

ahora necesitamos un bucle for para iterar por años, es decir, buscar info por años:

In [None]:
for x in range(2011,2023):
    print(x)

In [None]:
for x in range(2020,2026):
    y = f"este es el año {x}"
    print(y)

In [None]:
for año in range(2011,2023):
    url =  f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month"
    print(url)

In [None]:
datos_energia = requests.get(url)

In [None]:
datos_energia.status_code

In [None]:
datos_json = datos_energia.json()
print(datos_energia.json())
type(datos_json)

In [None]:
df = pd.json_normalize(datos_json['included'])
print(df)

In [None]:
print(datos_json.keys())  # Muestra las claves principales del JSON

In [None]:
df = pd.json_normalize(datos_json["included"][0]["attributes"]["values"])
print(df)

In [None]:
## CORRECCIÓN                                                                                                               
diccionario_año = {"tipo_energia": [], "tipo_generacion": [], "fecha": [], "valor": []}
## IMPORTANTE crear diccionaro PARA CREAR TABLA !!!! ORDENAR, NORMALIZAR

In [None]:
'''for año in range(2011,2023):
    url =  f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month"
    datos_energia = requests.get(url)
      #transformamos data API solicitada a formato json (para leer)
    json_año = datos_energia.json()
    print(json_año)'''

In [None]:
''' ahora es necesario incluir los datos a la tabla,
    para eso necesitamos otro bucle que inserte en el json (que son diccionarios)
    Los archivos .json (JavaScript Object Notation) tienen un formato basado en texto y estructurado en pares clave-valor,
      parecido a los diccionarios en Python o los objetos en JavaScript.'''

    ## Un archivo .json usa corchetes {} para objetos y corchetes [] para listas.
    # son listas de diccionarios

''' CONTINUAMOS BUCLE'''
for año in range(2011,2023):
    url =  f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month"
    datos_energia = requests.get(url)
      #transformamos data API solicitada a formato json (para leer)
    json_año = datos_energia.json()
    
    for api in json_año['included']:
        for dato in api['attributes']['values']: #añadimos datos de api a x en forma de dict
            diccionario_año['tipo_energia'].append(api['attributes']['title'])
            diccionario_año['tipo_generacion'].append(api['attributes']['type'])
            diccionario_año['valor'].append(dato['value'])
            diccionario_año['fecha'].append(dato['datetime'])
    
    

In [None]:
df_año = pd.DataFrame(diccionario_año)
df_año

*BONUS:*

Si pudiste realizar el primer ejercicio, te animamos a desafiarte a ti misma con el siguiente en forma de bonus.

**Extracción de Datos por Comunidad Autónoma:**

Extraer datos de generación de energía renovable y no renovable por Comunidad Autónoma.

Utilizar el diccionario cod_comunidades para obtener los códigos de cada comunidad autónoma.

Transformar los datos para incluir una columna que especifique la comunidad autónoma y su identificador.

Almacenar los datos en un DataFrame con la siguiente estructura:

In [1]:
cod_comunidades = {'Ceuta': 8744,
                    'Melilla': 8745,
                    'Andalucía': 4,
                    'Aragón': 5,
                    'Cantabria': 6,
                    'Castilla - La Mancha': 7,
                    'Castilla y León': 8,
                    'Cataluña': 9,
                    'País Vasco': 10,
                    'Principado de Asturias': 11,
                    'Comunidad de Madrid': 13,
                    'Comunidad Foral de Navarra': 14,
                    'Comunitat Valenciana': 15,
                    'Extremadura': 16,
                    'Galicia': 17,
                    'Illes Balears': 8743,
                    'Canarias': 8742,
                    'Región de Murcia': 21,
                    'La Rioja': 20}

In [2]:
cod_comunidades.values()

dict_values([8744, 8745, 4, 5, 6, 7, 8, 9, 10, 11, 13, 14, 15, 16, 17, 8743, 8742, 21, 20])

In [4]:
import requests
import pandas as pd

In [6]:

# Define el dict para el df
diccionario_ccaa = {"tipo_energia": [], "tipo_generacion": [], "fecha": [], "valor": [], "ccaa": []}
# Define the URL with the appropriate variable
# HACEMOS BUCLE FOR PARA DICCIONARIO(CLAVE- K, VALOR - V)
for k, v in cod_comunidades.items():
    for año in range(2011, 2023): 
        url_ccaa=  f"https://apidatos.ree.es/es/datos/generacion/estructura-generacion?start_date={año}-01-01T00:00&end_date={año}-12-31T23:59&time_trunc=month&geo_limit=ccaa&geo_ids={v}"
        datos_ccaa =  requests.get(url_ccaa)
        
        if datos_ccaa.status_code == 200:
            try:
                json_ccaa = datos_ccaa.json()
                print(json_ccaa)

                for api in json_ccaa['included']:
                    for dato in api["attributes"]["values"]:
                        diccionario_ccaa["tipo_energia"].append(api["attributes"]["title"])
                        diccionario_ccaa["tipo_generacion"].append(api["attributes"]["type"])
                        diccionario_ccaa["valor"].append(dato["value"])
                        diccionario_ccaa["fecha"].append(dato["datetime"])
                        diccionario_ccaa["ccaa"].append(k)
            except ValueError:
                print(f"Error decoding JSON for {url_ccaa}")
        else:
            print(f"Request failed for {url_ccaa} with status code {datos_ccaa.status_code}")

df_ccaa = pd.DataFrame(diccionario_ccaa)
df_ccaa

{'data': {'type': 'Generación por tecnología', 'id': 'gen1', 'attributes': {'title': 'Generación por tecnología', 'last-update': '2019-06-12T15:32:24.000+02:00', 'description': None}, 'meta': {'cache-control': {'cache': 'HIT', 'expireAt': '2025-04-08T11:53:07'}}}, 'included': [{'type': 'Motores diésel', 'id': '10344', 'groupId': '1', 'attributes': {'title': 'Motores diésel', 'description': None, 'color': '#8DA69F', 'icon': None, 'type': 'No-Renovable', 'magnitude': None, 'composite': False, 'last-update': '2018-12-21T10:43:15.000+01:00', 'values': [{'value': 16727.395, 'percentage': 0.9984123785647769, 'datetime': '2011-01-01T00:00:00.000+01:00'}, {'value': 15216.784, 'percentage': 0.9979209739248868, 'datetime': '2011-02-01T00:00:00.000+01:00'}, {'value': 16429.358, 'percentage': 1, 'datetime': '2011-03-01T00:00:00.000+01:00'}, {'value': 14974.756, 'percentage': 1, 'datetime': '2011-04-01T00:00:00.000+02:00'}, {'value': 15951.381, 'percentage': 0.9891760027701971, 'datetime': '2011-05

Unnamed: 0,tipo_energia,tipo_generacion,fecha,valor,ccaa
0,Motores diésel,No-Renovable,2011-01-01T00:00:00.000+01:00,16727.395,Ceuta
1,Motores diésel,No-Renovable,2011-02-01T00:00:00.000+01:00,15216.784,Ceuta
2,Motores diésel,No-Renovable,2011-03-01T00:00:00.000+01:00,16429.358,Ceuta
3,Motores diésel,No-Renovable,2011-04-01T00:00:00.000+02:00,14974.756,Ceuta
4,Motores diésel,No-Renovable,2011-05-01T00:00:00.000+02:00,15951.381,Ceuta
...,...,...,...,...,...
338,Generación total,Generación total,2020-08-01T00:00:00.000+02:00,18096.779,Ceuta
339,Generación total,Generación total,2020-09-01T00:00:00.000+02:00,16830.054,Ceuta
340,Generación total,Generación total,2020-10-01T00:00:00.000+02:00,16095.768,Ceuta
341,Generación total,Generación total,2020-11-01T00:00:00.000+01:00,15792.687,Ceuta
