<div style="text-align: center;">
  <img src="https://github.com/Hack-io-Data/Imagenes/blob/main/01-LogosHackio/logo_amarillo@4x.png?raw=true" alt="esquema" />
</div>


# Laboratorio ETL: Análisis del Sistema Energético en España

## Objetivo

Durante todos los laboratorios de esta semana realizarás un proceso completo de ETL para analizar la relación entre la demanda, el consumo y la generación eléctrica en diferentes provincias de España a lo largo de un año. Además, complementarán este análisis con datos demográficos y económicos extraídos del Instituto Nacional de Estadística (INE). El **objetivo principal** del análisis es **examinar cómo la demanda, el consumo y la generación eléctrica en diferentes provincias de España a lo largo de los años están influenciados por factores demográficos y económicos, como la población y el PIB provincial**. El análisis busca identificar patrones y correlaciones entre estas variables para comprender mejor las dinámicas energéticas regionales y su relación con el desarrollo socioeconómico en España.

Antes de realizar el análisis, vamos a definir las hipótesis con las que vamos a trabajar, las cuales definirán todo tu análisis y planteamiento de los laboratorios: 

- **Hipótesis 1: La demanda eléctrica está correlacionada con la población de la provincia.** Provincias con mayor población tienden a tener una mayor demanda eléctrica.
  
- **Hipótesis 2: El crecimiento económico (medido por el PIB) está correlacionado con el consumo eléctrico.** Las provincias con un PIB más alto o en crecimiento experimentan un mayor consumo de energía.

- **Hipótesis 3: La proporción de generación renovable está relacionada con factores económicos o geográficos.** Provincias con un mayor desarrollo económico o con condiciones geográficas favorables (como más horas de sol o viento) tienden a generar más energía renovable.


## Tareas Laboratorio Carga

En este laboratorio, tu objetivo será diseñar la estructura de una base de datos relacional, crear las tablas necesarias y cargar en ellas los datos limpios y preparados que obtuviste en el laboratorio anterior. Trabajarás con datos relacionados con la demanda, generación eléctrica, y variables socioeconómicas, almacenándolos de manera eficiente para facilitar el análisis y las consultas posteriores.


- **Diseño de la Base de Datos:** Define una estructura de base de datos relacional que sea adecuada para almacenar los datos de demanda eléctrica, generación eléctrica, población y PIB por provincia.

- **Creación de la Base de Datos:** Escribe los scripts SQL necesarios para crear las tablas definidas en la estructura de la base de datos. Asegúrate de definir correctamente los tipos de datos y las restricciones (e.g., `NOT NULL`, `UNIQUE`).

- **Carga de Datos en la Base de Datos:** Utiliza Python para cargar los datos limpios y preparados en las tablas de la base de datos. Asegúrate de que los datos se insertan correctamente, manejando posibles errores o inconsistencias en los datos.


In [1]:
# Librerías para tratamiento de datos

import pandas as pd
pd.set_option('display.max_columns', None) # Parámetro que modifica la visualización de los DFs
import numpy as np

# Librería para el acceso a variables y funciones
import sys
sys.path.append("../")
from src import soporte_funciones as sf #Archivo .py donde encontraremos todas nuestras funciones.
from src import soporte_variables as sv

# Librería para trabajar con bases de datos SQL
import psycopg2
from psycopg2 import OperationalError, errorcodes, errors

# Librería para ignorar avisos
import warnings
warnings.filterwarnings("ignore") # Ignora TODOS los avisos



<img src="datos/diagrama.png" width="300">

# Creación DDBB

In [None]:
sf.crear_db("SistemaElectrico")

La base de datos ya existe


# Listas Tuplas

In [None]:
csvs = ["comunidades", "demanda", "edades", "generacion", "pib_total", "pib", "poblacion", "provincias", "ramas", "tipos_energia"]
df_dict = {csv: pd.DataFrame() for csv in csvs}
dicc_tuplas = {}

# Carga de archivos CSV
for csv in csvs:
    directorio = f"datos/DatosFinales/{csv}.csv"
    df_dict[csv] = pd.read_csv(directorio, index_col=0)

# Conversión a tuplas (tipo de dato aceptado para cargar datos a una base de datos SQL)
for csv in csvs:
    dicc_tuplas[csv] = [tuple(fila) for fila in df_dict[csv].values]

# Asignación a variables
lista_tuplas_comunidades = dicc_tuplas["comunidades"]
lista_tuplas_demanda = dicc_tuplas["demanda"]
lista_tuplas_edades = dicc_tuplas["edades"]
lista_tuplas_generacion = dicc_tuplas["generacion"]
lista_tuplas_pib_total = dicc_tuplas["pib_total"]
lista_tuplas_pib = dicc_tuplas["pib"]
lista_tuplas_poblacion = dicc_tuplas["poblacion"]
lista_tuplas_provincias = dicc_tuplas["provincias"]
lista_tuplas_ramas = dicc_tuplas["ramas"]
lista_tuplas_tipos_energia = dicc_tuplas["tipos_energia"]


# Inserción de Tablas

In [None]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_comunidades)

In [None]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_ramas)

Commit realizado


In [6]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_tipo_energia)

Commit realizado


In [7]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_generacion)

Commit realizado


In [8]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_demanda)

Commit realizado


In [9]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_provincias)

Commit realizado


In [10]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_edades)

Commit realizado


In [11]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_poblacion)

Commit realizado


In [12]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_pib_total)

Commit realizado


In [13]:
sf.dbeaver_commit(sf.dbeaver_conexion("SistemaElectrico"),sv.query_creacion_pib)

Commit realizado


# Inserción de Datos

In [4]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_comunidades,lista_tuplas_comunidades)


Commit realizado


In [5]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_ramas,lista_tuplas_ramas)

Commit realizado


In [6]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_tipo_energia,lista_tuplas_tipos_energia)

Commit realizado


In [None]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_generacion,lista_tuplas_generacion)

Commit realizado


In [None]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_demanda,lista_tuplas_demanda)

Commit realizado


In [9]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_provincias,lista_tuplas_provincias)


Commit realizado


In [10]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_edades,lista_tuplas_edades)


Commit realizado


In [None]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_poblacion,lista_tuplas_poblacion)

Commit realizado


In [None]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_pib_total,lista_tuplas_pib_total)

Commit realizado


In [None]:
sf.dbeaver_commitmany(sf.dbeaver_conexion("SistemaElectrico"),sv.query_insercion_pib,lista_tuplas_pib)

Commit realizado
