In [0]:
# Databricks notebook source
# DBTITLE 1,Importação de Bibliotecas
from pyspark.sql import SparkSession
from pyspark.sql.functions import col, when

# DBTITLE 1,Criação da SparkSession
spark = SparkSession.builder.appName("CamadaGold").getOrCreate()

# DBTITLE 1,Carregar Dados da Camada Silver
inadimplencia_silver_df = spark.read.format('parquet').load('dbfs:/mnt/Aneel/Silver/inadimplencia_silver')
economicos_silver_df = spark.read.format('parquet').load('dbfs:/mnt/Aneel/Silver/economicos_silver')
dominio_indicadores_silver_df = spark.read.format('parquet').load('dbfs:/mnt/Aneel/Silver/dominio_indicadores_silver')

# Verificar dados carregados
print("Dados da Camada Silver")
display(inadimplencia_silver_df)
display(economicos_silver_df)
display(dominio_indicadores_silver_df)

# DBTITLE 1,Criar Tabelas Dimensão e Fato
# Tabela Fato de Inadimplência
fact_inadimplencia = inadimplencia_silver_df.select(
    'AnoIndice', 'SigAgente', 'SigIndicador', 'VlrIndiceEnviado', 'DatGeracaoConjuntoDados'
)
fact_inadimplencia.write.format('parquet').mode('overwrite').save('dbfs:/mnt/Aneel/Gold/fact_inadimplencia')

# Tabela Fato de Dados Econômicos
fact_economicos = economicos_silver_df.select(
    'AnoIndice', 'TaxaDesemprego', 'Inflacao', 'PIB'
)
fact_economicos.write.format('parquet').mode('overwrite').save('dbfs:/mnt/Aneel/Gold/fact_economicos')

# Tabelas Dimensão
dim_agente = inadimplencia_silver_df.select('SigAgente', 'NumCNPJ').distinct()
dim_agente.write.format('parquet').mode('overwrite').save('dbfs:/mnt/Aneel/Gold/dim_agente')

dim_indicador = dominio_indicadores_silver_df.select('SiglaIndicador', 'DescricaoIndicador').distinct()
dim_indicador.write.format('parquet').mode('overwrite').save('dbfs:/mnt/Aneel/Gold/dim_indicador')

# Dimensão Tempo usando 'AnoIndice' e 'NumPeriodoIndice'
dim_tempo = inadimplencia_silver_df.select('AnoIndice', 'NumPeriodoIndice').distinct()
dim_tempo = dim_tempo.withColumnRenamed('AnoIndice', 'Ano')
dim_tempo = dim_tempo.withColumnRenamed('NumPeriodoIndice', 'Mes')

# Calcular o trimestre a partir de 'Mes'
dim_tempo = dim_tempo.withColumn('Trimestre', 
    when(col('Mes').between(1, 3), 1)
    .when(col('Mes').between(4, 6), 2)
    .when(col('Mes').between(7, 9), 3)
    .otherwise(4)
)

dim_tempo.write.format('parquet').mode('overwrite').save('dbfs:/mnt/Aneel/Gold/dim_tempo')

# Verificar os dados das tabelas fato e dimensão
print("Tabela Dimensão Tempo")
display(dim_tempo)
print("Tabela Dimensão Agente")
display(dim_agente)
print("Tabela Dimensão Indicador")
display(dim_indicador)
print("Tabela Fato de Dados Econômicos")
display(fact_economicos)
print("Tabela Fato de Inadimplência")
display(fact_inadimplencia)


Dados da Camada Silver


DatGeracaoConjuntoDados,SigAgente,NumCNPJ,SigIndicador,AnoIndice,NumPeriodoIndice,VlrIndiceEnviado
2024-07-05,CEEE-D,8467115000100,IResBR21,2016,6,1.72
2024-07-05,EMR,19527639000158,IResBR21,2016,6,0.12
2024-07-05,CERPRO,44560381000139,IResBR21,2016,6,0.0
2024-07-05,CERRP,46598678000119,IResBR21,2016,6,0.0
2024-07-05,CERIM,50235449000107,IResBR21,2016,6,1.09
2024-07-05,CELESC,8336783000190,IResBR21,2016,6,1.04
2024-07-05,CERIS,57384943000182,IResBR21,2016,6,0.0
2024-07-05,CEDRAP,60196987000193,IResBR21,2016,6,2.35
2024-07-05,CETRIL,49313653000110,IResBR21,2016,6,0.21
2024-07-05,CERIPA,49606312000132,IResBR21,2016,6,0.0


AnoIndice,TaxaDesemprego,Inflacao,PIB
2012,7.4,344.4,4814760100000.0
2013,7.3,365.8,5331618900000.0
2014,6.9,388.9,5778952900000.0
2015,8.4,424.0,5995786900000.0
2016,11.4,461.1,6269327900000.0
2017,12.9,477.0,6585478800000.0
2018,12.4,494.5,7004141100000.0
2019,12.1,512.9,7389131000000.0
2020,13.5,529.4,7609596800000.0
2021,13.5,573.3,9012141600000.0


SiglaIndicador,DescricaoIndicador
AREA,"Área do conj., expressa em km2, correspondente a área geogr. e não a área elétr."
AREAT,Área do conjunto em km2
CM,Encargo de uso do sistema de distribuição aplicado à unidade cons. (mensal)
CMA,Encargo de uso do sistema de distribuição aplicado à unidade consumidora (anual)
CMM,"Consumo médio mensal, em MWh, média aritmética simples do último ano, excluin-"
CMMT,Consumo médio mensal em MWh
CMMTCO,Energia cons comercial nos últimos 12 meses (ano móvel) MT e BT
CMMTIN,Energia cons industrial nos últimos 12 meses (ano móvel) MT e BT
CMMTOU,Energia cons outras classes nos últimos 12 meses (ano móvel) MT e BT
CMMTRE,Energia cons residencial nos últimos 12 meses (ano móvel) MT e BT


Tabela Dimensão Tempo


Ano,Mes,Trimestre
2017,3,1
2017,8,3
2019,5,2
2017,10,4
2018,10,4
2016,7,3
2016,11,4
2019,3,1
2018,1,1
2018,3,1


Tabela Dimensão Agente


SigAgente,NumCNPJ
CEDRAP,60196987000193
EQUATORIAL AL,12272084000100
EQUATORIAL PA,4895728000180
CERMC,52548732000114
CEPRAG,78274610000170
CERTEL ENERGIA,9257558000121
CERR,5938444000196
CEEE-D,8467115000100
COPREL,90660754000160
COOPERA,83646653000170


Tabela Dimensão Indicador


SiglaIndicador,DescricaoIndicador
DMICVLDA,Valor apurado do indicador DMIC violado
Fec1r,Freqüência Equivalente de Interrupção por Unidade Consumidora (Racion.)- 1 Min.
IRur6,Perc. da rec. fat. 6° mês ant. não receb. no mês de ref. classe Rural
CREstProj,"Créd. Prazo Viol. por estudos, orçamentos e projetos por obras (art. 32)"
TI1,Tensão Interna
QVRclCobr,Quant. Prazos Viol. de reclamação de cobrança ou devol. de diferenças (art. 133)
QVReligIdv,Quant. Prazos Viol. de religação por suspensão indevida do fornec. (art. 176)
NMOPTP,Número de mortes de decorrentes de acidentes do trabalho - Próprio Típico
PMVrfRsc,Prazo Médio de verif. de equip. por ressarc. de dano elétrico (art. 206)
NEMPRT,Números de Empregados - Terceirizado


Tabela Fato de Dados Econômicos


AnoIndice,TaxaDesemprego,Inflacao,PIB
2012,7.4,344.4,4814760100000.0
2013,7.3,365.8,5331618900000.0
2014,6.9,388.9,5778952900000.0
2015,8.4,424.0,5995786900000.0
2016,11.4,461.1,6269327900000.0
2017,12.9,477.0,6585478800000.0
2018,12.4,494.5,7004141100000.0
2019,12.1,512.9,7389131000000.0
2020,13.5,529.4,7609596800000.0
2021,13.5,573.3,9012141600000.0


Tabela Fato de Inadimplência


AnoIndice,SigAgente,SigIndicador,VlrIndiceEnviado,DatGeracaoConjuntoDados
2016,CEEE-D,IResBR21,1.72,2024-07-05
2016,EMR,IResBR21,0.12,2024-07-05
2016,CERPRO,IResBR21,0.0,2024-07-05
2016,CERRP,IResBR21,0.0,2024-07-05
2016,CERIM,IResBR21,1.09,2024-07-05
2016,CELESC,IResBR21,1.04,2024-07-05
2016,CERIS,IResBR21,0.0,2024-07-05
2016,CEDRAP,IResBR21,2.35,2024-07-05
2016,CETRIL,IResBR21,0.21,2024-07-05
2016,CERIPA,IResBR21,0.0,2024-07-05
