
## Resumo do notebook

Neste notebook fazemos a importação de dados de uma fonte temporária do Databricks. 

In [0]:
from pyspark.sql.functions import upper, trim, col, try_to_timestamp

cap_path = "/Volumes/ons/staging/capacidade_geracao"
cap_df = spark.read.format("parquet").load(f"{cap_path}/*.parquet")

cap_df = cap_df.withColumn('id_subsistema', upper(trim(col('id_subsistema'))))
cap_df = cap_df.withColumn('nom_subsistema', upper(trim(col('nom_subsistema'))))

cap_df = cap_df.withColumn('dat_entradateste', try_to_timestamp(col('dat_entradateste')))
cap_df = cap_df.withColumn('dat_entradaoperacao', try_to_timestamp(col('dat_entradaoperacao')))
cap_df = cap_df.withColumn('dat_desativacao', try_to_timestamp(col('dat_desativacao')))

cap_df = cap_df.withColumn('val_potenciaefetiva', col('val_potenciaefetiva').cast('double'))
cap_df.write.format("delta").mode("overwrite").saveAsTable("ons.dados.capacidade_geracao")

display(cap_df.limit(5))

id_subsistema,nom_subsistema,id_estado,nom_estado,nom_modalidadeoperacao,nom_agenteproprietario,nom_agenteoperador,nom_tipousina,nom_usina,ceg,nom_unidadegeradora,cod_equipamento,num_unidadegeradora,nom_combustivel,dat_entradateste,dat_entradaoperacao,dat_desativacao,val_potenciaefetiva
NE,NORDESTE,AL,ALAGOAS,TIPO I,CHESF,CHESF,HIDROELÉTRICA,XINGÓ,UHE.PH.SE.027053-9.01,UG 527 MW USINA XINGO 4 AL,ALUXG-0UG4,4,HIDRÁULICA,1995-10-26T00:00:00.000Z,1995-10-26T00:00:00.000Z,,527.0
NE,NORDESTE,AL,ALAGOAS,TIPO I,CHESF,CHESF,HIDROELÉTRICA,XINGÓ,UHE.PH.SE.027053-9.01,UG 527 MW USINA XINGO 6 AL,ALUXG-0UG6,6,HIDRÁULICA,1994-04-30T00:00:00.000Z,1994-04-30T00:00:00.000Z,,527.0
NE,NORDESTE,AL,ALAGOAS,TIPO I,CHESF,CHESF,HIDROELÉTRICA,XINGÓ,UHE.PH.SE.027053-9.01,UG 527 MW USINA XINGO 5 AL,ALUXG-0UG5,5,HIDRÁULICA,1995-01-31T00:00:00.000Z,1995-01-31T00:00:00.000Z,,527.0
NE,NORDESTE,AL,ALAGOAS,TIPO I,CHESF,CHESF,HIDROELÉTRICA,XINGÓ,UHE.PH.SE.027053-9.01,UG 527 MW USINA XINGO 1 AL,ALUXG-0UG1,1,HIDRÁULICA,1997-08-22T00:00:00.000Z,1997-08-22T00:00:00.000Z,,527.0
NE,NORDESTE,AL,ALAGOAS,TIPO I,CHESF,CHESF,HIDROELÉTRICA,XINGÓ,UHE.PH.SE.027053-9.01,UG 527 MW USINA XINGO 2 AL,ALUXG-0UG2,2,HIDRÁULICA,1996-12-20T00:00:00.000Z,1996-12-20T00:00:00.000Z,,527.0


In [0]:
spark.sql("""
COMMENT ON TABLE ons.dados.capacidade_geracao IS
'Tabela contém informações sobre subsistemas operacionais e seus status. Inclui detalhes como nomes de subsistemas, estados operacionais e agentes associados. Esses dados podem ser utilizados para monitorar o desempenho dos diferentes subsistemas, analisar a eficiência operacional e acompanhar mudanças ao longo do tempo, incluindo datas de ativação e desativação.'
""")

DataFrame[]

In [0]:
desc_cap = {
    "id_subsistema": "Código do Subsistema da Usina",
    "nom_subsistema": "Nome do Subsistema",
    "id_estado": "Sigla do Estado onde está a Usina",
    "nom_estado": "Nome do Estado",
    "nom_modalidadeoperacao": "Modalidade de Operação da Usina",
    "nom_agenteproprietario": "Agente Proprietário da Usina",
    "nom_agenteoperador": "Agente Operador da Usina",
    "nom_tipousina": "Tipo da Usina",
    "nom_usina": "Nome da Usina",
    "ceg": "Código Único do Empreendimento de Geração",
    "nom_unidadegeradora": "Nome da Unidade Geradora",
    "cod_equipamento": "Código do Equipamento – Unidade Geradora",
    "num_unidadegeradora": "Código Operacional da Unidade Geradora",
    "nom_combustivel": "Combustível da Unidade Geradora",
    "dat_entradateste": "Data de Entrada em Teste (Comissionamento)",
    "dat_entradaoperacao": "Data de Entrada em Operação Comercial",
    "dat_desativacao": "Data de Desativação da Unidade Geradora",
    "val_potenciaefetiva": "Potência Nominal da Unidade Geradora, em MW"
}

for col_name, col_desc in desc_cap.items():
    print({"Coluna": col_name, "Descrição": col_desc})
    spark.sql(f"COMMENT ON COLUMN ons.dados.capacidade_geracao.{col_name} IS '{col_desc}'")

{'Coluna': 'id_subsistema', 'Descrição': 'Código do Subsistema da Usina'}
{'Coluna': 'nom_subsistema', 'Descrição': 'Nome do Subsistema'}
{'Coluna': 'id_estado', 'Descrição': 'Sigla do Estado onde está a Usina'}
{'Coluna': 'nom_estado', 'Descrição': 'Nome do Estado'}
{'Coluna': 'nom_modalidadeoperacao', 'Descrição': 'Modalidade de Operação da Usina'}
{'Coluna': 'nom_agenteproprietario', 'Descrição': 'Agente Proprietário da Usina'}
{'Coluna': 'nom_agenteoperador', 'Descrição': 'Agente Operador da Usina'}
{'Coluna': 'nom_tipousina', 'Descrição': 'Tipo da Usina'}
{'Coluna': 'nom_usina', 'Descrição': 'Nome da Usina'}
{'Coluna': 'ceg', 'Descrição': 'Código Único do Empreendimento de Geração'}
{'Coluna': 'nom_unidadegeradora', 'Descrição': 'Nome da Unidade Geradora'}
{'Coluna': 'cod_equipamento', 'Descrição': 'Código do Equipamento – Unidade Geradora'}
{'Coluna': 'num_unidadegeradora', 'Descrição': 'Código Operacional da Unidade Geradora'}
{'Coluna': 'nom_combustivel', 'Descrição': 'Combustí