
## Extração da tabela fato com dados da exportacao e importação para a camada Gold

### Cria o schema Gold se ele não existir


In [0]:
%sql

CREATE SCHEMA if not exists gold;

### Cria o dataframe a partir da consulta SQL.
Nesse caso faz o UINON ALL das tabelas de exportação e de importação que estão na camada silver.
Cria na tabela exportação as colunas que não existem nesta mas que existem na tabela importação, com o valor 0, visto que o UNION ALL precisa que as tabelas tenham as mesmas colunas.
Cria também uma coluna especificando se é exportação ou importação.
Depois cria uma visão temporária.


In [0]:
from pyspark.sql.functions import col

df = spark.sql("""
    select
        cod_ano,
        cod_mes,
        cod_ncm,
        cod_unid,
        cod_pais,
        cod_uf,
        cod_via,
        cod_urf,
        cod_quantidade_estatistica,
        qt_peso_liquido,
        vl_fob,
        0 as vl_frete,
        0 as vl_seguro,
        'EXPORTACAO' as cod_tipo
    from silver.exportacao_completa

    UNION ALL

    select *,
    'IMPORTACAO' as cod_tipo 
    from silver.importacao_completa

""")

df.createOrReplaceTempView('vw_exp_imp_completa_gold')

Aqui foi feito um select só para verificar se a visão criada trouxe os dados corretamente

In [0]:
%sql
select * from vw_exp_imp_completa_gold

cod_ano,cod_mes,cod_ncm,cod_unid,cod_pais,cod_uf,cod_via,cod_urf,cod_quantidade_estatistica,qt_peso_liquido,vl_fob,vl_frete,vl_seguro,cod_tipo
2012,6,87089100,11,97,PR,7,145200,90,1194.0,21925.0,0.0,0.0,EXPORTACAO
2012,6,33051000,10,249,SP,1,817800,3763,3763.0,17164.0,0.0,0.0,EXPORTACAO
2012,6,94035000,11,628,RS,1,1017700,19576,561623.0,1490086.0,0.0,0.0,EXPORTACAO
2012,6,85371090,10,589,PR,4,817700,2063,2063.0,84614.0,0.0,0.0,EXPORTACAO
2012,6,83012000,10,158,SP,7,1010900,352,352.0,14720.0,0.0,0.0,EXPORTACAO
2012,6,70071100,11,63,SP,1,817800,733,2360.0,19993.0,0.0,0.0,EXPORTACAO
2012,6,85122019,11,239,SP,4,817700,3,0.0,97.0,0.0,0.0,EXPORTACAO
2012,6,84131900,11,239,ZN,4,817600,2,0.0,2360.0,0.0,0.0,EXPORTACAO
2012,6,82016000,10,845,RS,7,1015500,586,586.0,3131.0,0.0,0.0,EXPORTACAO
2012,6,85365090,11,239,SP,1,817800,5172,1059.0,21879.0,0.0,0.0,EXPORTACAO


In [0]:
%sql
select distinct cod_tipo 
from vw_exp_imp_completa_gold

cod_tipo
EXPORTACAO
IMPORTACAO


### Salva a tabela no formato parquet

In [0]:
permanent_table = "exportacao_importacao_completa_gold"

df.write.format("parquet").saveAsTable(permanent_table)

### Salva a tabela fato no schema Gold

In [0]:
%sql

CREATE TABLE IF NOT EXISTS gold.f_exportacao_importacao AS SELECT * FROM default.exportacao_importacao_completa_gold;

num_affected_rows,num_inserted_rows
