## Informações Gerais
| Informações | Detalhes |
| ----------- | -------- |
| Nome Tabela | silver.pedidos |
| Origem | bromze.pedidos / bronze.estabelecimentos|

## Historico de atualização
| Data | Desenvolvido por | Motivo |
| ----------- | -------- | -------|
| 05/10/2024 | Matheus | Criação do Notebook |

In [0]:
#importações
from pyspark.sql.functions import current_date, current_timestamp, expr

In [0]:
#Funções
# Função que aplica os comentarios na tabela
def adicionaComentariosTabela(a, b, c, d):
    spark.sql(f"COMMENT ON TABLE {a}.{b} IS '{c}'")
    for key, value in d.items():
        sqlaux = f"ALTER TABLE {a}.{b} CHANGE COLUMN {key} COMMENT '{value}'"
        spark.sql(sqlaux)

In [0]:
database = "silver"
tabela = "pedidos"

In [0]:
%sql
select * from bronze.estabelecimentos

Local,Email,EstabelecimentoID,Telefone,data_carga,data_hora_carga
Bar do mineiro,bar@bardomineiro,1,(31) 96787-9326,2024-10-06,2024-10-06T17:52:10.771Z
Restaurante da Ana,ana@restaurantedana.com,2,(11) 98891-8293,2024-10-06,2024-10-06T17:52:10.771Z
Supermercado ABC,contato@superabc.com,3,(71) 99854-2730,2024-10-06,2024-10-06T17:52:10.771Z
Padaria do Paulo,paulo@padariapaulo.com,4,(61) 97029-4259,2024-10-06,2024-10-06T17:52:10.771Z
Lanchonete da Maria,maria@lanchonetemaria.com,5,(61) 95460-5114,2024-10-06,2024-10-06T17:52:10.771Z
Café Expresso,contato@cafeexpresso.com,6,(81) 91353-6764,2024-10-06,2024-10-06T17:52:10.771Z
Pizzaria Bella,contato@pizzariabella.com,7,(91) 96418-7540,2024-10-06,2024-10-06T17:52:10.771Z
Churrascaria Gaúcha,contato@churrascariagaucha.com,8,(31) 98582-4944,2024-10-06,2024-10-06T17:52:10.771Z
Cantina Italiana,contato@cantinaitaliana.com,9,(91) 93994-5119,2024-10-06,2024-10-06T17:52:10.771Z
Mercadinho da Esquina,contato@mercadinhoesquina.com,10,(41) 90819-7897,2024-10-06,2024-10-06T17:52:10.771Z


In [0]:
df_pedidos = spark.sql(
    f"""
    WITH pedidos AS (
        SELECT
            PedidoID AS id_pedido,
            EstabelecimentoID AS id_estabelecimento,
            Produto AS produto,
            quantidade_vendida AS quantidade,
            Preco_Unitario AS preco,
            data_venda AS data_pedido
        FROM
            bronze.pedidos
    ),
    
    estabelecimentos AS (
        SELECT
            Local AS nome_estabelecimento,
            Email AS email,
            EstabelecimentoID AS id_estabelecimento,
            Telefone AS telefone
        FROM
            bronze.estabelecimentos
    )
    
    SELECT
        CAST(ped.id_pedido AS INT),
        CAST(ped.id_estabelecimento AS INT),
        ped.produto,
        CAST(ped.quantidade AS INT),
        CAST(ped.preco AS DECIMAL(20,2)),
        CAST(ped.data_pedido AS DATE),
        est.nome_estabelecimento,
        est.email,
        est.telefone
    FROM
        pedidos ped
    LEFT JOIN
        estabelecimentos est
    ON ped.id_estabelecimento = est.id_estabelecimento
    """
)


In [0]:
df_pedidos.display()

id_pedido,id_estabelecimento,produto,quantidade,preco,data_pedido,nome_estabelecimento,email,telefone
1,50,Suco Natural,440,11.11,2023-07-22,Bar do João,joao@bardojoao.com,(71) 98909-8853
2,12,Refrigerante 123,278,15.45,2024-07-06,Pastelaria do Mário,contato@pastelariadomario.com,(21) 99320-8273
3,16,Água Mineral,178,4.26,2023-08-09,Adega do Luiz,contato@adegadoluz.com,(71) 93274-7401
4,42,Cerveja XYZ,38,11.65,2024-04-17,Café Gourmet,contato@cafegourmet.com,(81) 91370-2605
5,28,Refrigerante 123,94,9.39,2024-03-14,Padaria São João,contato@padariasaojoao.com,(91) 95641-1530
6,22,Suco Natural,108,8.04,2024-03-30,Papelaria Central,contato@papelariacentral.com,(41) 93189-7746
7,37,Cerveja XYZ,194,12.99,2024-03-27,Hamburgueria Burger,contato@hamburgueriaburger.com,(31) 93120-6163
8,28,Vinho ABC,349,1.26,2023-11-11,Padaria São João,contato@padariasaojoao.com,(91) 95641-1530
9,15,Suco Natural,62,6.25,2024-01-20,Padoca do Zé,contato@padocadodze.com,(61) 94617-3404
10,19,Vinho ABC,297,18.37,2024-05-07,Barbearia do Toninho,contato@barbeariadotoninho.com,(91) 99438-6690


In [0]:
df_pedidos = df_pedidos.withColumn("data_carga", current_date())
df_pedidos = df_pedidos.withColumn("data_hora_carga", expr("current_timestamp() - INTERVAL 3 HOURS"))

In [0]:
# Comentário Tabela
comentario_tabela = 'Esta tabela é uma entidade corporativa que contém a relação dos pedidos'

lista_comentario_colunas = {
    'id_pedido': 'Id do pedido.',
    'id_estabelecimento': 'Id do estabelecimento.',
    'produto': 'Nome do produto.',
    'quantidade': 'Quantidade do pedido.',
    'preco': 'Preço do produto unitário.',
    'nome_estabelecimento': 'Nome do estabelecimento.',
    'email': 'E-mail do estabelecimento.',
    'telefone': 'Telefone do estabelecimento.',
    'data_pedido': 'Data do pedido.',
    'data_carga': 'Data que o registro foi carregado.',
    'data_hora_carga': 'Data e hora que o registro foi carregado.'
}


In [0]:
adicionaComentariosTabela(database, tabela, comentario_tabela, lista_comentario_colunas)

In [0]:
df_pedidos.write \
    .format('delta') \
    .mode('overwrite') \
    .clusterBy("id_pedido") \
    .option('overwriteSchema', 'true') \
    .saveAsTable(f'{database}.{tabela}')
adicionaComentariosTabela(database, tabela, comentario_tabela, lista_comentario_colunas)
print("Comentarios adicionados nas tabelas")
print("Dados gravados com sucesso!")

Comentarios adicionados nas tabelas
Dados gravados com sucesso!


In [0]:
spark.sql(f"OPTIMIZE {database}.{tabela}")
print("Processo de otmização finalizado!")

Processo de otmização finalizado!


In [0]:
%sql
DESCRIBE DETAIL silver.pedidos

format,id,name,description,location,createdAt,lastModified,partitionColumns,clusteringColumns,numFiles,sizeInBytes,properties,minReaderVersion,minWriterVersion,tableFeatures,statistics
delta,7c2d83c3-5bf9-49ca-90ea-91ecaa2eaa35,spark_catalog.silver.pedidos,Esta tabela é uma entidade corporativa que contém a relação dos pedidos,dbfs:/user/hive/warehouse/dbfs/FileStore/Ampev/silver/pedidos,2024-07-31T18:32:40.605Z,2024-10-06T21:48:46Z,List(),List(id_pedido),1,11022,"Map(delta.enableDeletionVectors -> true, delta.enableRowTracking -> true, delta.checkpointPolicy -> v2, delta.rowTracking.materializedRowCommitVersionColumnName -> _row-commit-version-col-08ea7b72-824f-4a73-86d7-49bf6f589dd6, delta.rowTracking.materializedRowIdColumnName -> _row-id-col-dbe8dd7f-f718-4cfb-a5b5-e74e358a51ee)",3,7,"List(clustering, deletionVectors, domainMetadata, rowTracking, v2Checkpoint)","Map(numRowsDeletedByDeletionVectors -> 0, numDeletionVectors -> 0)"
