# ðŸ“˜ DocumentaÃ§Ã£o da Camada Bronze â€“ Notebook de IngestÃ£o

Este notebook realiza a **extraÃ§Ã£o de dados do banco PostgreSQL** hospedado no Azure e grava as tabelas na **camada Bronze** do Data Lake em formato Delta. Abaixo estÃ£o as aÃ§Ãµes executadas:

---

## ðŸ”¹ ConfiguraÃ§Ã£o da ConexÃ£o
- DefiniÃ§Ã£o da **URL JDBC** para conexÃ£o com o banco PostgreSQL (`jdbc:postgresql://.../vendas?sslmode=require`).  
- CriaÃ§Ã£o de um dicionÃ¡rio `connection_properties` contendo:
  - UsuÃ¡rio (`user`)  
  - Senha (`password`)  
  - Driver (`org.postgresql.Driver`)  

---

## ðŸ”¹ ExtraÃ§Ã£o de Dados (Leitura via Spark)
Foram extraÃ­das as seguintes tabelas do schema `public` no PostgreSQL:

- **Clientes** â†’ `df_clientes`  
- **Produtos** â†’ `df_produtos`  
- **Pedidos** â†’ `df_pedido`  
- **Itens_Pedido** â†’ `df_itens_pedido`  

Cada DataFrame foi exibido com `display()` para validaÃ§Ã£o.

---

## ðŸ”¹ PersistÃªncia na Camada Bronze
Os DataFrames foram gravados em formato **Delta** na camada Bronze, utilizando `.write.format("delta").mode("append").saveAsTable(...)`.

- `df_clientes` â†’ `bronze.vendas_clientes`  
- `df_produtos` â†’ `bronze.vendas_produtos`  
- `df_pedido` â†’ `bronze.vendas_pedidos`  
- `df_itens_pedido` â†’ `bronze.vendas_itens__pedidos`  

---

## ðŸŽ¯ Objetivo da Camada Bronze
- Armazenar os dados **brutos** vindos do sistema transacional (PostgreSQL).  
- Garantir **persistÃªncia confiÃ¡vel** em formato Delta para futuras transformaÃ§Ãµes.  
- Servir como base para a construÃ§Ã£o das camadas **Silver** e **Gold** dentro da arquitetura **Medallion**.  


In [0]:
jdbc_url = (
    "jdbc:postgresql://azuremaniezzijp.postgres.database.azure.com:5432/vendas"
    "?sslmode=require"
)

# OBSERVAÃ‡ÃƒO : NA URL SEMPRE LEMBRE DE COLOCAR O BANCO DE DADOS NO FINAL DA URL

connection_properties = {
    "user": "PgAdminJp",
    "password": "***",
    "driver": "org.postgresql.Driver"
}




In [0]:

# Extraindo tabela Clientes do banco postgres


df_clientes = spark.read.jdbc(
    url=jdbc_url,
    table="public.clientes",
    properties=connection_properties
)

display(df_clientes)


# Extraindo tabela Produtos do banco postgres

df_produtos = spark.read.jdbc(
    url=jdbc_url,
    table="public.produtos",
    properties=connection_properties
)

display(df_produtos)



# Extraindo tabela Pedidos do banco postgres

df_pedido = spark.read.jdbc(
    url=jdbc_url,
    table="public.pedido",
    properties=connection_properties
)


display(df_pedido)

# Extraindo tabela Itens_Pedidos do banco postgres

df_itens_pedido = spark.read.jdbc(
    url=jdbc_url,
    table="public.itens_pedido",
    properties=connection_properties
)

display(df_itens_pedido)

df_clientes.write \
    .format("delta") \
    .mode("append") \
    .saveAsTable("bronze.vendas_clientes")


df_produtos.write \
    .format("delta") \
    .mode("append") \
    .saveAsTable("bronze.vendas_produtos")


df_pedido.write \
    .format("delta") \
    .mode("append") \
    .saveAsTable("bronze.vendas_pedidos")


df_itens_pedido.write \
    .format("delta") \
    .mode("append") \
    .saveAsTable("bronze.vendas_itens__pedidos")

