# ü™ô Camada Bronze - Ingest√£o e Explos√£o de Itens via Auto Loader

## üìå Objetivo

Este pipeline tem como objetivo realizar a **ingest√£o incremental e automatizada de dados de vendas**, oriundos de arquivos Delta armazenados no Data Lake (**camada Bronze**), aplicando transforma√ß√µes com **explode de arrays**, enriquecimento com dados aninhados e grava√ß√£o otimizada com particionamento por data. 

*A camada Bronze √© respons√°vel por armazenar os dados brutos exatamente como foram recebidos, sem transforma√ß√µes. Essa abordagem permite manter um hist√≥rico completo, garantindo rastreabilidade e possibilitando futuros reprocessamentos caso necess√°rio.*

√â aplicado o Auto Loader para detec√ß√£o cont√≠nua de arquivos, com escrita resiliente no Delta Lake e **registro condicional da tabela no cat√°logo**, garantindo um pipeline robusto, reutiliz√°vel e econ√¥mico em recursos.

---

## üìÅ Estrutura de Pastas

| Camada     | Localiza√ß√£o                                                                 |
|------------|------------------------------------------------------------------------------|
| Bronze     | `abfss://bronze@dlsprojetofixo.dfs.core.windows.net/vendas_lucas`           |
| Bronze Out | `abfss://bronze@dlsprojetofixo.dfs.core.windows.net/vendas_lucas_exploded`  |

---

## üîç Fonte de Dados

- **vendas_lucas** ‚Äî Arquivos Delta contendo pedidos com m√∫ltiplos itens e endere√ßo aninhado (arrays e structs).

---

## üõ†Ô∏è Transforma√ß√µes Aplicadas

- üîÅ **Explode de arrays**: transforma m√∫ltiplos itens por pedido em m√∫ltiplas linhas (`explode(Items)`)
- üîç **Extra√ß√£o de nested fields**: extrai campos de structs como `ShippingAddress.City`, `Item.Price`, etc.
- üè∑Ô∏è **Padroniza√ß√£o de colunas**: com `alias()` para clareza sem√¢ntica
- üìÖ **Particionamento por data**: organiza os arquivos por `OrderDate` para ganho de performance
- ‚õìÔ∏è **Registro din√¢mico no cat√°logo**: cria a tabela automaticamente, caso ainda n√£o esteja registrada

---

## ‚öôÔ∏è T√©cnicas Avan√ßadas Utilizadas

| T√©cnica                         | Benef√≠cio                                                                 |
|----------------------------------|--------------------------------------------------------------------------|
| üîÑ `Auto Loader (cloudFiles)`    | Ingest√£o cont√≠nua com detec√ß√£o de novos arquivos Delta                   |
| üéØ `explode()`                   | Permite granularidade por item, essencial para an√°lises por produto      |
| üßä `Delta Lake`                  | Toler√¢ncia a falhas, versionamento e performance com escrita ACID       |
| üß≠ `checkpointLocation`          | Garante consist√™ncia e permite retomada segura em falhas                 |
| üìä `ZORDER BY`                   | Otimiza performance de leitura com filtros por `OrderID` e `CustomerID` |
| üîç `Verifica√ß√£o condicional`     | Cria a tabela no cat√°logo apenas se ainda n√£o existir                    |

---

## üß™ Valida√ß√£o Final

Ap√≥s a escrita, o pipeline executa:

- ‚úÖ **Contagem total de registros gravados**
- üöÄ **Otimiza√ß√£o com `OPTIMIZE ZORDER`**
- üìö **Registro autom√°tico da tabela no metastore**

---

## üîê Governan√ßa e Reusabilidade

- Tabela registrada no metastore (`bronze.vendas_lucas_exploded`)
- Compat√≠vel com SQL, notebooks e visualiza√ß√µes
- C√≥digo modular, reutiliz√°vel e com depend√™ncias expl√≠citas

---

## üë®‚Äçüíª Stack Utilizada

- **Databricks** (Notebook)
- **Apache Spark Structured Streaming**
- **Delta Lake**
- **Auto Loader**
- **Azure Data Lake Storage Gen2 (ABFSS)**

---

## üìà Resultados Esperados

- üöÄ Alta performance com controle de schema evolutivo
- ‚úÖ Pipeline resiliente e idempotente
- üîÑ Pronto para ser usado em um **workflow orquestrado** ou **job programado**

---




| **Informa√ß√µes**    |            **Detalhes**         |
|--------------------|---------------------------------|
| Nome da Tabela     |          Camada Bronze          |
| Data da Ingestao   |            31/03/2025           |
| Ultima Atualiza√ßao |            31/03/2025           |
| Origem             | Banco de Dados Azure - Patrick  |
| Respons√°vel        |           Lucas Sousa           |
| Motivo             | Cria√ß√£o de Camadas Bronze       |
| Observa√ß√µes        |               None              |

##INGEST√ÉO EM FORMATO CSV - TABELA CLIENTES

In [0]:
# üì¶ Pipeline Bronze - Ingest√£o de Dados Clientes (Arquivo CSV)
# üß† Objetivo: Realizar a ingest√£o eficiente, estruturada e confi√°vel de dados de clientes para a camada Bronze

from pyspark.sql.types import StructType, StructField, StringType, IntegerType, TimestampType
from pyspark.sql.functions import current_timestamp, to_date

# ------------------------------------------
# ‚úÖ Caminhos do pipeline (todos no container 'bronze' para padroniza√ß√£o e rastreabilidade)
# ------------------------------------------

path_source = 'abfss://transient@dlsprojetofixo.dfs.core.windows.net/ecommerce_customers_500.csv'  # Fonte CSV
path_target = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/clientes_lucas'                   # Destino Delta Lake
checkpoint_path = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/clientes_lucas_checkpoint'   # Checkpoint streaming
schema_location = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/clientes_lucas_schema'       # Schema do Auto Loader

# ------------------------------------------
# ‚úÖ Defini√ß√£o expl√≠cita do schema do CSV
# ------------------------------------------

schema = StructType([
    StructField("CustomerID", IntegerType(), True),
    StructField("Name", StringType(), True),
    StructField("Email", StringType(), True),
    StructField("Phone", StringType(), True),
    StructField("Date_Time_Load", TimestampType(), True)  # Ser√° substitu√≠da pelo timestamp real de ingest√£o
])

# ------------------------------------------
# ‚úÖ Cria√ß√£o do banco de dados 'bronze' caso n√£o exista
# ------------------------------------------
spark.sql("CREATE DATABASE IF NOT EXISTS bronze")

# ------------------------------------------
# ‚úÖ Leitura com Auto Loader (cloudFiles)
# ------------------------------------------

# Auto Loader permite leitura eficiente e incremental dos arquivos
# - cloudFiles.format define o tipo (CSV)
# - schemaLocation guarda o schema detectado, √∫til para schema evolution
# - schema define os tipos esperados, evitando infer√™ncia autom√°tica

raw_df = (
    spark.readStream
        .format("cloudFiles")
        .option("cloudFiles.format", "csv")
        .option("cloudFiles.schemaLocation", schema_location)
        .schema(schema)
        .load(path_source)
)

# ------------------------------------------
# ‚úÖ Transforma√ß√µes nos dados
# ------------------------------------------

# Substitui Date_Time_Load pela data e hora de ingest√£o do Spark
transformed_df = raw_df.withColumn("Date_Time_Load", current_timestamp())

# ‚úÖ Limpeza b√°sica de dados (essencial na Bronze)
# - Remove duplicatas e registros nulos
transformed_df = transformed_df.dropDuplicates().na.drop()

# Cria coluna de particionamento com apenas a data (sem hora)
transformed_df = transformed_df.withColumn("Data_Particao", to_date("Date_Time_Load"))

# ------------------------------------------
# ‚úÖ Escrita dos dados em Delta Lake com boas pr√°ticas
# ------------------------------------------

# - checkpointLocation: permite rein√≠cio seguro do stream
# - mergeSchema: aceita mudan√ßas futuras de schema
# - partitionBy: melhora a performance de leitura e filtragem
# - trigger(once=True): executa o pipeline uma √∫nica vez (modo batch)

(
    transformed_df.writeStream
        .format("delta")
        .outputMode("append")
        .option("checkpointLocation", checkpoint_path)
        .option("mergeSchema", "true")
        .partitionBy("Data_Particao")
        .trigger(once=True)
        .option("path", path_target)
        .toTable("bronze.clientes")
)

# Remove arquivos n√£o referenciados com reten√ß√£o de 7 dias
spark.sql("VACUUM bronze.clientes RETAIN 168 HOURS")


# ‚úÖ Log de sucesso no notebook
print("‚úÖ Pipeline de ingest√£o de clientes conclu√≠do com sucesso na camada Bronze!")

‚úÖ Pipeline de ingest√£o de clientes conclu√≠do com sucesso na camada Bronze!


In [0]:
%sql select * from bronze.clientes LIMIT 10

CustomerID,Name,PhoneNumber,Age,Date_Time_Load
1,Peter Arroyo,+1-510-4943,35,2025-04-09T00:16:28.167Z
2,Noah Kramer,+1-322-2452,36,2025-04-09T00:16:28.167Z
3,Kirk Becker,+1-554-6529,69,2025-04-09T00:16:28.167Z
4,Jacqueline Gray,+1-700-4444,58,2025-04-09T00:16:28.167Z
5,Julie Hobbs,+1-157-9744,51,2025-04-09T00:16:28.167Z
6,Philip Thompson,+1-843-5051,47,2025-04-09T00:16:28.167Z
7,Lisa Becker,+1-381-5680,41,2025-04-09T00:16:28.167Z
8,Marie Moon,+1-917-7575,41,2025-04-09T00:16:28.167Z
9,Michael Johnson,+1-400-5224,48,2025-04-09T00:16:28.167Z
10,Victor Williams,+1-188-8635,70,2025-04-09T00:16:28.167Z


## INGEST√ÉO EM FORMATO JSON - TABELA VENDAS

In [0]:
# üì¶ Pipeline Bronze - Ingest√£o de Dados com Auto Loader (Delta Lake + JSON)
# üß† Objetivo: Ingest√£o eficiente, econ√¥mica e resiliente de dados brutos em JSON para camada Bronze

from pyspark.sql.functions import current_timestamp
from pyspark.sql.types import StructType, StructField, StringType, IntegerType, DoubleType

# ------------------------------------------
# ‚úÖ Caminhos do pipeline (todos no container 'bronze' para padroniza√ß√£o e rastreabilidade)
# ------------------------------------------
path_source = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/ecommerce_large.json'  # Origem dos arquivos JSON
path_target = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/vendas_lucas'          # Destino Delta Lake
checkpoint_path = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/_checkpoints/vendas_lucas'  # Estado da ingest√£o
schema_path = 'abfss://bronze@dlsprojetofixo.dfs.core.windows.net/_schema/vendas_lucas'            # Metadados do schema inferido

# ‚úÖ Defini√ß√£o expl√≠cita do schema (evita erro de infer√™ncia se pasta estiver vazia)
schema = StructType([
    StructField("order_id", StringType(), True),
    StructField("customer_id", StringType(), True),
    StructField("product_id", StringType(), True),
    StructField("quantity", IntegerType(), True),
    StructField("price", DoubleType(), True),
    StructField("order_date", StringType(), True)
])

# ‚úÖ Leitura com Auto Loader (cloudFiles) e schema definido
# - Monitoramento autom√°tico de novos arquivos
# - Schema persistente para evolu√ß√£o segura
# - Tolerante a falhas e ideal para ingest√£o cont√≠nua ou programada
raw_df = (
    spark.readStream
        .format("cloudFiles")
        .option("cloudFiles.format", "json")
        .option("cloudFiles.schemaLocation", schema_path)
        .schema(schema)
        .load(path_source)
)

# ‚úÖ Limpeza b√°sica de dados (essencial na Bronze)
# - Remove duplicatas e registros nulos
clean_df = raw_df.dropDuplicates().na.drop()

# ‚úÖ Enriquecimento com coluna de auditoria
# - Marca o momento da ingest√£o dos dados
bronze_df = clean_df.withColumn("data_carga", current_timestamp())

# ‚úÖ Cria√ß√£o do banco de dados Bronze (se ainda n√£o existir)
spark.sql("CREATE DATABASE IF NOT EXISTS bronze")

# ‚úÖ Escrita em Delta Lake com boas pr√°ticas
# - checkpointLocation: permite rein√≠cio seguro em caso de falhas
# - mergeSchema: aceita novas colunas automaticamente
# - partitionBy: organiza fisicamente os arquivos por data da carga
# - trigger(once=True): executa o pipeline uma vez e encerra (ideal para batch)
(
    bronze_df.writeStream
        .format("delta")
        .option("checkpointLocation", checkpoint_path)
        .option("mergeSchema", "true")
        .partitionBy("data_carga")
        .trigger(once=True)
        .outputMode("append")
        .option("path", path_target)
        .toTable("bronze.vendas")
)

# Remove arquivos n√£o referenciados com reten√ß√£o de 7 dias
spark.sql("VACUUM bronze.vendas RETAIN 168 HOURS")


# ‚úÖ Log de sucesso
print("‚úÖ Pipeline executado com sucesso na tabela bronze.vendas!")

‚úÖ Pipeline executado com sucesso na tabela bronze.vendas!


In [0]:

%sql select * from bronze.vendas LIMIT 10

CustomerID,Items,OrderDate,OrderID,ShippingAddress,Status,TotalAmount,Date_Time_Load
123,"List(List(ef50354b-b782-4fcb-ad8d-81471c3ea7a4, 422.11, Keyboard, 1))",2024-02-08,1,"List(Lake Matthewberg, Pakistan, 29350, WA, 629 Mercado Motorway Apt. 766)",Completed,36.79,2025-04-09T00:16:58.962Z
126,"List(List(376bbc8e-ad01-44dc-8012-13c49020a44d, 37.53, Gaming Chair, 2))",2024-07-24,2,"List(West Jeffrey, Brunei Darussalam, 39678, AK, 101 Ronald Roads)",Cancelled,603.69,2025-04-09T00:16:58.962Z
500,"List(List(0f4940b5-3f26-4f33-bce0-404654c64594, 232.66, Router, 3), List(96e26e0e-6142-4339-8366-0acad6ae9f61, 27.71, Smartwatch, 3), List(a44e433a-19a2-4905-9c21-5f2402388dc4, 101.39, External Hard Drive, 2), List(e6ffb3e7-f8b7-4ca5-9e5a-0fd1f77b70b9, 222.25, Monitor, 1))",2024-01-27,3,"List(Lake Mike, Saint Pierre and Miquelon, 17295, ME, 98322 Lisa Road)",Cancelled,306.05,2025-04-09T00:16:58.962Z
215,"List(List(950b6c30-424c-4709-ace9-7b7de4797c45, 303.86, Gaming Chair, 1), List(78e306ee-993e-4442-a8b8-181865dde069, 139.28, Keyboard, 2), List(d8ff9a48-3d81-4747-bab9-862aef188f23, 132.5, Router, 3), List(77eb8f95-3713-4df0-bb17-f7f9d71511f7, 194.67, Laptop, 3), List(6c2d822b-2ab2-4a2d-b038-b06a7426804d, 160.01, Gaming Chair, 3))",2023-01-02,4,"List(Wardborough, Qatar, 30418, CO, 52559 Garrett Roads)",Completed,142.48,2025-04-09T00:16:58.962Z
85,"List(List(cbdab18c-86b4-4aad-b276-72994d0d808c, 153.66, Scanner, 1), List(f5f2df88-3558-4045-a6df-e097470edd32, 69.01, Smartwatch, 1))",2024-06-07,5,"List(Scottfort, Botswana, 06962, OK, 6294 Cox Forges Suite 579)",Pending,260.02,2025-04-09T00:16:58.962Z
297,"List(List(6836df29-15e0-46e1-b53d-63d57c75dc5e, 341.36, Power Supply, 3))",2023-11-16,6,"List(North Davidshire, Saint Helena, 59379, SC, 73872 Ortiz Fields Suite 280)",Cancelled,551.39,2025-04-09T00:16:58.962Z
144,"List(List(f5500e10-e547-41ee-b382-29fc426b1d0e, 439.84, Router, 1), List(01ca72d5-ca67-42f1-86a3-ccefa54a85b5, 229.2, Printer, 1), List(3370e320-855e-4131-b2c1-64f435c10708, 255.24, Webcam, 3))",2022-12-31,7,"List(Andersonmouth, Iraq, 58727, VT, 2321 Ronald Cliff)",Pending,549.0,2025-04-09T00:16:58.962Z
223,"List(List(1a9cad3e-1d8a-4cee-9e9e-37aa024ad178, 435.35, Monitor, 1), List(9b70a813-d4ca-42a9-9d69-7433d60af255, 485.35, Smartphone, 1), List(bdb24cec-29bd-4339-8118-6b2ea6d16baa, 11.09, Power Supply, 2), List(ac1adafe-106a-4ebb-b23e-14479cbc7ecc, 293.18, Smartphone, 2))",2023-10-20,8,"List(North Melanie, Norfolk Island, 62596, SC, 188 Reyes Alley)",Completed,533.41,2025-04-09T00:16:58.962Z
420,"List(List(0f6cfadf-bb5b-4ba3-94ae-ac8c0c5396f3, 245.35, Webcam, 1), List(d01e6a0a-7779-4f42-af0d-f91fe1493667, 295.57, Mouse, 2), List(9bb52eb2-2945-4f34-9c60-3616d99041d1, 416.37, Laptop, 3))",2023-05-05,9,"List(West Mathew, Denmark, 04118, NM, 14607 Smith Hills Apt. 583)",Pending,561.69,2025-04-09T00:16:58.962Z
60,"List(List(b8441ad2-cb50-4526-9ca0-58dc3add602d, 401.35, Power Supply, 2), List(b98753e7-3660-48cc-9042-a9f2b09f33a8, 91.16, Charger, 2), List(5c929555-2c72-4ba4-8675-982c934d328d, 172.52, Smartwatch, 3), List(2dfdeab4-2913-465f-aadc-7ddcb0fdab53, 428.85, Keyboard, 1), List(b90663bb-ccc8-42b9-b7a4-f15085e2275f, 107.87, USB Cable, 1))",2024-04-25,10,"List(Smithtown, Seychelles, 39360, MO, 116 Reid Island)",Pending,781.29,2025-04-09T00:16:58.962Z


#FUN√á√ÉO **EXPLODE** ##
Descompactar valores das colunas do tipo **ARRAY** conforme coluna **Items** e **ShippingAdress**  - Fonte Tabela (bronze.vendas)

A fun√ß√£o **Explode()** no Apache Spark √© usada para desnormalizar dados estruturados, transformando arrays ou mapas em m√∫ltiplas linhas. Isso √© √∫til para lidar com dados aninhados em formatos como JSON ou Parquet

In [0]:
from pyspark.sql.functions import col, explode
from pyspark.sql.types import StructType, StructField, StringType, DoubleType, IntegerType

# ========================================
# 1. CONFIGURA√á√ïES INICIAIS E CAMINHOS
# ========================================

# Caminhos no Data Lake (container Bronze no ADLS Gen2)
file_path = "abfss://bronze@dlsprojetofixo.dfs.core.windows.net/vendas_lucas"
path_target = "abfss://bronze@dlsprojetofixo.dfs.core.windows.net/vendas_lucas_exploded"
checkpoint_location = "abfss://bronze@dlsprojetofixo.dfs.core.windows.net/_checkpoint/vendas_lucas_exploded"

# Nome do banco e tabela no cat√°logo Hive/Unity Catalog
schema_name = "bronze"
table_name = "vendas_lucas_exploded"

# ========================================
# 2. CONFIGURA√á√ÉO DOS SCHEMAS DE ESTRUTURAS ANINHADAS
# ========================================

# Define o schema para a estrutura aninhada "Items"
items_schema = StructType([
    StructField("ItemID", StringType(), True),
    StructField("Price", DoubleType(), True),
    StructField("ProductName", StringType(), True),
    StructField("Quantity", IntegerType(), True)
])

# Define o schema para "ShippingAddress"
shipping_address_schema = StructType([
    StructField("City", StringType(), True),
    StructField("Country", StringType(), True),
    StructField("PostalCode", StringType(), True),
    StructField("State", StringType(), True),
    StructField("Street", StringType(), True)
])

# ========================================
# 3. LEITURA DOS DADOS COM AUTO LOADER
# ========================================

# Leitura incremental utilizando Auto Loader (cloudFiles)
# Permite escalabilidade, economia de cluster e detec√ß√£o autom√°tica de novos arquivos
# Schema evolution e gerenciamento autom√°tico de arquivos

df = spark.readStream.format("delta") \
    .option("cloudFiles.format", "delta") \
    .option("cloudFiles.schemaLocation", "/mnt/schemas/vendas_lucas") \
    .load(file_path)

# ========================================
# 4. TRANSFORMA√á√ÉO DOS DADOS
# ========================================

# Realiza o explode na coluna de array "Items", transformando m√∫ltiplos itens em linhas distintas
# Mant√©m as colunas principais do pedido e extrai campos internos do item e endere√ßo

df_exploded = df.withColumn("Item", explode(col("Items")))

# Seleciona as colunas finais com renomea√ß√£o clara para facilitar an√°lise e governan√ßa
final_df = df_exploded.select(
    col("OrderDate"),
    col("OrderID"),
    col("CustomerID"),
    col("Status"),
    col("Item.ItemID").alias("ItemID"),
    col("Item.ProductName").alias("ProductName"),
    col("Item.Quantity").alias("Quantity"),
    col("Item.Price").alias("Price"),
    col("TotalAmount"),
    col("ShippingAddress.City").alias("City"),
    col("ShippingAddress.Country").alias("Country"),
    col("ShippingAddress.PostalCode").alias("PostalCode"),
    col("ShippingAddress.State").alias("State"),
    col("ShippingAddress.Street").alias("Street"),
    col("Date_Time_Load")
)

# ========================================
# 5. ESCRITA DO STREAM COM DELTA LAKE
# ========================================

# Escrita do DataFrame em modo append utilizando Delta Lake
# Checkpoint permite rein√≠cio seguro sem duplica√ß√£o
# PartitionBy em OrderDate melhora performance de leitura em queries temporais
# Trigger once executa o stream como batch controlado, com menor custo e uso do cluster

query = final_df.writeStream \
    .format("delta") \
    .outputMode("append") \
    .option("checkpointLocation", checkpoint_location) \
    .option("mergeSchema", "true") \
    .partitionBy("OrderDate") \
    .trigger(once=True) \
    .start(path_target)

# Aguarda o fim da execu√ß√£o do streaming (modo batch seguro)
query.awaitTermination()

# ========================================
# 6. REGISTRO DA TABELA NO CAT√ÅLOGO (CASO N√ÉO EXISTA)
# ========================================

# Cria√ß√£o do banco de dados no metastore se ainda n√£o existir
spark.sql(f"CREATE DATABASE IF NOT EXISTS {schema_name}")

# Cria√ß√£o manual da tabela baseada nos arquivos j√° gravados, caso n√£o esteja registrada
if not spark._jsparkSession.catalog().tableExists(f"{schema_name}.{table_name}"):
    spark.sql(f"""
        CREATE TABLE {schema_name}.{table_name}
        USING DELTA
        LOCATION '{path_target}'
    """)

# ========================================
# 7. P√ìS-PROCESSAMENTO: CONTAGEM E OTIMIZA√á√ÉO
# ========================================

# L√™ a tabela j√° gravada (modo batch) para an√°lise posterior
# Isso garante que estamos operando sobre dados est√°veis ap√≥s o stream

df_final = spark.read.format("delta").load(path_target)

# Conta o n√∫mero total de registros processados ap√≥s o explode e escrita
# Essa m√©trica √© essencial para auditoria e valida√ß√£o do pipeline

total_linhas = df_final.count()
print(f"‚úÖ Total de linhas ap√≥s transforma√ß√£o e grava√ß√£o: {total_linhas}")

# ========================================
# 8. OTIMIZA√á√ÉO E Z-ORDER
# ========================================

# Aplica t√©cnica de otimiza√ß√£o com Z-ORDER sobre colunas cr√≠ticas
# Essa estrat√©gia reorganiza fisicamente os dados para acelerar consultas com filtros por OrderID e CustomerID
# Ideal para reduzir tempo de leitura e custo de I/O em workloads anal√≠ticos complexos

spark.sql(f"""
    OPTIMIZE {schema_name}.{table_name}
    ZORDER BY (OrderID, CustomerID)
""")

print("‚úÖ Pipeline finalizado com sucesso e tabela otimizada!")


‚úÖ Total de linhas ap√≥s transforma√ß√£o e grava√ß√£o: 29945
‚úÖ Pipeline finalizado com sucesso e tabela otimizada!


In [0]:
%sql select * from bronze.vendas_lucas_exploded LIMIT 10

OrderDate,OrderID,CustomerID,Status,ItemID,ProductName,Quantity,Price,TotalAmount,City,Country,PostalCode,State,Street,Date_Time_Load
2022-12-03,31,198,Cancelled,b5a7360a-a833-446a-9db2-697e83b335a9,Monitor,1,80.17,276.05,Ericstad,Romania,43407,IN,31942 Sanchez Grove,2025-04-09T00:16:58.962Z
2022-12-03,31,198,Cancelled,c5026804-4c82-4e16-8b47-d6d34ac17e83,Headphones,1,339.26,276.05,Ericstad,Romania,43407,IN,31942 Sanchez Grove,2025-04-09T00:16:58.962Z
2022-12-03,1052,311,Cancelled,732a8215-9e95-4617-8bae-0253584e141b,Scanner,1,345.94,776.54,West Michaelville,Mayotte,97677,CO,2621 Matthew Groves,2025-04-09T00:16:58.962Z
2022-12-03,1052,311,Cancelled,73b85fb9-1cf4-4b7f-b2d8-aebf20037bf1,Router,3,53.11,776.54,West Michaelville,Mayotte,97677,CO,2621 Matthew Groves,2025-04-09T00:16:58.962Z
2022-12-03,1052,311,Cancelled,a6f647a3-d5de-4122-b3cb-fe3da5d1022f,Gaming Chair,2,454.57,776.54,West Michaelville,Mayotte,97677,CO,2621 Matthew Groves,2025-04-09T00:16:58.962Z
2022-12-03,1052,311,Cancelled,5b345cf6-aef8-4341-be1e-465b48aa671f,Printer,2,470.79,776.54,West Michaelville,Mayotte,97677,CO,2621 Matthew Groves,2025-04-09T00:16:58.962Z
2022-12-03,1118,272,Completed,fcb2ec93-3fa5-4256-8300-9287597b81d3,Printer,2,433.37,215.35,Hendersonview,Syrian Arab Republic,99399,PA,53044 Sarah Spur,2025-04-09T00:16:58.962Z
2022-12-03,1118,272,Completed,3f42205e-5fc4-4c4a-b670-0f101a25e9a8,USB Cable,3,19.16,215.35,Hendersonview,Syrian Arab Republic,99399,PA,53044 Sarah Spur,2025-04-09T00:16:58.962Z
2022-12-03,1205,239,Pending,e9c8de14-8948-4635-a1dd-ce1bcaa33988,Tablet,3,171.27,717.73,North Nicholasbury,Sudan,52897,KS,54207 Warner Villages Apt. 371,2025-04-09T00:16:58.962Z
2022-12-03,1205,239,Pending,0e61542b-f7cb-4763-bc4d-862b990aa5f4,Scanner,2,81.4,717.73,North Nicholasbury,Sudan,52897,KS,54207 Warner Villages Apt. 371,2025-04-09T00:16:58.962Z
